专利名称:一种版面比对的方法及装置的制作方法
技术领域:
本发明属于文字处理技术领域,特别涉及一种版面比对的方法及装置。
背景技术:
目前的报纸、书籍出版校对领域中,一般是三个校次来保证质量,在二、三校次中 要确认,要修改的是否都修改,另外是否有误操作、误修改,影响版面其他部分。通过人工对 两个纸样进行逐字逐句的查看,查看修改是否正确。具体步骤如下步骤1、对要出版的素材进行版面排版,并通过打印机打出第一个校次纸样。步骤2、校对人员在纸上用符号标出可疑错误的地方。送编辑进行确认,编辑确认 那些是要修改的,把纸样送排版人员对版面进行修改。步骤3、排版人员对版面修改完毕,打印出第二份纸样,送校对人员进行第二个校 次的校对。步骤4、校对人员把第一校次纸样先逐字逐句查看一校次中要修改的内容是否修 改,并且没有误修改。然后再对文章内容进行通读校对。并在纸样上画出可疑错误,供编辑 进行确认,编辑在纸样上确认后,送排版人员进行修改。步骤5、排版人员对版面修改完毕,打印出第三份纸样,送校对人员进行第三个校 次的校对。步骤6、校对人员通过对比二校次的纸样内容逐字逐句查看要修改的是否被修改, 是否有误修改的地方。如果没有完成校对,进行印刷;如果有错误在进行下个校次的修改, 直到错误都修改并没有错误。基于上述的人工校对方法,在2、3校次需要查看当前版面相比上个版本修改的内 容时,需要通过人工逐字逐句的进行检查,若想发现两个版本的差异费时费力,效率非常 低。
发明内容
为了解决对人工版面比对效率非常低的问题,本发明实施例提供了一种版面比对 的方法,包括提取修改前和/或修改后版面的版面信息,所述版面信息包括;文件内容信息、块 坐标位置信息和版面的图形文件;根据提取的文件内容信息和块坐标位置信息对应的字符串信息,生成版面比对结 果对应的字符串信息,版面比对结果包括标识版面被修改的参数信息和版面修改所涉及 的块的坐标位置信息;根据对版面比对结果对应的字符串信息进行解析,在版面的图形文件上标识出版 面修改标记,标识区域由修改所涉及的块的坐标位置确定。同时本发明实施例还提供一种版面比对的装置,包括提取模块用于提取修改前和/或修改后版面的版面信息,所述版面信息包括;文件内容信息、块坐标位置信息和版面的图形文件;比对模块用于根据提取的文件内容信息和块坐标位置信息对应的字符串信息, 生成版面比对结果对应的字符串信息,版面比对结果包括标识版面被修改的参数信息和 版面修改所涉及的块的坐标位置信息;解析模块用于根据对版面比对结果对应的字符串信息进行解析,在版面的图形 文件上标识出版面修改标记,标识区域由修改所涉及的块的坐标位置确定。由本发明提供的具体实施方案可以看出,正是由于对版面比对结果对应的字符串 信息进行解析,在版面的图形文件上标识出版面修改标记,进而提高版面比对效率。
图1为本发明提供的第一实施例方法流程图;图2为本发明提供的第一实施例版面示意图;图3本发明提供的第一实施例版面比对示意图;图4为本发明提供的第二实施例装置结构图。
具体实施例方式为了解决现有技术中采用人工的方式,对不同版本的版面比对效率低的问题,本 发明实施例提供的版面比对的方法的原则是,首先排版完成后提取当前版面VI. 0版本的 版面信息,对版面进行校对并修改后提取修改后版面V2. 0版本的版面信息,提取修改前和 修改后版面的版面信息,在实际应用时,根据版面修改的实际情况,也可能只能提取到修改 前或修改后版面的版面信息。版面信息包括;文件内容信息、块坐标位置信息和版面的图形 文件,对于版面的文字块,文件内容信息为文字内容,对于版面的图片块,文件内容信息为 图片对应路径,对于版面的表格块,文件内容信息为行列数和单元格内容。根据提取的文件 内容信息和块坐标位置信息生成字符串信息,例如将文件内容信息和块坐标位置信息以文 本的格式或xml格式进行存储,生成文本格式文件或xml格式文件。根据提取的文件内容 信息和块坐标位置信息对应的字符串信息,生成版面比对结果对应的字符串信息,版面比 对结果包括标识版面被修改的参数信息和版面修改所涉及的块的坐标位置信息,根据对 版面比对结果对应的字符串信息进行解析,在版面的图形文件上标识出版面修改标记,标 识区域由修改所涉及的块的坐标位置确定。正是由于根据提取的文件内容信息和块坐标位 置信息对应的字符串信息,得到标识版面被修改的参数信息和版面修改所涉及的块的坐标 位置信息,并在在版面的图形文件上标识出版面修改标记,提高了校对的效率,使人工对版 面的不同的版本的比对,通过电脑实现,提高了校对准确率和速度,也使对版面的误操作、 误修改需要花费大量人力和时间才能发现,变得更加容易监控。本发明提供的第一实施例是一种版面比对的方法,为了描述方便,本实施例以xml 格式文件进行说明,但不对字符串信息的具体格式进行限定,字符串信息的具体格式为文 本格式同样适用。方法流程如图1所示,包括步骤101 版面信息提取。步骤102:版面比对。步骤103 比对结果显示。
其中步骤101中,对版面进行排版,在完成排版后得到VI. 0版本的版面,如图2所 示,版面11中包括一个或多个块21,每个块21的ID不同,例如图2中的3个块21的ID分 别为1、2、3,块21可以是图像块、文字块、表格块,利用计算机程序对V1.0版本的版面的版 面内容的所有块进行遍历,提取版面中各块的版面信息,包括文件内容信息、块坐标位置 信息和版面的图形文件。完成提取后,打印纸样并进行版面校对。对于版面的文字块,文件内容信息为文字内容如“123abc—二三”,对于版面 的图片块,文件内容信息为图片对应路径如“\\20080912\43. jpg”,对于版面的表格块, 文件内容信息为行列数如“行数为12,列数为21”和单元格内容如“1行1列、1行2 列........12行20列、12行21列”,块坐标位置信息表示块在版面中的坐标位置。本实施例中,提取的VI. 0版面中各块的版面信息的格式如下所示,〈?xml version=" 1.0" > <Block> <Basic> <!--块的 Id--> <Id>2</Id><!--块的类型和 Id。类型,Text; Photo; Table; Other。--><Type>Text</Type><!--X轴的所有坐标。--><Point-X> 11,22</Point-X><!--Y轴的所有坐标。-->〈Point-Y> 11,33</Point-Y> <Words>212</Words> </Basic><!--图片块类型--> <PhotoType> <!--图片的路径。--> <Path>\\20080912\43 .jpg</Path> <! 图片的最后<务改时间。--> <ModifyTime>2008-03-12 14:11:42</ModifyTime> <!--图片的大小--> <Size>213231</Size> </PhotoType> <!--表格块类型--> <TableType> <!--表格总行数。一> <CountRow> 12</CountRow> <!--表格总列数--> <CountCol>21 </CountCol> 对应单元格的信息。—> 〈Item Row=T Col="2" > <!--该当前格对应的Text内容。--> <TextContent><![CDATA[]]> </TextContent> </Item>〈Item Row=T Col="3" > <TextContent><![CDATA[]]> </TextContent> </Item> </TableType> <TextType> <!--Text对应的内容。《> <TextContent><![CDATA[ ]]> </TextContent> </TextType> </Block> 其中包括块的ID为2,xml格式为<Id>2</Id> ;块的类型为文字块,xml格 式为<Type>TeXt</Type> ;块坐标位置信息,其对应的字符串信息如采用ml格式为 <Point-X>ll,22</Point-X>、<Point_Y>l 1,33</Point_Y> ;文件内容信息如果为图片对应 路径,xml格式为<Path>\\20080912\43. jpg</Path>,文件内容信息如果为行列数和单元格内容,xml 格式为 <CountRow>12</CountRow>、<CountCol>21</CountCol>、〈Item Row =〃 1〃 Col=" 2" XTextContentX ! [CDATA[]]></TextContent>...〈Item Row = " 1 " Col = " 3 " XTextContentX ! [CDATA[]]></ TextContent> ;文字内容,xml 格式为〈TextContentX ! [CDATA[]] X/textContent>,其中 [CDATA []可以具体是[CDATA [123abc —二三]。版面中的每个块对应一个块xml文件,根据不同的块类型,分别填入到上面 的xml文件的对应位置,例如块类型为文字块则在〈TextContentX ! [CDATA [] ] ></ TextContent)中填入文字内容“123abc —二三”(此时的图片对应路径和表格),块类型 为图像块则在〈PathX/I^ath〉中填入图片路径“\\20080912\43· jpg。一个版面包括一个块或多个块,因此将所有的块的id和类型提取出放在版面信 息xml文件中。通过版面信息xml文件可以获取到所有的版面块详细内容。例如,VI. O版 面中有2个块,则VI. O版面的版面信息xml文件中,包括这2个块的ID,和对应的块类型。 另外版面信息xml文件还会记录版面的上下左右四个端点坐标位置,块的坐标位置是相对 四个点的相对坐标位置。版面信息xml文件格式如下〈?xml version=" 1.0" > <Page>〈Properties〉 <!--提交的用户。--> <SubmitUser>lsm</SubmitUser> <!--提交的时间。--><SubmitTime>2008-03-12 14:1 l:42</SubmitTime> <!--当前的版本。--> <Version>01 <N ersion><PageLefl>l 1680.271654</PageLefl> <!--版面顶点坐标--> <PageTop>9883.696850</PageTop> <!--版面有顶点坐标一 > <PageRight>21086.728346</PageRight><!--版面底坐标,这一组坐标的目的主要是确定,版面的大小宽度。--〉 <PageBottom>22883.303150</PageBottom> 〈/Properties〉 <!--所有的块信息。 <Blocks><!--块的类型和 Id。类型,I=Text; 2=Photo; 3=Table; 4=Cell; 5=Other.<Block Type=” 1 ">3</Block> 〈Block Type="2,*>4</Block> 〈Block Type="3">6</Block> 〈Block Type=” 1 丨丨>1 l</Block> </B locks〉 </Page>版面的上下左右四个端点坐标位置为=PageLeft > 11680. 271654</ PageLeftXPageTop>9883. 696850</PageTop>、<PageRight>21086. 728346</PageRight>、 <PageBottom>22883. 303150</PageBottom>,块的 id 和类型表示为例如<BlockType ="1" >3</Block>,其中的1表示块类型,1对应文本块,3表示ID为3。进行版面校对修改后,得到V2. 0版本的版面,利用计算机程序对V2. 0版面进行与 VI. 0版面类似的操作,V2. 0版面的版面信息的块的格式与VI. 0版面的类似,不同之处只是 xml格式文件中的文件内容信息、块坐标位置信息有所不同,如版面中的块的文字内容被修 改,由[CDATA[123abc —二三]被修改为[CDATA[ —二三abcl23],或者因版面中的块的位 置移动,块坐标位置信息由 <Point-X>ll,22</Point-X>、<Point_Y>ll,33</Point_Y> 被修 改为 <Point-X>12,22</Point-X>、<Point_Y>12,33</Point_Y>,或者 ID 为 2 的块被删除, 其对应的xml格式文件整个也被删除,或者增加ID为2的块,增加其对应的整个xml格式 文件。将所有的块的id和类型提取出放在V2. 0版面的版面信息xml文件中,此处不再赘 述。对于步骤102,利用计算机程序对V2. 0版面和VI. 0版面进行比对,具体而言就是 根据V2. 0版面的版面信息对应的xml格式文件和VI. 0版面的版面信息对应的xml格式文件,生成版面比对结果对应的xml格式文件,该版面比对结果对应的xml格式文件包括标 识版面被修改的参数信息和版面修改所涉及的块的坐标位置信息,即版面比对结果,其中 标识版面被修改的参数信息可以是绘制版面中的块被修改、删除、移动和新增的线的宽度、 线的颜色和相应的版面修改说明信息等,该xml格式文件还包括版面修改类型,如版面中 的块被修改、删除、移动和新增。对V2. 0版面中ID为2的块的版面信息对应的xml格式文件和VI. 0版面中ID为 2的块的版面信息进行比对,例如,ID为2的块是文字块,对文字块坐标(块坐标位置对应 的字符串信息)、文字内容字符串进行比较,看是否一致,如果是图片块,比较图片坐标(图 片块坐标位置对应的字符串信息)、图片存储路径、图片大小、图片修改时间的字符串是否 相等,如果是其他,比较对应坐标字符串是否相等。并生成版面比对结果xml信息,存储于 版面比对结果对应的xml格式文件中。若文字内容字符串进行比较有差别,则比对结果xml 信息包括标识块被修改的参数信息,若文字块坐标进行比较有差别,则比对结果xml信息 包括标识块被移动的参数信息,若文字内容字符串和文字块坐标进行比较有差别,比对结 果xml信息包括标识块即被修改又被移动的参数信息。又如,ID为3的块,在VI. 0版面中 有,V2. 0版面中没有,根据VI. 0版面中ID为3的块对应的xml格式文件,生成比对结果xml 信息,生成比对结果ml信息包括标识ID为3的块被删除的参数信息的xml格式文件。又 如ID为4的块,在V2. 0版面中有,VI. 0版面中没有,根据V2. 0版面中ID为4的块对应的 xml格式文件,生成比对结果xml信息,生成比对结果xml信息包括标识新增ID为4的块的 参数信息的xml格式文件。版面修改的修改类型如块被修改,删除、移动或新增也被包括在 版面比对结果对应的xml格式文件中,每种修改类型对应不同的标识版面被修改的参数信 息。如不同的修改类型通过不同的颜色参数去标识。版面比对结果对应的xml格式文件中还包含V2. 0版面上下左右四个点坐标,记录 所有被修改、移动、删除、新增的块的版面比对结果,版面比对结果包括标识版面被修改的 参数信息和版面修改所涉及的块的坐标位置信息。版面比对结果对应的xml格式文件如下
权利要求
1.一种版面比对的方法,其特征在于,包括提取修改前和/或修改后版面的版面信息,所述版面信息包括;文件内容信息、块坐标 位置信息和版面的图形文件;根据提取的文件内容信息和块坐标位置信息对应的字符串信息,生成版面比对结果对 应的字符串信息,版面比对结果包括标识版面被修改的参数信息和版面修改所涉及的块 的坐标位置信息;对版面比对结果对应的字符串信息进行解析,在版面的图形文件上标识出版面修改标 记,标识区域由修改所涉及的块的坐标位置确定。
2.如权利要求1所述的方法,其特征在于,将提取的文件内容信息和块坐标位置信息 以ml格式按块进行存储。
3.如权利要求2所述的方法,其特征在于,根据提取的文件内容信息和块坐标位置信 息对应的字符串信息,生成版面比对结果对应的字符串信息具体为根据修改前和/或修改后版面中的块对应的xml格式文件,得到版面比对结果对应的 xml格式文件,版面比对结果对应的xml格式文件包括标识版面被修改的参数信息和版面 修改所涉及的块的坐标位置信息;对参数信息对应的字符串信息进行解析具体为对版面比对结果对应的xml格式文件进行解析。
4.如权利要求3所述的方法,其特征在于,块ID以xml格式进行存储,以块ID为索引, 根据修改前和/或修改后版面中的块对应的ml格式文件,得到版面比对结果对应的xml 格式文件。
5.如权利要求4所述的方法,其特征在于,若修改前和修改后版面具有相同ID的块, 则对修改前和修改后版面中具有相同ID的块对应的xml格式文件进行比较,若对具有相同 ID的块进行了修改或移动操作,则得到包括标识块被修改和/或被移动的参数信息的xml 格式文件;若修改前具有的块ID修改后没有,则根据修改前版面中具有的ID的块对应的xml格 式文件,得到包括标识版面中的块被删除的参数信息的xml格式文件;若修改后具有的块ID修改前没有,则根据修改后版面中具有的ID的块对应的xml格 式文件,得到包括标识版面中有新增的块的参数信息的xml格式文件。
6.如权利要求3所述的方法,其特征在于,版面比对结果对应的xml格式文件还包括 版面的修改类型标记,标识版面被修改的参数信息与版面的修改类型标记对应。
7.如权利要求2所述的方法,其特征在于,存储块ID的xml格式文件中包括版面的端 点坐标位置信息,块坐标位置是版面的端点坐标位置的相对坐标位置。
8.如权利要求1所述的方法,其特征在于,若版面的块为文字块,则文件内容信息为 文字内容,若版面的块为图片块,则文件内容信息为图片对应存储路径,若版面的块为表格 块,则文件内容信息为行列数和单元格内容。
9.一种版面比对的装置,其特征在于,包括提取模块用于提取修改前和/或修改后版面的版面信息,所述版面信息包括;文件内 容信息、块坐标位置信息和版面的图形文件;比对模块用于根据提取的文件内容信息和块坐标位置信息对应的字符串信息,生成版面比对结果对应的字符串信息,版面比对结果包括标识版面被修改的参数信息和版面 修改所涉及的块的坐标位置信息;解析模块用于根据对版面比对结果对应的字符串信息进行解析,在版面的图形文件 上标识出版面修改标记,标识区域由修改所涉及的块的坐标位置确定。
10.如权利要求9所述的装置,其特征在于,还包括存储模块用于将提取的文件内容 信息和块坐标位置信息以xml格式按块进行存储。
11.如权利要求10所述的装置,其特征在于,比对模块还用于根据修改前和/或修改 后版面中的块对应的xml格式文件,得到版面比对结果对应的xml格式文件,版面比对结果 对应的xml格式文件包括标识版面被修改的参数信息和版面修改所涉及的块的坐标位置 fn息;解析模块还用于对版面比对结果对应的xml格式文件进行解析。
12.如权利要求11所述的装置,其特征在于,存储模块还用于存储xml格式的块ID;比对模块还用于以块ID为索引,根据修改前和/或修改后版面中的块对应的xml格式文件,得到版面比对结果对应的xml格式文件。
13.如权利要求12所述的装置,其特征在于,比对模块还用于若修改前和修改后版面 具有相同ID的块,则对修改前和修改后版面中具有相同ID的块对应的xml格式文件进行 比较,若对具有相同ID的块进行了修改或移动操作,则得到包括标识块被修改和/或被移 动的参数信息的xml格式文件;若修改前具有的块ID修改后没有,则根据修改前版面中具有的ID的块对应的xml格 式文件,得到包括标识版面中的块被删除的参数信息的xml格式文件;若修改后具有的块ID修改前没有,则根据修改后版面中具有的ID的块对应的xml格 式文件,得到包括标识版面中有新增的块的参数信息的xml格式文件。
全文摘要
本发明公开了一种版面比对的方法及装置,为了解决采用人工的方式,对不同版本的版面比对效率非常低的问题,本发明公开的方法包括提取修改前和/或修改后版面的版面信息,所述版面信息包括;文件内容信息、块坐标位置信息和版面的图形文件;根据提取的文件内容信息和块坐标位置信息对应的字符串信息,生成版面比对结果对应的字符串信息,根据对版面比对结果对应的字符串信息进行解析,在版面的图形文件上标识出版面修改标记,标识区域由修改所涉及的块的坐标位置确定,正是由于对版面比对结果对应的字符串信息进行解析,在版面的图形文件上标识出版面修改标记,进而提高版面比对效率。
文档编号G06F17/21GK102043762SQ20091023578
公开日2011年5月4日 申请日期2009年10月15日 优先权日2009年10月15日
发明者朱建波, 李少明, 陈志雄 申请人:北京北大方正电子有限公司, 北大方正集团有限公司