计算及调整影像的图文分离功效的方法

文档序号：6563117阅读：190来源：国知局

专利名称：：计算及调整影像的图文分离功效的方法
技术领域：
：本发明涉及一种应用于多功效事务机的影印功效的计算及调整影像的图文分离功效的方法，特别涉及一种能够显示具体图文分离正确率的方法。
背景技术：
：在多功效事务机的影印功效中，一般是先由多功效事务机的扫描模块对原稿进行扫描并将原稿的像素数据储存在缓冲器中，接着再将这些像素数据从缓冲器中取出以便进行一连串的影像处理程序。这些影像处理程序是借由一些影像处理模块来进行，这些模块包含，例如，色域转换(colorspaceconversion,CSC)模块，彩色图文分离(colorphoto/textseparation,colorPTS)模块，彩色背景移除(colorbackgroundremoval,colorBGR)模块，彩色滤波(colorfiltering)模块，色彩管理模块(colormanagementmodule,CMM)以及半色调(halftoning)处理等。被处理完成的影像数据最终是储存在打印机缓冲器以进行后续的打印处理。在上述的影像处理步骤中，图文分离是很重要的过程，因为图文分离的处理结果将影响后续的彩色背景移除，彩色滤波，色彩管理以及半色调等处理。因此，一般的研发及质量管理人员经常要致力于尝试各种图文分离的算法的组合以及设定每种图文分离算法的参数值，期望能够获得较佳的图文分离结果。目前存在有数十种的图文分离算法，且每种图文分离的算法又包含多个参数项目，因此研发人员必须重复使用多种算法及不同的参数值以便确认最佳的图文分离算法的组合及算法的参数值。但熟知的并没有提供图文分离结果的测量工具，无法提升判断图文分离结果的效率。详细来说，目前的图文分离结果的判断是以人工方式进行。也就是说，研发人员必须先将图文分离的结果打印在纸张上，再以肉眼在图文分离的纸张上标示出错误的图文分离的区块，例如应该是图片的部分被识别为文字区块等错误。每张影像需要被检查的区块数量非常多且通常划分的区块尺寸很小，因此使用人工识别不仅费时，还造成人眼的疲惫。此外，由于没有一套客观的测量工具，因此常造成多位判断的人员会产生不同的判断结果，但又无法明确地决定谁的判断结果是正确的，也无法提供一套统一的判断标准让多位研发人员有共同的规则可遵循。因此，需要一种可计算图文分离功效的工具来解决以上的问题。
发明内容本发明的目的在于提供一种计算影像的图文分离功效的方法，用以提升判断图文分离结果的效率。本发明的另一目的在于提供一种调整影像的图文分离功效的方法，用以快速获得最佳的图文分离算法的参数值。本发明提供一种计算影像的图文分离功效的方法，用以显示使用一图文分离算法对一原始影像进行图文分离运算所产生的一图文分离结果的功效，包括步骤(A).产生一标准区块属性文件，包括Al.在一显示器上显示该原始影像；A2.使用该图文分离算法对该原始影像进行图文分离运算；A3.依据该图文分离运算的结果将该原始影像分割为多个区块，且每一区块被标示为文字区块、图像区块或边界区块；A4.改变部分的所述多个区块的标示；以及A5.产生该标准区块属性文件；以及(B).比较该图文分离结果与该标准区块属性文件而显示一图文分离功效数据表。优选地，所述多个区块被标示不同的颜色以显示每一所述区块的属性。优选地，该图文分离功效数据表包括文字区块识别功效数据，图像区块识别功效数据，边界区块识别功效数据以及识别正确率。其中该文字区块识别功效数据包括被正确识别以及错误识别的文字区块数目，该图像区块识别功效数据包括被正确识别以及错误识别的图像区块数目，而该边界区块识别功效数据包括被正确识别以及错误识别的边界区块数目。本发明还提供一种调整影像的图文分离功效的方法，用以调整使用一图文分离算法对一原始影像进行图文分离运算的功效，该方法包括步骤A.使用该图文分离算法的一图文参数值对该原始影像进行图文分离运算而获得一第一图文分离结果；B.比较该第一图文分离结果与一标准区块属性文件而产生一图文分离功效数据表；以及C.依据该图文分离功效数据表判断是否使用另一图文分离算法或参数值对该原始影像进行图文分离运算。优选地，该标准区块属性文件依据下列步骤而得-显示该原始影像；使用该图文分离算法对该原始影像进行图文分离运算；依据该图文分离运算的结果将该原始影像分割为多个区块，且每一区块被标示为文字区块、图像区块或边界区块；改变部分的所述多个区块的标示；以及产生该标准区块属性文件。优选地，所述多个区块被标示不同的颜色以显示每一所述区块的属性。优选地，该图文分离功效数据表包括文字区块识别功效数据，图像区:块识别功效数据，边界区块识别功效数据以及识别正确率。其中，该文字区i央识别功效数据包括被正确识别以及错误识别的文字区块数目，该图像区块i只别功效数据包括被正确识别以及错误识别的图像区块数目，而该边界区块识、别功效数据包括被正确识别以及错误识别的边界区块数目。本发明提供的计算图文分离功效的方法明确地将使用者所认为的正确的图文分离结果储存为一标准区块属性文件，让使用者可以知道每次所使用的图文分离算法及其参数值所产生的正确率。因此让多位使用者可以使用共同的标准来判断图文分离的效果。不同的使用者可以依据其本身的标准产生其它的标准区块属性文件，而最终可以选用其中一个文件作为所有人都认可的标准。相比熟知的以人工在纸张上逐一标记来检测图文分离功效的方式，本发明的方法提供了评估图文分离结果的功效的具体评估标准，大幅提升试验图文分离算法及参数值设定的效率。图1为使用本发明方法显示一原始影像于显示器上的示意图。图2为经图文分离处理所产生的被分割为多个区块以及被标示区块属性的图文分离结果。图3为使用者改变图2的部分区块的属性的示意图。图4为标准区块属性文件的一实施例的部分示意图。图5为使用另一图文分离算法或参数值所产生的图文分离结果以及一图文分离功效数据表。图6为本发明方法的流程示意图。其中，附图标记说明如下-A、区域100、显示器200、原始影像200A、200C、图文分离运算产生的影像201、2021、2022、区块201B、边界区块201P、图像区块201T、文字区块300、图文分离功效数据表601611、步骤具体实施例方式本发明计算影像的图文分离功效的方法可用一计算机程序来实施，借由执行该程序来完成本发明的步骤。请参阅图1至图4,其表示使用该程序所产生的输出影像。本发明的步骤包括(A).产生一标准区块属性文件以下说明产生此标准区块属性文件的步骤如图1所示，将被执行图文分离的原始影像200显示于显示器100。如图2所示，使用预设的图文分离算法以及图文分离算法的参数值对原始影像200进行图文分离运算。请再参阅图2，经过图文分离运算所产生的影像200A被显示在屏幕上。影像200A被分割为多个大小相同的区块201。这些区块201根据不同的属性而被标示为文字区块201T,图像区块201P以及边界区块201B。在实际的操作中，不同属性的区块被标示为不同的颜色，例如，文字区块被标示为红色，图像区块被标示为黑色，而边界区块被标示为蓝色。由于本发明的附图不能显示各种颜色，因此在图2中我们以不同的线条样式来标示三种属性的区块。又为了简化图面，我们仅以区域A内的区块来做例示说明，在实际的情况中，整张影像的区块都被标示了相对应的属性标记。在区域A中包含了被标示垂直实线的区块201P，很明显地，区块201P代表的是被预设的图文分离算法及参数值所识别出的图像区块。同样地，被以水平方向虚线标示的区块201T则代表该区块被识别为文字区块。而以斜线标示的区块201B则代表边界区块。也就是说，图像区块表示区块内的影像被判定为图像，而文字区块表示区块内的影像被判定为文字，同时边界区块则代表区块内的影像被判定为包含了文字与图像两者都具有的边界影像。接着请参照图3。在屏幕100上我们可以明显地看见哪些区块的属性是不恰当的。例如区块2021原本被标示为边界区块(斜线)，但使用者认为此区块应被定义为图像区块，因此使用者可以在此区块上标示一个X记号。此X记号的颜色和前述预设的区块属性的颜色相同。例如要将一区块更改为图像区块时可以将该区块标示上黑色的X。要将一区块更改为文字区块时可以将该区块标示上红色的X，而要将一区块更改为边界区块时可以将该区块标示上蓝色的X。在图3中，使用者更改了区块2021及2022的属性。其中，区块2021原本被判定为边界区块，但使用者认为此区块大部分包含图像，因此将其更改为图像区块。而区块2022原本被识别为文字区块，但使用者观看此区块时发现区块内仅有1/3的部分是文字，区块内其它的部分并没有文字或图像，因此将此区块更改为边界区块。要说明的是，这些区块属性的更改是依据使用者个人的标准而完成。当使用者已完成区块属性的调整后，便可以下达产生一个标准区块属性文件的指令。由上述内容可以理解，此标准区块属性文件所代表的是被使用者调整过的结果，也就是以肉眼明确调整的较符合原始影像的识别结果。此标准区块属性文件格式可以是，例如一个.txt文件。请参阅图4，其为标准区块属性文件的一实施例图。图4中的文件为一个文字文件(.txt)，其中P代表图像区块，T代表文字区块，而B代表边界区块。请参阅图5，在图5中使用者使用了另一种图文分离算法或是另一组图文分离参数值来对同一原始影像进行图文分离运算，并获得了图文分离的结果200C。接着使用者可以下达一个指令，让程序可以将此图文分离的结果与上述的标准区块属性文件进行比较，而获得一个图文分离功效数据表300。下表是一个图文分离功效数据表300的实施例。<table>tableseeoriginaldocumentpage9</column></row><table>DiagonalTotal:91.3%=7335/8034在表中的Reference的字段代表标准属性区块文件的判定结果，而Computed字段则代表使用图文分离算法所产生的结果。另外，TEXT表示文字区块，BORD表示边界区块，而PICT表示图像区块。由表中可得知，整个影像被划分为8034个区块，其中和标准属性区块文件的识别结果相符合的区块有7335(3518+686+3131)个，也就是识别正确率是91.3%(43.8%+8.5%+39%)。再详细地说，在标准区块属性文件中共包含3935个文字区块(3518+143+274),而在图文分离结果中与标准区块属性文件相符合的文字区块数量为3518,占总区块的43.8%，也就是文字区块识别的功效为43.8%，而原本应为文字区块却被判断为边界区块的数量为143，占总区块的1.8%，而被当成图像的则有274个区块，占总区块的3.4%。而在边界区块文件的判断中，标准区块属性文件共判断出929个边界区块(41+686+202)，而在图文分离结果中与标准区块属性文件相符合的边界区块数量是686，占总区块数量的8.5%，而原本应为边界区块但却被判断成文字区块的数量为41，占总区块数量的0.5%，而被当成图像区块的数量则有202个区块，占总区块数量的2.5%。此外，在标准区块属性文件中共有3170个图像区块(1+38+3131)，而在图文分离结果中与标准区块属性文件相符合的图像区块共有3131个区块，占总区块数量比例为39.0%,而原本应为图像区块但在图文分离判断中却被当成文字区块的有1个区块，占总区块数量的0.03%，而被当成边界区块的则有38个区块，占总区块数量的0.5%。图文分离功效数据表300明确地显示了使用者所选用的图文分离算法及所设定的参数值和标准区块属性文件的识别结果的差异度。如果使用者对于识别正确率的数值不满意，则可以再使用另一组图文分离算法或参数值进行图文分离的运算，直到获得一个可接受的识别正确率为止，例如大于95%的正确率。请再参阅图6，其为本发明计算影像的图文分离功效的方法的流程图。其中步骤601:本方法开始。步骤602:显示原始影像。步骤603:使用一图文分离方法及其参数值对原始影像进行图文分离处理而产生一图文分离结果。步骤604:将该图文分离结果划分为多个区块，并依据每一区块的属性(文字、边界或图像)对该区块进行标示。步骤605:借由在区块上标示X符号以改变某些区块的属性。步骤606:产生一个标准区块属性表。步骤607:使用另一个图文分离算法及参数值对原始影像进行图文分离处理。步骤608:产生并显示一个图文分离功效数据表。步骤609:图文分离功效数据表所显示的识别正确率是否可接受？步骤610:所产生的识别正确率是可接受的话，则流程结束。步骤611:所产生的识别正确率是不可接受的，则回到步骤607以便使用另一组图文分离算法或参数值进行图文分离处理并产生另一图文分离功效数据表。通过以上描述可以理解，本发明提供的计算图文分离功效的方法明确地将使用者所认为的正确的图文分离结果储存为一标准区块属性文件，让使用者可以知道每次所使用的图文分离算法及其参数值所产生的正确率。因此让多位使用者可以使用共同的标准来判断图文分离的效果。不同的使用者可以依据其本身的标准产生其它的标准区块属性文件，而最终可以选用其中一个文件作为所有人都认可的标准。相比熟知的以人工在纸张上逐一标记来检测图文分离功效的方式，本发明的方法提供了评估图文分离结果的功效的具体评估标准，大幅提升试验图文分离算法及参数值设定的效率。本领域技术人员可以在本发明技术范围内进行修改，但都不会超出本发明的范围。权利要求1.一种计算影像的图文分离功效的方法，用以显示使用一图文分离算法对一原始影像进行图文分离运算所产生的一图文分离结果的功效，包括步骤(A).产生一标准区块属性文件，包括A1.在一显示器上显示该原始影像；A2.使用该图文分离算法对该原始影像进行图文分离运算；A3.依据该图文分离运算的结果将该原始影像分割为多个区块，且每一区块被标示为文字区块、图像区块或边界区块；A4.改变部分的所述多个区块的标示；以及A5.产生该标准区块属性文件；以及(B).比较该图文分离结果与该标准区块属性文件而显示一图文分离功效数据表。2.如权利要求1所述的计算影像的图文分离功效的方法，其中所述多个区块被标示不同的颜色以显示每一所述区块的属性。3.如权利要求1所述的计算影像的图文分离功效的方法，其中该图文分离功效数据表包括文字区块识别功效数据，图像区块识别功效数据，边界区块识别功效数据以及识别正确率。4.如权利要求3所述的计算影像的图文分离功效的方法，其中该文字区块识别功效数据包括被正确识别以及错误识别的文字区块数百；该图像区块识别功效数据包括正确识别以及错误识别的图像区块数目；以及该边界区块识别功效数据包括被正确识别以及错误识别的边界区块数目。5.—种调整影像的图文分离功效的方法，用以调整使用一图文分离算法对一原始影像进行图文分离运算的功效，该方法包括步骤A.使用该图文分离算法的一图文参数值对该原始影像进行图文分离运算而获得一第一图文分离结果；B.比较该第一图文分离结果与一标准区块属性文件而产生一图文分离功效数据表；以及C.依据该图文分离功效数据表判断是否使用另一图文分离算法或参数值对该原始影像进行图文分离运算。6.如权利要求5所述的调整影像的图文分离功效的方法，其中该标准区块属性文件依据下列步骤而得显示该原始影像；使用该图文分离算法对该原始影像进行图文分离运算；依据该图文分离运算的结果将该原始影像分割为多个区块，且每一区块被禾示示为文字区块、图像区块或边界区块；改变部分的所述多个区块的标示；以及产生该标准区块属性文件。7.如权利要求6所述的调整影像的图文分离功效的方法，其中所述多个区i夫被标示不同的颜色以显示每一所述区块的属性。8.如权利要求5所述的调整影像的图文分离功效的方法，其中该图文分离I力效数据表包括文字区块识别功效数据，图像区块识别功效数据，边界区土央识别功效数据以及识别正确率。9.如权利要求8所述的调整影像的图文分离功效的方法，其中该文字区块识别功效数据包括被正确识别以及错误识别的文字区块数目；该图像区块识别功效数据包括被正确识别以及错误识别的图像区块数目；以及该边界区块识别功效数据包括被正确识别以及错误识别的边界区块数目。全文摘要本发明涉及一种计算及调整影像的图文分离功效的方法。在计算影像图文分离功效的方法中，包括一产生一标准区块属性文件的步骤，以及一比较一图文分离结果与该标准区块属性文件而显示一图文分离功效数据表的步骤。在本发明的调整影像的图文分离功效的方法中，包括一比较一图文分离结果与该标准区块属性文件而产生该图文分离功效数据表的步骤，以及依据该图文分离功效数据表判断是否使用另一图文分离算法或参数值进行另一次图文分离运算的步骤。文档编号G06K9/00GK101169825SQ20061014983公开日2008年4月30日申请日期2006年10月25日优先权日2006年10月25日发明者黄俊嘉申请人:致伸科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄俊嘉
技术所有人：致伸科技股份有限公司
我是此专利的发明人

上一篇：物流管理方法及物流管理系统的制作方法
上一篇：记忆卡结构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。