一种文本图像的结构化处理方法及装置与流程

文档序号:29072863发布日期:2022-03-01 21:52阅读:165来源:国知局
一种文本图像的结构化处理方法及装置与流程

1.本发明属于图像识别技术领域,特别是涉及一种文本图像的结构化处理方法、装置、计算机设备及计算机可读存储介质。


背景技术:

2.医疗影像领域中,对于发票图像的光学字符识别(ocr,optical character recognitio)项目,主要目的是利用对图像的文字识别内容以及文字坐标信息,对医疗发票的项目名称明细字段进行格式化标准输出。
3.现有技术中,客户会上传多张医疗发票,医疗发票上涵盖的文字信息众多,理赔作业人员进行理赔作业时需要将费用清单上的所有关于医疗的项目名称及其对应的属性项进行全量的精准的录入。。
4.但是,目前的方案中,由于医疗发票的版面相对复杂,项目名称字符过长时会导致多行打印,导致很难做到数据的标准结构化输出,另外,目前方案的人工参与度较高,导致人力成本居高不下。


技术实现要素:

5.有鉴于此,本发明提供一种文本图像的结构化处理方法、装置、计算机设备及计算机可读存储介质,在一定程度上解决了目前方案中项目名称字符过长时会导致多行打印,导致很难做到数据的标准结构化输出,且目前方案的人工参与度较高,导致人力成本居高不下的问题。
6.依据本发明的第一方面,提供了一种文本图像的结构化处理方法,包括:
7.确定文本图像中的文本框,以及所有文本框中的项目文本框;
8.确定所有文本框中的表头文本框,以及属性名称文本框;
9.根据所述表头文本框、所述项目文本框和所述属性名称文本框之间的方位关系,从所有文本框中确定分别与所述项目文本框和所述属性名称文本框对应的属性值文本框,以及确定所有项目文本框中的多行打印项目文本框;
10.在根据所述项目文本框、所述属性名称文本框、所述属性值文本框的对应关系,建立所述文本图像的结构化关系时,将所述多行打印项目文本框与相邻行的文本框进行合并。
11.依据本发明的第二方面,提供了一种文本图像的结构化处理装置,该装置可以包括:
12.识别模块,用于确定文本图像中的文本框,以及所有文本框中的项目文本框;
13.第一确定模块,用于确定所有文本框中的表头文本框,以及属性名称文本框;
14.第二确定模块,用于根据所述表头文本框、所述项目文本框和所述属性名称文本框之间的方位关系,从所有文本框中确定分别与所述项目文本框和所述属性名称文本框对应的属性值文本框,以及确定所有项目文本框中的多行打印项目文本框;
15.合并模块,用于在根据所述项目文本框、所述属性名称文本框、所述属性值文本框的对应关系,建立所述文本图像的结构化关系时,将所述多行打印项目文本框与相邻行的文本框进行合并。
16.第三方面,本发明实施例提供了一种计算机设备,所述计算机设备包括:
17.存储器,用于存储程序指令;
18.处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如第一方面所述的文本图像的结构化处理方法包括的步骤。
19.第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的文本图像的结构化处理方法的步骤。
20.针对在先技术,本发明具备如下优点:
21.本发明提供的一种文本图像的结构化处理方法,包括:可以针对文本图像的初步ocr识别结果中的表头文本框、项目文本框和属性名称文本框之间的方位关系,在确定项目文本框、属性名称文本框、属性值文本框的结构化对应关系并输出的同时,进一步通过上述方位关系,确定所有项目文本框中的多行打印项目文本框并进行合并,从而解决了文本图像的结构化输出中的多行打印问题,提高了文本图像的结构化输出的质量,另外,整个过程可以通过机器算法自动的实现,降低了人工参与程度,从而降低了人力成本。
22.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
23.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
24.图1是本发明实施例提供的一种文本图像的结构化处理方法的步骤流程图;
25.图2是本发明实施例提供的一种文本图像;
26.图3是本发明实施例提供的另一种文本图像的结构化处理方法的步骤流程图;
27.图4是本发明实施例提供的一种文本图像的局部区域示意图;
28.图5是本发明实施例提供的一种文本图像的结构化处理装置的框图。
具体实施方式
29.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
30.图1是本发明实施例提供的一种文本图像的结构化处理方法的步骤流程图,如图1所示,该方法可以包括:
31.步骤101、确定文本图像中的文本框,以及所有文本框中的项目文本框。
32.在本发明实施例中,文本图像可以为包含有文本内容的图像,如客户上传的医疗发票图像、扫描得到的证件图像等。
33.在实际应用中,文本图像中的文本内容具有对应的结构化格式,具体的,文本图像中的文本内容存在于各自对应的文本框中,文本框的位置受到结构化格式的限制,如,文本图像中存在用于表征项目名称的项目文本框、用于表征项目名称的属性值的属性值文本框等,不同类型的文本框所处的位置不同,且文本框之间也存在一定的位置约束,如,行列关系,项目文本框对应的属性值文本框,要处于与该项目文本框横向相邻的区域中,这些都是对文本图像的结构化处理过程中需要考虑到的。
34.进一步的,文本图像中除了针对特定领域(如医疗项目)的文本框之外,还存在其他内容相关的文本框,如,医疗发票中还存在一些其他信息对应的文本框,如收款单位、复核人、收款人之类的文本框,在本发明实施例的文本图像结构化处理过程中,需要识别出针对特定领域的文本框,并将这些文本框确定为项目文本框,项目文本框用于表征特定领域下的项目内容,识别项目文本框可以通过对文本框中的文本内容进行识别分类实现。
35.步骤102、确定所有文本框中的表头文本框,以及属性名称文本框。
36.在本发明实施例的文本图像结构化处理过程中,较为重要的文本框还有表头文本框,以及属性名称文本框,参照图2,其示出了本发明实施例提供的一种文本图像,其中识别得到了多个文本框10,表头文本框11用于表征处于表头位置的项目信息,如,表头文本框11的内容可以为“项目名称”,步骤101识别得到的多个项目文本框12用于表征具体的项目内容,其包含的内容可以包括:“治疗费”、“以下是清单项【国基】利动(乳果糖口服溶液)”、“非比麸(小麦纤维素颗粒)”、“粘膜抗感染治疗4(活性银离子抗菌液(银尔通))”等,项目文本框12可以作为表头文本框11的下属文本框,纵向排列在与该表头文本框11纵向相邻的区域中。属性名称文本框13用于表征属性名称,其包含的内容为:“数量/单位”、“金额(元)”等。
37.进一步的,表头文本框以及属性名称文本框可以通过预设的关键字匹配得到,如,通过关键字“项目名称”,可以匹配到表头文本框,通过关键字“数量”、“金额”,可以匹配到属性名称文本框。
38.步骤103、根据所述表头文本框、所述项目文本框和所述属性名称文本框之间的方位关系,从所有文本框中确定分别与所述项目文本框和所述属性名称文本框对应的属性值文本框,以及确定所有项目文本框中的多行打印项目文本框。
39.具体的,参照图2,由于目前ocr识别的问题,使得项目文本框12存在多行打印的问题,即一个完整的项目文本框12被错误的识别为多个多行打印项目文本框121,如,一个完整的项目文本框12:“以下是清单项【国基】利动(乳果糖口服溶液)”,被错误的识别为多个多行打印项目文本框121,包括:“以下是清单项”、“液)”。这种错误的识别大大影响了文本图像的结构化输出的精度。
40.在本发明实施例中,可以具体通过表头文本框、项目文本框和属性名称文本框之间的方位关系,在实现文本图像的结构化输出的基础上,进一步解决项目文本框中存在的多行打印项目文本框的问题。其中,文本图像的结构化输出的基础是确定与项目文本框对应的属性值文本框,属性值文本框用于表征项目文本框针对某一属性名称的具体属性值,如,项目文本框可以为治疗费,则针对金额属性名称,治疗费项目文本框对应的属性值文本框的内容可以为一个金额,如60。
41.参照图2,可以看出,项目文本框12和对应的属性值文本框14之间存在以横向行的方式排列的方位特性;项目文本框12和表头文本框11之间存在以纵向列的方式排列的方位特性,表头文本框11与属性名称文本框13之间存在以横向行的方式排列的方位特性,且表头文本框11处于端部的表头位置,属性名称文本框13和属性值文本框14之间存在以纵向列的方式排列的方位特性,则根据这些方位关系,可以首先以项目文本框12为起点,设置横向的直线21(直线21的斜率由文本图像中文本文件的斜率计算得到),使得与横向的直线21重叠的文本框10被确定为该项目文本框12对应的属性值文本框14,通过上述方式遍历所有项目文本框12,并依次确定每个项目文本框12对应的属性值文本框14,即可得到文本图像的初步结构化输出。
42.另外,由于属性名称文本框13和属性值文本框14之间存在以纵向列的方式排列的方位特性,则可以针对属性名称文本框13做出向下的纵向的直线22(直线22的斜率由文本图像中文本文件的斜率计算得到),使得直线22所框选出的文本框可以作为该属性名称文本框13下的属性值文本框14。
43.进一步的,参照图2,可以看出,以多行打印项目文本框121为起点设置的横向的直线23,与任何属性值文本框14都不重叠,因此可以根据这种方位关系,确定出所有项目文本框12中的多行打印项目文本框121。
44.步骤104、在根据所述项目文本框、所述属性名称文本框、所述属性值文本框的对应关系,建立所述文本图像的结构化关系时,将所述多行打印项目文本框与相邻行的文本框进行合并。
45.在本发明实施例中,对文本图像进行了ocr识别并确定了项目文本框、属性名称文本框、属性值文本框的结构化对应关系后,可以将多行打印项目文本框与上下相邻行的文本框进行合并,从而解决了结构化输出中的多行打印问题,提高了结构化输出的质量。
46.例如,参照图2,可以将被错误的识别的多个多行打印项目文本框121:“以下是清单项”、“液)”与上下相邻的文本框“【国基】利动(乳果糖口服溶”进行合并,得到正确完整的项目文本框:“以下是清单项【国基】利动(乳果糖口服溶液)”,
47.综上所述,本发明实施例提供的一种文本图像的结构化处理方法,可以针对文本图像的初步ocr识别结果中的表头文本框、项目文本框和属性名称文本框之间的方位关系,在确定项目文本框、属性名称文本框、属性值文本框的结构化对应关系并输出的同时,进一步提供上述方位关系,确定所有项目文本框中的多行打印项目文本框并进行合并,从而解决了文本图像的结构化输出中的多行打印问题,提高了文本图像的结构化输出的质量,另外,整个过程可以通过机器算法自动的实现,降低了人工参与程度,从而降低了人力成本。
48.图3是本发明实施例提供的另一种文本图像的结构化处理方法的步骤流程图,如图3所示,该方法可以包括:
49.步骤201、确定所述文本图像中的文本框,以及所述文本框所包含的文本内容。
50.在本发明实施例中,可以通过文本框检测模型对文本图像中的文本框进行检测,然后输出一个文本框的集合box_set,集合中每个文本框包含8个数据为[x0,y0,x1,y1,x2,y2,x3,y3],分别表示该文本框左上、右上、左下和右下的4个顶点坐标。
[0051]
步骤202、将所述文本框的文本内容输入文本分类模型,得到类型为项目名称的项目文本内容,以及确定所述项目文本内容对应的项目文本框。
[0052]
在该步骤中,识别出文本框之后,可以将文本框所处区域进一步输入项目名称文本分类模型,项目名称文本分类模型可以首先识别文本框中的文本内容,得到文本内容集合info_set,进而再对文本内容进行语义分类,得到分类结果为项目名称的项目文本内容的集合pro_info_set,最后可以将项目文本内容对应的文本框确定为项目文本框,得到项目文本框集合pro_box_set。
[0053]
步骤203、通过预设的关键字与所述文本框的文本内容进行匹配,确定所述表头文本框,以及所述属性名称文本框。
[0054]
该步骤中,具体可以通过预设的表头关键字与文本框的文本内容进行匹配,确定表头文本框,以及通过预设的属性名称关键字与文本框的文本内容进行匹配,确定表头文本框。
[0055]
例如,参照图2,通过关键字“项目名称”,可以匹配到表头文本框11,通过关键字“数量”、“金额”,可以匹配到属性名称文本框13。
[0056]
步骤204、根据所述表头文本框、所述项目文本框和所述属性名称文本框之间的方位关系,从所有文本框中确定分别与所述项目文本框和所述属性名称文本框对应的属性值文本框,以及确定所有项目文本框中的多行打印项目文本框。
[0057]
该步骤具体可以参照上述步骤103,此处不再赘述。
[0058]
可选的,为了确定与属性名称文本框对应的属性值文本框,步骤204具体可以包括:
[0059]
子步骤2041、根据由所述表头文本框到所述属性名称文本框所构成的第一直线的水平斜率,确定纵向斜率。
[0060]
可选的,所述第一直线为:由所述表头文本框的中心点到所述属性名称文本框的中心点所构成的直线。
[0061]
在本发明实施例中,为了确定与属性名称文本框对应的属性值文本框,参照图4,其示出了本发明实施例提供的一种文本图像的局部区域示意图,可以首先由表头文本框的中心点到属性名称文本框的中心点构成第一直线31,第一直线31即反映了整个文本图像中文本文件的水平方向上的水平斜率k,进一步通过水平斜率k,可以求得文本文件的纵向方向上的纵向斜率k’,k’=-1/k。
[0062]
具体的,根据文本框的集合box_set中每个文本框包含8个顶点坐标数据[x0,y0,x1,y1,x2,y2,x3,y3],可以求表头文本框的中心点和属性名称文本框的中心点,中心点x,y轴坐标具体计算如下:
[0063]
x
center
=(x0+x1+x2+x3)/4
[0064]ycenter
=(y0+y1+y2+y3)/4
[0065]
计算结果包括表头文本框的中心点坐标(x
cc
,y
cc
),以及属性名称文本框的中心点坐标(x
pc
,y
pc

[0066]
第一直线31的计算方式如下:
[0067]
(y-y
pc
)(x
cc-x
pc
)-(x-x
pc
)(y
cc-y
pc
)=0;
[0068]
水平斜率k的计算方式如下:
[0069]
纵向斜率k’的计算方式如下:
[0070]
子步骤2042、根据所述纵向斜率,在所述属性名称文本框的两侧分别设置纵向的第二直线。
[0071]
在该步骤中,参照图4,由于属性名称文本框13和属性值文本框14之间存在以纵向列的方式排列的方位特性,则可以可以取属性名称文本框13的两侧边界点分别为(x3,y3),(x2,y2),并从边界点位置针对属性名称文本框13分别做出两条向下的纵向的第二直线32,第二直线32的斜率为纵向斜率k’。
[0072]
子步骤2043、将与所述第二直线重叠的项目框,确定为所述属性名称文本框对应的属性值文本框。
[0073]
在该步骤中,参照图4,根据属性名称文本框13和属性值文本框14之间存在以纵向列的方式排列的约束关系,可以将第二直线32所框选出的文本框作为该属性名称文本框13下的属性值文本框14。属性值文本框14用于表征项目文本框12针对某一属性名称的具体属性值。
[0074]
具体的,针对每一个文本框,可以通过如下方式判断第二直线是否与文本框重叠:
[0075]
a、计算两条直线交点的方程为:
[0076][0077]
其中,h(x)、f(x)代表两条直线的方程式,可通过求解二元一次方程组解得交点(x,y)。
[0078]
b、计算文本框底边的直线方程:
[0079]
(y-y0)(x
1-x0)-(x-x0)(y
1-y0)=0;
[0080]
c、分别通过a的计算结果和文本框底边的直线方程,计算文本框底边与第二直线的交点(x
tl
,y
tl
),x
tr
,y
tr
);
[0081]
d、根据以下判定条件判定文本框是否为处于属性名称文本框下的属性值文本框:
[0082]
若满足x3<x
tr
<x2,则文本框为处于属性名称文本框下的属性值文本框;
[0083]
若满足x3<x
lr
<x2,则文本框为处于属性名称文本框下的属性值文本框;
[0084]
若满足则文本框为处于属性名称文本框下的属性值文本框。
[0085]
可选的,为了确定项目文本框中的多行打印项目文本框,步骤204具体还可以包括:
[0086]
子步骤2044、根据所述水平斜率,以所述项目文本框为起点构建水平的第三直线。
[0087]
在该步骤中,参照图4,为了确定项目文本框12中的多行打印项目文本框121,可以根据水平斜率,以项目文本框12为起点构建水平的第三直线33。第三直线33的起点具体可以为项目文本框12的中心点。
[0088]
子步骤2045、在所述第三直线与所述属性值文本框不重叠的情况下,确定所述第三直线对应的项目文本框为所述多行打印项目文本框。
[0089]
参照图4,可以看出,以多行打印项目文本框121为起点设置的横向的第三直线33,与任何属性值文本框14都不重叠,因此可以根据这种方位关系,确定出所有项目文本框12中的多行打印项目文本框121。
[0090]
如吗,针对正确完整的项目文本框:“以下是清单项【国基】利动(乳果糖口服溶液)”,通过上述方式可以识别到多行打印项目文本框121:“以下是清单项”、“液)”。
[0091]
可选的,为了确定与项目文本框对应的属性值文本框,步骤204具体还可以包括:
[0092]
子步骤2046、将与所述第三直线重叠的属性值文本框,确定为所述第三直线对应的项目文本框所对应的属性值文本框。
[0093]
进一步参照图4,由于项目文本框12和对应的属性值文本框14之间存在以横向行的方式排列的方位特性,则可以首先以项目文本框12为起点,设置横向的第三直线33,使得与横向的第三直线33重叠的文本框10被确定为该项目文本框12对应的属性值文本框14,通过上述方式遍历所有项目文本框12,并依次确定每个项目文本框12对应的属性值文本框14,即可得到文本图像的初步结构化输出。最后结合子步骤2041至2045的结构化输出,可以得到文本图像的完整结构化输出。
[0094]
步骤205、在根据所述项目文本框、所述属性名称文本框、所述属性值文本框的对应关系,建立所述文本图像的结构化关系时,将所述多行打印项目文本框与相邻行的文本框进行合并。
[0095]
该步骤具体可以参照上述步骤104,此处不再赘述。
[0096]
综上所述,本发明实施例提供的一种文本图像的结构化处理方法,可以针对文本图像的初步ocr识别结果中的表头文本框、项目文本框和属性名称文本框之间的方位关系,在确定项目文本框、属性名称文本框、属性值文本框的结构化对应关系并输出的同时,进一步提供上述方位关系,确定所有项目文本框中的多行打印项目文本框并进行合并,从而解决了文本图像的结构化输出中的多行打印问题,提高了文本图像的结构化输出的质量,另外,整个过程可以通过机器算法自动的实现,降低了人工参与程度,从而降低了人力成本。
[0097]
图5是本发明实施例提供的一种文本图像的结构化处理装置的框图,如图5所示,该装置可以包括:
[0098]
识别模块301,用于确定文本图像中的文本框,以及所有文本框中的项目文本框;
[0099]
第一确定模块302,用于确定所有文本框中的表头文本框,以及属性名称文本框;
[0100]
第二确定模块303,用于根据所述表头文本框、所述项目文本框和所述属性名称文本框之间的方位关系,从所有文本框中确定分别与所述项目文本框和所述属性名称文本框对应的属性值文本框,以及确定所有项目文本框中的多行打印项目文本框;
[0101]
合并模块304,用于在根据所述项目文本框、所述属性名称文本框、所述属性值文本框的对应关系,建立所述文本图像的结构化关系时,将所述多行打印项目文本框与相邻行的文本框进行合并。
[0102]
可选的,所述识别模块301,包括:
[0103]
第一确定子模块,用于确定所述文本图像中的文本框,以及所述文本框所包含的文本内容;
[0104]
分类子模块,用于将所述文本框的文本内容输入文本分类模型,得到类型为项目名称的项目文本内容,以及确定所述项目文本内容对应的项目文本框。
[0105]
可选的,所述第一确定模块302,包括:
[0106]
第二确定子模块,用于通过预设的关键字与所述文本框的文本内容进行匹配,确定所述表头文本框,以及所述属性名称文本框。
[0107]
可选的,所述第二确定模块303,包括:
[0108]
第三确定子模块,用于根据由所述表头文本框到所述属性名称文本框所构成的第一直线的水平斜率,确定纵向斜率;
[0109]
第四确定子模块,用于根据所述纵向斜率,在所述属性名称文本框的两侧分别设置纵向的第二直线;
[0110]
第五确定子模块,用于将与所述第二直线重叠的项目框,确定为所述属性名称文本框对应的属性值文本框。
[0111]
可选的,所述第一确定模块302,,包括:
[0112]
第六确定子模块,用于根据所述水平斜率,以所述项目文本框为起点构建水平的第三直线;
[0113]
第七确定子模块,用于在所述第三直线与所述属性值文本框不重叠的情况下,确定所述第三直线对应的项目文本框为所述多行打印项目文本框。
[0114]
可选的,所述第二确定模块303,包括:
[0115]
第八确定子模块,用于将与所述第三直线重叠的属性值文本框,确定为所述第三直线对应的项目文本框所对应的属性值文本框。
[0116]
可选的,所述第一直线为:由所述表头文本框的中心点到所述属性名称文本框的中心点所构成的直线。
[0117]
综上所述,本发明实施例提供的一种文本图像的结构化处理装置,可以针对文本图像的初步ocr识别结果中的表头文本框、项目文本框和属性名称文本框之间的方位关系,在确定项目文本框、属性名称文本框、属性值文本框的结构化对应关系并输出的同时,进一步提供上述方位关系,确定所有项目文本框中的多行打印项目文本框并进行合并,从而解决了文本图像的结构化输出中的多行打印问题,提高了文本图像的结构化输出的质量,另外,整个过程可以通过机器算法自动的实现,降低了人工参与程度,从而降低了人力成本。
[0118]
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0119]
优选的,本发明实施例还提供一种计算机设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述文本图像的结构化处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0120]
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述文本图像的结构化处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0121]
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0122]
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
[0123]
在此提供的文本图像的结构化处理方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0124]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0125]
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
[0126]
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0127]
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0128]
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的文本图像的结构化处理方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0129]
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领
域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1