表格数据的提取方法、装置、电子设备及存储介质与流程

文档序号:29795311发布日期:2022-04-23 18:41阅读:140来源:国知局
表格数据的提取方法、装置、电子设备及存储介质与流程

1.本技术属于数据处理领域,具体涉及一种表格数据的提取方法、装置、电子设备及存储介质。


背景技术:

2.用户浏览文档图像时,该文档图像上会包含表格、文本或图片等多项内容,一些情况下,用户只关心该文档图像中的部分内容,如用户只关心该文档图像中的表格数据。因此,为了便于用户快速了解该文档图像中的表格数据,需要从该文档图像中提取出该表格数据。
3.在一些场景下,通过排除规则对该文档图像中不是表格的一些线条进行排除以筛选出表格并提取表格数据,但是通常通过线条的长度或宽度又或者是面积,但是排除规则的通用性并不是很好,因为不同文档图像中的表格大小都各不相同,根据线条的长度或宽度或面积很难适用不同大小的表格,因此排除规则在某一个文档图像上表现很好,但是在另一个文档图像上可能并不适用于该排除规则,表格数据的提取难度较大,准确度较低。


技术实现要素:

4.本技术实施例提供一种表格数据的提取方法、装置、电子设备以及存储介质,能够解决相关技术中在需要提取表格中的数据时,表格数据的提取难度较大,准确度较低的问题。
5.第一方面,本技术实施例提供了一种表格数据的提取方法,包括:响应于用户的第一输入,获取文档图像;选取所述文档图像中的第一水平线条和第一垂直线条,对所述第一水平线条和所述第一垂直线条进行按位与运算得到多个第一交点,对所述第一水平线条和所述第一垂直线条进行按位或运算,得到至少一个备选表格轮廓;基于所述第一交点从所述备选表格轮廓中选取目标表格轮廓,获取所述目标表格轮廓在所述文档图像中的位置信息,所述目标表格轮廓上有多个所述第一交点;根据所述位置信息,确定所述文档图像的表格区域,从所述表格区域中提取至少一个单元格的数据。
6.第二方面,本技术实施例提供了一种表格数据的提取装置,包括:获取模块,用于响应于用户的第一输入,获取文档图像;第一选取模块,用于选取所述文档图像中的第一水平线条和第一垂直线条,对所述第一水平线条和所述第一垂直线条进行按位与运算得到多个第一交点,对所述第一水平线条和所述第一垂直线条进行按位或运算,得到至少一个备选表格轮廓;第二选取模块,用于基于所述第一交点从所述备选表格轮廓中选取目标表格轮廓,获取所述目标表格轮廓在所述文档图像中的位置信息,所述目标表格轮廓上有多个所述第一交点;确定模块,用于根据所述位置信息,确定所述文档图像的表格区域,从所述表格区域中提取至少一个单元格的数据。
7.第三方面,本技术实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理
器执行时实现如第一方面所述的方法的步骤。
8.第四方面,本技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
9.第五方面,本技术实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
10.在本技术实施例中,通过响应于用户的第一输入,获取文档图像,选取所述文档图像中的第一水平线条和第一垂直线条,对所述第一水平线条和所述第一垂直线条进行按位与运算得到多个第一交点,对所述第一水平线条和所述第一垂直线条进行按位或运算,得到至少一个备选表格轮廓,基于所述第一交点从所述备选表格轮廓中选取目标表格轮廓,获取所述目标表格轮廓在所述文档图像中的位置信息,所述目标表格轮廓上有多个所述第一交点,根据所述位置信息,确定所述文档图像的表格区域,从所述表格区域中提取至少一个单元格的数据,能够针对不同的文档图像,从备选表格轮廓中选取出满足于该文档图像所需的目标表格轮廓,以此确定表格区域和从表格区域中提取单元格的数据,能够较为容易的提取出表格数据,且提高了提取出的表格数据的准确度。
附图说明
11.图1是本技术实施例提供的一种表格数据的提取方法的第一种流程示意图;
12.图2是本技术实施例提供的一种表格数据的提取方法的第二种流程示意图;
13.图3是本技术实施例提供的一种第一水平线条的二值化图;
14.图4是本技术实施例提供的一种第一垂直线条的二值化图;
15.图5是本技术实施例提供的一种表格数据的提取方法的第二种流程示意图;
16.图6是本技术实施例提供的一种第一交点的二值化图;
17.图7是本技术实施例提供的一种参考表格轮廓的示意图;
18.图8是本技术实施例提供的一种表格数据的提取方法的第三种流程示意图;
19.图9是本技术实施例提供的一种二值化线段图;
20.图10是本技术实施例提供的一种第二交点的二值化图;
21.图11是本技术实施例提供的一种横竖线相交的二值化图;
22.图12是本技术实施例提供的一种表格数据的提取装置的结构示意图;
23.图13是本技术实施例的电子设备的结构示意图。
具体实施方式
24.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
25.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
26.在一些场景下,通过排除规则对该文档图像中不是表格的一些线条进行排除以筛选出表格并提取表格数据,但是排除规则通常通过线条的长度或宽度又或者是面积,排除规则的通用性并不是很好,因为不同文档图像中的表格大小都各不相同,对于很多行列合并的表格,某些行或列的线条可能会很长,也可能会很短,这样,仅仅建立排除规则是很困难的,根据线条的长度或宽度或面积很难适用不同大小的表格,因此排除规则在某一个文档图像上表现很好,但是在另一个文档图像上可能并不适用于该排除规则。所以在众多复杂的表格中,仅仅编写排除规则,会变的极其的困难,普适性不理想,而且会有过多的超参数需要调整。
27.下面结合附图,通过具体的实施例及其应用场景对本技术实施例提供的一种表格数据的提取方法、装置、电子设备及存储介质进行详细地说明。
28.图1示出本发明的一个实施例提供的一种表格数据的提取方法,该方法可以由电子设备执行,例如终端设备,也就是说,上述的表格数据的提取方法可以由安装在终端设备的硬件或软件来执行,该方法包括如下步骤:
29.步骤s101:响应于用户的第一输入,获取文档图像。
30.具体来讲,文档图像可以为用户输入的任意一张包含至少一个表格的图片,该表格在文档图像中的区域为表格区域,在用户输入文档图像之后,为了便于后续步骤的执行,可以将该文档图像转换为灰度图,再采用自适应二值化算法对灰度图进行自适应二值化处理,得到二值化图像。值得注意的是,文档图像中不仅包含至少一个表格,还包含其余的文本内容以及图片等。
31.步骤s102:选取文档图像中的第一水平线条和第一垂直线条,对第一水平线条和第一垂直线条进行按位与运算得到多个第一交点,对第一水平线条和第一垂直线条进行按位或运算,得到至少一个备选表格轮廓。
32.具体来讲,在获取到文档图像之后,文档图像中包含多个水平线条和多个垂直线条。从文档图像中的多条水平线条中选取满足条件的第一水平线条,和从多个垂直线条中选取满足条件的第一垂直线条。
33.进一步,对第一水平线和第一垂直线进行按位或运算,输出横竖线条相交的二值化图,在该二值化图中进行轮廓查找,找到所有的表格外部轮廓,作为备选表格轮廓,称作备选表格轮廓是因为横竖线相交后会得到很多个外部轮廓,并不确定哪个是表格的轮廓,所以先将多个外部轮廓均作为备选的轮廓。在该二值化图中包含多个第一交点,第一交点为第一水平线条和第一垂直线条进行按位或运算相交后的交点。
34.步骤s103:基于第一交点从备选表格轮廓中选取目标表格轮廓,获取目标表格轮廓在文档图像中的位置信息,目标表格轮廓上有多个第一交点。
35.具体来讲,备选表格轮廓可以为符合表格外框的轮廓,备选表格轮廓中的部分轮廓上第一交点的数量可能很少甚至没有,可以通过备选表格轮廓上第一交点的数量来确定目标表格轮廓,第一交点是由水平线和垂直线相交得来,这样就尽可能的排除无用的水平线和垂直线,而减少不必要的第一交点而影响目标表格轮廓的选取,提高目标表格轮廓的
选取精度。例如,将备选表格轮廓中第一交点的数量大于预定数量的轮廓选取为目标表格轮廓,其中,预定数量可以根据实际情况确定,本技术实施例在此并不作限定。
36.步骤s104:根据位置信息,确定文档图像的表格区域,从表格区域中提取至少一个单元格的数据。
37.具体来讲,目标表格轮廓的位置信息指示目标表格轮廓在文档图像的表格区域所在的位置,表格区域中包括至少一个表格,一个表格内包括多个单元格,可以从表格区域中提取至少一个单元格的数据,如提取一行、一列或全表数据等,单元格的数据包括但不限于单元格的属性和文本数据等,单元格的属性包括但不限于长度、宽度、
38.通过本技术实施例公开的技术方案,能够针对不同的文档图像,从备选表格轮廓中选取出满足于该文档图像所需的目标表格轮廓,以此确定表格区域和从表格区域中提取单元格的数据,能够较为容易的提取出表格数据,且提高了提取出的表格数据的准确度。
39.在一种可能的实现方式中,如图2所示的,选取文档图像中的第一水平线条和第一垂直线条包括以下步骤:
40.步骤s1021:对文档图像进行自适应二值化处理,输出二值化文档图像。
41.步骤s1022:通过腐蚀和膨胀算法选取二值化文档图像水平方向上的所有线条,在水平方向,合并上下间距小于第一阈值的线条,再选取线条长度超出第二阈值的线条和线条宽度小于第三阈值的线条为第一水平线条。
42.具体来讲,通过腐蚀和膨胀算法选取二值化文档图像水平方向(x方向)上的线条,再采用闭运算方法合并上下间距小于第一阈值的线条,采用开运算选取线条长度超出第二阈值的线条和线条宽度小于第三阈值的线条,排除长度过短以及宽度过宽的线条,输出如图3所示的只有水平方向的第一水平线条的二值化图。
43.步骤s1023:通过腐蚀和膨胀算法选取二值化文档图像垂直方向上的所有线条,在垂直方向,合并左右间距小于第四阈值的线条,再选取线条长度超出第五阈值的线条和线条宽度小于第六阈值的线条为第一垂直线条。
44.具体来讲,通过腐蚀和膨胀算法选取二值化文档图像垂直方向(y方向)上的线条,再采用闭运算方法合并左右间距小于第四阈值的线条,再采用开运算选取线条长度超出第五阈值的线条和线条宽度小于第六阈值的线条,排除长度过短以及宽度过宽的线条,输出如图4所示的只有垂直方向的第一垂直线条的二值化图。
45.通过设置选取条件对文档图像中的第一水平线条和第一垂直线条进行选取,针对不同的表格,选取出满足该表格的条件的第一水平线条和第一垂直线条,通用性高,能精准的对文档图像中的表格区域进行定位。
46.在一种可能的实现方式中,如图5所示的,基于所述第一交点从备选表格轮廓中选取目标表格轮廓包括以下步骤:
47.步骤s1031:从第一水平线条中选取通过第一交点的第二水平线条,和从第一垂直线条中选取通过第一交点的第二垂直线条。
48.具体来讲,对第一水平线条和第一垂直线条进行按位与运算,输出如图6所示的只有横竖线交点的二值化图,找到所有的第一交点。
49.遍历所有第一交点,将每个第一交点与第一水平线条的位置信息进行比较,判断该第一交点上是否有一条水平直线,如果有,则将该水平直线作为通过第一交点的第二水
平线条,输出一张有第一交点的水平线二值化图。
50.遍历所有第一交点,将每个第一交点与第一垂直线条的位置信息进行比较,判断该第一交点上是否有一条垂直直线,如果有,则将该垂直直线作为通过第一交点的第二垂直线条,输出一张有第一交点的垂直线二值化图。
51.步骤s1032:对第二水平线条和第二垂直线条进行按位或运算,得到第二水平线条和第二垂直线条相交的多个二值化轮廓图,从多个二值化轮廓图中选取至少一个参考表格轮廓,至少一个参考表格轮廓均包含第一交点。参考表格轮廓如图7所示。
52.具体来讲,将有第二水平线条的水平线二值化图和第二垂直线条的垂直线二值化图进行按位或运算,得到横竖线条相交的二值化图,再进行外部轮廓查找,得到所有的二值化轮廓图,再通过每个二值化轮廓图中是否包含第一交点,将不包含第一交点的二值化轮廓图排除,将至少一个有第一交点的二值化轮廓图作为参考表格轮廓。其中,参考表格轮廓可以为表格的外框。
53.步骤s1033:遍历备选表格轮廓,确定备选表格轮廓与至少一个参考表格轮廓的相交面积比,选取相交面积比大于第七阈值的备选表格轮廓为目标表格轮廓。
54.具体来讲,遍历所有的备选表格轮廓,逐一与每个参考表格轮廓进行比较,具体是逐一将备选表格轮廓与每个参考表格轮廓进行相交,如果相交面积比大于第七阈值,则说明备选表格轮廓与参考表格轮廓的匹配度较高,可以将其选为目标表格轮廓。
55.通过本技术实施例公开的技术方案,参考表格轮廓是通过第一交点做水平线和垂直线的选择得来的,没有做排除规则,从而最大限度确保其完整性。另外,不需要得到该表格内所有的交点,所以通过简单水平线和垂直线提取和尽量少的排除规则,就可以得到表格内的交点。通过交点选择出经过该交点的水平线和垂直线,就可以利用外部轮廓查找得到最大精准度的表格区域。另外,如果备选表格轮廓过大或者过小,还可以通过参考表格轮廓进行修正,从而进一步提高表格定位的准确性与精准度。
56.此外,通过定位到表格区域在文档图像中的位置,这时实际已经排除了表格之外水平线和垂直线的干扰,节省了非表格线条的排除时间,减少定位表格区域的耗时,进一步提高表格区域的检测精度和效率。
57.在一种可能的实现方式中,如图8所示的,从表格区域中提取至少一个单元格的数据包括以下步骤:
58.步骤s1041:获取表格区域,并对表格区域进行自适应二值化处理,得到二值化表格图像。
59.步骤s1042:提取二值化表格图像在水平方向的第三水平线条,获取第三水平线条上的第二交点,遍历第二交点,选取垂直方向上一致的第三交点,垂直方向包含多个第三交点。
60.具体来讲,提取二值化表格图像在水平方向的第三水平线条包括:
61.利用腐蚀算法获取表格区域在水平方向的多个水平线段,再利用膨胀算法和闭合算法闭合各水平线段,得到第三水平线条。
62.其中,实际表格中,每两条线段之间实际上是被一条垂直的线分割的,据此我们可以先假设,如果一条线段的最左端和一条线段的最右端(或者是一条线段的开始端和一条线段的结束端)距离足够近的话,就可以认为该位置就是水平线和垂直线的一个交点。依照
此条件,列举出符合该条件的所有端点,这些端点就是后选择水平线和垂直线的参考点。另外,也有可能是两条不是我们需要的线段,也满足如上条件,需要下一步进行多余的端点的排除。
63.需要注意的是,表格最左侧线段的左侧端点和最右侧线段的最右端端点,它们的左端和右端只有一个交点,这样按照两个端点的距离比较的话,是会被忽略掉了,所以要将这些端点最后补充到端点列表里。
64.具体来讲,输入二值化表格图像,通过腐蚀和膨胀方法,得到水平方向上的线条,水平方向上有两个输出,分别为水平线段和长直线。对于水平线段而言,如图9所示的,输出一个二值化线段图。使用腐蚀算法,使水平线段上下左右尽量分开,进行轮廓查找,输出所有的线段位置列表。这里会有大量的线段,为了提高速度,可以使用闭运算,闭合垂直方向线段宽度小于某一阀值的线段。
65.再使用膨胀算法和闭合算法闭合各水平线段,使所有的水平线段连接成一条直线(第三水平线条),进行轮廓查找,排除过短的直线,输出所有的直线二值化图和所有直线的位置列表。
66.获取第三水平线条上的第二交点包括:遍历各水平线段,获取各水平线段两端的端点,再获取相邻端点之间的距离,选取距离小于第八阈值的端点为第二交点。
67.具体来讲,输入线段二值化图,找到所有的线段,遍历所有的线段,得到所有线段两端的端点,输出端点的列表。遍历所有端点,判断两个端点之间的距离,如果距离小于第八阈值(很小),说明此端点是两条水平线段的临界点,如果距离很大,说明这是一条孤立的线段,可以筛除;所以判断该端点小于第八阀值,则认为这是水平线条和垂直线条的一个交点,孤立线段的两个端点会被排除,如图10所示的,输出所有第二交点的列表。
68.遍历第二交点的列表,只保留垂直方向上一致的端点,因为垂直方向交点的水平值近似相等,所以可以排除那些垂直方向上孤立的点,输出所有垂直方向一致的端点的列表。有一种特殊情况,如果遇到只有两行的单元格,垂直方向只有一个端点,经过以上过滤可能没有交点。这时,可以把水平方向上一致的点保留下来。
69.步骤s1043:提取二值化表格图像在垂直方向的第四垂直线条,对第三水平线条和第四垂直线条进行按位与运算,得到第三水平线条和第四垂直线条相交的第四交点,遍历第四交点,从第三水平线条中选取第三水平线条上有多个第四交点的线条为第四水平线条。
70.具体来讲,提取二值化表格图像在垂直方向的第四垂直线条包括:利用腐蚀算法获取表格区域在垂直方向的多个垂直线段,再利用膨胀算法和闭合算法闭合各垂直线段,得到第三垂直线条;遍历第三垂直线条,从第三垂直线条中选取第三垂直线条上有多个第三交点的线条为第四垂直线条,从而排除过短的线条,提高单元格的定位精度。
71.步骤s1044:计算第四水平线条的最小值和最大值,第四垂直线条的最小值和最大值,添加表格的外框,再对第四水平线条和第四垂直线条进行膨胀运算和按位或运算,得到横竖线相交的二值化图,再对二值化图进行闭运算,得到多个单元格轮廓。
72.具体来讲,计算第四水平线条的最小值(minx),最大值(maxx),第四垂直线条的最小值(miny),最大值(maxy),添加表格的外框(minx,miny,maxx,maxy)。分别对提取到的水平线二值化图和垂直线二值化图进行水平方向和垂直方向进行膨胀运算,再进行按位或运
算,输出如图11所示的横竖线相交的二值化图,再对该图进行闭运算,确保表格内的每个单元格都是闭合的状态。
73.步骤s1045:从多个单元格轮廓中选取至少一个轮廓面积等于第九阈值的目标单元格轮廓,获取目标单元格轮廓的位置信息,基于位置信息获取对应单元格内的数据。
74.具体来讲,查找多个单元格轮廓,过滤掉小于或大于第九阀值的轮廓,每个轮廓即为一个单元格,输出所有单元格位置列表,在对应的单元格位置获取单元格数据即可。
75.通过本技术实施例公开的技术方案,只针对表格区域进行精细的水平线和垂直线的检测和提取优化,从而提升单元格定位精度,降低单元格定位耗时和数据提取的精度。使用更为精细规则对表格内的水平线和垂直线进行提取,通过提取出水平线条和垂直线条的线段,确定交点,并利用该交点再次确定水平线和垂直线,避免单元格的缺失,提高定位单元格的准确性和完整性。
76.值得注意的是,以上各个实施例中涉及到的阈值可以根据实际情况确定其数值,本技术实施例在此并不作限定,附图中示出的水平线条、垂直线条、表格轮廓以及表格等仅仅是示意,本技术实施例并不局限于附图所示的样式。
77.需要说明的是,本技术实施例提供的一种表格数据的提取方法,执行主体可以为一种表格数据的提取装置,或者该一种表格数据的提取装置中的用于执行一种表格数据的提取方法的控制模块。本技术实施例中以一种表格数据的提取装置执行一种表格数据的提取方法为例,说明本技术实施例提供的一种表格数据的提取装置。
78.图12是根据本发明实施例的一种表格数据的提取装置的结构示意图。如图12所示,一种表格数据的提取装置1200包括:获取模块1201,用于响应于用户的第一输入,获取文档图像;第一选取模块1202,用于选取文档图像中的第一水平线条和第一垂直线条,对第一水平线条和第一垂直线条进行按位与运算得到多个第一交点,对所述第一水平线条和所述第一垂直线条进行按位或运算,得到至少一个备选表格轮廓;第二选取模块1203,用于基于所述第一交点从备选表格轮廓中选取目标表格轮廓,获取目标表格轮廓在文档图像中的位置信息,目标表格轮廓上有多个第一交点;确定模块1204,用于根据位置信息,确定文档图像的表格区域,从表格区域中提取至少一个单元格的数据。
79.在本技术实施例中,能够针对不同的文档图像,从备选表格轮廓中选取出满足于该文档图像所需的目标表格轮廓,以此确定表格区域和从表格区域中提取单元格的数据,能够较为容易的提取出表格数据,且提高了提取出的表格数据的准确度。
80.在一种实现方式中,第一选取模块1202,还用于对文档图像进行自适应二值化处理,输出二值化文档图像;通过腐蚀和膨胀算法选取二值化文档图像水平方向上的所有线条,在水平方向,合并上下间距小于第一阈值的线条,再选取线条长度超出第二阈值的线条和线条宽度小于第三阈值的线条为第一水平线条;通过腐蚀和膨胀算法选取二值化文档图像垂直方向上的所有线条,在垂直方向,合并左右间距小于第四阈值的线条,再选取线条长度超出第五阈值的线条和线条宽度小于第六阈值的线条为第一垂直线条。
81.在一种实现方式中,第二选取模块1203,还用于从第一水平线条中选取通过第一交点的第二水平线条,和从第一垂直线条中选取通过第一交点的第二垂直线条;第二水平线条和第二垂直线条进行按位或运算,得到第二水平线条和第二垂直线条相交的多个二值化轮廓图,从多个二值化轮廓图中选取至少一个参考表格轮廓,至少一个参考表格轮廓均
包含第一交点;遍历备选表格轮廓,确定备选表格轮廓与至少一个参考表格轮廓的相交面积比,选取相交面积比大于第七阈值的备选表格轮廓为目标表格轮廓。
82.在一种实现方式中,确定模块1204,还用于获取表格区域,并对表格区域进行自适应二值化处理,得到二值化表格图像;提取二值化表格图像在水平方向的第三水平线条,获取第三水平线条上的第二交点,遍历第二交点,选取垂直方向上一致的第三交点,垂直方向包含多个第三交点;提取二值化表格图像在垂直方向的第四垂直线条,对第三水平线条和第四垂直线条进行按位与运算,得到第三水平线条和第四垂直线条相交的第四交点,遍历第四交点,从第三水平线条中选取第三水平线条上有多个第四交点的线条为第四水平线条;计算第四水平线条的最小值和最大值,第四垂直线条的最小值和最大值,添加表格的外框,再对第四水平线条和第四垂直线条进行膨胀运算和按位或运算,得到横竖线相交的二值化图,再对二值化图进行闭运算,得到多个单元格轮廓;从多个单元格轮廓中选取至少一个轮廓面积等于第九阈值的目标单元格轮廓,获取目标单元格轮廓的位置信息,基于位置信息获取对应单元格内的数据。
83.在一种实现方式中,确定模块1204,还用于利用腐蚀算法获取表格区域在水平方向的多个水平线段,再利用膨胀算法和闭合算法闭合各水平线段,得到第三水平线条;遍历各水平线段,获取各水平线段两端的端点,再获取相邻端点之间的距离,选取距离小于第八阈值的端点为第二交点。
84.在一种实现方式中,确定模块1204,还用于利用腐蚀算法获取表格区域在垂直方向的多个垂直线段,再利用膨胀算法和闭合算法闭合各垂直线段,得到第三垂直线条;遍历第三垂直线条,从第三垂直线条中选取第三垂直线条上有多个第三交点的线条为第四垂直线条。
85.本技术实施例中的一种表格数据的提取装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,umpc)、上网本或者个人数字助理(personal digital assistant,pda)等,非移动电子设备可以为服务器、网络附属存储器(network attached storage,nas)、个人计算机(personal computer,pc)、电视机(television,tv)、柜员机或者自助机等,本技术实施例不作具体限定。
86.本技术实施例中的一种表格数据的提取装置可以为具有操作系统的装置。该操作系统可以为安卓(android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本技术实施例不作具体限定。
87.本技术实施例提供的一种表格数据的提取装置能够实现以上方法实施例中实现的各个过程,为避免重复,这里不再赘述。
88.可选的,如图13所示,本技术实施例还提供一种电子设备1300,包括处理器1301,存储器1302,存储在存储器1302上并可在处理器1301上运行的程序或指令,该程序或指令被处理器1301执行时实现上述一种表格数据的提取方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
89.需要说明的是,本技术实施例中的电子设备包括上述的移动电子设备和非移动电子设备。
90.本技术实施例还提供一种可读存储介质,可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述一种表格数据的提取方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
91.其中,处理器为上述实施例中的电子设备中的处理器。可读存储介质,包括计算机可读存储介质,如计算机只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等。
92.本技术实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述一种表格数据的提取方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
93.应理解,本技术实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
94.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本技术实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
95.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本技术各个实施例所述的方法。
96.上面结合附图对本技术的实施例进行了描述,但是本技术并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本技术的启示下,在不脱离本技术宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本技术的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1