表格数据的处理方法、装置和服务器与流程

文档序号:31130168发布日期:2022-08-13 05:18阅读:105来源:国知局
表格数据的处理方法、装置和服务器与流程

1.本说明书属于大数据技术领域,尤其涉及表格数据的处理方法、装置和服务器。


背景技术:

2.在涉及大数据的业务处理场景中,常常需要存入和读取数据量庞大的表格。
3.基于现有的处理方法在对上述表格进行存入操作时,所涉及到的数据处理量往往较大,并且后续在对已存入的表格进行读取操作时,读取效率较低,用户的读取等待时间较长。
4.针对上述问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本说明书提供了一种表格数据的处理方法、装置和服务器,能够以较小的数据处理量快速地完成对数据量庞大的表格的存入操作;并且基于上述存入方式,后续能够较为高效对表格进行读取操作,有效地缩短读取等待时间。
6.本说明书提供了一种表格数据的处理方法,包括:
7.接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;
8.响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;
9.根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;
10.根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;
11.根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;
12.根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
13.在一个实施例中,所述第二数据表包括关系型数据库表。
14.在一个实施例中,所述第一数据表、第二数据表包括写入区块链中的数据表。
15.在一个实施例中,获取目标表格的表头参数,包括:
16.从所述目标表格携带的设置参数中读取表头冻结参数;并根据表头冻结参数,确定表头在目标表格中的行号和列号,以得到目标表格的表头参数;
17.或,
18.接收并根据用户设置的自定义参数,确定表头在目标表格中的行号和列号,以得到目标表格的表头参数。
19.在一个实施例中,在根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息之后,所述方法还包括:
20.检测表头所在的位置区域是否为合并单元格;
21.在确定表头所在的位置区域为合并单元格的情况下,获取并根据该合并单元格所包含的单元格的单元格标识,生成表头的合并指示标签;
22.相应的,将表头的第一内容数据和第一位置信息存入第一数据表内,包括:
23.将表头的第一内容数据、第一位置信息,和合并指示标签存入第一数据表内。
24.在一个实施例中,根据第一位置信息,确定目标表格中除表头以外的内容单元格,包括:
25.根据第一位置信息,确定出目标表格中除表头以外的候选位置区域;
26.通过对候选位置区域中的单元格进行数据值检测,筛选出数据值非空的单元格作为内容单元格。
27.在一个实施例中,根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据,包括:
28.将对应同一个内容单元格的第二内容数据和第二位置信息分别作为value值和key值进行组合,得到与该内容单元格对应的键值对数据。
29.在一个实施例中,在根据目标表格的表格标识,将所述键值对数据存入第二数据表内之后,所述方法还包括:
30.根据预设的拆分规则,将第二数据表内的键值对数据拆分到多个子数据表内存储。
31.在一个实施例中,根据预设的拆分规则,将第二数据表内的键值对数据拆分到多个子数据表内存储,包括:
32.根据第二数据表所包含的键值对数据的数量,确定子数据表的数量;
33.对第二数据表中的内容单元格的单元格标识分别进行哈希运算,得到内容单元格的单元格标识的哈希值;
34.计算并根据内容单元格的单元格标识的哈希值与子数据表的数量相除后得到的余数,将该内容单元格的键值对数据拆分到对应的子数据表内。
35.在一个实施例中,在将表头的第一内容数据和第一位置信息存入第一数据表内之后,所述方法还包括:
36.检测目标表格中是否存在下拉框;
37.在确定目标表格中存在下拉框的情况下,获取下拉框的第三内容数据和第三位置信息;并将下拉框的第三内容数据和第三位置信息存入第三数据表内。
38.在一个实施例中,所述方法还包括:
39.接收表格读取请求;其中,所述表格读取请求至少携带有待读取的目标表格的表格标识;
40.根据目标表格的表格标识,确定出相对应的第一数据表和第二数据表;
41.根据第一数据表和第二数据表,重构目标表格;
42.向用户展示所述目标表格。
43.本说明书还提供了一种表格数据的处理装置,包括:
44.接收模块,用于接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;
45.第一提取模块,用于响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;
46.第一存入模块,用于根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;
47.第二提取模块,用于根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;
48.处理模块,用于根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;
49.第二存入模块,用于根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
50.在一个实施例中,所述装置还包括读取模块;
51.其中,所述接收模块,还用于接收表格读取请求;其中,所述表格读取请求至少携带有待读取的目标表格的表格标识;
52.所述读取模块,用于根据目标表格的表格标识,确定出相对应的第一数据表和第二数据表;根据第一数据表和第二数据表,重构目标表格;向用户展示所述目标表格。
53.本说明书还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述表格数据的处理方法的相关步骤。
54.本说明书还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现所述表格数据的处理方法的相关步骤。
55.基于本说明书提供的表格数据的处理方法、装置和服务器,在存入目标表格时,可以接收并响应表格存入请求,先获取并根据目标表格的表头参数,从目标表格中检测并提取出表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;再根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;再根据目标表格的表格标识,将键值对数据存入第二数据表内。通过先将目标表格中的内容数据拆分成表头的第一内容数据和内容单元格的第二内容数据;再根据第一处理规则将表头的第一内容数据和第一位置信息存入第一数据表内;同时,根据第二处理规则将内容单元格的第二内容数据和第二位置信息转化为对应的键值对数据后,再存入第二数据表内;对表头的第一内容数据和第一位置信息,以及内容单元格的第二内容数据和第二位置信息进行分开存储,从而能够以较小的数据处理量快速地完成对数据量庞大的表格的存入操作;并且基于上述存入方式,后续能够较为高效对表格进行读取操作,有效地缩短读取表格时的读取等待时间。
附图说明
56.为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
57.图1是本说明书的一个实施例提供的表格数据的处理方法的流程示意图;
58.图2是在一个场景示例中,应用本说明书实施例提供的表格数据的处理方法的一种实施例的示意图;
59.图3是在一个场景示例中,应用本说明书实施例提供的表格数据的处理方法的一种实施例的示意图;
60.图4是在一个场景示例中,应用本说明书实施例提供的表格数据的处理方法的一种实施例的示意图;
61.图5是在一个场景示例中,应用本说明书实施例提供的表格数据的处理方法的一种实施例的示意图;
62.图6是本说明书的一个实施例提供的服务器的结构组成示意图;
63.图7是本说明书的一个实施例提供的表格数据的处理装置的结构组成示意图;
64.图8是本说明书的另一个实施例提供的表格数据的处理装置的结构组成示意图。
具体实施方式
65.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
66.参阅图1所示,本说明书实施例提供了一种表格数据的处理方法。其中,该方法具体应用于云端服务器一侧。具体实施时,该方法可以包括以下内容:
67.s101:接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;
68.s102:响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;
69.s103:根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;
70.s104:根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;
71.s105:根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;
72.s106:根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
73.在一些数据处理场景,用户需要将自己整理好的表格数据通过终端设备导入云端服务器进行存储,以便对表格数据备份,以及后续使用。
74.在本实施例中,所述云端服务器具体可以包括一种应用于云端服务平台一侧,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述云端服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述云端服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并
不具体限定所述云端服务器所包含的服务器的数量。所述云端服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
75.在本实施例中,所述终端设备具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端设备。具体的,所述终端设备例如可以为台式电脑、平板电脑、笔记本电脑、手机等电子设备。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在手机上运行的某app等。
76.在一些实施例中,参阅图2所示,上述目标表格具体可以理解为用户指示待存入的表格。具体的,上述目标表格可以包括表头和表格内容两部分。
77.参阅图2所示,其中,上述表头具体可以包括:位于表格顶部的目标表格的表名,位于表格中的各行、各列的起始单元格中标签信息等。上述位于表格顶部的目标表格的表名,位于表格中的各行、各列的起始单元格中标签信息等可以记为表头的第一内容数据。上述第一内容数据所在的位置区域在表格中的行号、列号可以记为对应的第一位置信息。
78.参阅图2所示,上述表格内容具体可以包括:表格中除表头以外的内容单元格中的具体数据,可以记为内容单元格的第二内容数据。上述第二内容数据所在的内容单元格在表格中的行号、列号可以记为对应的第二位置信息。
79.在一些实施例中,当用户需要存入目标表格时,可以通过终端设备发起存入操作。终端设备接收并响应存入操作,生成对应的表格存入请求。其中,所述表格存入请求至少携带有待存入的目标表格。接着,终端设备可以将表格存入请求发送至云端服务器。相应的,云端服务器可以接收上述表格存入请求,并响应该表格存入请求,将目标表格存入表格数据库,或者区块链中。
80.在一些实施例中,上述表格存入请求具体还可以携带有用户标识。服务器在接收到表格存入请求之后,可以先根据用户标识,对表格存入请求进行用户验证。具体的,服务器可以根据用户标识,查询平台的用户数据库,以确定发起该表格请求的用户是否属于平台的注册用户。在确定用户数据库中匹配到相同的用户标识的情况下,可以确定发起该表格请求的用户属于平台的注册用户,用户验证通过,进而可以触发进行后续的表格数据处理。相反,在确定用户数据库中未匹配到相同的用户标识的情况下,可以确定发起该表格请求的用户不属于平台的注册用户,用户验证不通过,则不会触发进行后续的表格数据处理;进一步,可以生成并向终端设备发送用户注册提示,以提示用户先进行用户注册。
81.需要说明的是,本说明书中涉及到的与用户相关的数据均为在用户知晓且同意的前提下采集和使用的。并且,对上述与用户相关的数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
82.在一些实施例中,上述表头参数具体可以为表头在表格中的位置区域的行号和列号。
83.在一些实施例中,上述获取目标表格的表头参数,具体实施时,可以包括以下内容:从所述目标表格携带的设置参数中读取表头冻结参数;并根据表头冻结参数,确定表头在目标表格中的行号和列号,以得到目标表格的表头参数;或,接收并根据用户设置的自定义参数,确定表头在目标表格中的行号和列号,以得到目标表格的表头参数。
84.其中,上述表头冻结参数具体可以为用于限制表格中表头所在的位置区域不随浏览滑动表格时发生相应滑动。
85.上述自定义参数具体可以为用户在通过终端设备生成表格存入请求时,主动设置的用于指示表头所在的位置区域在表格中的行号和列号的设置参数。相应的,表格存入请求还可以携带有用户主动设置的自定义参数。
86.基于上述实施例,具体实施时,可以先检测表格存入请求中是否存在用户主动设置的自定义参数,在确定存在自定义参数时,可以直接根据自定义参数确定出目标表格的表头参数;在确定不存在自定义参数时,可以在对目标表格的设置参数进行检测,以获取目标表格的表头冻结参数,进而可以根据表头冻结参数,确定出目标表格的表头参数。
87.在一些实施例中,具体实施时,可以根据目标表格的表头参数,在目标表格中确定出表头的所在位置区域;在对表头的所在位置区域进行较为精细的检测识别,以获取表头的第一内容数据;同时,可以确定出第一内容数据在目标表格中的行号和列号,得到第一内容数据的第一位置信息。
88.在一些实施例中,上述第一数据表具体可以用于存储表格中的表头的相关数据,例如,表头的第一内容数据,以及第一内容数据的第一位置信息等。
89.上述表格标识具体可以理解为一种能够与目标表格对应的指示信息,例如,目标表格的表名、表编号等等。
90.具体实施时,表格存入请求中可以携带有目标表格的表格标识;相应的,可以从表格存入请求中提取得到目标表格的表格标识。或者,还可以从所提取的第一内容数据中,筛选出能够对目标表格整体匹配的第一内容数据,作为目标表格的表格标识。
91.在一些实施例中,上述根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内,具体实施时,可以包括:构建与目标表格的表格标识对应的初始的第一数据表;确定第一内容数据和第一位置信息之间的对应关系,并根据上述对应关系,将相互对应的第一内容数据和第一位置信息按序分别存入初始的第一数据表内,得到第一数据表。进一步,上述第一数据表中还可以包含有第一内容数据和第一位置信息的对应关系。
92.在一些实施例中,在根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息之后,所述方法具体实施时,还可以包括以下内容:
93.s1:检测表头所在的位置区域是否为合并单元格;
94.s2:在确定表头所在的位置区域为合并单元格的情况下,获取并根据该合并单元格所包含的单元格的单元格标识,生成表头的合并指示标签;
95.相应的,上述将表头的第一内容数据和第一位置信息存入第一数据表内,具体可以包括:将表头的第一内容数据、第一位置信息,和合并指示标签存入第一数据表内。
96.其中,上述合并指示标签能够指示出存在合并单元格的第一内容数据,以所具体合并的单元格的单元格标识。
97.上述单元标识与单元格对应。具体的,一个单元格的单元格标识可以基于该单元格在表格中的行号和列号组合得到。
98.在一些实施例中,上述根据第一位置信息,确定目标表格中除表头以外的内容单元格,具体实施时,可以包括以下内容:
99.s1:根据第一位置信息,确定出目标表格中除表头以外的候选位置区域;
100.s2:通过对候选位置区域中的单元格进行数据值检测,筛选出数据值非空的单元
格作为内容单元格。
101.具体实施时,可以根据第一位置信息,筛选出目标表格中除表头所在的位置区域以外的其他单元格作为候选位置区域;进一步,可以针对候选位置区域中的单元格分别进行数据值检测,以确定各个单元格是否为空,即各个单元格的数据值是否为空。在确定某个单元格的数据值为空的情况下,可以判断该单元格内不存在内容数据,则不作后续存入操作,以减少数据处理量。相反,在确定某个单元格的数据值为非空的情况下,可以判断该单元格内存在内容数据,筛选出该单元格作为内容单元格,以进行后续的存入操作。
102.在一些实施例中,具体实施时,可以仅对内容单元格进行较为精细的检测识别,以获取内容单元格的第二内容数据;同时,可以确定出该第二内容数据(即内容单元格)在目标表格中的行号和列号,得到第二内容数据的第二位置信息。而对于候选位置区域中的除内容单元格以外的其他单元格则不作处理。从而可以有效地降低数据处理量,提高整体的处理效率。
103.在一些实施例中,上述根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据,具体实施时,可以包括以下内容:将对应同一个内容单元格的第二内容数据和第二位置信息分别作为value值和key值进行组合,得到与该内容单元格对应的键值对数据。
104.具体的,对于某个内容单元格,第二内容数据为:“sz市”;第二位置信息为:第9列,第1行。与该内容单元格对应的键值对数据可以表示为以下形式:sz市-(9,1)。
105.在本实施例中,考虑到目标表格的格式(例如,所包含的总行数和总列数)往往是不固定的,而在云端服务器侧为了方便管理和维护所使用的第二数据表的格式则是统一、固定的。这种情况下,针对格式不固定、不统一的目标表格,可以采用键值对的方式,将第二内容数据和第二位置信息进行组合,得到一个同时包含有内容单元格的第二内容数据和第二位置信息的键值对数据;再将该键值对数据单独作为一个数据存入第二数据表中。这样,一方面可以实现使用格式固定统一的第二数据表处理不同格式情况的目标表格;另一方面也可以减少存入第二数据表的数据存储量,减轻存储负担。
106.在一些实施例中,为便于后续的查询读取,提高后续查询读取的效率,在根据目标表格的表格标识,将所述键值对数据存入第二数据表内之后,所述方法具体实施时,还可以包括:根据预设的拆分规则,将第二数据表内的键值对数据拆分到多个子数据表内存储。这样可以将原本数据量庞大的第二数据表拆分成多个子数据表分别进行存储,以便于后续的查询读取。
107.在一些实施例中,上述根据目标表格的表格标识,将所述键值对数据存入第二数据表内,具体实施时,可以包括:将键值对数据存入与目标表格的表格标识对应的第二数据表内;其中,所述第二数据表内还存储有键值对数据与内容单元表格的表格标识之间的对应关系。
108.在一些实施例中,参阅图3所示,上述根据预设的拆分规则,将第二数据表内的键值对数据拆分到多个子数据表内存储,具体实施时,可以包括以下内容:
109.s301:根据第二数据表所包含的键值对数据的数量,确定子数据表的数量;
110.s302:对第二数据表中的内容单元格的单元格标识分别进行哈希运算,得到内容单元格的单元格标识的哈希值;
111.s303:计算并根据内容单元格的单元格标识的哈希值与子数据表的数量相除后得到的余数,将该内容单元格的键值对数据拆分到对应的子数据表内。
112.在一些实施例中,在目标表格所包含的数据量较大,键值对数据的数量较多的情况下,可以将子数据表的数量设置得相对较大。在目标表格所包含的数据量较小,键值对数据的数据量较少的情况下,可以将子数据表的数量设置得相对较小。
113.具体的,可以先根据子数据表的数量,确定余数数值与各个子数据表的对应关系。再对各个内容单元格的单元格标识分别先做哈希运算,得到与该内容单元格对应的单元格标识的哈希值;再将各个内容单元格的单元格标识的哈希值与子数据表的数量相除,根据所得到的余数值,将该内容单元格的键值对数据拆分到对应的子数据表中。
114.这样可以将数量较多的键值对数据,较为均匀地拆分到多个子数据表中,便于后续的查询读取。
115.后续在进行查询读取时,可以先计算并根据各个计算各个内容单元格的单元格标识的哈希值与子数据表的数量相除得到的余数;再根据余数,确定出各个该内容单元格的键值对数据所在的子数据表;进而只要对一个子数据表进行检索,就可以读取得到该内容单元格的键值对数据。
116.在一些实施例中,在将表头的第一内容数据和第一位置信息存入第一数据表内之后,所述方法具体实施时,还可以包括以下内容:
117.s1:检测目标表格中是否存在下拉框;
118.s2:在确定目标表格中存在下拉框的情况下,获取下拉框的第三内容数据和第三位置信息;并将下拉框的第三内容数据和第三位置信息存入第三数据表内。
119.具体的,在目标表格的下拉框中可以存储有一个或多个选项信息,上述选项信息可以记为下拉框的第三内容数据;下拉框所在的位置区域的位置参数可以记为第三位置信息。
120.在一些实施例中,参阅图4所示,所述方法具体实施时,还可以包括以下内容:
121.s401:接收表格读取请求;其中,所述表格读取请求至少携带有待读取的目标表格的表格标识;
122.s402:根据目标表格的表格标识,确定出相对应的第一数据表和第二数据表;
123.s403:根据第一数据表和第二数据表,重构目标表格;
124.s404:向用户展示所述目标表格。
125.在本实施例中,具体实施时,可以先根据目标表格的表格标识所区块链中检索到对应的第一数据表和第二数据表。根据第一数据表,可以获取表头的第一内容数据和第一位置信息,以及合并指示标签。根据第二数据表,可以获取内容单元格的键值对数据;并基于键值对数据进一步获取各个内容单元格的第二内容数据和第二位置信息。进而可以根据表头的第一内容数据和第一位置信息,以及合并指示标签,在初始表中重建表头;根据各个内容单元格的第二内容数据和第二位置信息,重建内容单元格;并将剩余的单元格的内容数据设置为空。从而可以快速、准确地重构得到目标表格。进一步,可以将该目标表格发送给终端设备,通过终端设备向用户展示出该目标表格。
126.这样可以快速、准确地完成读取和重构,并及时地向用户展示出该目标表格,有效地缩短了用户的读取等待时间,使用户可以获得较好的交互体验。
127.在一些实施例中,所述目标表格包括交易数据处理记录表,也可以包括企业员工信息表,还可以包括项目结算表等等。当然,上述所列举的目标表格只是一种示意性说明。具体实施时,根据具体的应用场景和处理需求,上述目标表格还可以包括其他内容的表格。对此,本说明书不做限定。
128.在一些实施例中,在向用户展示所述目标表格之后,参阅图5所示,所述方法具体实施时,还可以包括以下内容:
129.s405:获取用户对所展示的目标表格中单元格的操作数据;
130.s406:根据所述操作数据,对第一数据表和/或第二数据表进行更新。
131.在本实施例中,具体实施时,可以先根据操作数据,确定出更新的内容数据。其中,上述操作数据包括:对原内容数据的删除操作、修改操作;对原内容数据为空的单元格的新增内容数据的操作等。接着,可以根据更新的内容数据,分别对第一数据表中的第一内容数据,和/或,第二数据表中的第二内容数据进行对应的更新。从而可以高效、便捷地对已存入的目标表格及时进行更新和维护。
132.在一些实施例中,所述第二数据表具体可以包括关系型数据库表。进一步,上述第一数据表也可以为关系型数据表。
133.其中,上述关系型数据库具体可以是指建立在关系型数据模型的基础上,借助于集合代数等数学概念和方法来处理数据的数据库。例如,oracle、mysql、db2等数据库。
134.通过使用上述关系型数据库表作为第二数据表,可以使得后续进行查询、读取时,更加的高效、便捷,有效地缩短读取等待时间。
135.在一些实施例中,上述第一数据表、第二数据表具体可以包括写入区块链中的数据表。
136.由于上述第一数据表、第二数据表被写入区块链中,上述第一数据表、第二数据表中的内容数据难以被篡改,具有较高的安全性和可靠性。此外,由于上述第一数据表、第二数据表被写入区块链中,上述第一数据表、第二数据表还支持去中心化操作,进而用户或者管理者可以更加便捷、高效地对上述第一数据表、第二数据表中相关数据进行操作。
137.由上可见,基于本说明书实施例提供的表格数据的处理方法,在存入目标表格时,可以接收并响应表格存入请求,先获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;再根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;再根据目标表格的表格标识,将键值对数据存入第二数据表内。通过先将目标表格中的内容数据拆分成表头的第一内容数据和内容单元格的第二内容数据;再根据第一处理规则将表头的第一内容数据和第一位置信息存入第一数据表内;根据第二处理规则将内容单元格的第二内容数据和第二位置信息转化为对应的键值对数据后,再存入第二数据表内,从而能够以较小的数据处理量完成对数据量庞大的表格的存入操作;并且基于上述存入方式,后续能够较为高效对表格进行读取操作,有效地缩短读取表格时的读取等待时间。
138.本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令
的存储器,所述处理器具体实施时可以根据指令执行以下步骤:接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
139.为了能够更加准确地完成上述指令,参阅图6所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口601、处理器602以及存储器603,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
140.其中,所述网络通信端口601,具体可以用于接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格。
141.所述处理器602,具体可以用于响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
142.所述存储器603,具体可以用于存储相应的指令程序。
143.在本实施例中,所述网络通信端口601可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行ftp数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如gsm、cdma等;其还可以为wifi芯片;其还可以为蓝牙芯片。
144.在本实施例中,所述处理器602可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
145.在本实施例中,所述存储器603可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如ram、fifo等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、tf卡等。
146.本说明书实施例还提供了一种基于上述表格数据的处理方法的计算机存储介质,
所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
147.在本实施例中,上述存储介质包括但不限于随机存取存储器(random access memory,ram)、只读存储器(read-only memory,rom)、缓存(cache)、硬盘(hard disk drive,hdd)或者存储卡(memory card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
148.在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
149.本说明书实施例还提供了一种计算机程序产品,包含有计算机程序,所述计算机程序被处理器执行时实现以下步骤:接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
150.参阅图7所示,在软件层面上,本说明书实施例还提供了一种表格数据的处理装置,该装置具体可以包括以下的结构模块:
151.接收模块701,具体可以用于接收表格存入请求;其中,所述表格存入请求至少携带有待存入的目标表格;
152.第一提取模块702,具体可以用于响应所述表格存入请求,获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;
153.第一存入模块703,具体可以用于根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;其中,所述第一数据表用于存储表格中表头的相关数据;
154.第二提取模块704,具体可以用于根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;
155.处理模块705,具体可以用于根据第二处理规则,利用内容单元格的第二内容数据
和第二位置信息,构建与内容单元格对应的键值对数据;
156.第二存入模块706,具体可以用于根据目标表格的表格标识,将所述键值对数据存入第二数据表内;其中,所述第二数据表用于存储表格中内容单元格的相关数据。
157.在一些实施例中,所述第二数据表具体可以包括关系型数据库表等。
158.在一些实施例中,所述第一数据表、第二数据表具体可以包括写入区块链中的数据表。
159.在一些实施例中,上述第一提取模块702具体实施时,可以按照以下方式获取目标表格的表头参数:从所述目标表格携带的设置参数中读取表头冻结参数;并根据表头冻结参数,确定表头在目标表格中的行号和列号,以得到目标表格的表头参数;或,接收并根据用户设置的自定义参数,确定表头在目标表格中的行号和列号,以得到目标表格的表头参数。
160.在一些实施例中,上述第一提取模块702在根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息之后,还可以用于检测表头所在的位置区域是否为合并单元格;在确定表头所在的位置区域为合并单元格的情况下,获取并根据该合并单元格所包含的单元格的单元格标识,生成表头的合并指示标签。
161.相应的,上述第一存入模块703具体实施时,可以按照以下方式将表头的第一内容数据和第一位置信息存入第一数据表内:将表头的第一内容数据、第一位置信息,和合并指示标签存入第一数据表内。
162.在一些实施例中,上述第二提取模块704具体实施时,可以按照以下方式根据第一位置信息,确定目标表格中除表头以外的内容单元格:根据第一位置信息,确定出目标表格中除表头以外的候选位置区域;通过对候选位置区域中的单元格进行数据值检测,筛选出数据值非空的单元格作为内容单元格。
163.在一些实施例中,上述处理模块705具体实施时,可以按照以下方式根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据:将对应同一个内容单元格的第二内容数据和第二位置信息分别作为value值和key值进行组合,得到与该内容单元格对应的键值对数据。
164.在一些实施例中,上述第二存入模块706在根据目标表格的表格标识,将所述键值对数据存入第二数据表内之后,还可以用于根据预设的拆分规则,将第二数据表内的键值对数据拆分到多个子数据表内存储。
165.在一些实施例中,上述第二存入模块706具体实施时,可以按照以下方式根据预设的拆分规则,将第二数据表内的键值对数据拆分到多个子数据表内存储:根据第二数据表所包含的键值对数据的数量,确定子数据表的数量;对第二数据表中的内容单元格的单元格标识分别进行哈希运算,得到内容单元格的单元格标识的哈希值;计算并根据内容单元格的单元格标识的哈希值与子数据表的数量相除后得到的余数,将该内容单元格的键值对数据拆分到对应的子数据表内。
166.在一些实施例中,上述第一提取模块702在将表头的第一内容数据和第一位置信息存入第一数据表内之后,具体实施时,还可以用于检测目标表格中是否存在下拉框;在确定目标表格中存在下拉框的情况下,获取下拉框的第三内容数据和第三位置信息;并将下拉框的第三内容数据和第三位置信息存入第三数据表内。
167.在一些实施例中,参阅图8所示,所述装置具体还可以包括读取模块707;所述读取模块707与所述接收模块701相连。其中,所述接收模块701,具体还可以用于接收表格读取请求;其中,所述表格读取请求至少携带有待读取的目标表格的表格标识;所述读取模块707,具体可以用于根据目标表格的表格标识,确定出相对应的第一数据表和第二数据表;根据第一数据表和第二数据表,重构目标表格;向用户展示所述目标表格。
168.需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
169.由上可见,基于本说明书实施例提供的表格数据的处理装置,在存入目标表格时,可以接收并响应表格存入请求,先获取并根据目标表格的表头参数,从目标表格中检测并提取表头的第一内容数据和第一位置信息;根据第一处理规则和目标表格的表格标识,将表头的第一内容数据和第一位置信息存入第一数据表内;再根据第一位置信息,确定目标表格中除表头以外的内容单元格;并对内容单元格进行处理,以提取得到内容单元格的第二内容数据和第二位置信息;根据第二处理规则,利用内容单元格的第二内容数据和第二位置信息,构建与内容单元格对应的键值对数据;再根据目标表格的表格标识,将键值对数据存入第二数据表内。从而能够以较小的数据处理量完成对数据量庞大的表格的存入操作;并且基于上述存入方式,后续能够较为高效对该表格进行读取操作,有效地缩短读取等待时间。
170.虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
171.本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件
部件内的结构。
172.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
173.通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
174.本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
175.虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1