数据类型识别方法及装置与流程

文档序号:17587019发布日期:2019-05-03 21:24阅读:214来源:国知局
数据类型识别方法及装置与流程

本申请涉及数据分析领域,具体而言,涉及一种数据类型识别方法及装置。



背景技术:

在数据分析领域,在进行数据处理前一般需要知道待处理数据的数据类型,而在工作时,本领域技术人员为了录入的方便常常忽略设置待处理数据的数据类型,在进行分析前一般由技术人员手工标注数据类型,但随着计算机技术的飞速发展,待处理数据的数据量越来越大,手工标注的任务量变得越来越大,导致数据类型识别的计算量越来越大。

申请内容

有鉴于此,本申请的目的在于提供一种数据类型识别方法及装置,以解决或者改善上述问题。

为了实现上述目的,本申请实施例采用的技术方案如下:

第一方面,本申请实施例提供一种数据类型识别方法,应用于电子设备,所述方法包括:

获得待处理数据表,其中,所述待处理数据表包括多个数据位置以及每个数据位置的多个节点数据;

对所述待处理数据表进行抽样,并根据抽样后的待处理数据表中的每个数据位置的各个节点数据得到每个数据位置的各个节点数据的数据类型信息,其中,所述数据类型信息包括至少一个数据类型,所述数据类型包括字符串、数字、时间中的一种;

遍历每个数据位置的各个节点数据,根据该数据位置的各个节点数据的数据类型信息得到各个节点数据的共有数据类型信息,根据所述共有数据类型信息得到抽样前的待处理数据表中该数据位置的数据类型信息。

可选地,所述待处理数据表包括多个抽样数据单元,所述抽样数据单元包括不同数据位置的节点数据,所述对所述待处理数据表进行抽样的步骤包括:

对所述待处理数据表的各个抽样数据单元进行抽样,并根据抽样后的各个抽样数据单元得到抽样后的待处理数据表。

可选地,所述根据所述共有数据类型信息得到抽样前的待处理数据表中该数据位置的数据类型信息的步骤包括:

获得该数据位置的标签信息,并对所述标签信息进行语义分析得到所述标签信息对应的数据类型信息;

提取所述共有数据类型信息与所述标签信息对应的数据类型信息之间的公共数据类型信息,所述公共数据类型信息为该数据位置的数据类型信息。

可选地,所述根据所述共有数据类型信息得到抽样前的待处理数据表中该数据位置的数据类型信息的步骤之后,所述方法还包括:

根据每个数据位置的数据类型信息对所述待处理数据表进行校验,并判断校验结果是否满足预设标准;

若否,则返回对所述待处理数据表进行抽样的步骤。

可选地,所述根据每个数据位置的数据类型信息对所述待处理数据表进行校验,并判断校验结果是否满足预设标准的步骤,包括:

根据每个数据位置的数据类型信息生成每个数据位置的验证规则;

遍历每个数据位置,根据该数据位置的验证规则对重新抽样的待处理数据表中该数据位置的各个节点数据进行校验,得到校验结果,其中,所述校验结果包括与所述验证规则匹配的第一节点数据以及与所述验证规则不匹配的第二节点数据;

根据所述第一节点数据与所述第二节点数据得到该数据位置与所述验证规则的匹配比例,并判断所述匹配比例是否高于比例阈值;

若是,则判定校验结果满足所述预设标准;

若否,则判定校验结果不满足所述预设标准。

第二方面,本申请实施例还提供一种数据类型识别装置,应用于电子设备,所述方法包括:

获取模块,用于获得待处理数据表,其中,所述待处理数据表包括多个数据位置以及每个数据位置的多个节点数据;

抽样模块,用于对所述待处理数据表进行抽样,并根据抽样后的待处理数据表中的每个数据位置的各个节点数据得到每个数据位置的各个节点数据的数据类型信息,其中,所述数据类型信息包括至少一个数据类型,所述数据类型包括字符串、数字、时间中的一种;以及

识别模块,用于遍历每个数据位置的各个节点数据,根据该数据位置的各个节点数据的数据类型信息得到各个节点数据的共有数据类型信息,根据所述共有数据类型信息得到抽样前的待处理数据表中该数据位置的数据类型信息。

可选地,所述抽样模块还用于:

对所述待处理数据表的各个抽样数据单元进行抽样,并根据抽样后的各个抽样数据单元得到抽样后的待处理数据表。

可选地,所述识别模块还用于:

获得该数据位置的标签信息,并对所述标签信息进行语义分析得到所述标签信息对应的数据类型信息;

提取所述共有数据类型信息与所述标签信息对应的数据类型信息之间的公共数据类型信息,所述公共数据类型信息为该数据位置的数据类型信息。

可选地,所述数据类型识别装置还包括校验模块;

所述校验模块用于根据每个数据位置的数据类型信息对待处理数据表进行校验,并判断校验结果是否满足预设标准,并在校验结果不满足预设标准,使所述抽样模块重新对待处理数据表进行抽样。

可选地,所述校验模块还用于:

根据每个数据位置的数据类型信息生成每个数据位置的验证规则;

遍历每个数据位置,根据该数据位置的验证规则对重新抽样的待处理数据表中该数据位置的各个节点数据进行校验,得到校验结果,其中,所述校验结果包括与所述验证规则匹配的第一节点数据以及与所述验证规则不匹配的第二节点数据;

根据所述第一节点数据与所述第二节点数据得到该数据位置与所述验证规则的匹配比例,并判断所述匹配比例是否高于比例阈值;

若是,则判定校验结果满足所述预设标准;

若否,则判定校验结果不满足所述预设标准。

相比现有技术,本申请的有益效果是:

本申请实施例提供的数据类型识别方法及装置,通过待处理数据表进行抽样,并仅对抽样后的节点数据进行数据类型识别从而避免了对待处理数据中的所有节点数据进行数据类型识别,减少了数据类型识别的计算量,提高了对数据位置的数据类别的识别速度。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的用于实现数据类型识别方法的电子设备的结构示意框图。

图2为本申请实施例提供的数据类型识别方法的一种流程示意图。

图3为本申请实施例提供的数据类型识别方法的另一种流程示意图。

图4为本申请实施例提供的数据类型识别装置的功能模块图。

图标:100-电子设备;110-总线;120-处理器;130-存储介质;140-总线接口;150-网络适配器;160-用户接口;200-数据类型识别装置;210-获取模块;220-抽样模块;230-识别模块;240-校验模块。

具体实施方式

针对上述背景技术中描述的技术问题,需特别说明的是,对于规范的数据表,例如excel表,相关技术人员在进行编辑时经常将表格数据的数据类型设置为兼容性较强的常规类型,但在进行数据处理时,无法根据常规类型得到表格数据的具体数据类型,因此在进行数据处理时常常会产生较大的问题,例如,无法根据数据类型直接将表中的数据分为待处理数据以及数据标记。基于此,本申请发明人提供了一种数据类型识别方法及装置,以解决上述技术问题,并着重解决excel表中表格数据的数据类型识别问题。本申请提供的数据类型识别方法及装置,通过待处理数据表进行抽样,并仅对抽样后的节点数据进行数据类型识别从而避免了对待处理数据中的所有节点数据进行数据类型识别,减少了数据类型识别的计算量,提高了对数据位置的数据类别的识别速度。

以上现有技术中的方案所存在的缺陷,均是申请人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案,都应该是申请人在本申请过程中对本申请做出的贡献。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的关键可以相互组合。

请参阅图1,为本申请实施例提供的电子设备100的结构示意框图。电子设备100可以作为服务器的一部分,并通过网络协议与客户端通讯连接。

如图1所示,电子设备100可以由总线110作一般性的总线体系结构来实现。根据电子设备100的具体应用和整体设计约束条件,总线110可以包括任意数量的互连总线和桥接。总线110将各种电路连接在一起,这些电路包括处理器120、存储介质130和总线接口140。可选地,电子设备100可以使用总线接口140将网络适配器150等经由总线110连接。网络适配器150可用于实现电子设备100中物理层的信号处理功能,并通过网络协议与各个用户端通讯连接。用户接口160可以连接外部设备,例如:键盘、显示器、鼠标或者操纵杆等。总线110还可以连接各种其它电路,如定时源、外围设备、电压调节器或者功率管理电路等,这些电路是本领域所熟知的,因此不再详述。

可以替换的,电子设备100也可配置成通用处理系统,例如通称为芯片,该通用处理系统包括:提供处理功能的一个或多个微处理器,以及提供存储介质130的至少一部分的外部存储器,所有这些都通过外部总线体系结构与其它支持电路连接在一起。

可替换的,电子设备100可以使用下述来实现:具有处理器120、总线接口140、用户接口160的asic(专用集成电路);以及集成在单个芯片中的存储介质130的至少一部分,或者,电子设备100可以使用下述来实现:一个或多个fpga(现场可编程门阵列)、pld(可编程逻辑器件)、控制器、状态机、门逻辑、分立硬件部件、任何其它适合的电路、或者能够执行本申请通篇所描述的各种功能的电路的任意组合。

其中,处理器120负责管理总线110和一般处理(包括执行存储在存储介质130上的软件)。处理器120可以使用一个或多个通用处理器和/或专用处理器来实现。处理器120的例子包括微处理器、微控制器、dsp处理器和能够执行软件的其它电路。应当将软件广义地解释为表示指令、数据或其任意组合,而不论是将其称作为软件、固件、中间件、微代码、硬件描述语言还是其它。

在图1中存储介质130被示为与处理器120分离,然而,本领域技术人员很容易明白,存储介质130或其任意部分可位于电子设备100之外。举例来说,存储介质130可以包括传输线、用数据调制的载波波形、和/或与无线节点分离开的计算机制品,这些介质均可以由处理器120通过总线接口140来访问。可替换地,存储介质130或其任意部分可以集成到处理器120中,例如,可以是高速缓存和/或通用寄存器。

处理器120可执行下述实施例,具体地,存储介质130中可以存储有数据类型识别装置200,处理器120可以用于数据类型识别装置200。

进一步地,请参阅图2,为本申请实施例提供的数据类型识别方法的一种流程示意图,本实施例中,数据类型识别方法由图1中所示的电子设备100执行。所应说明的是,本申请实施例提供的数据类型识别方法不以图2及以下的具体顺序为限制。本申请提供的数据类型识别方法的具体流程如下:

步骤s110,获得待处理数据表,其中,待处理数据表包括多个数据位置以及每个数据位置的多个节点数据。

需要说明的是,数据位置是节点数据在待处理数据表中的存在位置,例如,在一张excel表中,数据位置可以为excel表各个数据列,每个数据位置的多个节点数据可以为每个数据列中的各个表格数据。

作为一种实施方式,电子设备100可以响应用户操作直接从数据源中获取规范的待处理数据表,其中,数据源可以为电子设备100内的存储介质130,也可以为与电子设备100通信连接的数据存储服务器,规范的待处理数据表可以为数据库数据表、excel表等中的一种或多种组合。

对于规范的待处理数据表,可以根据待处理数据表的表格结构得到多个数据位置以及每个数据位置的多个节点数据。

作为另一种实施方式,电子设备100可以通过爬虫等数据获取方法,从互联网中获得爬虫数据,对于爬虫数据可以根据各个爬虫数据的标签信息对爬虫数据进行规范化,其中,可以将标签信息配置为规范化数据表格的数据位置,各个相同标签信息的不同数据可以作为该标签信息的数据位置的多个节点数据。

作为一种实施方式,电子设备100可以通过数据传输端口实时获得上述爬虫数据或规范的待处理数据表,为检测实时数据的数据类型,可以预设数据填充阈值,实时数据的数据量满足数据填充阈值时,根据已得到的实时数据生成待处理数据表。

基于上述设计,本申请提供的数据类型识别方法可以识别各种数据来源,各种数据表中的数据的数据类型,提高了本申请提供的数据类型识别方法的泛用性。

步骤s120,对待处理数据表进行抽样,并根据抽样后的待处理数据表中的每个数据位置的各个节点数据得到每个数据位置的各个节点数据的数据类型信息。

需要说明的是,数据类型信息包括至少一种数据类型,其中,当进行数据类型识别的类型精度较高时,数据类型信息包括至少一种数据类型,即数据类型信息可以为数据类型的集合,例如,对于2018这一节点数据,该节点数据数据的数据类型信息可以包括年时间类型、时间类型以及数字类型,当本数据类型识别的类型精度较低时,数据类型信息可以仅包括一种数据类型,例如,为提高本数据类型识别方法的运算速度,数据类型可以包括:字符串、时间以及数字,则对于节点数据“2018.01.01”其数据类型信息可以仅包括时间类型。

需要说明的是,上述类型精度是对数据类型精确度的度量,例如,对于时间类型这一数据类型可以进一步划分为年时间,日期时间,时间戳时间等更准确的数据类型,其中,年时间类型的类型精度比时间类型的类型精度更高。

可选地,在步骤s120之前,方法还可以包括:

对待处理数据表中的每个数据位置的数据类型进行预验证。

其中,待处理数据表中的每个数据位置的数据类型可以通过如下方式进行预验证:

首先,获取待处理数据表中的每个数据位置的标签信息,其中,标签信息可以包括表头信息、备注信息以及预设数据类型的一种或多种组合,需要说明的是预设数据类型是相关技术人员在待处理数据表中设置的每个数据位置的数据类型。

然后,根据标签信息获得每个数据位置的预检数据类型信息。

作为一种实施方式,对于表头信息或备注信息可以进行语义分析,并根据语义分析结果得到标签信息的数据类型信息;对于预设数据类型可以直接得到预设的数据类型信息。

可选地,对于既包括预设数据类型,又包括表头信息或备注信息的标签信息,可以将预设数据类型的数据类型信息与语义分析的的数据类型信息进行合并,例如,预设数据类型的数据类型信息包括时间类型,表头信息为“年份”,根据表头信息可以得到语义分析的的数据类型信息包括年时间类型,则该数据位置的预检数据类型信息包括时间类型以及年时间类型。

需要说明的是,为提升执行速度,对于既包括预设数据类型,又包括表头信息或备注信息的标签信息可以仅根据预设数据类型得到预检数据类型信息。

最后,根据数据类型需求将预检数据类型信息对应的数据位置分为需识别数据位置组以及不需识别数据位置组。其中,对于预检数据类型信息满足数据类型需求的数据位置,可以将该数据位置配置为不需识别数据位置,反之,则配置为需识别数据位置。

可选地,数据类型需求可以为本数据类型识别方法的类型精度,如果预检数据类型信息的类型精度比数据类型需求更高,则视为预检数据类型信息满足数据类型需求,例如,本申请识别出的数据类型可以包括字符串、数字、日期中的一种,如果预检数据类型信息包括时间类型以及年时间类型,年时间类型的类型精度比时间类型的类型精度高,则判定预检数据类型信息满足数据类型需求,并将该数据位置归入不需识别数据位置组。

基于上述设计,在执行步骤s120时,可以从待处理数据表中提取需识别数据位置组,并仅对可以需识别数据位置组进行抽样与特征识别,由于,避免了对各个数据位置进行数据类型识别,进一步减低了数据类型识别的计算量,提高了本数据类型识别方法的运行速度。

作为一种实施方式,步骤s120可以通过对待处理数据表的各个抽样数据单元进行抽样实现。其中,抽样数据单元包括不同数据位置的节点数据。

需要说明的是,抽样数据单元是待处理数据表的组成单元,例如,在excel表中,各个数据位置可以为表格中的各个数据列,对应的,抽样数据单元可以为各个数据行,一个抽样数据单元可以包括同一行中各个数据列的表格数据。对于爬虫数据,抽样数据单元可以为一个爬虫数据包。

具体地,在步骤s120中可以先对所述待处理数据表的各个抽样数据单元进行抽样,然后根据抽样后的各个抽样数据单元得到抽样后的待处理数据表。其中,抽样方法可以为简单随机抽样、分层抽样以及系统抽样中的一种,考虑到本申请应用场景的数据量较大,在抽样时一般采用系统抽样,在抽样时间隔预设长度,每n个抽样数据单元进行一次抽样。

基于上述设计,在抽样时可以进行一次抽样抽取出所有需要识别数据类型的数据位置的节点数据样本,减少了抽样的次数。

作为一种实施方式,得到每个数据位置的各个节点数据的数据类型信息的步骤可以包括首先将每个数据位置的节点数据输入数据类型识别网络,然后通过数据类型识别网络得到数据类型信息的。

可选地,对于结构不规范的数据,为进行数据类型识别,数据类型识别网络可以为神经网络,神经网络可以分为特征提取层以及分类函数,在工作时将各个节点数据输入特征提取层得到语义特征,再通过分类函数对语义特征进行分类,得到各个节点数据的数据类型信息。

可选地,对于结构规范的数据,为减少运算量,数据类型识别网络可以由各个数据类型的正则表达式构成,将各个节点数据输入数据类型识别网络后,将各个正则表达式与该节点数据进行匹配,如果匹配成功,则在该节点数据的数据类型信息中写入匹配成功的正则表达式对应的数据类型。

步骤s130,遍历每个数据位置的各个节点数据,根据该数据位置的各个节点数据的数据类型信息得到各个节点数据的共有数据类型信息,根据共有数据类型信息得到抽样前的待处理数据表中该数据位置的数据类型信息。

作为一种实施方式,对于每个数据位置,根据该数据位置的各个节点数据的数据类型信息,得到各个节点数据的共有数据类型信息,其中,共有数据类型信息中的各个数据类型为各个节点数据的数据类型信息中都包括的数据类型。例如,对某一数据位置的各个节点数据进行数据类型识别时,由于其中一个节点数据为“2018”使该节点数据的数据类型信息包括数值类型以及时间类型,而该数据位置的其他节点数据的数据类型信息仅有数值类型时,则该数据位置的数据类型信息包括数值类型。

可选地,考虑到待处理数据表可能存在误判以及输入错误的情况,可以对抽样后的数据位置的各个节点数据的数据类型进行统计,并将各个数据类型的频率配置为该数据位置的数据类型概率,并将概率高于预设阈值的数据类型作为该数据位置的数据类型。

基于上述设计,避免了数据数值的偶然性导致的数据类型识别错误,提高了数据类型识别的精确度。

作为一种实施方式,对于预验证后需识别数据位置的数据位置,在得到该数据位置的共有数据类型信息后,可以根据共有数据类型信息与预检数据类型信息得到公共数据类型信息,其中,公共数据类型信息可以包括数据类型信息的各个数据类型以及预检数据类型信息中的各个类型信息。

作为另一种实施方式,对于没有进行预验证的待处理数据表,可以参照预检的方法处理各个数据位置的标签信息,得到各个数据位置对应的数据类型信息,再根据对应的数据类型信息以及共有数据类型信息得到公共数据类型信息。

基于上述设计,可以有效利用标签信息,提高本申请提供的数据类型识别方法的类型精度。

可选地,请参阅图3,为本申请实施例提供的数据类型识别方法的一种流程示意图,本申请提供的数据类型识别方法在步骤s130之后还包括步骤s140。

步骤s140,根据每个数据位置的数据类型信息对待处理数据表进行校验,并判断校验结果是否满足预设标准。

并当校验结果不满足预设标准时,重新执行步骤s120。

作为一种实施方式,步骤s140可以通过以下子步骤执行:

首先,根据每个数据位置的数据类型信息生成每个数据位置的验证规则。

在执行上述步骤时,对于每个数据位置,可以先从该数据位置的数据类型信息中类型精度最高的数据类型,并根据该数据类型生成对应的正则法则,再将正则表达式作为该数据位置的验证规则。

然后,遍历每个数据位置,根据该数据位置的验证规则对重新抽样的待处理数据表中该数据位置的各个节点数据进行校验,得到校验结果,其中,校验结果包括与验证规则匹配的第一节点数据以及与验证规则不匹配的第二节点数据;

具体地,第一节点数据为可以与该数据位置的正则表达式匹配的节点数据,第二节点数据为可以与该数据位置的正则表达式无法匹配的节点数据。在匹配时,可以根据该位置的正则表达式对该位置的节点数据进行筛选,也可以逐一测试各个节点数据是否与正则表达式匹配。

最后,根据第一节点数据与第二节点数据得到该数据位置与验证规则的匹配比例,并判断匹配比例是否高于比例阈值,从而得到对校验结果是否满足预设标准的判断结果。

其中,当匹配比例高于比例阈值时,则判定校验结果满足预设标准;匹配比例低于比例阈值时,则判定校验结果不满足预设标准。

基于上述步骤,在对数据类型识别后在进行数据类型检验避免了在抽样时因为抽样的偶然性,导致的数据类型识别错误,进一步提高了本申请提供的数据类型识别方法的准确性。

基于上述数据类型识别方法,本申请发明人发现可以根据识别到的数据类型对待处理数据表进行重构,重构的待处理数据表包括至少一个数据维度以及各个数据维度对应的数据度量。例如,数据类型可以包括数字类型、字符串类型以及时间类型中的一种,数字类型的数据可以配置为数据度量,字符串类型以及时间类型的数据可以配置为数据维度。

其中,数据度量可以被配置为由数据维度确定的数据值,数据维度可以被配置为数据标志并用于与其他待处理数据表关联,例如,可以通过数据维度的数据维度值确定待处理数据表的数据单元,同时确定该数据维度对应的数据度量值。

本申请实施例还提供一种数据类型识别装置200,数据类型识别装置200,在一种实施方式中,请参阅图4,为本申请实施例提供的数据类型识别装置200的功能模块图,数据类型识别装置200可包括以下功能模块:

获取模块210,用于获得待处理数据表,其中,待处理数据表包括多个数据位置以及每个数据位置的多个节点数据;

抽样模块220,用于对待处理数据表进行抽样,并根据抽样后的待处理数据表中的每个数据位置的各个节点数据得到每个数据位置的各个节点数据的数据类型信息,其中,数据类型信息包括至少一个数据类型,数据类型包括字符串、数字、时间中的一种;

识别模块230,用于遍历每个数据位置的各个节点数据,根据该数据位置的各个节点数据的数据类型信息得到各个节点数据的共有数据类型信息,根据共有数据类型信息得到抽样前的待处理数据表中该数据位置的数据类型信息。

可选地,抽样模块220还用于:

对待处理数据表的各个抽样数据单元进行抽样,并根据抽样后的各个抽样数据单元得到抽样后的待处理数据表。

可选地,识别模块230还用于:

获得该数据位置的标签信息,并对标签信息进行语义分析得到标签信息对应的数据类型信息;

提取共有数据类型信息与标签信息对应的数据类型信息之间的公共数据类型信息,公共数据类型信息为该数据位置的数据类型信息。

可选地,数据类型识别装置200还可以包括校验模块240,校验模块240用于根据每个数据位置的数据类型信息对待处理数据表进行校验,并判断校验结果是否满足预设标准,并在校验结果不满足预设标准,使抽样模块220重新对待处理数据表进行抽样。

可选地,校验模块240还用于:

根据每个数据位置的数据类型信息生成每个数据位置的验证规则;

遍历每个数据位置,根据该数据位置的验证规则对重新抽样的待处理数据表中该数据位置的各个节点数据进行校验,得到校验结果,其中,校验结果包括与验证规则匹配的第一节点数据以及与验证规则不匹配的第二节点数据;

根据第一节点数据与第二节点数据得到该数据位置与验证规则的匹配比例,并判断匹配比例是否高于比例阈值;

若是,则判定校验结果满足预设标准;

若否,则判定校验结果不满足预设标准。

本申请实施例还提供一种可读存储介质,可读存储介质中存储有计算机程序,计算机程序被执行时可以实现上述任意方法实施例中的数据类型识别方法。

在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

需要说明的是,在本文中,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本关键的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1