基于字符匹配的数据分类方法、装置、设备以及存储介质与流程

文档序号:27311728发布日期:2021-11-09 22:40阅读:来源:国知局

技术特征:
1.一种基于字符匹配的数据分类方法,其特征在于,所述方法包括:获取待分类的业务数据;将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据,其中,所述数据模型中预设有多个数据分类,且所述数据模型中的每个数据均已被预先划分至各个数据分类中;根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中;其中,所述匹配数据为相同数据或者近似数据,所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据,所述近似数据指所述数据模型中与所述业务数据的字符未完全一致,且包含所述业务数据中所有字符的数据。2.根据权利要求1所述的基于字符匹配的数据分类方法,其特征在于,所述根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中,包括:当所述匹配数据为所述相同数据时,将所述相同数据在所述数据模型的数据分类确定为所述目标数据分类,并将所述业务数据分类至所述目标数据分类中;当所述匹配数据为所述近似数据时,按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据,基于所述相似数据在所述数据模型的数据分类确定所述目标数据分类,并将所述业务数据分类至所述目标数据分类中。3.根据权利要求2所述的基于字符匹配的数据分类方法,其特征在于,所述按照预设的查找方式在所述数据模型中查找与所述业务数据对应的相似数据,包括:将所述业务数据和所述数据模型中的数据分别映射为数据向量空间中的数据向量;基于所述业务数据和所述数据模型中的数据分别对应的数据向量,从所述数据模型的数据中筛选出与所述业务数据对应的相似数据。4.根据权利要求3所述的基于字符匹配的数据分类方法,其特征在于,所述基于所述业务数据和所述数据模型中的数据分别对应的数据向量,从所述数据模型的数据中筛选出与所述业务数据对应的相似数据,包括:根据历史半径确定出当前半径,其中,所述历史半径是上一次筛选相似数据的过程中所确定出的半径,所述当前半径大于所述历史半径;根据业务数据向量和所述当前半径确定出数据向量范围,其中,所述业务数据向量是所述业务数据在所述数据向量空间中所对应的向量,所述数据向量范围是在所述数据向量空间中,以所述业务数据向量为中心,以所述当前半径为半径的圆形范围;判断所述数据向量范围内的数据向量的数量是否大于历史数据向量范围内的数据向量的数量,其中,所述历史数据向量范围是在所述数据向量空间中,以所述业务数据向量为中心,以所述历史半径为半径的圆形范围;当所述数据向量范围内的数据向量的数量未大于所述历史数据向量范围内的数据向量的数量时,将所述数据向量范围内的数据向量在所述数据模型中所对应的数据确定为与所述业务数据对应的相似数据。5.根据权利要求4所述的基于字符匹配的数据分类方法,其特征在于,所述根据历史半径确定出当前半径,包括:
通过以下公式以指数增长的方式,根据历史半径计算出当前半径:y=log
a x;z=a
y+1
;其中,y为所述历史半径对应的指数值,a为预设的底数,x为所述历史半径,z为所述当前半径。6.根据权利要求1

5任一项所述的基于字符匹配的数据分类方法,其特征在于,所述获取待分类的业务数据之后,所述方法还包括:判断所述业务数据中是否存在表结构中文字段名称;当判断出所述业务数据中存在所述表结构中文字段名称时,按照预设的中英文转换方式,将所述业务数据中的表结构中文字段名称转换为表结构英文字段名称;判断所述业务数据的表结构英文字段名称是否在预设的特殊转换表格中,其中,所述特殊转换表格中记录有多个目标表结构英文字段名称和每个所述目标表结构英文字段名称所对应的特殊转换方式,所述目标表结构英文字段名称是指需要执行特殊转换的表结构英文字段名称;当判断出所述业务数据的表结构英文字段名称在所述特殊转换表格中时,按照目标特殊转换方式,将所述业务数据的表结构英文字段名称转换为特殊表结构英文字段名称,所述目标特殊转换方式是指所述业务数据的表结构英文字段名称在所述特殊转换表格中所对应的特殊转换方式。7.根据权利要求1

5任一项所述的基于字符匹配的数据分类方法,其特征在于,所述获取待分类的业务数据之后,所述方法还包括:判断所述业务数据中是否存在合并数据;当判断出所述业务数据中存在所述合并数据时,根据所述合并数据所对应的源数据的数据类型重新设置所述合并数据的数据类型;其中,所述源数据是指上游系统中的原始数据,所述合并数据是由所述源数据合并后得到的数据。8.一种基于字符匹配的数据分类装置,其特征在于,所述装置包括:获取模块,用于获取待分类的业务数据;匹配模块,用于将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据,其中,所述数据模型中预设有多个数据分类,且所述数据模型中的每个数据均已被预先划分至各个数据分类中;分类模块,用于根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中;其中,所述匹配数据为相同数据或者近似数据,所述相同数据指所述数据模型中与所述业务数据的字符完全一致的数据,所述近似数据指所述数据模型中与所述业务数据的字符未完全一致,且包含所述业务数据中所有字符的数据。9.一种计算机设备,其特征在于,所述计算机设备包括:存储有可执行程序代码的存储器;与所述存储器连接的处理器;所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1

7任一项所述的基于字符匹配的数据分类方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1

7任一项所述的基于字符匹配的数据分类方法。

技术总结
本发明公开了一种基于字符匹配的数据分类方法,包括:获取待分类的业务数据;将所述业务数据与预设的数据模型中的每个数据进行字符匹配,得到所述数据模型中与所述业务数据相匹配的匹配数据;根据所述匹配数据在所述数据模型中对应的目标数据分类,将所述业务数据分类至所述数据模型中的所述目标数据分类中。可见,本发明能够通过简单的字符匹配的方式实现对业务数据的分类,减少数据分类中进行的复杂的数据分析过程,在保证数据分类的准确性的同时,兼顾数据分类的效率。本发明还涉及区块链技术领域。技术领域。技术领域。


技术研发人员:谢峥
受保护的技术使用者:平安国际智慧城市科技股份有限公司
技术研发日:2021.08.12
技术公布日:2021/11/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1