人员信息数据整合方法、系统和计算机可读存储介质与流程

文档序号:34896208发布日期:2023-07-26 00:18阅读:来源:国知局

技术特征:

1.一种人员信息数据整合方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的人员信息数据整合方法,其特征在于,所述s102中确定数据记录的排重键的操作包括:

3.根据权利要求2所述的人员信息数据整合方法,其特征在于,所述散列映射的算法为md5算法。

4.根据权利要求1所述的人员信息数据整合方法,其特征在于,将去重后的所述人员信息数据均分至不同的所述分库表中的具体操作为:

5.根据权利要求1所述的人员信息数据整合方法,其特征在于,根据所述可信度权值选取所述异常数据中可信度最高的一条所述人员信息数据的方法为通过二叉树进行遍历查询,其中,所述二叉树的左侧的人员信息数据的可信度权值较高低的数据,右侧的人员信息数据的可信度权值较高,所述遍历查询为后序算法遍历查询。

6.根据权利要求1所述的人员信息数据整合方法,其特征在于,所述可信度权值的设置依据包括信息来源、获取手段和置信度中的至少一种。

7.根据权利要求1所述的人员信息数据整合方法,其特征在于,所述人员基础库使用postgres数据库创建。

8.计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至7任一项所述的方法。

9.人员信息数据整合系统,其特征在于,所述系统包括:

10.根据权利要求9所述的人员信息数据整合系统,其特征在于,所述分配单元确定数据记录的排重键的操作包括:

11.根据权利要求10所述的人员信息数据整合方法,其特征在于,所述散列映射的算法为md5算法。

12.根据权利要求9所述的人员信息数据整合系统,其特征在于,所述分配单元包括:

13.根据权利要求9所述的人员信息数据整合系统,其特征在于,根据所述可信度权值选取所述异常数据中可信度最高的一条所述人员信息数据的方法为通过二叉树进行遍历查询,其中,所述二叉树的左侧的人员信息数据的可信度权值较高低的数据,右侧的人员信息数据的可信度权值较高,所述遍历查询为后序算法遍历查询。

14.根据权利要求9所述的人员信息数据整合系统,其特征在于,所述可信度权值的设置依据包括信息来源、获取手段和置信度中的至少一种。

15.根据权利要求9所述的人员信息数据整合系统,其特征在于,所述人员基础库使用postgres数据库创建。


技术总结
本发明公开了一种人员信息数据整合方法,包括:S101、创建人员基础库,人员基础库用于导入人员信息数据并形成人员信息表,人员基础库具有多个分库表;S102、确定数据记录的排重键,基于排重键对人员信息数据进行去重;S103、将去重后的所述人员信息数据均分至不同的所述分库表中;S104、将人员信息数据与所述人员信息表进行匹配,其中,响应于人员信息数据为异常数据,根据可信度权值选取异常数据中可信度最高的一条作为人员属性所对应的人员信息数据与人员信息表进行匹配,异常数据为针对同一人员属性的多条内容不一致的人员信息数据。本发明能够更好地进行负载均衡,从而保证以较快的速度进行查询和更新处理,数据选取的准确度也更高。

技术研发人员:吴松松,李锐,陈汀,姚志强,张磊,田野
受保护的技术使用者:厦门市美亚柏科信息股份有限公司
技术研发日:
技术公布日:2024/1/13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1