一种基于图数据库的地址快速匹配搜索方法、装置及介质与流程

文档序号:36478030发布日期:2023-12-25 03:40阅读:38来源:国知局
一种基于图数据库的地址快速匹配搜索方法与流程

本发明涉及计算机,具体涉及一种基于图数据库的地址快速匹配搜索方法、装置及介质。


背景技术:

1、在商业应用中,尤其是在银行的一些消费贷款、信用卡申请业务中,需要将申请信息中的地址和单位名称进行匹配,用于执行合并客户信息、识别重复记录、黑名单地址/单位名称命中检测等任务。然而,由于数据质量、命名约定和用户输入习惯等因素的影响,这种匹配往往面临一些挑战。而在此之上,如何利用已有的匹配结果,作用在后续的匹配上,面临的挑战更大。

2、为了找到一个和输入的地址/单位名称相匹配的地址/单位名称,假设这样一种情况,地址d找到了一个和它相匹配的地址b,而地址b在之前也已经通过模糊匹配服务,找到了相匹配的地址a。此时,对于要返回给用户的匹配结果有这样几种情况:

3、1、通过不断的链式查询找到最早的匹配结果;

4、2、通过不断的链式查询找到匹配分值最高的匹配结果;

5、3、多种可选的匹配结果。

6、在反欺诈的业务中,如果一个地址/单位名称关联了多个申请人信息,那么就认为这个地址/单位名称本身是一个风险很大的地址。这个地址能关联到的点越多,那么风险可能越大。而如果选择匹配分值最高的匹配结果,最坏的情况下,每一次新的匹配,产生的分数都比之前高一些,那么每次都会返回新的地址/单位名称,就达不到关联的目的;如果选择最早匹配的地址/单位名称,则会将所有和这个地址/单位名称匹配的所有信息都关联起来,而这种关联会产生传播效应,进一步传递风险。

7、地址b通过模糊匹配找到了一个地址a1,地址a1也通过模糊匹配也找到了一个和它相匹配的地址a2,以此类推下去,很容易想到,这可能会产生一个地址匹配的链条,这条链条的最初始的链是an->a,即:b->a1->a1->a2->a3...->an->a,在这种情况下,需要设计一种方案,能够有效的识别出历史的匹配,能够将a做为b的模糊匹配地址返回。现有的一些方案是将历史的匹配对存储在key/value数据库中,然后通过不断的链式查询一点一点的往前推进,直到找到最初的匹配地址/单位名称。

8、即,在实时模糊匹配的场景下,不断的有新的地址/单位名称传输过来,当新的地址/单位名称匹配了b历史库中的地址/单位名称a1时,如何高效地寻找a1最早的匹配地址a是亟需解决的问题。


技术实现思路

1、针对背景技术中所提及的技术缺陷,本发明实施例的目的在于提供一种基于图数据库的地址快速匹配搜索方法、装置及存储介质。

2、为实现上述目的,第一方面,本发明实施例提供了一种基于图数据库的地址快速匹配搜索方法,包括:

3、创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间、单位名称点之间或地址点与单位名称点之间形成多个匹配边;

4、获取输入地址;

5、采用模糊匹配算法从所述图模型中找到所述输入地址的匹配地址。

6、作为本申请的一种优选实现方式,找到所述输入地址的匹配地址之后,所述方法还包括:

7、在所述图模型上,采用图连通算法找到所述输入地址的最初地址。

8、进一步地,作为本申请的一种优选实现方式,所述方法还包括:

9、若采用模糊匹配算法从所述图模型中未找到所述输入地址的匹配地址,则确定所述输入地址从所述图模型匹配得到的地址为第一匹配项;

10、将所述输入地址和第一匹配项插入到所述图模型中,作为新地址点;

11、在所述输入地址和新地址点之间、所述新地址点和最初地址之间分别建立匹配边。

12、进一步地,作为本申请的一种优选实现方式,在所述输入地址和新地址点之间、所述新地址点和最初地址之间分别建立匹配边之后,所述方法还包括:

13、将所述匹配地址或未匹配结果返回给用户。

14、第二方面,本发明实施例提供了一种基于图数据库的地址快速匹配搜索装置,包括:

15、创建单元,用于创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间、单位名称点之间或地址点与单位名称点之间形成多个匹配边;

16、获取单元,用于获取输入地址;

17、处理单元,用于采用模糊匹配算法从所述图模型中找到所述输入地址的匹配地址。

18、作为本申请的一种优选实现方式,所述处理单元还用于:

19、在所述图模型上,采用图连通算法找到所述输入地址的最初地址;

20、若采用模糊匹配算法从所述图模型中未找到所述输入地址的匹配地址,则确定所述输入地址从所述图模型匹配得到的地址为第一匹配项;

21、将所述输入地址和第一匹配项插入到所述图模型中,作为新地址点;

22、在所述输入地址和新地址点之间、所述新地址点和最初地址之间分别建立匹配边;

23、将所述匹配地址或未匹配结果返回给用户。

24、第三方面,本发明实施例还提供了一种基于图数据库的地址快速匹配搜索装置,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如上述第一方面所述的方法步骤。

25、第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现如上述第一方面所述的方法步骤。

26、本发明实施例提供的基于图数据库的地址快速匹配搜索方案,利用图数据库高效搜索多跳关联关系的能力,利用图的连通性算法以及图库自身的内部id的单调递增性,快速找到可以连通的id最小的点,作为最初匹配的地址返回给用户,这种方案不需要进行链式查询,速度上相比链式查询要快很多。



技术特征:

1.一种基于图数据库的地址快速匹配搜索方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,找到所述输入地址的匹配地址之后,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述方法还包括:

4.如全路要求3所述的方法,其特征在于,在所述输入地址和新地址点之间、所述新地址点和最初地址之间分别建立匹配边之后,所述方法还包括:

5.一种基于图数据库的地址快速匹配搜索装置,其特征在于,包括:

6.如权利要求5所述的装置,其特征在于,所述处理单元还用于:

7.如全路要求6所述的装置,其特征在于,所述处理单元还用于:

8.一种基于图数据库的地址快速匹配搜索装置,其特征在于,所述电子设备用于针对图数据库进行用户权限管理,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-4任一项所述的方法步骤。

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,其特征在于,所述程序指令被处理器执行时实现如权利要求1-4任一项所述的方法步骤。


技术总结
本发明实施例公开了一种基于图数据库的地址快速匹配搜索方法、装置及存储介质。其中,方法包括:创建图模型;所述图模型包括多个地址点或单位名称点,所述地址点之间、单位名称点之间或地址点与单位名称点之间形成多个匹配边;获取输入地址;采用模糊匹配算法从所述图模型中找到所述输入地址的匹配地址。本发明实施例提供的基于图数据库的地址快速匹配搜索方案,利用图数据库高效搜索多跳关联关系的能力,利用图的连通性算法以及图库自身的内部id的单调递增性,快速找到可以连通的id最小的点,作为最初匹配的地址返回给用户,这种方案不需要进行链式查询,速度上相比链式查询要快很多。

技术研发人员:张晨,周研,蒋阔,吴菁
受保护的技术使用者:浙江创邻科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1