基于模块度和互信息的保险欺诈检测方法及系统与流程

文档序号:34302627发布日期:2023-05-31 17:24阅读:53来源:国知局
基于模块度和互信息的保险欺诈检测方法及系统与流程

本发明涉及计算机,尤其涉及一种基于模块度和互信息的保险欺诈检测方法及系统。


背景技术:

1、随着科学技术的发展,获取数据并利用数据建模以解决相应的问题,已经是非常常见的技术手段,例如,各个保险购买平台会收集用户的保险购买、受理、记录等数据,并根据收集的记录数据构建保险欺诈检测模型,以减少保险公司被骗保的现象。

2、随着市场的多样化,农业生产从事者在生产活动过程中的合作也越来越明显,这加快了农业险在农业生产者中覆盖的同时,也催生了农业险欺诈团伙。这些团伙旨在通过互相合作、制造虚假理赔事故,来骗取公司的理赔额,这不仅影响了公司的市场形象,也大大损害了公司在农业险市场中产生的经济效益。

3、目前的农险欺诈检测方法主要是根据用户的历史投保信息,挖掘用户和的供销合作关系,从而挖掘出虚假理赔事故。但是这种方法检测出来的虚假理赔事故准确率不高。

4、因此,亟需一种能提高农险欺诈检测结果的农险欺诈检测方法。


技术实现思路

1、本发明提供一种基于模块度和互信息的保险欺诈检测方法、系统、设备及存储介质,其主要目的在于更好的表示关系拓补网络中的低维表示矩阵,有效提高保险欺诈用户的检测效率。

2、第一方面,本发明实施例提供一种基于模块度和互信息的保险欺诈检测方法,包括:

3、根据数据库中对应的关系拓补网络,获取用户邻接矩阵和用户属性特征矩阵,所述关系拓补网络包括所述数据库中的用户、所述数据库中任意两个用户之间的合作关系和所述数据库中用户的个人属性信息;

4、根据所述用户邻接矩阵和所述用户属性特征矩阵,对向量表征学习模型进行训练,直到训练后向量表征学习模型对应的损失函数满足目标条件,获取训练后的向量表征学习模型,其中,所述损失函数根据所述向量表征学习模型的模块度最大化和互信息最大化确定;

5、根据所述数据库中目标用户对应的用户邻接矩阵和所述目标用户对应的用户属性特征矩阵,获取所述目标用户对应的最佳低维表征矩阵,并根据所述目标用户对应的最佳低维表征矩阵和目标聚类算法,获取所述目标用户对应的目标类别;

6、根据所述目标类别中用户的历史保险欺诈信息,确定所述目标用户是否存在保险欺诈。

7、优选地,所述向量表征学习模型包括图卷积神经网络、互信息模块和模块度模块,所述根据所述用户邻接矩阵和所述用户属性特征矩阵,对向量表征学习模型进行训练,直到训练后向量表征学习模型对应的损失函数满足目标条件,获取训练后的向量表征学习模型,包括:

8、根据所述用户邻接矩阵和所述用户属性特征矩阵,基于所述图卷积神经网络,获取初始低维表征矩阵,并根据所述初始低维表征矩阵,获取全局表示向量;

9、对所述用户属性特征矩阵中的元素随机排列组合,得到参考特征表示矩阵,并根据所述用户邻接矩阵和所述参考特征表示矩阵,基于所述图卷积神经网络,获取参考低维表征向量;

10、根据所述初始低维表征矩阵、所述全局表示向量和所述参考低维表征向量,基于所述互信息模块,获取第一损失函数;

11、根据预设类别指示矩阵、模块度常数矩阵和所述初始低维表征矩阵,基于所述模块度模块,获取第二损失函数;

12、判断损失函数是否满足目标条件,若不满足,则调整所述向量表征学习模型的网络参数,重复上述过程,直到调整后的向量表征学习模型对应的损失函数满足所述目标条件,并获取训练后的向量表征学习模型,所述损失函数包括所述第一损失函数和所述第二损失函数。

13、优选地,所述根据所述初始低维表征矩阵、所述全局表示向量和所述参考低维表征向量,基于所述互信息模块,获取第一损失函数,通过如下公式获得:

14、

15、其中,表示所述第一损失函数,i、j均为正整数且不相等,n表示所述数据库中用户的总数量,为双线性打分函数,s表示所述全局表示向量,hi表示所述初始低维表征矩阵中的第i个初始低维表征向量,表示所述参考低维表征矩阵中的第j个参考低维表征向量。

16、优选地,所述根据预设类别指示矩阵、模块度常数矩阵和所述初始低维表征矩阵,基于所述模块度模块,获取第二损失函数,通过如下公式获得:

17、

18、q=tr(utbu),s.t.tr(utu)=n,

19、

20、其中,表示所述第二损失函数,u表示所述预设类别指示矩阵,b表示所述模块度常数矩阵,h表示所述初始低维特征表示矩阵,c表示预设类别表示矩阵,bij表示所述模块度常数矩阵中第i行第j列元素,aij表示所述用户邻接矩阵中第i行第j列元素,di表示所述关系拓补网络中第i个节点对应的度数,dj表示所述关系拓补网络中第j个节点对应的度数,|e|表示所述关系拓补网络中边的总数,q表示模块度,n表示预设对角线之和,i、j均为正整数且不相等。

21、优选地,所述基于所述初始低维表征矩阵,获取全局表示向量,通过如下公式获得:

22、

23、其中,s表示所述全局表示向量,h表示所述初始低维特征表示矩阵,σ表示线性整流函数,n表示所述数据库中用户的总数量,hi表示所述初始低维表征矩阵中的第i个初始低维表征向量,i为正整数。

24、优选地,所述根据所述目标类别中用户的历史保险欺诈信息,确定所述目标用户是否存在保险欺诈,包括:

25、获取所述目标类别中的历史保险欺诈信息;

26、根据所述历史保险欺诈信息对应的欺诈用户;

27、若所述目标用户与所述欺诈用户之间存在合作关系,则判定所述目标用户存在保险欺诈行为。

28、优选地,所述目标条件包括:训练次数达到预设次数,和,相邻两次训练对应的损失函数之差小于预设损失阈值。

29、第二方面,本发明实施例提供一种基于模块度和互信息的保险欺诈检测系统,包括:

30、网络模块,用于根据数据库中对应的关系拓补网络,获取用户邻接矩阵和用户属性特征矩阵,所述关系拓补网络包括所述数据库中的用户、所述数据库中任意两个用户之间的合作关系和所述数据库中用户的个人属性信息;

31、表征模块,用于根据所述用户邻接矩阵和所述用户属性特征矩阵,对向量表征学习模型进行训练,直到训练后向量表征学习模型对应的损失函数满足目标条件,获取训练后的向量表征学习模型,其中,所述损失函数根据所述向量表征学习模型的模块度最大化和互信息最大化确定;

32、聚类模块,用于根据所述数据库中目标用户对应的用户邻接矩阵和所述目标用户对应的用户属性特征矩阵,获取所述目标用户对应的最佳低维表征矩阵,并根据所述目标用户对应的最佳低维表征矩阵和目标聚类算法,获取所述目标用户对应的目标类别;

33、检测模块,用于根据所述目标类别中用户的历史保险欺诈信息,确定所述目标用户是否存在保险欺诈。

34、第三方面,本发明实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于模块度和互信息的保险欺诈检测方法的步骤。

35、第四方面,本发明实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于模块度和互信息的保险欺诈检测方法的步骤。

36、本发明提出的基于模块度和互信息的保险欺诈检测方法及系统,首先基于数据库中记录的用户构建的关系拓补网络,该拓补关系网络可以有效建模出用户之间的社交关系和用户的属性信息,并基于互信息最大化的方法可以降低该检测方法的时间复杂度,从而提高该检测方法的运行效率;另外,本发明基于模块度最大化,使得向量表征模型可以有效的将关系拓补网络中用户之间的合作关系刻画到最佳低维表征矩阵中,从而可以更有效和更准确的挖掘出目标用户与其它用户之间的合作关系,更有效、更准确的检测出目标用户是否存在保险欺诈行为。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1