一种医保欺诈行为识别方法、装置及电子设备与流程

文档序号:35816899发布日期:2023-10-22 07:42阅读:56来源:国知局
一种医保欺诈行为识别方法、装置及电子设备与流程

本技术涉及数据处理,尤其涉及一种医保欺诈行为识别方法、装置及电子设备。


背景技术:

1、社会医疗保险(简称医保)对维护社会安定、调节收入差距、促进社会公平等具有重要意义,为了防止医保基金被冒领套取,需要对医保报销行为进行异常甄别。现有技术中,通常是将历史医保行为按时间维度汇总,使用行为序列分类模型对参保人的行为和特征序列进行分类预测,打上“异常”或“正常”的预测标签。然而,在实际中医保行为复杂多样,包括过度医疗型欺诈、虚假就医型欺诈、冒用医保卡欺诈等各种不同类型的欺诈,对应的数据分布具有较大差异,现有技术笼统的将医保行为归类为“异常”和“正常”,使得模型难以学习到统一的模式,医保欺诈识别率较低。


技术实现思路

1、本技术实施例提供一种医保欺诈行为识别方法、装置及电子设备,以解决现有医保欺诈识别方法的识别率率较低的问题。

2、第一方面,本技术实施例提供了一种医保欺诈行为识别方法,包括:

3、获取待识别的医保行为数据;

4、将所述医保行为数据输入预先训练好的多门控多专家混合(multi-gatemixture-of-experts,mmoe)模型中进行医保欺诈识别,获得所述医保行为数据所属的欺诈类型;

5、其中,所述mmoe模型是利用医保行为样本数据集对初始mmoe模型进行多任务训练得到的,所述mmoe模型具有至少两个学习任务,每个学习任务分别用于识别一类医保欺诈行为。

6、可选地,所述mmoe模型的训练过程包括:

7、获取医保行为样本数据集,并对所述医保行为样本数据集中的医保行为样本数据标注至少两种欺诈类型标签;

8、将所述医保行为样本数据输入所述初始mmoe模型中,获取所述初始mmoe模型输出的所述医保行为样本数据分别属于各类医保欺诈行为的概率;

9、基于预先定义的损失函数、所述初始mmoe模型输出的所述医保行为样本数据分别属于各类医保欺诈行为的概率和所述医保行为样本数据的欺诈类型标签,计算模型损失值;

10、基于所述模型损失值,对所述初始mmoe模型的参数进行调整,以得到训练好的所述mmoe模型。

11、可选地,所述模型损失值为所述至少两个学习任务中各学习任务的损失值与该学习任务的损失权重的加权和;

12、其中,在所述医保行为样本数据不属于第一欺诈类型的情况下,用于识别所述第一欺诈类型的第一学习任务的损失权重为预设值,所述预设值小于或等于1;在所述医保行为样本数据属于所述第一欺诈类型的情况下,所述第一学习任务的损失权重为第一权重,所述第一权重与所述医保行为样本数据的欺诈金额和所述医保行为样本数据集中属于所述第一欺诈类型的样本数量相关;所述第一学习任务为所述至少两个学习任务中的任一个。

13、可选地,所述第一权重等于第一参量、第二参量和第三参量的乘积,所述第一参量为所述医保行为样本数据的欺诈金额与所述医保行为样本数据集中的最大欺诈金额的比值,所述第二参量为所述医保行为样本数据集中不属于所述第一欺诈类型的样本数量与所述医保行为样本数据集中属于所述第一欺诈类型的样本数量的比值,所述第三参量为权重调节系数。

14、可选地,所述mmoe模型包括n个专家单元、n个门控单元和n个塔单元,每个门控单元均与所述n个专家单元连接,所述n个门控单元与所述n个塔单元一一对应连接,n等于所述mmoe模型的学习任务的数量。

15、第二方面,本技术实施例还提供一种医保欺诈行为识别装置,包括:

16、获取模块,用于获取待识别的医保行为数据;

17、识别模块,用于将所述医保行为数据输入预先训练好的多门控多专家混合mmoe模型中进行医保欺诈识别,获得所述医保行为数据所属的欺诈类型;

18、其中,所述mmoe模型是利用医保行为样本数据集对初始mmoe模型进行多任务训练得到的,所述mmoe模型具有至少两个学习任务,每个学习任务分别用于识别一类医保欺诈行为。

19、可选地,所述mmoe模型的训练过程包括:

20、获取医保行为样本数据集,并对所述医保行为样本数据集中的医保行为样本数据标注至少两种欺诈类型标签;

21、将所述医保行为样本数据输入所述初始mmoe模型中,获取所述初始mmoe模型输出的所述医保行为样本数据分别属于各类医保欺诈行为的概率;

22、基于预先定义的损失函数、所述初始mmoe模型输出的所述医保行为样本数据分别属于各类医保欺诈行为的概率和所述医保行为样本数据的欺诈类型标签,计算模型损失值;

23、基于所述模型损失值,对所述初始mmoe模型的参数进行调整,以得到训练好的所述mmoe模型。

24、可选地,所述模型损失值为所述至少两个学习任务中各学习任务的损失值与该学习任务的损失权重的加权和;

25、其中,在所述医保行为样本数据不属于第一欺诈类型的情况下,用于识别所述第一欺诈类型的第一学习任务的损失权重为预设值,所述预设值小于或等于1;在所述医保行为样本数据属于所述第一欺诈类型的情况下,所述第一学习任务的损失权重为第一权重,所述第一权重与所述医保行为样本数据的欺诈金额和所述医保行为样本数据集中属于所述第一欺诈类型的样本数量相关;所述第一学习任务为所述至少两个学习任务中的任一个。

26、可选地,所述第一权重等于第一参量、第二参量和第三参量的乘积,所述第一参量为所述医保行为样本数据的欺诈金额与所述医保行为样本数据集中的最大欺诈金额的比值,所述第二参量为所述医保行为样本数据集中不属于所述第一欺诈类型的样本数量与所述医保行为样本数据集中属于所述第一欺诈类型的样本数量的比值,所述第三参量为权重调节系数。

27、可选地,所述mmoe模型包括n个专家单元、n个门控单元和n个塔单元,每个门控单元均与所述n个专家单元连接,所述n个门控单元与所述n个塔单元一一对应连接,n等于所述mmoe模型的学习任务的数量。

28、第三方面,本技术实施例还提供一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的医保欺诈行为识别方法中的步骤。

29、第四方面,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的医保欺诈行为识别方法中的步骤。

30、在本技术实施例中,获取待识别的医保行为数据;将所述医保行为数据输入预先训练好的多门控多专家混合mmoe模型中进行医保欺诈识别,获得所述医保行为数据所属的欺诈类型;其中,所述mmoe模型是利用医保行为样本数据集对初始mmoe模型进行多任务训练得到的,所述mmoe模型具有至少两个学习任务,每个学习任务分别用于识别一类医保欺诈行为。这样,通过对mmoe模型进行多任务协同训练,使得模型可以区分不同医保欺诈类型的差异,从而对于医保欺诈行为具有更高的识别准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1