团伙案件识别方法、装置、计算机设备、存储介质和产品与流程

文档序号:31471914发布日期:2022-09-09 23:28阅读:44来源:国知局
团伙案件识别方法、装置、计算机设备、存储介质和产品与流程

1.本技术涉及计算机技术领域,特别是涉及一种团伙案件识别方法、装置、计算机设备、存储介质和产品。


背景技术:

2.目前,在保险行业中保险欺诈行为越来越多。在医保领域,团伙作案的保险欺诈案件较为凸出,例如,参保人员可以通过与医生或者代理人的勾结来骗取医疗保障金。
3.传统技术中,风险识别系统可以对历史案件进行分析,通过提取历史案件的共同特征来识别团伙作案案件。
4.但是,上述风险识别过程限于对历史案件的分析,对理赔过程中的团伙作案风险识别效率较差。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种能够对历史案件和理赔过程中的案件进行团伙作案的风险识别,且能够提高团伙作案的风险识别效率的团伙案件识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
6.第一方面,本技术提供了一种团伙案件识别方法。该方法包括:获取与待处理案件关联的目标人物;根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物;人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值;该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度;将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件。
7.在其中一个实施例中,该方法还包括:基于历史理赔案件的基本信息,构建人物基本关系图谱;人物基本关系图谱中包括历史理赔案件所关联的各人物之间的关联关系;确定历史理赔案件中与关联关系对应的待分析案件;对待分析案件进行异常检测,并根据异常检测结果确定关联关系对应的关联风险值;根据人物基本关系图谱以及各关联关系对应的关联风险值,构建人物关系图谱。
8.在其中一个实施例中,根据异常检测结果确定关联关系对应的关联风险值,包括:确定待分析案件中检测异常的案件数量;将案件数量与待分析案件的总数量之间的比值,确定为关联关系对应的关联风险值。
9.在其中一个实施例中,异常检测包括住院时间异常检测、治疗费用异常检测以及就诊行为异常检测。
10.在其中一个实施例中,对待分析案件进行异常检测,包括:在待分析案件的平均床位费小于参考床位费的情况下,确定待分析案件的住院时间检测异常;在待分析案件的平均治疗费用小于参考治疗费用,且,待分析案件的住院天数大于参考住院天数的情况下,确定待分析案件的治疗费用检测异常;在待分析案件与其它待分析案件的就诊时间相同的情况下,确定待分析案件的就诊行为检测异常;在待分析案件的异常检测存在至少一项检测异常的情况下,确定待分析案件为检测异常案件。
11.在其中一个实施例中,该方法还包括:在关联风险值大于等于预设的第一风险阈值的情况下,对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度;将相似度大于或等于相似度阈值的待分析案件确定为相似案件;验证相似案件是否为团伙作案案件;在确定相似案件为团伙作案案件的情况下,在人物关系图谱中将关联风险值对应的关联关系标注为团伙作案关系。
12.在其中一个实施例中,第一风险阈值与相似度阈值负相关。
13.在其中一个实施例中,对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度,包括:提取各待分析案件的医疗元素,得到待分析案件对应的特征向量;计算任意两个待分析案件的特征向量之间的余弦相似度,和/或,计算任意两个待分析案件的向量之间的杰卡德相似度;相应地,将相似度大于等于相似度阈值的待分析案件确定为相似案件,包括:将余弦相似度大于等于第一余弦相似度阈值,或者,杰卡德相似度大于等于第一杰卡德相似度阈值的待分析案件确定为相似案件。
14.在其中一个实施例中,风险关联关系包括关联风险值大于预设的第二风险阈值的关联关系,和/或,目标人物对应的团伙作案关系。
15.在其中一个实施例中,将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件,包括:提取待处理案件的医疗元素,得到待处理案件对应的第一向量;以及,提取历史案件的医疗元素,得到历史案件对应的第二向量;计算第一向量和第二向量的余弦相似度,和/或,杰卡德相似度;在余弦相似度大于等于第二余弦相似度阈值,或者,杰卡德相似度大于等于第二杰卡德相似度阈值的情况下,确定待处理案件为团伙作案案件。
16.在其中一个实施例中,获取与待处理案件关联的目标人物之前,还包括:对待处理案件进行异常检测;在检测结果正常的情况下,执行获取与待处理案件关联的目标人物的步骤。
17.第二方面,本技术还提供了一种团伙案件识别装置。该装置包括:获取模块,用于获取与待处理案件关联的目标人物;
第一确定模块,用于根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物;人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值;该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度;第二确定模块,用于将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件。
18.第三方面,本技术还提供了一种计算机设备。该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面中的步骤。
19.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面中的步骤。
20.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面中的步骤。
21.上述团伙案件识别方法、装置、计算机设备、存储介质和计算机程序产品,计算机设备通过获取与待处理案件关联的目标人物,并根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物,接着,将该待处理案件与各关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件;其中,该人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值,该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度。也就是说,本技术实施例中,根据待处理案件的目标人物和系统中预设的人物关系图谱,查询出与目标人物之间的风险关联程度较高的关联人物,进而,再对待处理案件与关联人物的各历史案件之间进行相似度分析,最后,根据分析结果来确定该待处理案件是否为团伙作案案件。该团伙案件识别过程中,不仅能实现对历史案件进行团伙作案案件的识别,还能实现对理赔系统中的待处理案件进行团伙作案案件的识别,即直接对理赔系统中团伙作案案件进行事中拦截;另外,在对理赔系统中的待处理案件进行团伙作案案件的识别过程中,是通过对待处理案件和与待处理案件关联的目标人员之间具有风险关联关系的关联人物的历史案件进行分析对比,即对待处理案件和数据库中的部分历史案件进行相似度分析对比,且该部分历史案件与待处理案件所涉及到的人物之间具有团伙作案的风险程度较高;因此,相比于现有技术中与数据库中的全量历史案件进行相似度分析对比而言,不仅能确保团伙案件的识别准确率,还能大大减少团伙案件识别过程中的案件处理量,减少计算资源,提高团伙案件的识别效率。
附图说明
22.图1为一个实施例中团伙案件识别方法的应用环境图;图2为一个实施例中团伙案件识别方法的流程示意图;图3为另一个实施例中团伙案件识别方法的流程示意图;图4为另一个实施例中团伙案件识别方法的流程示意图;图5为另一个实施例中团伙案件识别方法的流程示意图;图6为另一个实施例中团伙案件识别方法的流程示意图;图7为另一个实施例中团伙案件识别方法的流程示意图;图8为另一个实施例中团伙案件识别方法的流程示意图;图9为一个实施例中团伙案件识别装置的结构框图。
具体实施方式
23.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
24.本技术实施例提供的团伙案件识别方法,可以应用于如图1所示的计算机设备中。该计算机设备可以是终端,也可以是服务器,其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史案件数据和人物关系图谱数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种团伙案件识别方法。
25.本领域技术人员可以理解,图1中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。该计算机设备可以用独立的服务器或者是多个服务器组成的服务器集群来实现,本技术实施例对此并不做限定。
26.下面将通过实施例并结合附图具体地对本技术实施例的技术方案以及本技术实施例的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
27.在一个实施例中,如图2所示,提供了一种团伙案件识别方法,以该方法应用于图1中的计算机设备为例进行说明,包括以下步骤:步骤201,获取与待处理案件关联的目标人物。
28.其中,该目标人物可以是与待处理案件相关的所有人物,也可以是与待处理案件相关的预设类别的人物,例如:对于医保案件来说,该预设类别的人物可以是医保案件的投保人、被保人、主治医生、代理人等。
29.步骤202,根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物。
30.其中,人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值;该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度。可选地,该人物关系图谱中的各个人物之间可以仅包括关联关系,也可以包括关联关系和关联风险值;例如,该关联关系可以包括但不限于是亲属关系、介绍关系、医患关系、代理关系、同事关系、领里关系、同案件关系、以及团伙关系等;另外,该关联风险值可以是具体数值,如0-1、0-100、或者是百分比形式等,也可以是用于表征团伙作案的风险程度的风险等级值,如a、b、c,或者、、等,本技术实施例对关联风险值的表现形式并不做具体限定。
31.可选地,可以根据关联关系的类型预设风险关联关系,也可以根据关联风险值的大小或者等级预设风险关联关系,也就是说,可以将具有预设类型和/或关联风险值较高(关联风险值的大小大于等于预设风险阈值,或者,关联风险值的等级高于预设风险等级)的两个人物之间的关系确定为风险关联关系;例如:在关联关系包括团伙关系的情况下,可
以确定两个人物之间具有风险关联关系,或者,在两个人物之间的关联风险值大于等于0.8的情况下,可以确定两个人物之间具有风险关联关系。换句话说,计算机设备可以基于预设的人物关系图谱,采用人物关系图谱中各个人物之间的关联关系和/或关联风险值,来确定与待处理案件关联的目标人员之间具有风险关联关系的关联人物。可选地,风险关联关系可以包括关联风险值大于预设的第二风险阈值的关联关系,和/或,目标人物对应的团伙作案关系。
32.步骤203,将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件。
33.可选地,在确定出与待处理案件关联的目标人员之间具有风险关联关系的关联人物之后,可以获取各关联人物的历史案件,并对待处理案件和各个历史案件进行相似度分析,得到待处理案件和各个历史案件之间的相似度,进而,可以根据待处理案件和各个历史案件之间的相似度,判断该待处理案件是否为团伙作案案件;例如:在确定待处理案件与某个历史案件之间的相似度较高时,可以确定待处理案件为团伙作案案件,还可以确定该某个历史案件为团伙作案案件。
34.进一步地,在确定出团伙作案案件之后,还可以将该团伙作案案件发送至业务验证系统进行验证,以确保计算机设备识别出的该团伙作案案件就是团伙作案案件,能够进一步提高团伙作案案件的识别准确性。
35.上述团伙案件识别方法中,计算机设备通过获取与待处理案件关联的目标人物,并根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物,接着,将该待处理案件与各关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件;其中,该人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值,该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度。也就是说,本技术实施例中,根据待处理案件的目标人物和系统中预设的人物关系图谱,查询出与目标人物之间的风险关联程度较高的关联人物,进而,再对待处理案件与关联人物的各历史案件之间进行相似度分析,最后,根据分析结果来确定该待处理案件是否为团伙作案案件。该团伙案件识别过程中,不仅能实现对历史案件进行团伙作案案件的识别,还能实现对理赔系统中的待处理案件进行团伙作案案件的识别,即直接对理赔系统中团伙作案案件进行事中拦截;另外,在对理赔系统中的待处理案件进行团伙作案案件的识别过程中,是通过对待处理案件和与待处理案件关联的目标人员之间具有风险关联关系的关联人物的历史案件进行分析对比,即对待处理案件和数据库中的部分历史案件进行相似度分析对比,且该部分历史案件与待处理案件所涉及到的人物之间具有团伙作案的风险程度较高;因此,相比于现有技术中与数据库中的全量历史案件进行相似度分析对比而言,不仅能确保团伙案件的识别准确率,还能大大减少团伙案件识别过程中的案件处理量,减少计算资源,提高团伙案件的识别效率。
36.图3为另一个实施例中团伙案件识别方法的流程示意图。本实施例中涉及的是上述预设的人物关系图谱的其中一种可选的构建过程,如图3所示,在上述实施例的基础上,上述方法还包括:步骤301,基于历史理赔案件的基本信息,构建人物基本关系图谱。
37.其中,人物基本关系图谱中包括历史理赔案件所关联的各人物之间的关联关系;
可选地,该关联关系可以包括但不限于是亲属关系、介绍关系、医患关系、代理关系、以及涉及同一案件的关联关系等。
38.可选地,针对数据库中的各个历史理赔案件,可以提取历史理赔案件中的基本信息,该基本信息可以包括但不限于是保单信息、案件信息以及人物信息等,其中,该人物信息可以包括但不限于是投保人、被保人、主治医生、代理人等。计算机设备可以根据从各个历史理赔案件中提取出的基本信息,构建人物基本关系图谱。
39.步骤302,确定历史理赔案件中与关联关系对应的待分析案件。
40.可选地,针对上述人物基本关系图谱中的每一个关联关系,可以确定出各关联关系对应的两个目标人物所共同参与的历史理赔案件的目标数量,接着,还可以确定出这两个目标人物分别参与的理赔案件总数,在该目标数量与任一目标人物对应的理赔案件总数的比值超过某一预设占比的情况下,可以将该关联关系对应的这两个目标人物所共同参与的历史理赔案件确定为待分析案件。
41.也就是说,在任意两个人物所共同涉及的理赔案件数量在其中一个人物的理赔案件总数的占比超过预设占比的情况下,可以确定两个人物所共同涉及的理赔案件具有一定的聚集性,这两个人物也可能存在一定的团伙作案风险,可以进一步对这两个人物进行风险分析。例如:假设对于同一案件涉及的代理人和医生,该代理人和该医生共同参与的理赔案件数量占该代理人的理赔案件总数的比值在50%以上,换句话说就是,该代理人下50%以上的理赔案件都发生在该医生下,那么可以确定该代理人和该医生存在一定的团伙作案风险,可以将涉及该代理人和该医生的历史理赔案件确定为待分析案件。
42.步骤303,对待分析案件进行异常检测,并根据异常检测结果确定关联关系对应的关联风险值。
43.可选地,对上述确定出的有聚集性的待分析案件,可以对这些待分析案件进行异常检测,可以通过对这些待分析案件所涉及的存在造假可能的数据(即异常要素)进行异常分析,比如:住院时间是否异常、住院费是否异常、医药费是否异常等;在对各个待分析案件进行异常检测时,可以对该待分析案件所涉及的存在造假可能的数据一一进行异常判断,可以采用每个数据对应的参考值和待分析案件中该数据的实际值进行对比,来判断待分析案件中的数据是否存在异常;可选地,在异常检测时如果存在多个异常要素,那么在存在至少一个异常要素检测并确定该待分析案件存在异常时,即可确定该待分析案件为检测异常案件。
44.进一步地,在异常检测得到异常检测结果之后,可以根据该异常检测结果确定这些待分析案件涉及的两个目标人物的关联关系对应的关联风险值。可选地,可以确定出该关联关系对应的所有待分析案件中检测为异常的案件数量,并可以将该案件数量与该待分析案件的总数量之间的比值,确定为该关联关系对应的关联风险值。
45.步骤304,根据人物基本关系图谱以及各关联关系对应的关联风险值,构建人物关系图谱。
46.可选地,在确定出至少一个关联关系对应的关联风险值之后,可以将各个关联关系对应的关联风险值添加至人物基本关系图谱中,构建得到人物关系图谱。也就是说,在该人物关系图谱中,包括不同人物之间的关联关系,以及部分或者全部的关联关系对应的关联风险值,即两个具有关联关系的人物之间,如果共同参与的案件的聚集性不高,可以无需
确定两者之间的关联风险值。
47.本实施例中,计算机设备基于历史理赔案件的基本信息,构建包括历史理赔案件所关联的各人物之间的关联关系的人物基本关系图谱,接着,确定历史理赔案件中与关联关系对应的待分析案件,以及对待分析案件进行异常检测,并根据异常检测结果确定关联关系对应的关联风险值,最后,根据人物基本关系图谱以及各关联关系对应的关联风险值,构建人物关系图谱;也就是说,本技术实施例中的人物关系图谱中不仅包含人物之间的基本关联关系,还可以人物之间的涉案风险关系,通过案件的聚集性进一步分析人物之间的关联风险值,增加了人物关系图谱中各人物之间的关系维度,提高了人物关系图谱的全面性,进而还能提高基于该人物关系图谱进行团伙案件识别的准确性。
48.在本技术的一个可选的实施例中,上述异常检测可以包括住院时间异常检测、治疗费用异常检测以及就诊行为异常检测等;相应地,如图4所示,上述步骤303中“对待分析案件进行异常检测”可以包括:步骤401,在待分析案件的平均床位费小于参考床位费的情况下,确定待分析案件的住院时间检测异常。
49.其中,该参考床位费为一天的平均床位费。
50.可选地,计算机设备可以基于数据库中的所有历史理赔案件,估算出每个医院的住院床位费,例如:可以根据发生在某个医院的所有历史理赔案件,提取每个历史理赔案件中的住院总床位费、住院时间和出院时间,并通过计算公式:床位费/天=住院总床位费/(住院时间-出院时间),计算每个历史理赔案件对应的住院床位费;接着,可以判断每个历史理赔案件对应的住院床位费中住院床位费为整数和小数的占比,在整数占比高于小数占比的情况下,可以将住院床位费为整数中的最小整数作为该参考床位费。通过本实施例中的参考床位费的确定方法,无需依赖于外部平台提供的医疗数据,也避免了外部平台数据获取的高昂费用,大大提高了参考床位费的获取便捷性。
51.在对待分析案件进行住院时间异常检测时,可以提取该待分析案件的平均床位费,并在确定该平均床位费小于该参考床位费的情况下,可以确定该待分析案件的住院时间检测异常,即该待分析案件极有可能造假病历延长了住院时间,以获取更多理赔。
52.步骤402,在待分析案件的平均治疗费用小于参考治疗费用,且,待分析案件的住院天数大于参考住院天数的情况下,确定待分析案件的治疗费用检测异常。
53.可选地,计算机设备可以基于数据库中的所有历史理赔案件,估算出每个医院下每种疾病的治疗费用,例如:可以根据发生在某个医院下治疗某一种疾病的所有历史理赔案件,提取每个历史理赔案件中的治疗费用,可以将这些治疗费用的平均值作为该医院下治疗该疾病的参考治疗费用。同样的,还可以根据发生在某个医院下治疗某一种疾病的所有历史理赔案件,提取每个历史理赔案件中的住院天数,可以将这些住院天数的平均值作为该医院下治疗该疾病的参考住院天数。通过本实施例中的参考治疗费用和参考住院天数的确定方法,无需依赖于外部平台提供的医疗数据,也避免了外部平台数据获取的高昂费用,大大提高了参考治疗费用和参考住院天数的获取便捷性。
54.在对待分析案件进行治疗费用异常检测时,可以提取该待分析案件的平均治疗费用和住院天数,并在该待分析案件的平均治疗费用小于该参考治疗费用,且,该待分析案件的住院天数大于该参考住院天数的情况下,可以确定该待分析案件的治疗费用检测异常,
即可以认为该待分析案件为挂床。
55.步骤403,在待分析案件与其它待分析案件的就诊时间相同的情况下,确定待分析案件的就诊行为检测异常。
56.其中,该就诊时间可以包括住院时间和出院时间,也就是说,在该待分析案件与其他待分析案件,涉及同一时间住院和同一时间出院的情况下,可以确定该待分析案件的就诊行为检测异常,也可以确定与该待分析案件的就诊行为一致的其他待分析案件的就诊行为也检测为异常。
57.步骤404,在待分析案件的异常检测存在至少一项检测异常的情况下,确定待分析案件为检测异常案件。
58.本实施例中,计算机设备在确定待分析案件的平均床位费小于标准参考床位费的情况下,确定待分析案件的住院时间检测异常;在确定待分析案件的平均治疗费用小于参考治疗费用,且,确定待分析案件的住院天数大于参考住院天数的情况下,确定待分析案件的治疗费用检测异常;在确定待分析案件与其它待分析案件的就诊时间相同的情况下,确定待分析案件的就诊行为检测异常;最后,在对待分析案件的异常检测中存在至少一项检测异常的情况下,确定待分析案件为检测异常案件;也就是说,本实施例中计算机设备通过三种不同的异常检测方式对待分析案件进行异常检测,检测维度较多,检测范围全面,能够提高检测结果的准确性。
59.图5为另一个实施例中团伙案件识别方法的流程示意图。本实施例中涉及的是完善人物关系图谱的一种可选的实现过程,如图5所示,在上述实施例的基础上,上述方法还包括:步骤501,在关联风险值大于等于预设的第一风险阈值的情况下,对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度。
60.在上述步骤304根据人物基本关系图谱以及各关联关系对应的关联风险值,构建人物关系图谱之后,进一步地,还可以根据各关联关系对应的关联风险值,判断各个关联风险值是否大于等于预设的第一风险阈值;计算机设备在确定关联风险值大于等于预设的第一风险阈值的情况下,可以确定该关联风险值的风险关联程度较强,那么可以对该关联风险值对应的待分析案件进行相似性分析,获得该关联风险值对应的任意两个待分析案件之间的相似度。这里可以采用现有的相似度计算方法计算两个案件之间的相似度,本技术实施例对此不做过多的解释说明。
61.步骤502,将相似度大于或等于相似度阈值的待分析案件确定为相似案件。
62.可选地,该第一风险阈值与该相似度阈值负相关,也就是说,在人物之间的关联风险值较高时,可以相应地降低案件之间的相似度阈值,在案件相似度略低(比如:相似度阈值可以为0.98)的情况下,也可以认为是相似案件;相反的,在人物之间的关联风险值较低时,可以相应地提高案件之间的相似度阈值,在案件相似度较高(比如:相似度阈值可以为0.995)的情况下,也可以认为是相似案件。
63.步骤503,验证相似案件是否为团伙作案案件。
64.可选地,可以采用提取相似案件的共同特征来验证这些相似案件是否为团伙作案案件,也可以采用人工验证的方式,验证这些相似案件是否为团伙作案案件,本实施例对此并不做限定。
65.步骤504,在确定相似案件为团伙作案案件的情况下,在人物关系图谱中将关联风险值对应的关联关系标注为团伙作案关系。
66.可选地,在确定相似案件中有至少一个相似案件为团伙作案案件的情况下,可以确定该关联风险值对应的关联关系为团伙作案关系;也可以在确定相似案件中为团伙作案案件的占比高于某个阈值的情况下,确定该关联风险值对应的关联关系为团伙作案关系;进而,可以在人物关系图谱中将关联风险值对应的关联关系标注为团伙作案关系,即可以在原有的关联关系中增加团伙关系。
67.本实施例中,计算机设备在确定关联风险值大于等于预设的第一风险阈值的情况下,对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度;接着,可以将相似度大于或等于相似度阈值的待分析案件确定为相似案件,并验证相似案件是否为团伙作案案件;在确定相似案件为团伙作案案件的情况下,在人物关系图谱中将关联风险值对应的关联关系标注为团伙作案关系;也就是说,通过本实施例中的人物关系图谱完善过程,可以筛选出历史理赔案件中的团伙作案案件,还可以进一步基于历史的团伙作案案件确定人物关系图谱中的团伙作案人员,并完善人物关系图谱,使得人物关系图谱所包含的关系网越来越完整,越来越精确,进而还能提高基于完善后的人物关系图谱进行团伙案件识别的准确性。
68.图6为另一个实施例中团伙案件识别方法的流程示意图。本实施例中涉及的是计算机设备对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度的一种可选的实现过程,如图6所示,在上述实施例的基础上,上述步骤501包括:步骤601,提取各待分析案件的医疗元素,得到待分析案件对应的特征向量。
69.其中,该医疗元素可以按照疾病大类进行分类,包括但不限于是医疗费用(该医疗费用包括但不限于检查费、西药费、化验费、护理费、手术费、床位费、诊察费、材料费、放射费、自费费用)、门诊、住院时间、出院时间、住院时长、险种内部代码、出险金额等元素信息。
70.可选地,计算机设备可以提取各个待分析案件中的预设医疗元素对应的元素数据,并按照预设顺序将各医疗元素对应的元素数据生成该待分析案件对应的特征向量。
71.步骤602,计算任意两个待分析案件的特征向量之间的余弦相似度,和/或,计算任意两个待分析案件的向量之间的杰卡德相似度。
72.可选地,可以采用余弦相似度的计算公式,计算任意两个待分析案件的特征向量之间的余弦相似度,其中,余弦相似度的计算公式如公式(1)所示:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,ai和bi为任意两个待分析案件的特征向量,n为特征向量的维度,为任意两个待分析案件的特征向量之间的余弦相似度。
73.另外,还可以采用杰卡德相似度的计算公式,计算任意两个待分析案件的特征向量之间的杰卡德相似度,其中,杰卡德相似度的计算公式如公式(2)所示:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,a和b为任意两个待分析案件的特征向量,j(a,b)为任意两个待分析案件的特征向量之间的杰卡德相似度。
74.相应地,上述步骤502包括:步骤603,将余弦相似度大于等于第一余弦相似度阈值,或者,杰卡德相似度大于等于第一杰卡德相似度阈值的待分析案件确定为相似案件。
75.本实施例中,计算机设备通过提取各待分析案件的医疗元素,得到待分析案件对应的特征向量,计算任意两个待分析案件的特征向量之间的余弦相似度,和/或,计算任意两个待分析案件的向量之间的杰卡德相似度,并将余弦相似度大于等于第一余弦相似度阈值,或者,杰卡德相似度大于等于第一杰卡德相似度阈值的待分析案件确定为相似案件;也就是说,本技术实施例中计算机设备采用两种不同的相似度计算算法计算任意两个待分析案件之间的相似度,相比于现有技术中通过聚类或者通过计算距离算出的相似度,容易漏掉一些特征高度相同但案件相似度不是非常高的案件而言,而且采用杰卡德相似度能够找出某些案件特征高度一致,但余弦相似度不是十分高的案件,从而发现隐藏很深的欺诈案件,能够避免相似案件漏检的情况,提高相似案件的识别准确率。
76.图7为另一个实施例中团伙案件识别方法的流程示意图。本实施例中涉及的是计算机设备将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件的一种可选的实现过程,如图7所示,在上述实施例的基础上,上述步骤203包括:步骤701,提取待处理案件的医疗元素,得到待处理案件对应的第一向量;以及,提取历史案件的医疗元素,得到历史案件对应的第二向量。
77.步骤702,计算第一向量和第二向量的余弦相似度,和/或,杰卡德相似度。
78.步骤703,在余弦相似度大于等于第二余弦相似度阈值,或者,杰卡德相似度大于等于第二杰卡德相似度阈值的情况下,确定待处理案件为团伙作案案件。
79.需要说明的是,本实施例中的各个步骤的实现过程可以参照上述图6所示的实施例中的相关步骤描述,在此不再赘述。
80.本实施例中,计算机设备通过提取待处理案件的医疗元素,得到待处理案件对应的第一向量;以及,提取历史案件的医疗元素,得到历史案件对应的第二向量;并计算第一向量和第二向量的余弦相似度,和/或,杰卡德相似度;进而,在余弦相似度大于等于第二余弦相似度阈值,或者,杰卡德相似度大于等于第二杰卡德相似度阈值的情况下,确定待处理案件为团伙作案案件。也就是说,本技术实施例中计算机设备采用两种不同的相似度计算算法计算待分析案件与各个历史案件之间的相似度,相比于现有技术中通过一种相似度计算方式容易漏掉一些特征高度相同但案件相似度不是非常高的案件而言,能够避免团伙作案案件漏检的情况,提高团伙作案案件的识别准确率。
81.图8为另一个实施例中团伙案件识别方法的流程示意图。本实施例中涉及的是计算机设备在对待处理案件进行团伙作案案件识别之前,对待处理案件进行预先的异常检测的一种可选的实现过程,如图8所示,在上述实施例的基础上,上述步骤201之前还包括:
步骤801,对待处理案件进行异常检测。
82.可选地,在对待处理案件进行团伙作案案件的识别之前,还可以先对待处理案件进行异常检测,如果检测结果为异常,则可以确定该待处理案件为团伙作案案件,并可以发送至业务系统进行验证;在检测结果为正常的情况下,可以采用本技术实施例提供的团伙案件识别方法进行团伙作案案件的识别,以降低团伙案件案件识别的复杂度,提高团伙作案案件的识别效率。
83.另外,对待处理案件进行异常检测的方法和过程,可以参照上述步骤401至步骤404的相关描述,在此不再赘述。
84.步骤802,在检测结果正常的情况下,执行获取与待处理案件关联的目标人物的步骤。
85.本实施例中,计算机设备在获取与待处理案件关联的目标人物之前,对待处理案件进行异常检测,并在检测结果为正常的情况下,执行获取与待处理案件关联的目标人物的步骤,能够降低团伙案件案件识别的复杂度,提高团伙作案案件的识别效率。
86.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
87.基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的团伙案件识别方法的团伙案件识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个团伙案件识别装置实施例中的具体限定可以参见上文中对于团伙案件识别方法的限定,在此不再赘述。
88.在一个实施例中,如图9所示,提供了一种团伙案件识别装置,包括:获取模块901、第一确定模块902和第二确定模块903,其中:获取模块901,用于获取与待处理案件关联的目标人物;第一确定模块902,用于根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物;人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值;该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度;第二确定模块903,用于将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件。
89.在其中一个实施例中,该装置还包括人物关系图谱构建模块,该人物关系图谱构建模块包括第一构建单元、确定单元、异常检测单元和第二构建单元;其中,第一构建单元,用于基于历史理赔案件的基本信息,构建人物基本关系图谱;人物基本关系图谱中包括历史理赔案件所关联的各人物之间的关联关系;确定单元,用于确定历史理赔案件中与关联关系对应的待分析案件;异常检测单元,用于对待分析案件进行异常检测,并根据异常检测结果确定关联关系对应的关联风险值;第二构建单元,用于根据人物基本关系图谱以及各关联关系对应的关联风险值,构建人物关系图谱。
90.在其中一个实施例中,异常检测单元,具体用于确定待分析案件中检测异常的案件数量;将案件数量与待分析案件的总数量之间的比值,确定为关联关系对应的关联风险值。
91.在其中一个实施例中,异常检测包括住院时间异常检测、治疗费用异常检测以及就诊行为异常检测。
92.在其中一个实施例中,异常检测单元,具体用于在待分析案件的平均床位费小于参考床位费的情况下,确定待分析案件的住院时间检测异常;在待分析案件的平均治疗费用小于参考治疗费用,且,待分析案件的住院天数大于参考住院天数的情况下,确定待分析案件的治疗费用检测异常;在待分析案件与其它待分析案件的就诊时间相同的情况下,确定待分析案件的就诊行为检测异常;在待分析案件的异常检测存在至少一项检测异常的情况下,确定待分析案件为检测异常案件。
93.在其中一个实施例中,该人物关系图谱构建模块还包括关联关系标注模块,该关联关系标注模块,用于在关联风险值大于等于预设的第一风险阈值的情况下,对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度;将相似度大于或等于相似度阈值的待分析案件确定为相似案件;验证相似案件是否为团伙作案案件;在确定相似案件为团伙作案案件的情况下,在人物关系图谱中将关联风险值对应的关联关系标注为团伙作案关系。
94.在其中一个实施例中,第一风险阈值与相似度阈值负相关。
95.在其中一个实施例中,该关联关系标注模块,具体用于提取各待分析案件的医疗元素,得到待分析案件对应的特征向量;计算任意两个待分析案件的特征向量之间的余弦相似度,和/或,计算任意两个待分析案件的向量之间的杰卡德相似度;将余弦相似度大于等于第一余弦相似度阈值,或者,杰卡德相似度大于等于第一杰卡德相似度阈值的待分析案件确定为相似案件。
96.在其中一个实施例中,风险关联关系包括关联风险值大于预设的第二风险阈值的关联关系,和/或,目标人物对应的团伙作案关系。
97.在其中一个实施例中,上述第二确定模块903,具体用于提取待处理案件的医疗元素,得到待处理案件对应的第一向量;以及,提取历史案件的医疗元素,得到历史案件对应的第二向量;计算第一向量和第二向量的余弦相似度,和/或,杰卡德相似度;在余弦相似度大于等于第二余弦相似度阈值,或者,杰卡德相似度大于等于第二杰卡德相似度阈值的情况下,确定待处理案件为团伙作案案件。
98.在其中一个实施例中,该装置还包括异常检测模块,该异常检测模块,用于在获取模块901获取与待处理案件关联的目标人物之前,对待处理案件进行异常检测;在检测结果正常的情况下,指示获取模块901获取与待处理案件关联的目标人物。
99.上述团伙案件识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
100.在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取与待处理案件关联的目标人物;
根据预设的人物关系图谱,确定与目标人物具有风险关联关系的关联人物;人物关系图谱中包括不同人物之间的关联关系,以及关联关系对应的关联风险值;该关联风险值用于表征关联关系对应的人物进行团伙作案的风险程度;将待处理案件与关联人物相关的历史案件进行相似度分析,并根据分析结果确定待处理案件是否为团伙作案案件。
101.在一个实施例中,处理器执行计算机程序时还实现以下步骤:基于历史理赔案件的基本信息,构建人物基本关系图谱;人物基本关系图谱中包括历史理赔案件所关联的各人物之间的关联关系;确定历史理赔案件中与关联关系对应的待分析案件;对待分析案件进行异常检测,并根据异常检测结果确定关联关系对应的关联风险值;根据人物基本关系图谱以及各关联关系对应的关联风险值,构建人物关系图谱。
102.在一个实施例中,处理器执行计算机程序时还实现以下步骤:确定待分析案件中检测异常的案件数量;将案件数量与待分析案件的总数量之间的比值,确定为关联关系对应的关联风险值。
103.在一个实施例中,处理器执行计算机程序时还实现以下步骤:异常检测包括住院时间异常检测、治疗费用异常检测以及就诊行为异常检测。
104.在一个实施例中,处理器执行计算机程序时还实现以下步骤:在待分析案件的平均床位费小于参考床位费的情况下,确定待分析案件的住院时间检测异常;在待分析案件的平均治疗费用小于参考治疗费用,且,待分析案件的住院天数大于参考住院天数的情况下,确定待分析案件的治疗费用检测异常;在待分析案件与其它待分析案件的就诊时间相同的情况下,确定待分析案件的就诊行为检测异常;在待分析案件的异常检测存在至少一项检测异常的情况下,确定待分析案件为检测异常案件。
105.在一个实施例中,处理器执行计算机程序时还实现以下步骤:在关联风险值大于等于预设的第一风险阈值的情况下,对关联风险值对应的待分析案件进行相似性分析,获得任意两个待分析案件之间的相似度;将相似度大于或等于相似度阈值的待分析案件确定为相似案件;验证相似案件是否为团伙作案案件;在确定相似案件为团伙作案案件的情况下,在人物关系图谱中将关联风险值对应的关联关系标注为团伙作案关系。
106.在其中一个实施例中,第一风险阈值与相似度阈值负相关。
107.在一个实施例中,处理器执行计算机程序时还实现以下步骤:提取各待分析案件的医疗元素,得到待分析案件对应的特征向量;计算任意两个待分析案件的特征向量之间的余弦相似度,和/或,计算任意两个待分析案件的向量之间的杰卡德相似度;将余弦相似度大于等于第一余弦相似度阈值,或者,杰卡德相似度大于等于第一杰卡德相似度阈值的待分析案件确定为相似案件。
108.在一个实施例中,处理器执行计算机程序时还实现以下步骤:风险关联关系包括关联风险值大于预设的第二风险阈值的关联关系,和/或,目标人物对应的团伙作案关系。
109.在一个实施例中,处理器执行计算机程序时还实现以下步骤:提取待处理案件的医疗元素,得到待处理案件对应的第一向量;以及,提取历史案件的医疗元素,得到历史案件对应的第二向量;计算第一向量和第二向量的余弦相似度,和/或,杰卡德相似度;在余弦相似度大于等于第二余弦相似度阈值,或者,杰卡德相似度大于等于第二杰卡德相似度阈值的情况下,确定待处理案件为团伙作案案件。
110.在一个实施例中,处理器执行计算机程序时还实现以下步骤:在获取与待处理案件关联的目标人物之前,对待处理案件进行异常检测;在检测结果正常的情况下,执行获取与待处理案件关联的目标人物的步骤。
111.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各个实施例中的团伙案件识别方法的步骤。
112.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各个实施例中的团伙案件识别方法的步骤。
113.需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
114.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
115.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
116.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1