医保违规行为的检测方法、装置、设备及存储介质与流程

文档序号:27449466发布日期:2021-11-18 00:37阅读:181来源:国知局
医保违规行为的检测方法、装置、设备及存储介质与流程

1.本发明涉及数字医疗领域,尤其涉及一种医保违规行为的检测方法、装 置、设备及存储介质。


背景技术:

2.全国基本医保基金稳步增长,但与此同时,大量的违规问题也日 益显现,许多医院依旧存在利用医疗保障体系的漏洞而做出的违规操 作。为监督医保基金的使用情况,需要定期对医保违规行为进行检测。
3.当前针对医保欺诈场景中存在的医保违规行为的检测方法为通过预设的 规则进行数据筛选,但是这种检测方法的准确性并不高,原因在于对于刻意 绕过该规则的数据并不能对其进行识别。


技术实现要素:

4.本发明的主要目的在于解决现有医保违规行为检测方法的准确性较低的 问题。
5.本发明第一方面提供了一种医保违规行为的检测方法,包括:
6.接收终端发送的初始数据获取请求,并根据所述初始数据获取请求,获 取初始就医信息集;
7.基于所述初始就医信息集中每条就医记录,构建多条无向边,并基于每 条就医记录中的就医人员编号和每条就医记录中的问诊科室信息,构建多对 网络节点,以及将每条无向边连接一对网络节点,得到初始二部图网络;
8.基于所述初始二部图网络和fraudar算法,进行可疑群体检测,得到第一 可疑群体;
9.将所述第一可疑群体从所述初始二部图网络移除,得到二部图网络,并 对所述二部图网络进行可疑群体检测,得到第二可疑群体;
10.根据预设的迭代次数,对所述第二可疑群体进行迭代,得到至少一个第 三可疑群体,并计算所述第一可疑群体、所述第二可疑群体以及所述第三可 疑群体的并集,得到所述初始就医信息集中的虚假就医可疑群体,以及根据 所述初始就医信息集中的虚假就医可疑群体,生成医保违规行为的检测报告。
11.可选的,在本发明第一方面的第一种实现方式中,所述接收终端发送的 初始数据获取请求,并根据所述初始数据获取请求,获取初始就医信息集包 括:
12.接收终端发送的初始数据获取请求,其中,所述初始数据获取请求中包 括数据库标识参数和时间片段参数;
13.根据所述数据库标识参数,调用目标数据库;
14.基于所述时间片段参数,从所述目标数据库中获取初始就医信息集。
15.可选的,在本发明第一方面的第二种实现方式中,所述基于所述初始二 部图网络和fraudar算法,进行可疑群体检测,得到第一可疑群体包括:
16.计算所述初始二部图网络中每个网络节点的节点可疑度;
17.根据所述初始二部图网络中每个网络节点的节点可疑度,对所述初始二 部图网络中的目标网络节点及与所述目标网络节点相连的无向边进行迭代移 除,直至所述初始二部图网络的体积为零,得到多个候选二部图网络,其中, 所述目标网络节点为所述节点可疑度最大的网络节点;
18.计算每个候选二部图网络对应的全局平均可疑度,并确定全局平均可疑 度最大的目标二部图网络;
19.解析所述目标二部图网络的网络节点,得到第一可疑群体。
20.可选的,在本发明第一方面的第三种实现方式中,在所述计算所述初始 二部图网络中每个网络节点的节点可疑度之后,在所述根据所述初始二部图 网络中每个网络节点的节点可疑度,对所述初始二部图网络中的目标网络节 点及与所述目标网络节点相连的无向边进行迭代移除,直至所述初始二部图 网络的体积为零,得到多个候选二部图网络之前还包括:
21.基于所述初始二部图网络中每个网络节点的节点可疑度大小,将所述初 始二部图网络以优先树结构进行存储。
22.可选的,在本发明第一方面的第四种实现方式中,所述计算所述初始二 部图网络中每个网络节点的节点可疑度包括:
23.确定所述初始二部图网络中每个网络节点所连接的无向边,并计算每个 网络节点所连接的无向边的边可疑度;
24.计算每个网络节点所连接的无向边的边可疑度之和,得到每个网络节点 的节点可疑度。
25.可选的,在本发明第一方面的第五种实现方式中,所述计算每个候选二 部图网络对应的全局平均可疑度,并确定全局平均可疑度最大的目标二部图 网络还包括:
26.计算每个候选二部图网络中网络节点的节点可疑度之和,得到每个候选 二部图网络的全局可疑度,并统计每个候选二部图网络中网络节点的总数目;
27.根据每个候选二部图网络的全局可疑度和每个候选二部图网络中网络节 点的总数,计算每个候选二部图网络对应的全局平均可疑度,并确定全局平 均可疑度最大的目标二部图网络。
28.可选的,在本发明第一方面的第六种实现方式中,在所述根据预设的迭 代次数,对所述第二可疑群体进行迭代,得到至少一个第三可疑群体,并计 算所述第一可疑群体、所述第二可疑群体以及所述第三可疑群体的并集,得 到所述初始就医信息集中的虚假就医可疑群体,以及根据所述初始就医信息 集中的虚假就医可疑群体,生成医保违规行为的检测报告之后,还包括:
29.接收终端发送的多个候选数据获取请求,并根据所述候选数据获取请求, 获取多个不同时间段内的候选就医信息集;
30.确定每个候选就医信息集中的虚假就医可疑群体,并根据每个候选就医 信息集中的虚假就医可疑群体,构建虚假就医可疑群体集,其中,所述虚假 就医可疑群体中包括多个虚假就医可疑对象;
31.统计并计算所述虚假就医可疑群体集中每个虚假就医可疑对象的出现频 率,若
所述出现频率大于预设阈值时,则确定当前虚假就医可疑对象存在医 保违规行为。
32.本发明第二方面提供了一种医保违规行为的检测装置,包括:
33.数据获取模块,用于接收终端发送的初始数据获取请求,并根据所述初 始数据获取请求,获取初始就医信息集;
34.二部图构建模块,用于基于所述初始就医信息集中每条就医记录,构建 多条无向边,并基于每条就医记录中的就医人员编号和每条就医记录中的问 诊科室信息,构建多对网络节点,以及将每条无向边连接一对网络节点,得 到初始二部图网络;
35.可疑群体检测模块,用于基于所述初始二部图网络和fraudar算法,进行 可疑群体检测,得到第一可疑群体;
36.可疑群体复检模块,用于将所述第一可疑群体从所述初始二部图网络移 除,得到二部图网络,并对所述二部图网络进行可疑群体检测,得到第二可 疑群体;
37.迭代检测模块,用于根据预设的迭代次数,对所述第二可疑群体进行迭 代,得到至少一个第三可疑群体,并计算所述第一可疑群体、所述第二可疑 群体以及所述第三可疑群体的并集,得到所述初始就医信息集中的虚假就医 可疑群体,以及根据所述初始就医信息集中的虚假就医可疑群体,生成医保 违规行为的检测报告。
38.可选的,在本发明第二方面的第一种实现方式中,所述数据获取模块具 体包括:
39.接收单元,用于接收终端发送的初始数据获取请求,其中,所述初始数 据获取请求中包括数据库标识参数和时间片段参数;
40.调用单元,用于根据所述数据库标识参数,调用目标数据库;
41.获取单元,用于基于所述时间片段参数,从所述目标数据库中获取初始 就医信息集。
42.可选的,在本发明第二方面的第二种实现方式中,所述可疑群体检测模 块具体包括:
43.第一计算单元,用于计算所述初始二部图网络中每个网络节点的节点可 疑度;
44.迭代移除单元,用于根据所述初始二部图网络中每个网络节点的节点可 疑度,对所述初始二部图网络中的目标网络节点及与所述目标网络节点相连 的无向边进行迭代移除,直至所述初始二部图网络的体积为零,得到多个候 选二部图网络,其中,所述目标网络节点为所述节点可疑度最大的网络节点;
45.第二计算单元,用于计算每个候选二部图网络对应的全局平均可疑度, 并确定全局平均可疑度最大的目标二部图网络;
46.解析单元,用于解析所述目标二部图网络的网络节点,得到第一可疑群 体。
47.可选的,在本发明第二方面的第三种实现方式中,所述可疑群体检测模 块具体包括:
48.第一计算单元,用于计算所述初始二部图网络中每个网络节点的节点可 疑度;
49.存储单元,用于基于所述初始二部图网络中每个网络节点的节点可疑度 大小,将所述初始二部图网络以优先树结构进行存储;
50.迭代移除单元,用于根据所述初始二部图网络中每个网络节点的节点可 疑度,对所述初始二部图网络中的目标网络节点及与所述目标网络节点相连 的无向边进行迭代移除,直至所述初始二部图网络的体积为零,得到多个候 选二部图网络,其中,所述目标网络
节点为所述节点可疑度最大的网络节点;
51.第二计算单元,用于计算每个候选二部图网络对应的全局平均可疑度, 并确定全局平均可疑度最大的目标二部图网络;
52.解析单元,用于解析所述目标二部图网络的网络节点,得到第一可疑群 体。
53.可选的,在本发明第二方面的第四种实现方式中,所述第一计算单元具 体用于:
54.确定所述初始二部图网络中每个网络节点所连接的无向边,并计算每个 网络节点所连接的无向边的边可疑度;
55.计算每个网络节点所连接的无向边的边可疑度之和,得到每个网络节点 的节点可疑度。
56.可选的,在本发明第二方面的第五种实现方式中,所述第二计算单元具 体用于:
57.计算每个候选二部图网络中网络节点的节点可疑度之和,得到每个候选 二部图网络的全局可疑度,并统计每个候选二部图网络中网络节点的总数目;
58.根据每个候选二部图网络的全局可疑度和每个候选二部图网络中网络节 点的总数,计算每个候选二部图网络对应的全局平均可疑度,并确定全局平 均可疑度最大的目标二部图网络。
59.本发明第三方面提供了一种医保违规行为的检测设备,包括:存储器和 至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述 存储器中的所述指令,以使得所述医保违规行为的检测设备执行上述的医保 违规行为的检测方法。
60.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存 储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的医保 违规行为的检测方法。
61.本发明提供的技术方案中,通过获取就医信息集,以就医人员的编号和 医院的二级科室构建二部图网络,并基于fraudar算法回归出二部图网络中的 可疑群体,然后将可疑群体从二部图中移除后再次基于fraudar算法回归出新 的可疑群体,迭代回归多次,最后将每次迭代回归得到可疑群体作为虚假就 医可疑群体,并以此生成医保违规行为的检测结果,本发明以就医人员的编 号和医院的二级科室构建二部图网络,通过二部图网络将群体特征进行量化 表达,进而基于fraudar算法从该二部图网络回归出可疑群体,提高了医保违 规行为检测的准确性。
附图说明
62.图1为本发明实施例中医保违规行为的检测方法的第一个实施例示意图;
63.图2为本发明实施例中医保违规行为的检测方法的第二个实施例示意图;
64.图3为本发明实施例中医保违规行为的检测方法的第三个实施例示意图;
65.图4为本发明实施例中医保违规行为的检测方法的第四个实施例示意图;
66.图5为本发明实施例中医保违规行为的检测装置的一个实施例示意图;
67.图6为本发明实施例中医保违规行为的检测装置的另一个实施例示意图;
68.图7为本发明实施例中医保违规行为的检测设备的一个实施例示意图。
具体实施方式
69.本发明实施例提供了一种医保违规行为的检测方法、装置、设备及存储 介质,检测准确性更高。
70.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第 三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的 顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这 里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外, 术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含 了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出 的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、 产品或设备固有的其它步骤或单元。
71.为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本 发明实施例中医保违规行为的检测方法的一个实施例包括:
72.101、接收终端发送的初始数据获取请求,并根据初始数据获取请求,获 取初始就医信息集;
73.可以理解的是,初始就医信息集中的数据为医疗数据,如个人健康档案、 处方、检查报告等数据,例如某一家医院的医诊数据库中的用户就诊信息, 该初始就医信息集中包括多条就医记录,所述就医记录中包括就医人员编号 (id)和所述就医人员编号对应的问诊科室信息(hosp

dept)。
74.在一种可能的实现方式中,所述就医记录为医疗文本,所述医疗文本可 以是医疗电子记录(electronic healthcare record),电子化的个人健康记录,包 括病历、心电图、医学影像等一系列具备保存备查价值的电子化记录。
75.102、基于初始就医信息集中每条就医记录,构建多条无向边,并基于每 条就医记录中的就医人员编号和每条就医记录中的问诊科室信息,构建多对 网络节点,以及将每条无向边连接一对网络节点,得到初始二部图网络;
76.可以理解的是,一条无向边对应任意一对网络节点,在数目上,无向边 的数目与网络节点的对数是相同的,每条无向边仅连接一对网络节点,二部 图用于表示两个就医人员编号与医院二级科室信息之间问诊关系,其中,二 部图中包括两个点集,第一个点集为就医人员编号的集合,该集合中的每个 点用于表示一个就医人员编号,例如0025,第二个点集为医院二级科室信息 的集合,该集合中的每个点用于表示一个二级科室,例如皮肤科。服务器根 据一条就医记录,例如“2019年6月3日,就医人员0025在皮肤科进行问诊”, 从而构建一条无向边,该无向边的两个端点分别连接第一个点集中“0025”对应 的点和第二个点集中“皮肤科”对应的点。
77.103、基于初始二部图网络和fraudar算法,进行可疑群体检测,得到第 一可疑群体;
78.可以理解的是,fraudar算法通过定义一个可以表达结点平均可疑度的全 局度量,并在逐步贪心移除可疑度最小结点的迭代过程中,根据使该节点平 均可疑度达到最大的留存结点,组成可疑度最高的致密子图,即该第一可疑 群体。
79.104、将第一可疑群体从初始二部图网络移除,得到二部图网络,并对该 二部图网络进行可疑群体检测,得到第二可疑群体;
80.可以理解的是,服务器将一类可疑群体从初始二部图网络中移除后再次 进行可疑群体检测,从而得到另一类可疑群体。例如初始二部图网络中共包 含500条就医记录,第一可疑群体中涉及100条就医记录,将这100条就医 记录从中删除,以剩下的400条就医记录构成的二部图网络,再次进行可疑 群体检测,得到50条第二可疑群体。
81.105、根据预设的迭代次数,对第二可疑群体进行迭代,得到至少一个第 三可疑群体,并计算第一可疑群体、第二可疑群体以及第三可疑群体的并集, 得到初始就医信息集中的虚假就医可疑群体,以及根据初始就医信息集中的 虚假就医可疑群体,生成医保违规行为的检测报告。
82.可以理解的是,该迭代包括:将前一次可疑群体检测得到的第二可疑群 体从原二部图网络中移除后,再对新的二部图网络(即移除前一次的可疑群 体后的二部图网络)执行一次可疑群体检测。迭代次数可根据需求确定,每 一次迭代可以获得一个可疑群体,将该群体的结点从图中删除后再运行一次 迭代,又可以获得另一个次可疑群体,如此往复,可以根据业务需要得到多 个可疑群体,最后对得到的多个可疑群体计算并集,从而得到虚假就医可疑 群体,其中,虚假就医可疑群体即检测到存在医保违规行为的所有人员对象, 服务器根据该检测结果,生成相应的检测报告,例如可以通过数据读取得到 检测结果数据后,将检测结果数据匹配至相应的检测报告模板中以生成电子 检测报告等方式,本实施例中对检测报告的生成方式并不做限定。
83.本实施例中,本发明以就医人员的编号和医院的二级科室构建二部图网 络,通过二部图网络将群体特征进行量化表达,进而基于fraudar算法从该二 部图网络回归出可疑群体,提高了医保违规行为检测的准确性。
84.参阅图2,本发明实施例中医保违规行为的检测方法的第二个实施例包 括:
85.201、接收终端发送的初始数据获取请求,其中,初始数据获取请求中包 括数据库标识参数和时间片段参数;
86.可以理解的是,数据库标识参数包括数据库服务器的ip地址、数据库名 称以及用户名和密码,时间片段参数为一个时间范围,例如2019年6月1日 至2019年8月31日。
87.202、根据数据库标识参数,调用目标数据库;
88.可以理解的是,服务器首先根据数据库服务器的ip地址从而查询到对应 服务器,从而打开数据库服务,其次根据数据库名称,查到到对应的医诊记 录数据库,最后根据用户名和密码,对医诊记录数据库的进入权限进行校验。
89.203、基于时间片段参数,从目标数据库中获取初始就医信息集;
90.可以理解的是,医诊数据库中每条就医数据记录都存在一个唯一对应的 就医时间属性,服务器将时间片段参数转换为对应的数据库查询语句(sql 语句),从而根据就医时间属性查询与该时间片段参数对应的就医数据记录, 例如select*from hosp_medical_records where visit_time in(2019/06/01, 2019/08/31),其中,hosp_medical_records为表名称,visit_time为就医时间属 性,通过该语句可以查找出该医院的2019年6月1日至2019年8月31日内 的所有就医记录。
91.204、基于初始就医信息集中每条就医记录,构建多条无向边,并基于每 条就医记录中的就医人员编号和每条就医记录中的问诊科室信息,构建多对 网络节点,以及将每条无向边连接一对网络节点,得到初始二部图网络;
92.205、基于初始二部图网络和fraudar算法,进行可疑群体检测,得到第 一可疑群体;
93.206、将第一可疑群体从初始二部图网络移除,得到二部图网络,并对该 二部图网络进行可疑群体检测,得到第二可疑群体;
94.207、根据预设的迭代次数,对第二可疑群体进行迭代,得到至少一个第 三可疑群体,并计算第一可疑群体、第二可疑群体以及第三可疑群体的并集, 得到初始就医信息集中的虚假就医可疑群体,以及根据初始就医信息集中的 虚假就医可疑群体,生成医保违规行为的检测报告。
95.其中,步骤204

207与上述步骤102

105的执行步骤类似,具体此处不再 赘述。
96.本实施例中,详细描述了初始就医信息集的数据获取过程,通过数据请 求中的数据库标识参数与时间片段参数,快速定位相应时间段下的就医数据, 提升数据获取效率。
97.参阅图3,本发明实施例中医保违规行为的检测方法的第三个实施例包 括:
98.301、接收终端发送的初始数据获取请求,并根据初始数据获取请求,获 取初始就医信息集;
99.302、基于初始就医信息集中每条就医记录,构建多条无向边,并基于每 条就医记录中的就医人员编号和每条就医记录中的问诊科室信息,构建多对 网络节点,以及将每条无向边连接一对网络节点,得到初始二部图网络;
100.其中,步骤301

302与上述步骤101

102的执行步骤类似,具体此处不再 赘述。
101.303、计算初始二部图网络中每个网络节点的节点可疑度;
102.可以理解的是,服务器通过初始二部图来构建就医人员和问诊科室之间 的拓扑关系表达,并通过引入局部权重,从而计算虚假就医的可能性。其中, 初始二部图网络中的网络节点可以被分为两类。第一类网络节点(a类节点) 用于表示就医人员编号,该类网络节点的节点可疑度c(a)则表示该就医人 员虚假就医的可能性;第二类网络节点(b类节点)用于表示问诊科室信息, 该网络节点的节点可疑度c(b)则表示该二级科室虚假问诊的可能性。
103.具体的,服务器通过确定初始二部图网络中每个网络节点所连接的无向 边,并计算每个网络节点所连接的无向边的边可疑度,然后计算每个网络节 点所连接的无向边的边可疑度之和,得到每个网络节点的节点可疑度。
104.可以理解的是,在初始二部图网络中,网络节点之间以无向边进行连接, 其中,连接每个网络节点的无向边对应的边可疑度的计算公式,请参考公式 一:
105.fe(h)=1/lg(x+5)
106.公式一
107.其中,h为网络节点,x为连接该网络节点h的无向边的总数,fe(h)为网 络节点h的每条无向边的边可疑度,显而易见的是,边可疑度根据网络节点 的边连接数目降权,即网络节点连接的无向边数目越多,则每条无向边对应 的边可疑度随之降低。
108.应当理解的是,对于每个网络节点而言,均存在至少一个无向边与其相 连,若仅有一条无向边连接该网络节点,则将这条无向边的边可疑度作为该 网络节点的节点可疑度。
109.具体的,网络节点的节点可疑度对应的计算公式,请参考公式二:
110.f(h)=x/lg(x+5)
111.公式二
112.其中,f(h)为网络节点h的节点可疑度。
113.304、基于初始二部图网络中每个网络节点的节点可疑度,将初始二部图 网络以优先树结构进行存储;
114.可以理解的是,优先树为一种小堆顶的二叉树结构,本实施例中,优先 树的最小叶节点为初始二部图网络中的网络节点,每对叶节点(分别对应就 医人员编号和问诊科室信息)共享一个父节点,父节点记录其子节点中的最 小值,则该优先树的根节点为节点可疑度最小的网络节点,这样从根结点记 录的全局最小值出发,可以快速定位到该最小值所对应的叶结点,然后将其 从初始二部图中移除。
115.305、根据初始二部图网络中每个网络节点的节点可疑度,对初始二部图 网络中的目标网络节点及与目标网络节点相连的无向边进行迭代移除,直至 初始二部图网络的体积为零,得到多个候选二部图网络,其中,目标网络节 点为节点可疑度最大的网络节点;
116.可以理解的是,服务器每次将节点可疑度最大的网络节点及其连接该网 络节点的无向边进行移除,从而得到更新后的网络,并对其进行备份(即第 一个候选二部图网络),至此第一次迭代移除结束;然后再次计算更新后的 网络中每个网络节点的节点可疑度,并将其中节点可疑度最大的网络节点及 其连接该网络节点的无向边进行移除,更新网络并备份(即第二个候选二部 图网络),如此迭代多次,直至移除初始二部图网络中的所有网络节点。
117.306、计算每个候选二部图网络对应的全局平均可疑度,并确定全局平均 可疑度最大的目标二部图网络;
118.可以理解的是,全局平均可疑度是用来度量图结构中虚假就医群体的可 疑程度指标,该值越大,则表示对应的图节点组成的群体越是异常。具体的, 全局平均可疑度的计算公式,请参考公式三:
119.g(s)=f(s)/|s|
120.公式三
121.其中,s代表每个候选二部图网络的网络节点集合,|s|代表集合s中网络 节点的个数,f(s)是集合s中所有网络节点的节点可疑度之和。
122.307、解析目标二部图网络的网络节点,得到第一可疑群体;
123.可以理解的是,网络节点中存储的是就医人员编号信息或问诊科室信息, 服务器通过对网络节点进行数据解析,从而得到第一可疑群体,该可疑群体 中包括多个可疑对象(以编号表示的就医人员或医院的二级科室)。此时目 标二部图网络中的留存结点即目标结点,这些目标节点的关系网络是整个网 络的最可疑致密子图,该子图中两类结点之间关系紧密,且都与外部结点连 接相对稀疏,这在医疗场景下为一种违反社会规律的连接模式,可认定为有 较大概率进行虚假就医的可疑群体。
124.308、将第一可疑群体从初始二部图网络移除,得到二部图网络,并对该 二部图网络进行可疑群体检测,得到第二可疑群体;
125.309、根据预设的迭代次数,对第二可疑群体进行迭代,得到至少一个第 三可疑群体,并计算第一可疑群体、第二可疑群体以及第三可疑群体的并集, 得到初始就医信息集
中的虚假就医可疑群体,以及根据初始就医信息集中的 虚假就医可疑群体,生成医保违规行为的检测报告。
126.其中,步骤308

309与上述步骤104

105的执行步骤类似,具体此处不再 赘述。
127.本实施例中,详细描述可疑群体检测的过程,通过计算二部图网络中每 个网络节点的节点可疑度,并根据节点可疑度的大小将二部图网络以优先树 结构存储,从而快速移除目标网络节点;同时,通过一个全局量来表示每个 候选二部图网络的可疑度,根据全局量的数值比较结果,从而准确地获取目 标二部图网络。
128.参阅图4,本发明实施例中医保违规行为的检测方法的第四个实施例包 括:
129.401、接收终端发送的初始数据获取请求,并根据初始数据获取请求,获 取初始就医信息集;
130.402、基于初始就医信息集中每条就医记录,构建多条无向边,并基于每 条就医记录中的就医人员编号和每条就医记录中的问诊科室信息,构建多对 网络节点,以及将每条无向边连接一对网络节点,得到初始二部图网络;
131.403、基于初始二部图网络和fraudar算法,进行可疑群体检测,得到第 一可疑群体;
132.404、将第一可疑群体从初始二部图网络移除,得到二部图网络,并对该 二部图网络进行可疑群体检测,得到第二可疑群体;
133.405、根据预设的迭代次数,对第二可疑群体进行迭代,得到至少一个第 三可疑群体,并计算第一可疑群体、第二可疑群体以及第三可疑群体的并集, 得到初始就医信息集中的虚假就医可疑群体,以及根据初始就医信息集中的 虚假就医可疑群体,生成医保违规行为的检测报告;
134.406、接收终端发送的多个候选数据获取请求,并根据候选数据获取请求, 获取多个不同时间段内的候选就医信息集;
135.可以理解的是,每个候选数据请求中包括一个对应的时间片段参数,例 如数据请求1中包含时间片段参数[2019/01/01,2019/01/10],数据请求2中包 含时间片段参数[2019/04/01,2019/04/10],数据请求3中包含时间片段参数 [2019/06/01,2019/06/10],服务器根据数据请求1、2、3中的时间片段参数, 从而分别获取该医院2019年1月1日至2019年1月10日期间的就医信息集 a、2019年4月1日至2019年4月10日期间的就医信息集b以及2019年6 月1日至2019年6月10日的就医信息集c。
[0136]
407、确定每个候选就医信息集中的虚假就医可疑群体,并根据每个候选 就医信息集中的虚假就医可疑群体,构建虚假就医可疑群体集,其中,虚假 就医可疑群体中包括多个虚假就医可疑对象;
[0137]
可以理解的是,服务器通过对每个候选就医信息集执行上述步骤401

405 的方法,从而确定出每个候选就医信息集中的虚假就医可疑群体,以每个虚 假就医可疑群体作为子集,构建虚假就医可疑群体集。
[0138]
408、统计并计算虚假就医可疑群体集中每个虚假就医可疑对象的出现频 率,若出现频率大于预设阈值,则确定当前虚假就医可疑对象存在医保违规 行为。
[0139]
可以理解的是,通过每个虚假就医可疑对象的出现次数除以虚假就医可 疑群体集中虚假就医可疑群体的数目(即子集个数),得到每个虚假就医对 象的出现频率,例如通
过10个候选数据请求得到10个就医信息集,并对其 进行检测,得到10个虚假就医可疑群体,统计这10个群体中每个虚假就医 可疑对象(以就医人员编号标识)出现的次数,如就医人员编号为0058的虚 假就医可疑对象在这10个群体中出现了6次,其对应的出现频率为0.6,若 预设阈值为0.5,则确定该就医人员0058存在医保违规行为。
[0140]
本实施例中,详细描述了对多个时间段的就医信息数据进行虚假就医检 测的过程,通过多个候选数据请求,从而获取到多个不同时间段内的就医信 息数据,进而将其中出现多次的虚假就医可疑对象确定为存在医保违规行为 的对象,减少了获取的数据样本的偶然因素,进而提升检测准确性。
[0141]
上面对本发明实施例中医保违规行为的检测方法进行了描述,下面对本 发明实施例中医保违规行为的检测装置进行描述,请参阅图5,本发明实施例 中医保违规行为的检测装置的一个实施例包括:
[0142]
数据获取模块501,用于接收终端发送的初始数据获取请求,并根据所述 初始数据获取请求,获取初始就医信息集;
[0143]
二部图构建模块502,用于基于所述初始就医信息集中每条就医记录,构 建多条无向边,并基于每条就医记录中的就医人员编号和每条就医记录中的 问诊科室信息,构建多对网络节点,以及将每条无向边连接一对网络节点, 得到初始二部图网络;
[0144]
可疑群体检测模块503,用于基于所述初始二部图网络和fraudar算法, 进行可疑群体检测,得到第一可疑群体;
[0145]
可疑群体复检模块504,用于将所述第一可疑群体从所述初始二部图网络 移除,得到二部图网络,并对该二部图网络进行可疑群体检测,得到第二可 疑群体;
[0146]
迭代检测模块505,用于根据预设的迭代次数,对所述第二可疑群体进行 迭代,得到至少一个第三可疑群体,并计算所述第一可疑群体、所述第二可 疑群体以及所述第三可疑群体的并集,得到所述初始就医信息集中的虚假就 医可疑群体,以及根据所述初始就医信息集中的虚假就医可疑群体,生成医 保违规行为的检测报告。
[0147]
本实施例中,本发明以就医人员的编号和医院的二级科室构建二部图网 络,通过二部图网络将群体特征进行量化表达,进而基于fraudar算法从该二 部图网络回归出可疑群体,提高了医保违规行为检测的准确性。
[0148]
参阅图6,本发明实施例中医保违规行为的检测装置的另一个实施例包 括:
[0149]
数据获取模块501,用于接收终端发送的初始数据获取请求,并根据所述 初始数据获取请求,获取初始就医信息集;
[0150]
二部图构建模块502,用于基于所述初始就医信息集中每条就医记录,构 建多条无向边,并基于每条就医记录中的就医人员编号和每条就医记录中的 问诊科室信息,构建多对网络节点,以及将每条无向边连接一对网络节点, 得到初始二部图网络;
[0151]
可疑群体检测模块503,用于基于所述初始二部图网络和fraudar算法, 进行可疑群体检测,得到第一可疑群体;
[0152]
可疑群体复检模块504,用于将所述第一可疑群体从所述初始二部图网络 移除,得到二部图网络,并对该二部图网络进行可疑群体检测,得到第二可 疑群体;
[0153]
迭代检测模块505,用于根据预设的迭代次数,对所述第二可疑群体进行 迭代,得到至少一个第三可疑群体,并计算所述第一可疑群体、所述第二可 疑群体以及所述第三可
疑群体的并集,得到所述初始就医信息集中的虚假就 医可疑群体,以及根据所述初始就医信息集中的虚假就医可疑群体,生成医 保违规行为的检测报告。
[0154]
其中,所述数据获取模块501具体包括:
[0155]
接收单元5011,用于接收终端发送的初始数据获取请求,其中,所述初 始数据获取请求中包括数据库标识参数和时间片段参数;
[0156]
调用单元5012,用于根据所述数据库标识参数,调用目标数据库;
[0157]
获取单元5013,用于基于所述时间片段参数,从所述目标数据库中获取 就医信息集。
[0158]
其中,所述可疑群体检测模块503具体包括:
[0159]
第一计算单元5031,用于计算所述初始二部图网络中每个网络节点的节 点可疑度;
[0160]
存储单元5032,用于基于所述初始二部图网络中每个网络节点的节点可 疑度大小,将所述初始二部图网络以优先树结构进行存储;
[0161]
迭代移除单元5033,用于根据所述初始二部图网络中每个网络节点的节 点可疑度,对所述初始二部图网络中的目标网络节点及与所述目标网络节点 相连的无向边进行迭代移除,直至所述初始二部图网络的体积为零,得到多 个候选二部图网络,其中,所述目标网络节点为所述节点可疑度最大的网络 节点;
[0162]
第二计算单元5034,用于计算每个候选二部图网络对应的全局平均可疑 度,并确定全局平均可疑度最大的目标二部图网络;
[0163]
解析单元5035,用于解析所述目标二部图网络的网络节点,得到第一可 疑群体。
[0164]
其中,所述第一计算单元5031具体用于:
[0165]
确定所述初始二部图网络中每个网络节点所连接的无向边,并计算每个 网络节点所连接的无向边的边可疑度;
[0166]
计算每个网络节点所连接的无向边的边可疑度之和,得到每个网络节点 的节点可疑度。
[0167]
其中,所述第二计算单元5034具体用于:
[0168]
计算每个候选二部图网络中网络节点的节点可疑度之和,得到每个候选 二部图网络的全局可疑度,并统计每个候选二部图网络中网络节点的总数目;
[0169]
根据每个候选二部图网络的全局可疑度和每个候选二部图网络中网络节 点的总数,计算每个候选二部图网络对应的全局平均可疑度,并确定全局平 均可疑度最大的目标二部图网络。
[0170]
本发明实施例中,模块化的设计让医保违规行为的检测装置各部位的硬 件专注于某一功能的实现,最大化实现了硬件的性能,同时模块化的设计也 降低了装置的模块之间的耦合性,更加便于维护。
[0171]
上面图5和图6从模块化功能实体的角度对本发明实施例中的医保违规 行为的检测装置进行详细描述,下面从硬件处理的角度对本发明实施例中医 保违规行为的检测设备进行详细描述。
[0172]
图7是本发明实施例提供的一种医保违规行为的检测设备的结构示意图, 该医保违规行为的检测设备700可因配置或性能不同而产生比较大的差异, 可以包括一个或一个
以上处理器(central processing units,cpu)710(例如, 一个或一个以上处理器)和存储器720,一个或一个以上存储应用程序733或 数据732的存储介质730(例如一个或一个以上海量存储设备)。其中,存储 器720和存储介质730可以是短暂存储或持久存储。存储在存储介质730的 程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对医 保违规行为的检测设备700中的一系列指令操作。更进一步地,处理器710 可以设置为与存储介质730通信,在医保违规行为的检测设备700上执行存 储介质730中的一系列指令操作。
[0173]
医保违规行为的检测设备700还可以包括一个或一个以上电源740,一个 或一个以上有线或无线网络接口750,一个或一个以上输入输出接口760,和 /或,一个或一个以上操作系统731,例如windows serve,mac os x,unix, linux,freebsd等等。本领域技术人员可以理解,图7示出的医保违规行为 的检测设备结构并不构成对医保违规行为的检测设备的限定,可以包括比图 示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0174]
本发明还提供一种医保违规行为的检测设备,所述医保违规行为的检测 设备包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指 令被处理器执行时,使得处理器执行上述各实施例中的所述医保违规行为的 检测方法的步骤。
[0175]
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易 失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可 读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机 上运行时,使得计算机执行所述医保违规行为的检测方法的步骤。
[0176]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应 过程,在此不再赘述。
[0177]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本 发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个 存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory, rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘 等各种可以存储程序代码的介质。
[0178]
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制; 尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应 当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其 中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案 的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1