购药数据的处理方法及相关产品与流程

文档序号：17253376发布日期：2019-03-30 09:12阅读：207来源：国知局

本申请涉及电子技术领域，具体涉及一种购药数据的处理方法及相关产品。

背景技术：

随着国家基本医疗制度不断完善，越来越多的人加入医保行列，医保费用会为参保人员报销绝大的医疗费用，导致目前医保体制中存在一些利益问题。

例如，医药贩子会与参保人合作，给予参保人一定的利益，提前收集一批参保人的医保卡，利用医保卡批次刷药，由于在用医保卡购药时，只需支付自费部分，其余通过个人账或者统筹基金支付，然后将购买到的药品高价卖出，赚取差价牟利；或者，参保人与医院合作，通过批次刷药，套取医保基金。无论哪种情况，都在侵犯当前的医保体制，损害其他参保人的医保利益。但是，目前在医用医保卡购药时，仅验证是否符合报销条件，使用医保卡购药时均予报销，不考虑购药行为的合理性。

故目前检测医保卡购药合理性的方式单一，准确度低，存在套刷药品问题。

技术实现要素：

本申请实施例提供了一种购药数据的处理方法及相关产品，以期基于购药数据判断购药行为是否骗保行为，解决套刷药品问题。

第一方面，本申请实施例提供一种购药数据的处理方法，所述方法应用于电子设备，所述方法包括：

从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数；

构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集；

根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id；

确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为。

第二方面，本申请实施例提供一种购药数据的处理电子设备，所述电子设备包括：

获取单元，用于从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数；

构建单元，构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集；

第一确定单元，用于根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id；

第二确定单元，用于确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为。

第三方面，本申请实施例提供一种电子设备，包括一个或多个处理器、一个或多个存储器、一个或多个收发器，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述一个或多个处理器执行，所述程序包括用于执行如第一方面所述的方法中的步骤的指令。

第四方面，本申请实施例提供一种计算机可读存储介质，其存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如第一方面所述的方法。

第五方面，本申请实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机可操作来使计算机执行如第一方面所述的方法。

实施本申请实施例，具有如下有益效果：

可以看出，在本申请实施例中，获取医疗机构在n天内的购药数据，并对每天内的购药数据处理得到每天内以医保卡id为特征项的事物集，然后基于fp-growth算法确定n天内的n个事物集的频繁项集，获取所述频繁项集中的至少一个医保卡id在该n天内的购药数据，根据该购药数据确定该至少一个医保卡id的购药行为是否为骗保行为，实现了基于fp-growth算法确定出待选的属于成群结队购药的医保卡id，然后在根据购药数据确定该医保卡id购药的合理性，从而实现精确定位出在该n天内的属于成群结队开药的医保卡id，以确定出药贩子套取医保基金的医保卡id，为医疗体制的改革提供数据参考。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种购药数据的处理方法的流程示意图；

图1a为本申请实施例提供的一种确定事物集的示意图；

图1b为本申请实施例提供的一种确定fp-tree的示意图；

图2为本申请实施例提供的一种购药数据的处理方法的流程示意图；

图3为本申请实施例提供的另一种购药数据的处理方法的流程示意图；

图4为本申请实施例提供的一种购药数据的处理的电子设备的结构示意图；

图5是本申请实施例提供的一种购药数据的处理的的电子设备的功能单元组成框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

本申请中的电子设备可以包括智能手机(如android手机、ios手机、windowsphone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备mid(mobileinternetdevices，简称：mid)或穿戴式设备等，上述电子设备仅是举例，而非穷举，包含但不限于上述电子设备，为了描述的方便，下面实施例中将上述电子设备称为用户设备ue(userequipment，简称：ue)。当然在实际应用中，上述用户设备也不限于上述变现形式，例如还可以包括：智能车载终端、计算机设备等等。

参阅图1，图1为本申请实施例提供的一种购药数据的处理方法的流程示意图，该方法包括如步骤s101～s104中所示的内容：

步骤s101、从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数。

可选的，在从医疗数据库中获取n天内的购药数据，可利用间隔采样或者连续采样获取医疗数据，其具体包括：在医疗服务器的任务触发器中预先设置的采样间隔和采样时长，并将所述采样间隔和采样时长存储至医疗服务器的配置文件中，在启动所述任务触发器，解析所述配置文件，读取采样间隔和采样时长，并控制数据采集器根据所述采样间隔和采样时长从所述医疗机构的医疗数据库中进行采样，以获取n天内的购药数据，可以理解的是，如利用连续采样技术时，则需预先设置采样时长为n天，采样间隔为1天，即在n天内每天都从所述医疗数据库中获取购药数据，如利用间隔采样技术，则可预先设置采样时长为n天，采样间隔为t，单位为天，即在n天内每隔t天采集一次购药数据，其中，所述n为大于1的整数。

当然，购药数据中还包括医师id、医疗机构的id、就诊类型、医疗费用等。

步骤s102、构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集。

可选的，构建以每天内的购药数据中的医保卡id为特征项的事物集具体包括：按照购药时的结算时间的先后顺序依次获取每天购药数据中的所有医保卡id信息，将获取到的医保卡id信息依次添加至集合中，得到事物集，如遇到相同的医保卡id信息时，不合并相同的医保卡id信息，将相同的医保卡id信息各自作为一个元素添加至集合中，得到以医保卡id为特征项的事物集。

可选的，将n天内的购药数据以天为单位拆分，获取每天内的购药数据，分别得到每天内以医保卡id为特征项的事物集，从而得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集。

举例来说，如获取到的任意一天的医保卡id分别为id1、id2、id3、id4、id5、id1、id2，则可得到该天内以医保卡id为特征项的事物集a＝{id1、id2、id3、id4、id5、id1、id2}。

步骤s103、根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id。

可选的，根据fp-growth算法确定所述n个事物集的频繁项集具体包括：扫描所述n个事物集，获取所述n个事物集中的特征项的并集，即将n个事物集中医保卡id相同的项合并，得到以所述n个事物集中以所有医保卡id种类为元素的并集；确定所述交集中每个特征项在所述n个事物集出现的总次数，即在合并相同的医保卡id时，统计该医保卡id出现的总次数，将所述总次数标记为所述每个特征项的支持度，获取预先设置的第一最小支持度p1，剔除所述并集中支持度小于所述第一最小支持度p1的特征项，对所述并集执行剔除操作后，按照支持度降序的顺序重新排列剩余的特征项得到第一频繁项集，将所述第一频繁项集中的特征项标记为频繁项，其中，如剩余的特征项中存在支持度相同的特征项时，以该特征项(即医保卡)对应的在所述n个事物集中对应的最早结算时间的先后顺序排列该支持度相同的特征项；按照对所述剩余的特征项重新排列的顺序把所述n个事物集中的频繁项插入以空集null为根的初始频繁模式树fp-tree中，如插入时该频繁项节点已经存在，将该频繁项节点在所述初始频繁模式树fp-tree中的支持度加1，如插入时该频繁项节点不存在，在所述初始频繁模式树fp-tree中创建支持度为1的频繁项节点，得到所述n个事物集的fp-tree；从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集。

举例来说，假定n＝6，采样间隔为1天，获取6天内以医保卡id为特征项对应的6个事物集分别为a、b、c、d、e、f，其中，a、b、c、d、e、f为按照时间的先后顺序依次或得到的事物集，且该a、b、c、d、e、f中的特征项按照结算时间的先后顺序排列得到的，将所述6个事物集中医保卡id分别以字母的形式表示，在此不示出医保卡id的具体信息，如图1a所示，如a＝{r,z,h,j,p},b＝＝{z,y,x,w,v,u,t,s},c＝{z},d＝{r,x,n,o,s},e＝{y,r,x,z,q,t,p},f＝{y,z,x,e,q,s,t,m}，扫描a、b、c、d、e、f，可得该6个事物集中的特征项的并集为{r,z,h,j,p,y,x,w,v,u,t,s,n,o,,q,e,m},且确定r的出现次数为3，z的出现次数为5，h的出现次数为1，j的出现次数为1，p的出现次数为2，y的出现次数为3，x的出现次数为4，w的出现次数为1，v的出现次数为1，u的出现次数为1，t的出现次数为3，s的出现次数为3，n的出现次数为1，o的出现次数为1，q的出现次数为2，e的出现次数为1，m的出现次数为1，如p1＝3，则将{r,z,h,j,p,y,x,w,v,u,t,s,n,o,,q,e,m}中的h、j、p、w、v、u、n、o、q、e、m剔除得到集合{r,z,y,x,t,s}，对集合{r,z,y,x,t,s}按照支持度降序的方式重新排列得到第一频繁项集，其中，r,y,t,s的支持度相同，但r,y,t,s对应的结算时间依次增加，故得到第一频繁项集为{z,x,r,y,t,s}；然后，开启第二轮扫描，按照集合{z,x,r,y,t,s}中特征项的先后顺序，将a、b、c、d、e、f中包含z,x,r,y,t,s的特征项依次添加至以空集null为根的初始频繁模式树fp-tree中，如图1b所示，扫描a时，可将a中的频繁项z先添加至fp-tree，然后将频繁项r添加至该fp-tree，由于该fp-tree之前未存在且频繁项z和r的节点，故将频繁项z和r节点处的支持度分别标记为1，然后添加b中的频繁项z，由于fp-tree中已存在频繁项z的节点，故将频繁项z的节点加1，标记为2，然后，将b中的x,y,t,s依次添加至fp-tree，故将a、b、c、d、e、f中的所有频繁项添加完之后可得到如图1b最右方所示的fp-tree，即该6个事物集的fp-tree。可以看出，该fp-tree的树节点上给出集合中的单个元素及其在新的事物集中出现的总次数，路径的根节点的元素的出现次数示出该路径对应的序列的出现次数(即支持度)其中，如在添加任意一个事物集中的频繁项时，如该事物集中第一个需要添加的频繁项在该fp-tree中不存在祖先节点时，需重新开辟一条路径，以显示该事物集中的频繁项组成的集合，例如，添加d中的元素时，第一个需要添加的元素为r，由于在此之前该fp-tree中的祖先节点为z，故重新添加一条路径。

进一步地，从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集具体包括：获取预先设置的第二最小支持度p2；将所述n个事物集的fp-tree中的祖先节点到任意一个后代节点的路径上的所有元素组成一集合，从该后代节点中读取所述集合的支持度，将支持度大于或者等于所述第二最小支持度的集合标记为所述n个事物集的频繁项集。即fp-tree中从每条路径上的祖先节点开始到该路径上的任意一个后代节点的所有元素组成一个频繁项集，且该后代节点示出的支持度即为该集合的支持度。

进一步地的，如支持度大于或者等于所述第二最小支持度的集合的数量为单个时，将该集合标记为所述n个事物集的频繁项集，如支持度大于或者等于所述第二最小支持度的集合的数量为多个时，获取该多个集合的并集，将所述并集标记为所述n个事物集的频繁项集。

举例来说，如图1b所示，从每条路径上的祖先节点开始到该路径上的任意一个后代节点的所有元素组成一个频繁项集，如p2＝5，则可确定大于或者等于p2的频繁项集为{z}，数量为单个，即可将集合{z}标记为该6个事物集的频繁项集，如p2＝3时，可确定大于或者等于p2的频繁项集为{z}，{z,x}和{z,x,y}，且各自的支持度分别为5、3和3，频繁项集的数量为多个，故需取{z}，{z,x}和{z,x,y}的并集{z,x,y}，将集合{z,x,y}标记为该6个事物集的频繁项集。

在一可能的示例中，从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集还包括：设置所述n个事物集的频繁项集中所需的元素数量，从该fp-tree的后代节点中截取与该元素数量对应的集合，得到频繁项集，如设置频元素数量为4个时，可获得频繁项集{z,x,y,s}，{z,x,y,r}，频繁项集为{z,x,y,s}和{x,y,s,t}，故可将该频繁项集{z,x,y,s}，{z,x,y,r}的并集{z,x,y,r,s}标记为该6个事物集的频繁项集。

步骤s104、确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为。

可选的，确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为具体包括：确定所述频繁项集中的至少一个医保卡id在所述n天中的任意一天内存在购药行为的若干个医保卡id(至少包括两个医保卡id，否则，不对该天内的购药数据分析)，从该天的购药数据中获取在使用该若干个医保卡id购药时的若干个结算时间和药品名称，确定所述若干个结算时间之间的第一相似度和所述若干个药品名称之间的第二相似度；如所述第一相相似度和所述第二相似度均大于第一阈值时，确定该天内使用所述若干个医保卡id的购药行为是骗保行为。

进一步地，确定所述若干个结算时间之间的第一相似度具体包括：获取所述若干个结算时间中的时间最早的结算时间tmin以及时间最晚的结算时间tmax，根据所述最早的结算时间和最晚的结算时间对所述若干个时间归一化处理，得到对应的若干个归一化后的结算时间，将所述若干个归一化后的结算时间的平均值标记为所述第一相似度。

具体为：

其中，tnorm为归一化后的结算时间，ti为所述若干个结算时间中的任意一个结算时间。

进一步地，确定所述若干个药品名称之间的第二相似度具体包括：确定所述若干个药品名称中每个药品名称对应的药品的药效功能和治疗领域，将所述每个药品的药效功能和治疗领域向量化处理，得到每个药品名称对应的特征向量，从而得到所述若干个药品名称对应的若干个特征向量(假定为m个，m为大于1的整数)α、β、γ…，然后计算所述若干个特征向量α、β、γ…中任意两个特征向量的欧式距离，得到个欧式距离，将所述个欧式距离的平均值标记为所述第二相似度。

其中，所述第一阈值可以为0.5、0.6、0.7、0.8或者其他值。

举例来说，如图1b中所示的确定出的频繁项集{z,x,y}，可以看出第一天的事物集a中仅包含一个医保卡id，z，故忽略事物集a，而第二天的事物集b中包含三个医保卡id，z,x,y，故获取z,x,y对应的购药数据，获取购药数据中使用医保卡z,x,y购药时的结算时间以及药品名称，确定使用医保卡z,x,y购药时的结算时间之间的第一相似度，计算使用医保卡z,x,y购药时的药品名称之间的第二相似度。

可以看出，在本申请实施例中，获取医疗机构在n天内的购药数据，并对每天内的购药数据处理得到每天内以医保卡id为特征项的事物集，然后基于fp-growth算法确定n个事物集的fp-tree，并从该fp-tree中读取该n个事物集中的频繁项集，获取所述频繁项集中的至少一个医保卡id在该n天内的购药数据，根据该购药数据确定该至少一个医保卡id的购药行为是否为骗保行为，实现了基于fp-growth算法确定出待选的属于成群结队购药的多个医保卡id，然后再根据购药数据确定该多个医保卡id在结算时间以及药品名称上的相似度，如相似度满足条件时，确定该多个医保卡id在同一时间内存在批次购药行为，从而实现精确定位出在该n天内的属于成群结队开药的多个医保卡id，以确定出药贩子套取医保基金的多个医保卡id，为医疗体制的改革提供数据参考，完善医疗体制，保护公众利益。

参阅图2，图2为本申请实施例提供的一种购药数据的处理方法的流程示意图，该方法应用于电子设备，该方法包括如步骤s201～s207中所示的内容：

步骤s201、从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数。

步骤s202、构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集。

步骤s203、根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id。

步骤s204、确定所述频繁项集中的至少一个医保卡id在所述n天中的任意一天内存在购药行为的若干个医保卡id。

步骤s205、从医保数据库中获取若干个医保卡id对应的疾病史。

可选的，每个医保卡id对应一个特定的参保人，故在医保数据库中预先存储与每个医保id的参保人对应的疾病史。

步骤s206、从该天的购药数据中获取在使用该若干个医保卡id购药时的若干个药品名称，确定所述若干个医保卡id中每个医保卡id对应的患病史与使用所述每个医保卡id购药时的药品名称是否匹配。

可以理解的是，依据该参保人的疾病史可判断参保人所需的药品，如每个医保卡id对应的患病史与使用所述每个医保卡id购药时的药品名称不匹配时，确定当前购买的药品实际上不是用于治疗参保人的疾病，故确定该医保卡对应的购药行为为非法购药行为，由于药贩子在使用医保卡购药时，仅购买自己贩卖的药品，不去关注购买的药品是否与参保人的疾病匹配，故在一定程度上当确定购买的药品与疾病史不匹配时，确定购药行为为套取医保基金购买药品的行为。

步骤s207、获取所述若干个医保卡id中不匹配的医保卡id的总数量与所述频繁项集中的医保卡id的总数量的比值，如所述比值大于第二阈值，确定该天内使用所述若干个医保卡id的购药行为是骗保行为。

其中，所述第二阈值可以为0.5、0.6、0.7、0.8、0.9或者其他值。

可以看出，在本申请实施例中，获取医疗机构在n天内的购药数据，并对每天内的购药数据处理得到每天内以医保卡id为特征项的事物集，然后基于fp-growth算法确定n个事物集的fp-tree，并从该fp-tree中读取该n个事物集中的频繁项集，获取所述频繁项集中的至少一个医保卡id在该n天内的购药数据，根据该购药数据确定该至少一个医保卡id的购药行为是否为骗保行为，实现了基于fp-growth算法确定出待选的属于成群结队购药的多个医保卡id，然后再根据购药数据确定该多个医保卡id购买的药品与该多个医保卡id对应的参保人所患的疾病史是否匹配，如不匹配，确定使用所述多个医保卡购药时的行为为骗保行为，从而实现精确定位出在该n天内的属于成群结队开药的多个医保卡id，以确定出药贩子套取医保基金的多个医保卡id，为医疗体制的改革提供数据参考，完善医疗体制，保护公众利益。

参阅图3，图3为本申请实施例提供的另一种购药数据的处理方法的流程示意图，该方法应用于电子设备，该方法包括如步骤s301～s307中所示的内容：

步骤s301、从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数。

步骤s302、构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集。

步骤s303、根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id。

步骤s304、确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为。

参照第一个实施例和第二个实施例中确定骗保行为的方法，不再赘述。

步骤s305、在确定所述频繁项集中的至少一个医保卡id的购药行为存在骗保行为时，从医保数据库中获取所述至少一个医保id的关联设备。

可选的，基于医保数据库中存储的参保人的基本信息，获取所述医保卡id对应的关联设备，即在参保时参保人保留的用于联系的关联设备。

步骤s306、如确定所述至少一个医保卡id的骗保行为是首次骗保行为，向所述关联设备发送第一提示信息。

其中，所述第一提示信息用于提示所述至少一个医保卡id的购药行为是骗保行为以及用于提示锁定所述医保卡id对应的医保账户，且所述第一提示信息中包括本次锁定的第一时长。

步骤s307、如确定所述至少一个医保卡id的骗保行为是非首次骗保行为，向所述关联设备发送第二提示信息。

其中，所述第二提示信息用于提示所述至少一个医保卡id的购药行为是骗保行为以及用于提示锁定所述医保卡id对应的医保账户，所述第二提示信息中包括本次锁定的第二时长和已发生的骗保次数。

在一可能的示例中，所述方法还包括：

如确定所述至少一个医保卡id的购药行为是骗保行为时，获取当前的医保制度针对所述骗保行为的惩罚制度，确定当前骗保行为的骗保费用，根据所述骗保费用得到针对所述骗保行为的惩罚费用，如所述医保卡id对应的医保账户的余额大于或者等于所述惩罚费用时，从所述医保卡id对应的医保账户中扣除所述惩罚费用，以完成对所述惩罚费用的缴费行为，并向所述关联设备发送第三提示信息，所述第三提示信息用于提示已完成对惩罚费用的缴费行为，如所述医保卡id对应的医保账户的余额小于所述惩罚费用时，向所述关联设备发送第四提示信息，所述第四提示信息中包含所述惩罚费用的缴费链接或者缴费二维码，所述第四提示信息用于提示所述关联设备用户主动完成惩罚费用的缴费。

可以看出，在本示例中当产生惩罚费用时，从医保账户中自动扣除惩罚费用，或者，向关联设备发送扣费链接，以提高参保人对骗保行为的高度关注，以通过惩罚制度减少骗保行为的发生。

与上述图1、图2、图3所示的实施例一致的，请参阅图4，图4为本申请实施例提供的一种购药数据的处理的电子设备400的结构示意图，如图4所示，该电子设备400包括处理器、存储器、通信接口以及一个或多个程序，其中，上述一个或多个程序不同于上述一个或多个应用程序，且上述一个或多个程序被存储在上述存储器中，并且被配置由上述处理器执行，上述程序包括用于执行以下步骤的指令；

从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数；

构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集；

根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id；

确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为。

在一可能的示例中，在根据fp-growth算法确定所述n个事物集的频繁项集方面，上述程序中的指令具体用于执行以下操作：

扫描所述n个事物集，获取所述n个事物集中的特征项的并集；

确定所述交集中每个特征项在所述n个事物集出现的总次数，将所述总次数标记为所述每个特征项的支持度，获取预先设置的第一最小支持度，剔除所述并集中支持度小于所述第一最小支持度的特征项，对所述并集执行剔除操作后，按照支持度降序的顺序重新排列剩余的特征项得到第一频繁项集，将所述第一频繁项集中的特征项标记为频繁项；

按照所述第一频繁项集对所述剩余的特征项重新排列的顺序把所述n个事物集中的所有特征项中属于频繁项的特征项中插入以空集null为根的初始频繁模式树fp-tree中，如插入时该频繁项节点已经存在，将该频繁项节点在所述初始频繁模式树fp-tree中的支持度加1，如插入时该频繁项节点不存在，在所述初始频繁模式树fp-tree中创建支持度为1的频繁项节点，得到所述n个事物集的fp-tree；

从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集。

在一可能的示例中，在从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集方面，上述程序中的指令具体用于执行以下操作：

获取预先设置的第二最小支持度；

将所述n个事物集的fp-tree中的祖先节点到任意一个后代节点的路径上的所有元素组成一集合，从该后代节点中读取所述集合的支持度，将支持度大于或者等于所述第二最小支持度的集合标记为所述n个事物集的频繁项集。

在一可能的示例中，在将支持度大于或者等于所述第二最小支持度的集合标记为所述n个事物集的频繁项集方面，上述程序中的指令具体用于执行以下操作：

如支持度大于或者等于所述第二最小支持度的集合的数量为单个时，将该集合标记为所述n个事物集的频繁项集，如支持度大于或者等于所述第二最小支持度的集合的数量为多个时，获取该多个集合的并集，将所述并集标记为所述n个事物集的频繁项集。

在一可能的示例中，在确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为方面，上述程序中的指令具体用于执行以下操作：

确定所述频繁项集中的至少一个医保卡id在所述n天中的任意一天内存在购药行为的若干个医保卡id，从该天的购药数据中获取在使用该若干个医保卡id购药时的若干个结算时间和药品名称，确定所述若干个结算时间之间的第一相似度和所述若干个药品名称之间的第二相似度；

如所述第一相相似度和所述第二相似度均大于第一阈值时，确定该天内使用所述若干个医保卡id的购药行为是骗保行为。

确定所述频繁项集中的至少一个医保卡id在所述n天中的任意一天内存在购药行为的若干个医保卡id；

从医保数据库中获取若干个医保卡id对应的疾病史；

从该天的购药数据中获取在使用该若干个医保卡id购药时的若干个药品名称，确定所述若干个医保卡id中每个医保卡id对应的患病史与使用所述每个医保卡id购药时的药品名称是否匹配，如否，获取所述若干个医保卡id中不匹配的医保卡id的总数量与所述频繁项集中的医保卡id的总数量的比值，如所述比值大于第二阈值，确定该天内使用所述若干个医保卡id的购药行为是骗保行为。

在一可能的示例中，上述程序中的指令还用于执行以下操作：

在确定所述频繁项集中的至少一个医保卡id的购药行为存在骗保行为时；

从医保数据库中获取所述至少一个医保id的关联设备，确定所述至少一个医保卡id的骗保行为是否是首次骗保行为，若是，向所述关联设备发送第一提示信息，所述第一提示信息用于提示所述至少一个医保卡id的购药行为是骗保行为以及用于提示锁定所述医保卡id对应的医保账户，且所述第一提示信息中包括本次锁定的第一时长，如否，向所述关联设备发送第二提示信息，所述第二提示信息用于提示所述至少一个医保卡id的购药行为是骗保行为以及用于提示锁定所述医保卡id对应的医保账户，所述第二提示信息中包括本次锁定的第二时长和已发生的骗保次数。

参阅图5，图5示出了上述实施例中所涉及的购药数据的处理电子设备500的一种可能的功能单元组成框图，电子设备500包括获取单元510、构建单元520、第一确定单元530、第二确定单元540、其中；

获取单元510，用于从医疗机构的医疗数据库中获取n天内的购药数据，所述购药数据中至少包括医保卡id、药品名称、药品数量和结算时间，所述n为大于1的整数；

构建单元520，构建以每天内的购药数据中的医保卡id为特征项的事物集，得到以所述n天内的购药数据中的医保卡id为特征项对应的n个事物集；

第一确定单元530，用于根据fp-growth算法确定所述n个事物集的频繁项集，所述频繁项集中至少包括一个医保卡id；

第二确定单元540，用于确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为。

在一可能的示例中，在根据fp-growth算法确定所述n个事物集的频繁项集时，第一确定单元530，具体用于：扫描所述n个事物集，获取所述n个事物集中的特征项的并集；以及用于确定所述交集中每个特征项在所述n个事物集出现的总次数，将所述总次数标记为所述每个特征项的支持度，获取预先设置的第一最小支持度，剔除所述并集中支持度小于所述第一最小支持度的特征项，对所述并集执行剔除操作后，按照支持度降序的顺序重新排列剩余的特征项得到第一频繁项集，将所述第一频繁项集中的特征项标记为频繁项；以及用于按照所述第一频繁项集对所述剩余的特征项重新排列的顺序把所述n个事物集中的所有特征项中属于频繁项的特征项中插入以空集null为根的初始频繁模式树fp-tree中，如插入时该频繁项节点已经存在，将该频繁项节点在所述初始频繁模式树fp-tree中的支持度加1，如插入时该频繁项节点不存在，在所述初始频繁模式树fp-tree中创建支持度为1的频繁项节点，得到所述n个事物集的fp-tree；以及用于从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集。

在一可能的示例中，在从所述n个事物集的fp-tree中获取所述n个事物集的频繁项集时，第一确定单元530，具体用于：获取预先设置的第二最小支持度；以及用于将所述n个事物集的fp-tree中的祖先节点到任意一个后代节点的路径上的所有元素组成一集合，从该后代节点中读取所述集合的支持度，将支持度大于或者等于所述第二最小支持度的集合标记为所述n个事物集的频繁项集。

在一可能的示例中，在将支持度大于或者等于所述第二最小支持度的集合标记为所述n个事物集的频繁项集时，第一确定单元530，具体用于：如支持度大于或者等于所述第二最小支持度的集合的数量为单个时，将该集合标记为所述n个事物集的频繁项集，如支持度大于或者等于所述第二最小支持度的集合的数量为多个时，获取该多个集合的并集，将所述并集标记为所述n个事物集的频繁项集。

在一可能的示例中，在确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为时，第二确定单元540，具体用于：确定所述频繁项集中的至少一个医保卡id在所述n天中的任意一天内存在购药行为的若干个医保卡id，从该天的购药数据中获取在使用该若干个医保卡id购药时的若干个结算时间和药品名称，确定所述若干个结算时间之间的第一相似度和所述若干个药品名称之间的第二相似度；以及用于如所述第一相相似度和所述第二相似度均大于第一阈值时，确定该天内使用所述若干个医保卡id的购药行为是骗保行为。

在一可能的示例中，在确定所述频繁项集中的至少一个医保卡id在所述n天内的购药行为是否为骗保行为时，第二确定单元540，具体用于：确定所述频繁项集中的至少一个医保卡id在所述n天中的任意一天内存在购药行为的若干个医保卡id；以及用于从医保数据库中获取若干个医保卡id对应的疾病史；以及用于从该天的购药数据中获取在使用该若干个医保卡id购药时的若干个药品名称，确定所述若干个医保卡id中每个医保卡id对应的患病史与使用所述每个医保卡id购药时的药品名称是否匹配，如否，获取所述若干个医保卡id中不匹配的医保卡id的总数量与所述频繁项集中的医保卡id的总数量的比值，如所述比值大于第二阈值，确定该天内使用所述若干个医保卡id的购药行为是骗保行为。

在一可能的示例中，电子设备500，还包括发送单元550；

其中，发送单元550，用于：在确定所述频繁项集中的至少一个医保卡id的购药行为存在骗保行为时；以及用于从医保数据库中获取所述至少一个医保id的关联设备，确定所述至少一个医保卡id的骗保行为是否是首次骗保行为，若是，向所述关联设备发送第一提示信息，所述第一提示信息用于提示所述至少一个医保卡id的购药行为是骗保行为以及用于提示锁定所述医保卡id对应的医保账户，且所述第一提示信息中包括本次锁定的第一时长，如否，向所述关联设备发送第二提示信息，所述第二提示信息用于提示所述至少一个医保卡id的购药行为是骗保行为以及用于提示锁定所述医保卡id对应的医保账户，所述第二提示信息中包括本次锁定的第二时长和已发生的骗保次数。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任何一种购药数据的处理方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种购药数据的处理方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：u盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：read-onlymemory，简称：rom)、随机存取器(英文：randomaccessmemory，简称：ram)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪丽娟;周竹凌
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

上一篇：一种小型河道清理船的制作方法
上一篇：煮饭过程的控制方法和装置、以及烹饪器具和存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。