一种基于医疗大数据的用药预测方法及系统与流程

文档序号：22878463发布日期：2020-11-10 17:33阅读：202来源：国知局

本发明涉及大数据技术领域，更具体地，涉及一种基于医疗大数据的用药预测方法及系统。

背景技术：

目前我国慢病患者非常多，全国有超过三亿人都是慢病患者，慢病致死人数已经占到我国因病死亡人数的80％。大多数慢病都需要长期用药，而患有慢病的人群平均年龄都比较大，经常会出现药物已经用完而忘记再次去购买的情况，用药中断将会严重威胁患者的身体健康，药店也会因此流失用户并减少药品销量。因此，如果药店能够预测在本药店购买过慢病药品的用户的用药时间，并在合适的时间对其做出提醒，那么这不仅有利于患者及时用药，确保生命安全，同时还能提高药店的药品销量，维系买药的用户。

目前通用的商品购买预测是通过分析用户的购买的所有商品和用户浏览点击行为来做预测的，而这种预测方法并不适用于慢病药品的预测，它存在一下的不足：1、商品之间存在较大差异，慢病药品是一种特别的商品，其购买人群、购买频率和购买时间间隔等都和其他商品不同；2、通用的商品购买预测可以通过购买的商品来预测购买其他商品，而慢病药品一般都只会一直购买一种；3、通用的商品购买预测可以有多数据来源，而慢病药品的购买预测数据只来源于购买行为；4、用户隐私保护，通用的商品购买预测可能会用到用户的隐私数据以做到更好的预测，而慢病药品购买预测只会使用用户消费信息，更注重隐私保护。

因此，现在亟需一种基于医疗大数据的用药预测方法及系统来解决上述问题。

技术实现要素：

本发明提供一种克服上述问题或者至少部分地解决上述问题的一种基于医疗大数据的用药预测方法及系统。

第一方面，本发明提供一种基于医疗大数据的用药预测方法，包括：

基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；

关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

其中，在所述基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户之前，所述方法还包括：

获取预处理数据，从所述预处理数据中提取用户历史买药的相关信息。

其中，所述方法还包括：

对所述预处理数据进行数据清洗、数据转换以及数据过滤；

对处理后的数据进行结构化、标准化以及向量化。

其中，所述方法还包括：

根据预处理数据，计算用户购买慢病药品的频率以及平均时间间隔；

对比购买慢病药品的频率以及平均时间间隔，分别标记出购买时间未到导出时间的数据以及购买时间超过数据导出时间的数据。

其中，所述基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，包括：

根据所述二分类模型中各个模型特征的占比，按权重计算购买时间超过数据导出时间的用户回药店购买药品的概率；

抽取概率大于预设阈值的用户作为所述目标用户。

其中，所述方法还包括：

根据用户的反馈结果调整所述二分类模型的模型特征以及预测概率的计算方法。

第二方面，本发明提供一种基于医疗大数据的用药预测系统，包括：

预测模块，用于基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；

推送模块，用于关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

第三方面，本发明实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述第一方面所提供的基于医疗大数据的用药预测方法的步骤。

第四方面，本发明实施例提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述第一方面所提供的基于医疗大数据的用药预测方法的步骤。

本发明实施例提供的一种基于医疗大数据的用药预测方法及系统，通过针对性的分析慢病药品购买规律，能更加准确的预测出购买慢病药品的用户下次购买的时间，进而找出已经用完药品但还没有再次购买的人；并且通过模型训练中得出的各特征的占比，可以更准确的计算出最有可能再次回药店购买的用户。

附图说明

图1是本发明实施例提供的一种基于医疗大数据的用药预测方法流程示意图；

图2是本发明实施例所示的技术流程图；

图3是本发明实施例提供的一种基于医疗大数据的用药预测系统结构示意图；

图4是本发明一实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

图1是本发明实施例提供的一种基于医疗大数据的用药预测方法流程示意图，如图1所示，包括：

101、基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；

102、关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

可以理解的是，当前，随着大数据研究的发展，各行各业都积极与大数据开发平台合作，药品销售行业也早已使用大数据开发技术来实现诸如提高药品销量，维系购买会员，唤醒睡眠会员等目标。目前，药店方面已经积累了海量的会员行为数据，这为基于医疗大数据的慢病患者用药预测和提醒提供了基础。

进一步的，慢病患者的用药做预测和提醒，需要通过患者的历史行为来做判断，通过提取患者的历史消费信息中的每次消费时间，购买药品数量和类别等判断该患者是已经买过药品目前不需要购买的会员，还是已经用完药品需要购买的会员，再通过会员的消费等级，购买次数，购买频率等特征建立模型，然后预测出可能在提醒后会来购买的会员，最后通过一定的规则给预测出的会员排序，找出在提醒后最可能响应的会员。给最有可能响应的会员做出提醒，这不仅可以使药店更加精准地提醒有购买需求的会员，还可以减少提醒的成本。

图2是本发明实施例所示的技术流程图，如图2所示，整体流程包括s1-s7。

s1、获取预处理数据；

s2、计算用户下次买药时间，与数据导出时间做对比；

s3、构建二分类模型；

s4、预测下次购买时间还未到数据导出时间的用户；

s5、按一定规则对预测出的正样本数据排序；

s6、药店选择药品推荐给排序用户；

s7、算法上线测试调整。

通过上述过程可以实现预测出药品用完且未进行新一次买药的目标用户并关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

本发明实施例提供的一种基于医疗大数据的用药预测方法，通过针对性的分析慢病药品购买规律，能更加准确的预测出购买慢病药品的用户下次购买的时间，进而找出已经用完药品但还没有再次购买的人；并且通过模型训练中得出的各特征的占比，可以更准确的计算出最有可能再次回药店购买的用户。

在上述实施例的基础上，在所述基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户之前，所述方法还包括：

获取预处理数据，从所述预处理数据中提取用户历史买药的相关信息。

具体的，从数据源中抽取用户相关信息，主要数据源及抽取信息包括以下几个部分：

用户信息：用户在注册药店用户时填写的信息和用户在消费后变化的信息如用户积分，消费等级，买药种类等。

消费记录：用户在最近一年或两年内购买的慢病药品消费记录，如购买药品id，购买药品名称，购买药品种类，购买时间，购买数量等。

在上述实施例的基础上，所述方法还包括：

对所述预处理数据进行数据清洗、数据转换以及数据过滤；

对处理后的数据进行结构化、标准化以及向量化。

具体的，在提取源数据后，将数据进行清洗、转换、过滤，并对数据进行结构化、标准化、向量化处理，为后面其他隐含特征计算和模型训练做准备。

在上述实施例的基础上，所述方法还包括：

根据预处理数据，计算用户购买慢病药品的频率以及平均时间间隔；

对比购买慢病药品的频率以及平均时间间隔，分别标记出购买时间未到导出时间的数据以及购买时间超过数据导出时间的数据。

具体的，用消费记录中的数据计算用户购买慢病药品的频率，购买平均时间间隔，用最近一次的消费时间计算出下次的购买时间并与数据导出时间做对比。把预测购买时间未到导出时间的数据标记lable为0，把预测购买时间超过数据导出时间的数据标记lable为1。然后用上一步标记的数据构建二分类模型，对lable为0的数据进行向下取样，抽取和lable为1数据同样数量的部分数据训练模型。

在上述实施例的基础上，所述基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，包括：

根据所述二分类模型中各个模型特征的占比，按权重计算购买时间超过数据导出时间的用户回药店购买药品的概率；

抽取概率大于预设阈值的用户作为所述目标用户。

具体的在实际预测过程中，本发明实施例根据训练模型中选择的各特征的占比，按权重综合计算lable预测为1的各用户可能在回药店购买的概率，并进行排序。然后拿到推荐用户排序后再与药品数据合并，得到推荐用户买的药和药品品类，药店根据需要推荐的药品或品类从已经排序的人员列表中筛选出排序靠前的推荐用户。

在上述实施例的基础上，所述方法还包括：

根据用户的反馈结果调整所述二分类模型的模型特征以及预测概率的计算方法。

最后，在算法上线试用后，本发明实施例可以根据推荐反馈的结果调整模型的特征，同时调整用户再回药店购买的概率的计算方法。

图3是本发明实施例提供的一种基于医疗大数据的用药预测系统结构示意图，如图3所示，包括：预测模块30和推送模块302，其中：

预测模块301用于基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；

推送模块302用于关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

具体的如何利用预测模块301和推送模块302基于医疗大数据的用药预测可参见如图1所示的实施例，本发明实施例在此不再赘述。

图4示例了一种电子设备的结构示意图，如图4所示，该服务器可以包括：处理器(processor)401、通信接口(communicationsinterface)402、存储器(memory)403和总线404，其中，处理器401，通信接口402，存储器403通过总线404完成相互间的通信。通信接口402可以用于服务器与智能电视之间的信息传输。处理器401可以调用存储器403中的逻辑指令，以执行如下方法：基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

本实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

本实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述各方法实施例所提供的方法，例如包括：基于训练好的二分类模型，预测出药品用完且未进行新一次买药的目标用户，所述二分类模型是根据历史用户买药数据进行训练得到，并实现购买时间未到导出时间的数据与购买时间超过数据导出时间的数据的分类筛选；关联所述目标用户和药品数据，将关联结果推送给所述目标用户。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后，本申请的方法仅为较佳的实施方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黎云;袁冲;余军;沈章;吕静
技术所有人：武汉海云健康科技股份有限公司
我是此专利的发明人

上一篇：一种目标对象推荐方法、装置、设备和存储介质与流程
上一篇：一种油泥水热处理分离回收系统及方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。