治疗推荐方法、系统、装置及存储介质与流程

文档序号:17748238发布日期:2019-05-24 20:47阅读:206来源:国知局
治疗推荐方法、系统、装置及存储介质与流程

本发明涉及人工智能技术领域,更为具体地,涉及一种集成医学指南和数据模型的辅助治疗推荐方法、系统、装置及存储介质。



背景技术:

目前治疗推荐的方法大部分根据医学指南得出的,即:从医学指南中抽取对于某种疾病的可选治疗方案,或者从数据中通过机器学习模型和匹配方法来推荐治疗方案。

其中,如果仅仅依据医学指南的治疗推荐较粗,治疗方案往往存在较多种选择,可操作性不够,没有考虑患者个体化与相似性;如果仅仅基于数据挖掘的治疗推荐,挖掘出来的推荐结果很可能违背临床指南。

鉴于目前的单一的治疗推荐方法,本发明提供了一种集成医学指南和数据模型的辅助治疗推荐方法、系统、装置及存储介质。



技术实现要素:

鉴于上述问题,本发明的目的是提供一种治疗推荐方法、系统、装置及存储介质,以解决传统的治疗推荐方案不精准等问题。

第一方面,本发明提供一种治疗推荐方法,应用于电子装置,包括:

将医学指南中的治疗决策知识规则化,转化为指南规则,其中,指南规则根据出处来源和证据等级提供其置信度,指南规则包括条件,条件包括三要素,分别为特征、操作符和阈值;

根据指南规则,以及患者的基本信息、诊断结果、检验检查结果、用药史构建决策树模型;

根据构建的决策树模型对临床上相似患者进行精准分群,并且对相似患者用药模式进行分析,从而实现治疗的个性化推荐。

第二方面,本发明还提供一种治疗推荐系统,包括:

指南规则化单元,用于将医学指南中的治疗决策知识规则化,转化为指南规则,其中,指南规则根据出处来源和证据等级提供其置信度,指南规则包括条件,条件包括三要素,分别为特征、操作符和阈值;

决策树构建单元,用于根据指南规则,以及患者的基本信息、诊断结果、检验检查结果、用药史构建决策树模型;

决策树应用单元,用于根据构建的决策树模型对临床上相似患者进行精准分群,并且对相似患者用药模式进行分析,从而实现治疗的个性化推荐。

第三方面,本发明还提供一种电子装置,该电子装置包括:存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现如上述治疗推荐方法的步骤。

第四方面,本发明还提供一种计算机可读存储介质,计算机可读存储介质中包括计算机程序,计算机程序被处理器执行时,实现如上述治疗推荐方法的步骤。

从上面的技术方案可知,本发明提供的治疗推荐方法、系统、装置及存储介质,基于医疗大数据中患者基本信息、诊断结果、检验检查结果及用药史、疾病史等特征和治疗用药数据,在医学指南规则指导下构建数据驱动的决策树模型,对从而取得以下有益效果:

1)根据构建的决策树模型,对临床上相似患者精准分群,且对相似患者用药模式进行有效性分析,达到精准治疗的效果,实现治疗模式的个性化推荐;

2)实现对指南规则的丰富和扩展,利用数据模型,对于指南规则没有覆盖的患者群进行扩展,对于指南规则下的患者群进行进一步细分;

3)本发明的治疗推荐方法相对于基于机器学习的数据推荐用药模型融入更多的医学证据,能够明显提高治疗推荐的合理性和置信度。

为了实现上述以及相关目的,本发明的一个或多个方面包括后面将详细说明的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而,这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外,本发明旨在包括所有这些方面以及它们的等同物。

附图说明

通过参考以下结合附图的说明,并且随着对本发明的更全面理解,本发明的其它目的及结果将更加明白及易于理解。在附图中:

图1为根据本发明实施例的治疗推荐方法流程图;

图2为根据本发明实施例的构建决策树模型流程示意图;

图3为根据本发明实施例的治疗推荐系统逻辑结构框图;

图4为根据本发明实施例的电子装置逻辑结构示意图。

在所有附图中相同的标号指示相似或相应的特征或功能。

具体实施方式

在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。

本发明实施例可以应用于计算机系统/服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与计算机系统/服务器等电子设备一起使用的众所周知的计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。

计算机系统/服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器等电子设备可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。

在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。

以下将结合附图对本发明的具体实施例进行详细描述。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

实施例1

针对前述提出的目前的单一的治疗推荐,从而导致目前的治疗推荐方案不精准等问题,本发明提供了一种集成医学指南知识和数据驱动决策树的辅助治疗推荐方法,基于医疗大数据中患者基本信息、诊断结果、检验检查结果及用药史、疾病史等特征和治疗用药数据,在医学指南知识指导下构建数据驱动的决策树模型,对临床上相似患者精准分群,且对相似患者用药模式进行有效性分析(包括血压血糖达标率,治疗后严重并发症发生概率),实现治疗模式的个性化推荐。

为了详细说明本发明提供的治疗推荐方法,图1示出了根据本发明实施例的治疗推荐方法流程。

如图1所示,本发明提供治疗推荐方法包括:

s110:将医学指南中的治疗决策知识规则化,转化为指南规则;

在步骤s110中,医学指南中治疗决策知识可以规则化,指南的治疗相关规则可根据出处来源和证据等级提供其置信度,比如:美国甲状腺协会和临床内分泌医师协会2011年甲亢诊治指南建议,对于老年有心悸症状或并发有心血管病的甲亢患者,必须使用b受体阻滞剂(1级/++0)。

由于将医学指南中的治疗决策知识转化为指南规则,规则的形式包括条件和结论,条件包括特征变量(如年龄)、操作符(大于等于)、阈值(18)三要素,结论包括指南推荐的治疗模式(如用药组合)。在本发明的实施例中,通过人工梳理的方式将医学指南中的治疗决策知识规则化。

s120:根据指南规则,以及患者的基本信息、诊断结果、检验检查结果、用药史构建决策树模型。

在步骤s120中,通过指南规则与医疗大数据中患者基本信息、诊断结果、检验检查结果及用药史、疾病史等特征和治疗用药数据相互结合构建决策树模型。

在机器学习中,决策树是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。

从数据产生决策树的机器学习技术叫做决策树学习,也称作决策树。一个决策树包含三种类型的节点:决策节点、机会节点和终结点。决策树学习也是资料探勘中一个普通的方法。每个决策树都表述了一种树型结构,它由它的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠对源数据库的分割进行数据测试。这个过程可以递归式的对树进行修剪,当不能再进行分割或一个单独的类可以被应用于某一分支时,递归过程就完成了。

其中,构建决策树的关键步骤就是分裂属性,分裂属性就是让各个分裂子集尽可能的“纯”(让一个分裂子类中待分类的项尽可能的属于同一个类别),传统的决策树可选用gini不纯度指标来选择分裂属性特征。

本发明的实施例中,将决策树算法和依据指南作决策时的多条规则结合起来,对指南规则中涉及特征利用其规则置信度和覆盖样本数作为gini不纯度的调节权重来提升此特征被选中的优先级,使得与指南高置信度规则相关且覆盖数量大的特征优先被选出来生成定制化的决策树。

为了详细说明本发明构建决策树模型的过程,图2示出了根据本发明实施例的构建决策树模型流程。

如图2所示,构建决策树模型的流程包括如下步骤:

s210:将所有训练数据样本看作一个根节点。

s220:遍历每种分隔方式,在根节点中找到最优分隔点,其中,最优分隔点为根据指南规则改造后的gini不纯度最小的划分。

也就是说,遍历每种分隔方式,找到最好的分隔点,最好的划分就是使得依据指南规则改造后的gini不纯度最小的划分。

s230:根据最优分割点将根节点分隔为两个节点部分。

也就是说,将所有的训练数据分隔为两个节点部分n1和n2。

s240:对分隔的两个节点部分再分别进行最优分隔点分隔。

也就是说,对n1和n2分别继续执行步骤s220和步骤s230,当指南特征和阈值已在决策树生成中基本覆盖后,剩余特征自由分裂。

s250:直至每个节点中的gini不纯度达到最小,或者当前节点中的数值小于阈值,决策树模型构建完成。

也就是说,直到每个节点中的项足够“纯”,gini不纯度足够小,或者当前节点中记录数小于某个阀值,停止构建决策树的过程,此时决策树已经建成。

在上述构建决策树的过程中,步骤s220中,对于指南规则未涉及特征,根据决策树模型采用如下计算方法计算其在不同分割阈值的gini不纯度。gini指数来衡量数据的不纯度或者不确定性,同时用gini指数来决定类别变量的最优二分值的切分问题。在分类问题中,假设有m个类,则gini指数的定义为:

其中,pi表示样本点属于第i类的概率;

如果样本集合d根据某个特征a被分割为d1、d2两个部分,那么在特征a的条件下,集合d在特征a分割下的gini指数的定义为:

其中,gini指数gini(d,a)表示特征a不同分组的数据集d的不确定性,gini指数值越大,样本集合的不确定性也就越大,gini指数越小表示样本集纯度越高。

对于指南规则涉及特征,通过融合知识规则对原有gini不纯度计算方式进行定制改造,即在计算该特征对应规则阈值分裂点处的gini不纯度时增加权重系数,此权重系数是根据特征所在规则的置信度和满足特征条件的样本数来生成,从而使得与指南高置信度规则相关且覆盖数量大的特征在对应的阈值优先被选出来。其中,改造后的gini不纯度计算方式为:

weighta=ωra*percentra_t

其中,ωra为指南特征a所在规则置信度(0-1之间,越大表示置信度越高);percentra_t为指南特征a在规则对应阈值t下分割后所覆盖样本数占根节点所有样本总数的比例。

对于指南规则的多个关联特征,设置耦合gini不纯度权重系数,当其中一个特征a被选出时,通过设置权重使得关联的特征b在下次分割中能够优先被选出,改造后的gini不纯度计算方式为:

weightb=coef(a,b)*ωrab*percentrb_t

其中,coef(a,b)为特征a和b耦合系数(>1,且与a和b同时存在于规则的数量成正比);

ωrab为指南特征a和b所在规则置信度(0-1之间,越大表示置信度越高);

percentrb_t为指南特征b在规则对应阈值t下分割后所覆盖样本数占根节点所有样本总数的比例。

在本发明的实施例中,在构建决策树模型的过程中依据指南规则改造后的gini不纯度最小划分分为三种情况分别为:指南规则未涉及特征、指南规则涉及特征以及指南规则的多个关联特征,结合具体情况,得出改进的gini不纯度计算,最终在根节点中找到最优分隔点。

s130:根据构建的决策树模型对临床上相似患者进行精准分群,并且对相似患者用药模式进行有效分析,从而实现治疗的个性化推荐。

在步骤130中,对相似患者用药模式进行有效分析就是指:通过分析后得出患者的血压血糖达标率,治疗后严重并发症发生概率,从而进一步进行治疗推荐。

也就是说,利用指南知识规则来影响和改变决策树的归纳建树过程,把依据指南作决策时多个规则的置信度和相关特征与决策树生成算法过程结合起来,从而得到集成医学指南知识和数据驱动的辅助治疗决策树。这样可以对指南规则进行丰富和扩展,对于指南规则没有覆盖的患者群进行扩展,对于指南规则下的患者群进行进一步细分。

本发明实施例提供的治疗推荐方法,将医学指南中的治疗决策知识规则化,转化为指南规则;根据指南规则,以及患者的基本信息、诊断结果、检验检查结果、用药史构建决策树模型;根据构建的决策树模型对临床上相似患者进行精准分群,并且对相似患者用药模式进行有效分析,从而实现治疗的个性化推荐。本发明的治疗推荐方法相对于基于机器学习的数据推荐用药模型融入更多的医学证据,能够明显提高治疗推荐的合理性和置信度,以解决传统的治疗推荐方案不精准等问题。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

实施例2

与上述方法相对应,本发明还提供一种治疗推荐系统,图3示出了根据本发明实施例的治疗推荐系统逻辑结构。

如图3所示,本发明提供一种治疗推荐系统300,包括:指南规则化单元310、决策树构建单元320和决策树应用单元330。其中,指南规则化单元310、决策树构建单元320和决策树应用单元330的实现功能与实施例1中治疗推荐方法的对应的步骤一一对应,为避免赘述,本实施例不一一列举。

指南规则化单元310,用于将医学指南中的治疗决策知识规则化,转化为指南规则,其中,指南规则根据出处来源和证据等级提供其置信度,指南规则包括条件,条件包括三要素,分别为特征、操作符和阈值;

决策树构建单元320,用于根据指南规则,以及患者的基本信息、诊断结果、检验检查结果、用药史构建决策树模型;

决策树应用单元330,用于根据决策树构建单元320构建的决策树模型对临床上相似患者进行精准分群,并且对相似患者用药模式进行分析,从而实现治疗的个性化推荐。

优选地,决策树构建单元320包括:根节点形成模块321、最优分隔点确定模块322、根节点分隔模块323、根节点再次分隔模块324和决策树模型构建模块325。

其中,根节点形成模块321,用于将所有训练数据样本看作一个根节点;

最优分隔点确定模块322,用于遍历每种分隔方式,在所述根节点中找到最优分隔点,其中,所述最优分隔点为根据所述指南规则改造后的gini不纯度最小的划分;

根节点分隔模块323,用于根据所述最优分割点将所述根节点分隔为两个节点部分;

根节点再次分隔模块324,用于对分隔的两个节点部分再分别进行最优分隔点分隔;

决策树模型构建模块325,用于直至每个节点中的gini不纯度达到最小,或者当前节点中的数值小于阈值,所述决策树模型构建完成

优选地,最优分隔点确定模块322对于指南规则未涉及特征,根据所述决策树模型采用如下计算方法计算其在不同分割阈值的gini不纯度,假设有m个类,则gini指数的定义为:

其中,pi表示样本点属于第i类的概率;

如果样本集合d根据某个特征a被分割为d1、d2两个部分,那么在特征a的条件下,集合d在特征a分割下的gini指数的定义为:

其中,gini指数gini(d,a)表示特征a不同分组的数据集d的不确定性,gini指数值越大,样本集合的不确定性也就越大,gini指数越小表示样本集纯度越高。

优选地,最优分隔点确定模块322对于指南规则涉及特征,在计算该特征对应规则阈值分裂点处的gini不纯度时增加权重系数,此权重系数根据该特征所在规则的置信度和满足特征条件的样本数来生成,

其中,所述gini不纯度计算方式为:

weighta=ωra*percentra_t

其中,ωra为指南特征a所在规则置信度;

percentra_t为指南特征a在规则对应阈值t下分割后所覆盖样本数占根节点所有样本总数的比例。

优选地,最优分隔点确定模块322对于指南规则的多个关联特征,设置耦合gini不纯度权重系数,当其中一个特征a被选出时,通过设置权重使得关联的特征b在下次分割中优先被选出,

其中,所述gini不纯度计算方式为:

weightb=coef(a,b)*ωrab*percentrb_t

其中,coef(a,b)为特征a和b耦合系数;

ωrab为指南特征a和b所在规则置信度;

percentrb_t为指南特征b在规则对应阈值t下分割后所覆盖样本数占根节点所有样本总数的比例。

本发明实施例提供的治疗推荐系统,指南规则化单元310将医学指南中的治疗决策知识规则化,转化为指南规则;决策树构建单元320根据指南规则,以及患者的基本信息、诊断结果、检验检查结果、用药史构建决策树模型;决策树应用单元330根据决策树构建单元320构建的决策树模型对临床上相似患者进行精准分群,并且对相似患者用药模式进行分析,从而实现治疗的个性化推荐。本发明的治疗推荐系统相对于基于机器学习的数据推荐用药模型融入更多的医学证据,能够明显提高治疗推荐的合理性和置信度,以解决传统的治疗推荐方案不精准等问题。

实施例3

图4是本发明一实施例提供的电子装置逻辑结构的示意图。如图4所示,该实施例的电子装置40包括处理器41、存储器42以及存储在存储器42中并可在处理器41上运行的计算机程序43。处理器41执行计算机程序43时实现实施例1中治疗推荐方法的各个步骤,例如图1所示的步骤s110至s130。或者,处理器41执行治疗推荐方法时实现上述各装置实施例中各模块/单元的功能,例如图3所示的指南规则化单元310、决策树构建单元320和决策树应用单元330。

示例性的,计算机程序43可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器42中,并由处理器41执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序43在电子装置40中的执行过程。例如,情绪识别程序43可以被分割成实施例2中的指南规则化单元310、决策树构建单元320和决策树应用单元330,其功能作用在实施例2中有详细描述,在此不一一赘述。

电子装置40可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。电子装置40可包括,但不仅限于,处理器41、存储器42。本领域技术人员可以理解,图4仅仅是电子装置40的示例,并不构成对电子装置40的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子装置还可以包括输入输出设备、网络接入设备、总线等。

所称处理器41可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器42可以是电子装置40的内部存储单元,例如电子装置40的硬盘或内存。存储器42也可以是电子装置40的外部存储设备,例如电子装置40上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器42还可以既包括电子装置40的内部存储单元也包括外部存储设备。存储器42用于存储计算机程序以及电子设备所需的其他程序和数据。存储器42还可以用于暂时地存储已经输出或者将要输出的数据。

实施例4

本实施例提供一计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现实施例1中治疗推荐方法,为避免重复,这里不再赘述。或者,该计算机程序被处理器执行时实现实施例2中治疗推荐系统中各模块/单元的功能,为避免重复,这里不再赘述。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1