一种药物信息预测系统和方法
【专利摘要】本发明涉及药物信息预测技术领域,公开了一种药物信息预测系统和方法,该系统包括:接收装置,用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;以及处理装置,用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所述预测对象使用所述多种药物中的每一种药物的可能性。通过上述技术方案,本发明根据所接收的预测对象特征数据来预测相应的预测对象使用某种药物的可能性,实现了自动化地利用预测对象的已有信息来预测可能的药物信息。
【专利说明】
-种药物信息预测系统和方法
技术领域
[0001] 本发明设及药物信息预测技术,具体地,设及一种药物信息预测系统和方法。
【背景技术】
[0002] 在某种疾病发现、治疗的过程中,医生根据病人的病症表现进行相应的用药,在治 疗疾病的过程中,积累了大量的病人病症表现与病人用药方案。利用运些病人特征与用药 方案之间的关系可W指导医生对病人选择合适的药物。现有的相关分析方法通常是人为地 将病人信息与已有信息进行简单的比较,而缺少自动化的实现方式。
【发明内容】
[0003] 本发明的目的是提供一种药物信息预测系统和方法,用于解决自动化地预测对象 使用某种药物的可能性。
[0004] 为了实现上述目的,本发明提供了一种药物信息预测系统,该系统包括:接收装 置,用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;W及处理装 置,用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所述预测对象 使用所述多种药物中的每一种药物的可能性。
[0005] 相应地,本发明还提供了一种药物信息预测方法,该方法包括:接收预测对象的针 对多种药物中的每一种药物的预测对象特征数据;W及通过预先建立的预测模型,根据所 接收的预测对象特征数据来预测所述预测对象使用所述多种药物中的每一种药物的可能 性。
[0006] 通过上述技术方案,本发明根据所接收的预测对象特征数据来预测相应的预测对 象使用某种药物的可能性,实现了自动化地利用预测对象的已有信息来预测可能的药物信 息。
[0007] 本发明的其它特征和优点将在随后的【具体实施方式】部分予W详细说明。
【附图说明】
[000引附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具 体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
[0009] 图1是本发明提供的药物信息预测系统的框图;
[0010] 图2是本发明提供的药物信息预测流程的图示;W及
[0011] 图3是本发明提供的药物信息预测方法的流程图。
【具体实施方式】
[0012] W下结合附图对本发明的【具体实施方式】进行详细说明。应当理解的是,此处所描 述的【具体实施方式】仅用于说明和解释本发明,并不用于限制本发明。
[0013] 图1是本发明提供的药物信息预测系统的框图,如图1所示,该系统包括接收装置 和处理装置。接收装置用于接收预测对象的针对多种药物中的每一种药物的预测对象特征 数据;处理装置用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测预 测对象使用多种药物中的每一种药物的可能性。
[0014] 运里,"预测对象"意指将要进行药物使用可能性预测的对象,本领域技术人员应 当理解,需要对哪个对象进行药物使用可能性预测,就需要接收该对象的特征数据,因为每 个对象的特征数据是不同的,运里预测对象的特征数据被称为"预测对象特征数据"。每一 种药物所对应的对象特征是不同的,所W需要针对每一种药物分别预测预测对象使用该种 药物的可能性。接收装置接收的针对多种药物中的每一种药物的预测对象特征数据可W是 一个预测对象的,也可W是多个预测对象的,但是,无论是一个还是多个预测预测的特征数 据,都需要针对每一个预测对象分别进行每一种药物使用可能性的预测。
[0015] 预测对象特征数据包括预测对象治疗前的特征数据,例如,预测对象的基本数据、 临床检查数据、尿常规数据、生化数据、生命体征数据等。
[0016] 本发明提供的药物信息预测技术是根据预先建立的预测模型来进行的,运里的预 测模型可W为通过任意一种神经网络算法所建立的预测模型,只要适当地设置训练数据即 可,本发明在下文中提供了建立预测模型的优选方式。
[0017] 对于每一种药物,通过预先建立的预测模型可W得到预测对象使用每一种药物的 可能性,假设有m种药物,那么对于第j个预测对象来说,预测对象j使用运m种药物的可能性 可W表示为(Pjl Pj2…pjm)。
[0018] 图1所示的处理装置还用于将可能性与推荐阔值进行比较,将可能性大于推荐阔 值的药物设定作为预测对象的推荐药物。例如,可W将推荐阔值化设置为0.8,多种药物的 使用可能性中大于0.8的使用可能性所对应的药物作为该预测对象的推荐药物。也就是说, 预测得到针对一预测对象的多种药物中的每一种药物的可能性,即可W得到多个可能性, 将该多个可能性与推荐阔值(例如,0.8)进行比较,可能性大于0.8的药物即为推荐药物,最 终得到的推荐药物可W是一种,也可W是多种。
[0019] 下面具体介绍如何建立预测模型。
[0020] 图1所示的接收装置还用于接收多个先验对象中的每一个先验对象针对多种药物 中的每一种药物的先验对象特征数据;处理装置还用于将所接收的多个先验对象的先验对 象特征数据作为训练数据,来建立预测模型。
[0021] 运里,"先验对象"意指因数据采集需要而对其采集数据的对象,对先验对象所采 集的特征数据称为"先验对象特征数据",先验对象特征数据作为训练数据来建立预测模 型。先验对象特征数据包括先验对象治疗前的特征数据,例如,可W将先验对象的基本数 据、临床检查数据、尿常规数据、生化数据、生命体征数据等作为输入,将是否使用某种药物 作为输出。
[0022] 处理装置还用于对所接收的多个先验对象的先验对象特征数据进行数据处理,并 采用数据处理后的先验对象特征数据作为训练数据。本领域技术人员应当理解,不同的特 征数据具有不同的单位和表征形式,所W需要对所接收的先验对象特征数据进行数据处 理,同理,对于上文中描述的预测对象特征数据也需要进行与先验对象特征数据相同的数 据处理。下面仅W先验对象特征数据为例介绍数据处理过程。
[0023] 数据处理包括:针对所述多种药物中的每一种药物,将多个先验对象分为使用和 不使用两类,并用第一矩阵表示使用的先验对象特征,用第二矩阵表示不使用的先验对象 特征;针对每一个特征,利用第一矩阵和第二矩阵的对应列进行秩和检验,得到统计显著 性;将统计显著性小于显著性阔值的对象特征数据作为显著特征数据;通过第Ξ矩阵表示 使用的显著特征数据,通过第四矩阵表示不使用的显著特征数据;采用第Ξ矩阵和第四矩 阵作为训练数据;其中,第一至第四矩阵中各行分别表示不同的先验对象,各列分别表示不 同特征对应的特征数据,显著特征数据对应的特征为显著特征。
[0024] 具体来说,针对每一种药物,首先建立两个矩阵,第一矩阵用来表示使用该药物的 先验对象特征数据,第二矩阵用来表示不使用该药物的先验对象特征数据。其中,第一矩阵 和第二矩阵的一行表示一个先验对象的所有特征数据,一列表示所有先验对象的一个特 征,举例来说,第一行表示第一个先验对象的所有特征数据,第二行表示第二个先验对象的 所有特征数据,第一列表示第一个特征的特征数据,第二列表示第二个特征的特征数据。对 于每一个特征,利用第一矩阵和第二矩阵的对应列进行秩和检验,得到统计显著性,可W设 置显著性阔值T设置为0.01,统计显著性小于0.01的特征数据作为显著特征数据,显著特征 数据对应的特征即为显著特征。通过显著特征对第一矩阵和第二矩阵中的先验对象特征数 据进行数据提取,将第一矩阵和第二矩阵中显著特征的特征数据提取出来,并通过第Ξ矩 阵表示使用该药物的显著特征数据,通过第四矩阵表示不使用该药物的显著特征数据。第 Ξ矩阵和第四矩阵为作为训练数据的数据。
[0025] 由于不同特征的数据具有不同的量纲,数据处理还包括:在将多个先验对象分为 使用和不使用两类之前,对先验对象特征数据进行离散化或数值化,然后进行归一化。其 中,先验对象治疗前的特征数据有的是连续型数据有的是离散型数据,对于连续性数据,可 W保留数值,对于离散型数据,可W将数据转化为离散值,例如,1、2等。在对先验对象特征 数据进行离散化或数值化之后,对离散化或数值化之后的数据进行归一化。
[0026] 处理装置还用于:对预测对象特征数据离散化或数值化,然后进行归一化;根据预 测对象特征数据中的显著特征对应的数据来预测所述可能性。也就是说,还需要对预测对 象特征数据进行预处理,其中,离散化、数值化、归一化的过程与对先验对象特征数据进行 处理的过程类似。通过上文的描述,通过先验对象特征数据可W得到哪些特征为显著特征, 运样可W仅采用预测对象的显著特征数据来对使用某种药物的可能性进行预测。
[0027] 处理装置还用于:在没有推荐药物的情况下,重新设定显著性阔值;在重新设定显 著性阔值之后仍没有推荐药物的情况下,重新设定推荐阔值。具体来说,如果通过W上技术 方案没有得到推荐药物,可W改变显著性阔值,例如,将显著性阔值重新设定为0.05,再重 复本发明提供的过程,W得到推荐药物。然而,如果已经降低了显著性阔值,仍然没有推荐 药物,那么可W重新设定推荐阔值,例如,可W将推荐阔值重新设定为0.5。
[0028] 下面结合图2通过一个具体实施例对本发明进行更加详细的阐述。
[0029] 图2是本发明提供的药物信息预测流程的图示,如图2所示:
[0030] 步骤201,接收装置接收先验对象特征数据,一般为治疗前的对象数据。
[0031] 步骤202,对先验对象特征数据进行离散化或数值化及归一化。对于接收到的先验 对象特征数据,将其中连续性数据保留数值,将其中离散型数据(例如,阴性、阳性)可W将 数据转化为离散值,然后在对数值化或离散化后的特征数据进行归一化。例如可W通过下 式(1)进行归一化:
[0032]
(1)
[0033] 其中,Xi为一对象的特征数据,Xmin为所接收到的同一特征对应的多个先验对象的 特征数据中的最小值,Xmax为所接收到的同一特征对应的多个先验对象的特征数据中的最 大值。在归一化操作之后,将所有特征数据通过矩阵的形式表示出来,假设有P个先验对象, η个特征,那么所有先验对象所对应的特征数据可W表示为式(2):
[0034]
(2)
[0035] 其中XU表示第i个先验对象的第j个特征的取值,表示第j个特征。
[0036] 步骤203,选择先验对象特征数据中的显著特征数据。对于一种研究疾病,已有的 用药集合可W表示为{dl,cb,…,dm},di表示药物i,共有m种药物。针对药物di,将先验对象分 为两组:使用药物di和不使用药物di,其中,将使用药物di的特征表示为式(3):
[0037]
(3)
[0038] 其中,不,,表示使用药物di的先验对象特征矩阵,a表示使用药物di的先验对象的数 量;
[0039] 将不使用药物di的特征表示为式(4)
[0040]
(4)
[0041 ]其中,乂表示不使用药物di的先验对象特征矩阵。
[0042] 对每一个特征。,利用矩阵^和馬的对应列进行秩和检验,得到统计显著性,设 置显著性阔值Τ = 0.01,选择K0.01的特征作为药物di的显著特征。针对m种药物,对每一种 药物获得对应的显著特征。
[0043] 针对药物di,从式(3)和式(4)中将药物di的显著特征对应的特征数据提取出来,得 到式(5)和式(6):
[0044]
(5)
[0045]
(6)
[0046] 其中,b表示药物di的显著特征个数,&,为保留显著特征对应列而生成的矩阵, 为正样本训练数据。马,:为义4保留显著特征对应列而生成的矩阵,为负样本训练数据。
[0047] 步骤204,利用支持向量机并利用式(5)和式(6)的数据建立预测模型。
[0048] 步骤205,接收预测对象特征数据
[0049] 步骤206,对预测对象特征数据进行离散化或数值化及归一化,该过程参考步骤 202。
[0050] 步骤207,选择预测对象特征数据中的显著特征数据,通过步骤203可W知道哪些 特征为显著特征,将预测对象j所选择的显著特征数据表示为(刮1 XW…Xjb)。
[0051] 步骤208,将预测对象作为测试数据,预测预测对象j使用药物di的可能性wi。对每 一种药物进行预测,得到预测对象j使用每一种药物的可能性,表示为(PW PW…Pjm)。
[0052] 步骤209,设置推荐阔值化=0.8,pjiXrp所对应的药物为预测对象j的推荐药物。 [0化3] W上i、j、m、n、p、a、b均为正整数。
[0054] 通过上文描述,通过图2所示的过程没有推荐药物的情况下,可W通过改变显著性 阔值T或推荐阔值化来得到推荐药物。
[0055] 图3是本发明提供的药物信息预测方法的流程图,如图3所示,该方法包括:接收预 测对象的针对多种药物中的每一种药物的预测对象特征数据;通过预先建立的预测模型, 根据所接收的预测对象特征数据来预测预测对象使用多种药物中的每一种药物的可能性。
[0056] 应当说明的是,本发明提供的药物信息预测方法的具体细节及益处与本发明提供 的药物信息预测系统类似,于此不予寶述。
[0057] W上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实 施方式中的具体细节,在本发明的技术构思范围内,可W对本发明的技术方案进行多种简 单变型,运些简单变型均属于本发明的保护范围。
[0058] 另外需要说明的是,在上述【具体实施方式】中所描述的各个具体技术特征,在不矛 盾的情况下,可W通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可 能的组合方式不再另行说明。
[0059] 此外,本发明的各种不同的实施方式之间也可W进行任意组合,只要其不违背本 发明的思想,其同样应当视为本发明所公开的内容。
【主权项】
1. 一种药物信息预测系统,其特征在于,该系统包括: 接收装置,用于接收预测对象的针对多种药物中的每一种药物的预测对象特征数据; 以及 处理装置,用于通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所 述预测对象使用所述多种药物中的每一种药物的可能性。2. 根据权利要求1所述的系统,其特征在于,所述处理装置还用于将所述可能性与推荐 阈值进行比较,将所述可能性大于所述推荐阈值的药物设定作为所述预测对象的推荐药 物。3. 根据权利要求2所述的系统,其特征在于, 所述接收装置还用于接收多个先验对象中的每一个先验对象针对所述多种药物中的 每一种药物的先验对象特征数据;以及 所述处理装置还用于将所接收的所述多个先验对象的所述先验对象特征数据作为训 练数据,来建立所述预测模型。4. 根据权利要求3所述的系统,其特征在于,所述处理装置还用于对所接收的所述多个 先验对象的所述先验对象特征数据进行数据处理,并采用数据处理后的先验对象特征数据 作为所述训练数据。5. 根据权利要求4所述的系统,其特征在于,所述数据处理包括: 针对所述多种药物中的每一种药物,将所述多个先验对象分为使用和不使用两类,并 用第一矩阵表示使用的先验对象特征数据,用第二矩阵表示不使用的先验对象特征数据; 针对每一个特征,利用所述第一矩阵和所述第二矩阵的对应列进行秩和检验,得到统 计显著性; 将统计显著性小于显著性阈值的对象特征数据作为显著特征数据; 通过第三矩阵表示使用的显著特征数据,通过第四矩阵表示不使用的显著特征数据; 以及 采用所述第三矩阵和所述第四矩阵作为所述训练数据; 其中,第一至第四矩阵中各行分别表示不同的先验对象,各列分别表示不同特征对应 的特征数据,所述显著特征数据对应的特征为显著特征。6. -种药物信息预测方法,其特征在于,该方法包括: 接收预测对象的针对多种药物中的每一种药物的预测对象特征数据;以及 通过预先建立的预测模型,根据所接收的预测对象特征数据来预测所述预测对象使用 所述多种药物中的每一种药物的可能性。7. 根据权利要求6所述的方法,其特征在于,该方法还包括: 将所述可能性与推荐阈值进行比较,将所述可能性大于所述推荐阈值的药物设定作为 所述预测对象的推荐药物。8. 根据权利要求7所述的系统,其特征在于,建立所述预测模型包括: 接收多个先验对象中的每一个先验对象针对所述多种药物中的每一种药物的先验对 象特征数据;以及 将所接收的所述多个先验对象的所述先验对象特征数据作为训练数据,来建立所述预 测模型。9. 根据权利要求8所述的方法,其特征在于,该方法还包括: 对所接收的所述多个先验对象的所述先验对象特征数据进行数据处理,并采用数据处 理后的先验对象特征数据作为所述训练数据。10. 根据权利要求9所述的方法,其特征在于,所述数据处理包括: 针对所述多种药物中的每一种药物,将所述多个先验对象分为使用和不使用两类,并 用第一矩阵表示使用的先验对象特征数据,用第二矩阵表示不使用的先验对象特征数据; 针对每一个特征,利用所述第一矩阵和所述第二矩阵的对应列进行秩和检验,得到统 计显著性; 将统计显著性小于显著性阈值的对象特征数据作为显著特征数据; 通过第三矩阵表示使用的显著特征数据,通过第四矩阵表示不使用的显著特征数据; 以及 采用所述第三矩阵和所述第四矩阵作为所述训练数据; 其中,第一至第四矩阵中各行分别表示不同的先验对象,各列分别表示不同特征对应 的特征数据,所述显著特征数据对应的特征为显著特征。
【文档编号】G06F19/00GK105825054SQ201610147701
【公开日】2016年8月3日
【申请日】2016年3月15日
【发明人】黄亦谦
【申请人】北京千安哲信息技术有限公司