本发明涉及一种基于大数据的肿瘤疾病评估方法,属于医疗领域。
背景技术:
在医学上,癌是指起源于上皮组织的恶性肿瘤,是恶性肿瘤中最常见的一类。相对应的,起源于间叶组织的恶性肿瘤统称为肉瘤。有少数恶性肿瘤不按上述原则命名,如肾母细胞瘤、恶性畸胎瘤等。一般人们所说的“癌症”习惯上泛指所有恶性肿瘤。癌症具有细胞分化和增殖异常、生长失去控制、浸润性和转移性等生物学特征,其发生是一个多因子、多步骤的复杂过程,分为致癌、促癌、演进三个过程,与吸烟、感染、职业暴露、环境污染、不合理膳食、遗传因素密切相关。
根据肿瘤发生的不同部位和性质,对患者的临床表现和体征进行综合分析,结合实验室检查和影像学、细胞病理学检查通常能做出明确诊断。除了明确是否有恶性肿瘤,还应进一步了解其范围和程度,以便拟定治疗方案和评估预后。但目前仍缺乏理想的特异性强的早期诊断方法,尤其对深部肿瘤的早期诊断更为困难。
国际抗癌联盟认为,1/3的癌症是可以预防的,1/3的癌症如能早期诊断是可以治愈的,1/3的癌症可以减轻痛苦,延长生命。所以在早期发现癌症,并针对癌症的情况进行合理的治疗,癌症是可以痊愈的。但是现在对于癌症的分析和诊断很大程度上依靠主治医生的个人经验。
技术实现要素:
针对现有技术存在的不足,本发明提供一种基于大数据的肿瘤疾病评估方法,通过建立各年龄段、各种类型的肿瘤患者的诊疗数据库,通过数据分析和数据推导,根据待治疗患者检查情况,可以提出针对性的治疗方案的对比数据,提供癌症治疗的有效指导。
为解决上述技术问题,本发明采取的技术方案是,一种基于大数据的肿瘤疾病评估方法,包括以下步骤:
1)收集各年龄段、各种类型肿瘤患者作为在库患者,并将在库患者的治疗前的检测数据、治疗中的治疗方法数据、治疗后的检测数据,并依据收集的数据建立大数据数据库,将大数据数据库存储于数据库服务器中;
2)采集待测肿瘤患者的年龄段、肿瘤类型和肿瘤检查数据,并将待测肿瘤患者的年龄段、肿瘤类型和肿瘤检查数据上传至数据库服务器中;
3)数据库服务器以步骤2)中上传的待测肿瘤患者的年龄段、肿瘤类型作为搜索条件,搜索大数据数据库中与待测肿瘤患者的年龄段、肿瘤类型相符的在库患者作为数据相关患者,并提取数据相关患者的检测数据、治疗中的治疗方法数据、治疗后的检测数据;
4)将步骤3)中提取的数据相关患者的治疗前的检测数据与待测肿瘤患者的肿瘤检查数据进行比对,挑选出数据相关患者中与待测肿瘤患者病情匹配度高的作为评估患者集合;
5)对步骤4)挑选出的评估患者集合中的在库患者的治疗中的治疗方法数据、治疗后的检测数据进行分析,提出待测肿瘤患者的治疗方法和使用不同治疗方法后的预后情况。
优化的,上述基于大数据的肿瘤疾病评估方法,在步骤3)中,以待测肿瘤患者的年龄段作为搜索条件时,将搜索条件的阈值上限设置为待测肿瘤患者的年龄加两年,将搜索条件阈值的下限设置为待测肿瘤患者的年龄减两年;以待测肿瘤患者的肿瘤类型作为搜索条件时,将待测肿瘤患者的肿瘤类型分为肿瘤具体部位和肿瘤的病理学类型两部分。
优化的,上述基于大数据的肿瘤疾病评估方法,在步骤4)中,在挑选数据相关患者中与待测肿瘤患者病情匹配度高的作为评估患者集合的过程为:
4-1)将每个数据相关患者治疗前的检测数据设置为:i={i1,i2,…,in},其中,i为一个数据相关患者的治疗前检测数据集,in为治疗前检测数据的第n项数据;
4-2)将全部数据相关患者治疗前的检测数据设置为数据相关患者数据集d,d={i1,i2,…,im},其中im为第m个数据相关患者的治疗前检测数据集;
4-3)将待测肿瘤患者的肿瘤检查数据集设置为e,e={j1,j2,…,jn},其中jn为待测肿瘤患者的第n项肿瘤检查数据;
4-4)为待测肿瘤患者的肿瘤检查数据集e中的每一项肿瘤检查数据设立一个比对阈值,比对阈值的上限为此项肿瘤检查数据的130%,对比阈值的下限为此项肿瘤检查数据的80%;
4-5)将待测肿瘤患者的肿瘤检查数据集e中的每一项检查数据与其中一个数据相关患者的治疗前检测数据集in中的每一项治疗前检测数据进行比对,如果此数据相关患者的治疗前检测数据集in中80%的治疗前检测数据项的数值处于待测肿瘤患者的肿瘤检查数据集e中肿瘤检查数据的对比阈值内,则此数据相关患者的治疗前检测数据集归入评估患者集合的数据内;
4-6)重复上述步骤4-5),直至遍历数据相关患者数据集d中的每一个数据相关患者的治疗前检测数据集i。
优化的,上述基于大数据的肿瘤疾病评估方法,在步骤5)中,对步骤4)挑选出的评估患者集合中的在库患者的治疗中的治疗方法数据、治疗后的检测数据进行分析的过程为:
5-1)为待测肿瘤患者制定多项待选治疗方法,并将多项待选治疗方法的集合设置为z,z={z1,z1,…,zn},其中zn为第n项待选治疗方法;
5-2)将评估患者集合中的每个在库患者的治疗中的治疗方法数据集分别设置为p={p1,p2,…,pn},其中pn为某个在库患者的第n项治疗方法数据;并将评估患者集合中全部在库患者的治疗中的治疗方法数据设置为评估患者集合治疗方法数据集q={p1,p2,…,},其中pn为评估患者集合中第n个在库患者的治疗中的治疗方法数据;
5-3)将多项待选治疗方法的集合z中的每一项待选治疗方法与评估患者集合中的其中一个在库患者的治疗方法数据集p中的每一项治疗方法数据进行比对,如果此在库患者的治疗方法数据集p中的其中某一项或者多项治疗方法数据与多项待选治疗方法的集合z中的待选治疗方法数据相同,则将此评估患者集合中的在库患者的治疗中的治疗方法数据、治疗后的检测数据进行输出显示;
5-4)重复5-3)的过程,遍历评估患者集合治疗方法数据集q中的评估患者集合中的每一个在库患者治疗方法数据集p。
优化的,上述基于大数据的肿瘤疾病评估方法,在步骤5)中,对为待测肿瘤患者制定多项待选治疗方法进行评估,评估过程为:将多项待选治疗方法的集合z中的某一项待选治疗方法zn的可行度计算为:
优化的,上述基于大数据的肿瘤疾病评估方法,步骤5)中,设置待选治疗方法zn与治疗方法预后情况y之间的联系规则
优化的,上述基于大数据的肿瘤疾病评估方法,步骤5)中,对不同治疗方法的失误概率进行预测,失误概率预测方法为:
本发明的优点在于:
本申请的技术方案中,通过将过往患者的治疗前的检测数据、治疗中的治疗方法数据、治疗后的检测数据进行收集,通过收集的数据建立大数据数据库,为癌症患者的诊断治疗指导提供有效的数据支撑。
本申请中,以年龄段和肿瘤类型作为搜索条件在数据库内搜索在库患者信息,能够搜索出与待测肿瘤患者病情以及身体状况类似的在库患者的数据,通过这些数据中的检测数据、治疗中的治疗方法数据、治疗后的检测数据,为待测肿瘤患者的治疗提供数据依据。
分析评估患者集合中的在库患者的数据,通过数据分析的形式得到各种治疗方案以及治疗方案的可行性,为待测肿瘤患者的治疗提供有有效的数据资料。
待测肿瘤患者的肿瘤类型分为肿瘤具体部位和肿瘤的病理学类型两部分,以此为搜索条件,能够提高搜索精度,降低搜索数据的噪声。
通过将检测数据拆分为各个数据项,通过数据的逐项对比,可以获得在阈值内的全部数据,对数据相关患者数据集d进行去噪。
通过数据分析计算,可以得到与待测肿瘤患者的病情相匹配的治疗方案的可信任度、可行度和失误概率,通过这三者的对比,可以得到风险低且有效的治疗方案,为待测肿瘤患者的治疗提供数据依据。
附图说明
图1是本发明的基于大数据的肿瘤疾病评估方法的流程框图。
具体实施方式
下面结合附图与具体实施例进一步阐述本发明的技术特点。
具体实施方式
本发明为一种基于大数据的肿瘤疾病评估方法,包括以下步骤:
1)收集各年龄段、各种类型肿瘤患者作为在库患者,并将在库患者的治疗前的检测数据、治疗中的治疗方法数据、治疗后的检测数据,并依据收集的数据建立大数据数据库,将大数据数据库存储于数据库服务器中;
2)采集待测肿瘤患者的年龄段、肿瘤类型和肿瘤检查数据,并将待测肿瘤患者的年龄段、肿瘤类型和肿瘤检查数据上传至数据库服务器中;
3)数据库服务器以步骤2)中上传的待测肿瘤患者的年龄段、肿瘤类型作为搜索条件,搜索大数据数据库中与待测肿瘤患者的年龄段、肿瘤类型相符的在库患者作为数据相关患者,并提取数据相关患者的检测数据、治疗中的治疗方法数据、治疗后的检测数据;
4)将步骤3)中提取的数据相关患者的治疗前的检测数据与待测肿瘤患者的肿瘤检查数据进行比对,挑选出数据相关患者中与待测肿瘤患者病情匹配度高的作为评估患者集合;
5)对步骤4)挑选出的评估患者集合中的在库患者的治疗中的治疗方法数据、治疗后的检测数据进行分析,提出待测肿瘤患者的治疗方法和使用不同治疗方法后的预后情况。
在步骤3)中,以待测肿瘤患者的年龄段作为搜索条件时,将搜索条件的阈值上限设置为待测肿瘤患者的年龄加两年,将搜索条件阈值的下限设置为待测肿瘤患者的年龄减两年;以待测肿瘤患者的肿瘤类型作为搜索条件时,将待测肿瘤患者的肿瘤类型分为肿瘤具体部位和肿瘤的病理学类型两部分。
在步骤4)中,在挑选数据相关患者中与待测肿瘤患者病情匹配度高的作为评估患者集合的过程为:
4-1)将每个数据相关患者治疗前的检测数据设置为:i={i1,i2,…,in},其中,i为一个数据相关患者的治疗前检测数据集,in为治疗前检测数据的第n项数据;
4-2)将全部数据相关患者治疗前的检测数据设置为数据相关患者数据集d,d={i1,i2,…,im},其中im为第m个数据相关患者的治疗前检测数据集;
4-3)将待测肿瘤患者的肿瘤检查数据集设置为e,e={j1,j2,…,jn},其中jn为待测肿瘤患者的第n项肿瘤检查数据;
4-4)为待测肿瘤患者的肿瘤检查数据集e中的每一项肿瘤检查数据设立一个比对阈值,比对阈值的上限为此项肿瘤检查数据的130%,对比阈值的下限为此项肿瘤检查数据的80%;
4-5)将待测肿瘤患者的肿瘤检查数据集e中的每一项检查数据与其中一个数据相关患者的治疗前检测数据集in中的每一项治疗前检测数据进行比对,如果此数据相关患者的治疗前检测数据集in中80%的治疗前检测数据项的数值处于待测肿瘤患者的肿瘤检查数据集e中肿瘤检查数据的对比阈值内,则此数据相关患者的治疗前检测数据集归入评估患者集合的数据内;
4-6)重复上述步骤4-5),直至遍历数据相关患者数据集d中的每一个数据相关患者的治疗前检测数据集i。
在步骤5)中,对步骤4)挑选出的评估患者集合中的在库患者的治疗中的治疗方法数据、治疗后的检测数据进行分析的过程为:
5-1)为待测肿瘤患者制定多项待选治疗方法,并将多项待选治疗方法的集合设置为z,z={z1,z1,…,zn},其中zn为第n项待选治疗方法;
5-2)将评估患者集合中的每个在库患者的治疗中的治疗方法数据集分别设置为p={p1,p2,…,pn},其中pn为某个在库患者的第n项治疗方法数据;并将评估患者集合中全部在库患者的治疗中的治疗方法数据设置为评估患者集合治疗方法数据集q={p1,p2,…,},其中pn为评估患者集合中第n个在库患者的治疗中的治疗方法数据;
5-3)将多项待选治疗方法的集合z中的每一项待选治疗方法与评估患者集合中的其中一个在库患者的治疗方法数据集p中的每一项治疗方法数据进行比对,如果此在库患者的治疗方法数据集p中的其中某一项或者多项治疗方法数据与多项待选治疗方法的集合z中的待选治疗方法数据相同,则将此评估患者集合中的在库患者的治疗中的治疗方法数据、治疗后的检测数据进行输出显示;
5-4)重复5-3)的过程,遍历评估患者集合治疗方法数据集q中的评估患者集合中的每一个在库患者治疗方法数据集p。
在步骤5)中,对为待测肿瘤患者制定多项待选治疗方法进行评估,评估过程为:将多项待选治疗方法的集合z中的某一项待选治疗方法zn的可行度计算为:
步骤5)中,设置待选治疗方法zn与治疗方法预后情况y之间的联系规则
步骤5)中,对不同治疗方法的失误概率进行预测,失误概率预测方法为:
当然,上述说明并非是对本发明的限制,本发明也并不限于上述举例,本技术领域的普通技术人员,在本发明的实质范围内,作出的变化、改型、添加或替换,都应属于本发明的保护范围。