本发明涉及医疗检查文本处理技术,尤其涉及了一种放射检查的病程自动匹配管理方法和系统。
背景技术:
1、在医疗诊断中,许多疾病都需要患者定期到医院检查,特别是慢性病和恶性肿瘤。其中,恶性肿瘤还伴随定期放化疗和以放射检查为手段的预后诊断。对于患者流量众多的医院临床业务流而言,对众多随访患者数据的整理、归纳是提高医院临床工作效率的重要手段,也为疾病治疗攻关研究提供数据基础。影像检查随访数据管理的重点在于将同一个病灶各时间的变化整理在一个时间轴上,当前暂无用途完全一致的技术方法可供参考,但在慢性病和肿瘤病历数据采集领域有接近的思路可用于对比。
2、如现有技术1:专利cn108172267a通过数据采集模块采集健康数据,并通过文本匹配的方式抽取其中与医嘱相符的信息进行匹配,实现数据整理,但该方法只是从用户主动上传的日常饮食起居信息中提取关键词,对于具有复杂语义的临床放射检查报告效果不佳。
3、现有技术2:专利cn110364233a采用关键词识别的方式识别医疗数据中的特定信息,并将关联数据存放至关系型数据库和非关系型数据库,该方法仅通过关键词和关键参数识别数据,对于文本数据效果较差。
4、现有技术3:专利cn110364236a将影像报告中的诊断属性词与该患者病理报告中的关键词匹配,以识别该影像是否和目标疾病有关,从而形成随访报告,但该方法无法用于无病理检查的疾病;同时,也没有关注多次检查时的疾病变化情况。
5、现有技术4:专利cn113871025 a构建皮肤专病数据库,但采用的专病采集和数据整理方式为标识符整理,标识符只能匹配人工设定的固定几种关键词,检索效率和精准度较低。
6、当前对于医疗数据特别是影像检查数据随访匹配的方法均存在针对文本数据泛化性、准确率较差和提取信息不够全面的缺点。此外,不少病例报告存在多个组织有同一种异常的情况,但在随访的过程中,不同组织预后进展不一,需要细分处理,情况更为复杂,目前的方法均无法较好的提取这些信息。
技术实现思路
1、本发明针对现有技术中缺少对文本数据的结构化整理,以及结构化后缺少对异常目标匹配能力,无法针对患者的疾病进行随访追踪,从而导致医疗大数据缺乏有效归纳和整理,降低数据可用性的问题,提出了一种放射检查的病程自动匹配管理方法和系统。
2、为了解决上述技术问题,本发明通过下述技术方案得以解决:
3、一种放射检查的病程自动匹配管理方法,其方法包括:
4、步骤1,放射检查总数据集d的获取,从pacs系统中读取所有放射检查的检查编号、患者信息、检查时间,报告中的影像所见、诊断结果,为放射检查总数据集d;
5、步骤2,诊断结果实体目标的集合der的获取,构建实体关系抽取模型mer,从总数据集d中抽取疾病异常、患病组织、严重程度和随访对比信息,从而获得诊断结果实体目标的集合der;
6、步骤3,样本对(der,0,der,1)的获取,对实体目标的集合der中包含随访信息的检查定位同患者、同检查类型、检查时间更早的检查,及其抽取的诊断结果实体目标,获取同一个患者的先后两次同检查类型样本对(der,0,der,1);
7、步骤4,随访信息匹配,根据同一个患者的先后两次同检查类型样本对(der,0,der,1),进行通过随访关系抽取模型msr进行随访信息匹配,找到其中同一个异常的先后检查描述;
8、步骤5,异常随访变化数据的获取,通过随访关系抽取模型msr和实体关系抽取模型mer为核心模型,以在时间上具有先后顺序的同检查类型放射检查的随访文本序列为输入,输出结构化随访匹配结果,并结合院内pacs系统和结构化随访数据库,从而得到异常随访变化数据。
9、作为优选,放射检查总数据集d包括放射检查患者信息d0和影像诊断结果文本数据集d1;患者信息d0包括检查编号、病案号、检查类型及检查日期;影像诊断结果文本数据集d1均以检查编号为索引。
10、作为优选,诊断结果实体目标的集合der的获取包括:设定诊断结果实体目标,诊断结果实体目标包含检查编号、实体:[异常、组织、描述]、关系:[患病组织、严重程度、随访对比],即[组织]患有[异常],其严重程度为[描述1],随访对比为[描述2];其中,随访对比为报告中包含“较前相比”、“与tttt时间检查相比”具有多次检查对比含义的信息;
11、构建放射报告实体关系抽取模型mer,mer以transformer为基础结构,抽取输入文本的报告特征向量,输出报告文本中存在的每个实体,以及该实体与其他实体属于何种关系。
12、作为优选,放射报告实体关系抽取模型mer在transformer编码器模块和解码器模块之间添加报告实体关系提示模块。该提示模块以实体关系目标结构中的3种实体和3种关系为输入,输入报告实体关系提示特征,该提示特征作为注意力权重与报告特征向量逐像素相乘后输入transformer解码器模块。;
13、从所述诊断结果数据集d1中随机采集ner例报告,并标注上述实体关系目标,作为训练数据集训练模型mer;
14、采用训练好的实体关系抽取模型mer,从诊断结果数据集d1中抽取诊断结果实体目标,获得诊断结果实体目标的集合der。
15、作为优选,样本对(der,o,der.1)的获取包括,
16、步骤3.1,从诊断结果实体目标的集合der中找到包含随访对比关系的一个数据样本der,0,并从d0中找到对应检查基本信息d0,1的患者病案号c和检查类型i、检查时间t0,并根据检查编号从d1中找到对应诊断结果文本d1,1;
17、步骤3.2,从d0中定位病案号为c,检查类型为i,检查时间早于t0的最近一个同病案号c的同检查类型i的基本信息d0,2,其检查时间为t1,并根据其检查编号从der中找到对应已抽取的诊断结果实体目标样本der,1。
18、作为优选,随访信息的匹配包括:
19、步骤4.1,将训练好的实体关系抽取模型mer的参数权重,作为待微调的随访关系抽取模型msr;步骤4.2,将样本对(der,1,der,0)按照检查时间从前到后的顺序组成随访文本序列;
20、步骤4.3,定义随访匹配实体目标结构,具体包括患者病案号、实体:[组织,异常,描述]、关系:[患病组织,随访前程度,随访后程度,变化情况]
21、步骤4.4,随访关系抽取模型msr的获取,从der中采集样本对,按照步骤4.2组成随访文本序列样本集,并按照步骤4.3中所述随访匹配实体目标结构进行人工标注,组成样本集dsr;用样本集dsr训练随访关系抽取模型msr,从而得到随访关系抽取模型msr。
22、作为优选,随访文本序列结构为:
23、时间t1时,[组织1,1]患有[异常1,1],患病程度为[描述1,1a],随访对比为[描述1,1b];[组织1,2]患有[异常1,2],患病程度为[描述1,2a],随访对比为[描述1,2b];……;[组织1,k]患有[异常1,k],患病程度为[描述1,ka],随访对比为[描述1,kb];
24、时间t0时,[组织0,1]患有[异常0,1],患病程度为[描述0,1a],随访对比为[描述0,1b];[组织0,2]患有[异常0,2],患病程度为[描述0,2a],随访对比为[描述0,2b];……;[组织0,p]患有[异常0,p],患病程度为[描述0,pa],随访对比为[描述0,pb]。
25、作为优选,随访匹配实体目标结构为:
26、[{异常:[异常1],患病组织:[组织1],随访前检查时间:[时间1],随访前程度:[描述1a],随访后检查时间:[时间2],随访后程度:[描述1b],变化情况:[描述1c]},{异常:[异常2],患病组织:[组织2],随访前检查时间:[时间1],随访前程度:[描述2a],随访后检查时间:[时间2],随访后程度:[描述2b],变化情况:[描述2c]}]。
27、其中,随访前[描述1a]和随访后程度[描述1b]分别对应随访文本序列中同一异常在时间t1和时间t0的两次患病程度[描述1,ka]和[描述1,pa],变化情况[描述1c]对应随访对比[描述0,pb];
28、作为优选,随访关系抽取模型msr与实体关系抽取模型mer结构相同,同样在编码器模块和解码器模块之间添加报告实体关系提示模块,但其实体关系提示模块的输入为随访匹配实体目标结构的3种实体和4种关系;具体包括患者病案号、实体:[组织,异常,描述]、关系:[患病组织,随访前程度,随访后程度,变化情况]。
29、作为优选,异常随访变化数据的获取包括:
30、步骤5.1,从院内pacs中按照患者信息提取同一个患者的所有检查,并过滤同检查类型的检查x次{d0,d1,…,dx};
31、步骤5.2,将同检查类型放射报告按照时间先后顺序依次输入随访匹配系统的实体关系抽取模型mer,抽取实体:[异常、组织、描述]、关系:[患病组织、严重程度、随访对比],组成实体目标数据集{der,0,der,1,…,der,x};
32、步骤5.3,将实体目标数据集中的样本两两配对{(der,0,der,1),(der,1,der,2),…,(der,x-1,der,x)},并按照组成随访文本序列数据集{dt,0,dt,1,…,dt,x-1},将其按照顺序依次输入随访匹配系统的随访关系抽取模型msr,得到随访匹配实体目标数据集{dsr,0,dsr,1,…,dsr,x-1},其中dsr,i的结构为:[{异常:[异常1],患病组织:[组织1],检查:[{检查时间:[时间1],变化情况:[描述1,1]},{检查时间:[时间2],变化情况:[描述1,2]}]},{异常:[异常2],患病组织:[组织2],检查:[{检查时间:[时间1],变化情况:[描述2,1]},{检查时间:[时间2],变化情况:[描述2,2]}]}];
33、步骤5.4,将随访匹配实体目标数据集中同一个组织的同一种异常的所有检查时间、随访程度(包括:随访前程度、随访后程度)和变化情况按照时间顺序汇总,并删除步骤5.3前后配对造成的随访对比描述重复,得到该患者的异常随访变化数据。
34、为了解决上述技术问题,本发明还提供了一种放射检查的病程自动匹配管理的系统,其通过所述的一种放射检查的病程自动匹配管理方法实现的系统。
35、为了解决上述技术问题,本发明还提供了一种存储介质,其所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的一种放射检查的病程自动匹配管理的方法。
36、为了解决上述技术问题,本发明还提供了一种电子设备,包括存储器、处理器以及存储所述存储器上并可在所述处理器上运行的计算机程序,其所述处理器执行所述计算机程序时实现所述的一种放射检查的病程自动匹配管理的方法。
37、本发明由于采用了以上技术方案,具有显著的技术效果:
38、本发明将结构化信息中的实体关系用统一的文本表达出来,便于自然语言处理模型进行处理,同时统一的文本大大降低了因文本表述方式差异导致的模型计算误差;
39、本发明可以自动采集pacs系统中同一个患者任何病程的变化情况,用于放射相关的专病数据库构建和患者随访管理都是十分方便和精确。
40、本发明其准确率高,泛化性好,同时能够很好的获取疾病的病程信息。