一种医学影像报告结构化方法及相关装置

文档序号:40337596发布日期:2024-12-18 13:14阅读:33来源:国知局
一种医学影像报告结构化方法及相关装置

本技术涉及自然语言处理,尤其涉及一种医学影像报告结构化方法及相关装置。


背景技术:

1、医学影像报告承载着丰富而宝贵的临床信息,包括各种检查的影像发现、详细描述和诊断结果。然而,这些报告通常以半结构化甚至非结构化的形式存储,其中存在许多零散和非标准化的描述术语,这给分析、处理和挖掘其中的临床信息带来了极大挑战。

2、自然语言处理中的文本结构化技术可以对医学影像报告中的各种信息进行规范化和结构化的提取,同时将主要信息与相关附属信息进行关联,为后续的自动化数据挖掘和处理提供便利。在人工智能技术蓬勃发展的今天,医学影像报告的结构化信息还可为医学人工智能模型的训练准备高质量、规范化、信息聚焦的语料,提升模型从海量复杂冗余的原始报告文本中学习医学知识、发现临床事件、推理病情诊断的能力,这对于智能化、自动化的医学决策有着重要意义。

3、由于医学影像报告中存在着大量的影像所见、诊断实体和负责的临床事件关联关系,目前的医学影像报告结构化方案实现医学影像报告结构化的思路主要为,将医学影像报告结构化任务依次拆解为命名体识别、关系抽取、术语规范化等多个任务,并在不同任务上训练不同的自然语言处理模型,进而利用训练得到的自然语言处理模型处理对应的任务,最后将各个任务的处理结果整合为最终的结构化信息。目前的医学影像报告结构化方法虽然可获得医学影像报告的结构化信息,但是,实现过程较为复杂,另外,由于每个任务都需要训练模型,而训练模型需要人工标注数据,因此,目前的医学影像报告结构化方法的人工标注成本较高。


技术实现思路

1、有鉴于此,本技术提供了一种医学影像报告结构化方法及相关装置,用于解决现有的医学影像报告结构化方法实现过程较为复杂、人工标注成本较高的问题,其技术方案如下:

2、本技术第一方面提供一种医学影像报告结构化方法,包括:

3、获取目标医学影像报告;

4、基于预先获得的医学影像报告结构化模型,对所述目标医学影像报告进行结构化处理,得到所述目标医学影像报告的结构化信息;

5、其中,所述医学影像报告结构化模型采用训练数据对预训练后的大语言模型进行指令微调得到,所述训练数据至少包括标注有结构化信息的第一训练医学影像报告。

6、在一种可能的实现方式中,所述基于预先获得的医学影像报告结构化模型,对所述目标医学影像报告进行结构化处理,得到所述目标医学影像报告的结构化信息,包括:

7、将预设的指令提示信息和所述目标医学影像报告处理成提示指令,得到所述目标医学影像报告对应的提示指令,其中,所述目标医学影像报告对应的提示指令用于提示所述医学影像报告结构化模型列出所述目标医学影像报告中的关键信息;

8、将所述目标医学影像报告对应的提示指令输入所述医学影像报告结构化模型,得到所述医学影像报告结构化模型输出的所述目标医学影像报告的结构化信息。

9、在一种可能的实现方式中,所述结构化信息包括:实体类别标签以及所述实体类别标签对应的解剖位置标签和附加信息标签,其中,所述实体类别标签为正常实体标签、异常实体标签中的一种。

10、在一种可能的实现方式中,采用训练数据对预训练后的大语言模型进行指令微调得到医学影像报告结构化模型的过程包括:

11、采用标注有结构化信息的第一训练医学影像报告,对预训练后的大语言模型进行指令微调,指令微调后的大语言模型作为医学影像报告结构化模型;

12、或者,

13、采用标注有结构化信息的第一训练医学影像报告,对预训练后的大语言模型进行指令微调;

14、基于指令微调后的大语言模型对无标注的第二训练医学影像报告进行结构化处理,得到所述第二训练医学影像报告的结构化信息,作为所述第二训练医学影像报告的标注信息;

15、采用标注有结构化信息的第一训练医学影像报告以及标注有结构化信息的第二训练医学影像报告,对指令微调后的大语言模进行进一步指令微调,进一步指令微调后的大语言模型作为医学影像报告结构化模型。

16、在一种可能的实现方式中,所述采用标注有结构化信息的第一训练医学影像报告,对预训练后的大语言模型进行指令微调,包括:

17、将预设的指令提示信息和第一训练医学影像报告处理成提示指令,得到所述第一训练医学影像报告对应的提示指令,其中,所述第一训练医学影像报告对应的提示指令用于提示预训练后的大语言模型列出所述第一训练医学影像报告中的关键信息;

18、将所述第一训练医学影像报告对应的提示指令输入预训练后的大语言模型,以得到所述第一训练医学影像报告的结构化信息预测结果;

19、根据所述第一训练医学影像报告的结构化数据预测结果以及所述第一训练医学影像报告标注的结构化信息,确定第一预测损失;

20、根据所述第一预测损失,对预训练后的大语言模型进行参数更新。

21、在一种可能的实现方式中,所述采用标注有结构化信息的第一训练医学影像报告,对预训练后的大语言模型进行指令微调,还包括:

22、对标注有结构化信息的第一训练医学影像报告进行数据增强处理,得到标注有结构化信息的增强医学影像报告;

23、将预设的指令提示信息和所述增强医学影像报告处理成提示指令,生成所述增强医学影像报告对应的提示指令,其中,所述增强医学影像报告对应的提示指令用于提示预训练后的大语言模型列出所述增强医学影像报告中的关键信息;

24、将所述增强医学影像报告对应的提示指令输入预训练后的大语言模型,以得到所述增强医学影像报告的结构化信息预测结果;

25、根据所述增强医学影像报告的结构化信息预测结果以及所述增强医学影像报告标注的结构化信息,确定第二预测损失;

26、所述根据所述第一预测损失,对预训练后的大语言模型进行参数更新,包括:

27、根据所述第一预测损失和所述第二预测损失,对预训练后的大语言模型进行参数更新。

28、在一种可能的实现方式中,所述对标注有结构化信息的第一训练医学影像报告进行数据增强处理,得到标注有结构化信息的增强医学影像报告,包括:

29、采用若干种数据增强方式中的一种或多种,对所述第一训练医学影像报告进行数据增强处理,以得到增强医学影像报告,其中,所述若干种数据增强方式包括插入分词、打乱句子顺序和报告拼接,所述报告拼接指的是,为需要进行数据增强的第一训练医学影像报告拼接上另一第一训练医学影像报告;

30、若采用插入分词和/或打乱句子顺序的方式对所述第一训练医学影像报告进行数据增强处理,将所述第一训练医学影像报告的标注信息确定为所述增强医学影像报告的标注信息;

31、若至少采用报告拼接的方式对所述第一训练医学影像报告进行数据增强处理,则将拼接的两个第一训练医学影像报告的标注信息进行拼接并去冗余,得到所述增强医学影像报告的标注信息。

32、本技术第二方面提供一种医学影像报告结构化装置,包括:医学影像报告获取模块和医学影像报告结构化模块;

33、所述医学影像报告获取模块,用于获取目标医学影像报告;

34、所述医学影像报告结构化模块,用于基于预先获得的医学影像报告结构化模型,对所述目标医学影像报告进行结构化处理,得到所述目标医学影像报告的结构化信息;

35、其中,所述医学影像报告结构化模型采用训练数据对预训练后的大语言模型进行指令微调得到,所述训练数据至少包括标注有结构化信息的第一训练医学影像报告。

36、本技术第三方面提供一种电子设备,包括至少一个处理器和与所述处理器连接的存储器,其中:

37、所述存储器用于存储计算机程序;

38、所述处理器用于执行所述计算机程序,以使所述电子设备能够实现上述任意一项所述的医学影像报告结构化方法的步骤。

39、本技术第四方面提供一种计算机存储介质,所述存储介质承载有一个或多个计算机程序,当所述一个或多个计算机程序被电子设备执行时,能够使所述电子设备实现上述任意一项所述的医学影像报告结构化方法的步骤。

40、借由上述技术方案,本技术提供的医学影像报告结构化方法,首先获取目标医学影像报告,然后基于预先获得的医学影像报告结构化模型,对目标医学影像报告进行结构化处理,以得到目标医学影像报告的结构化信息,由于本技术中的医学影像报告结构化模型采用标注有结构化信息的训练医学影像报告对预训练后的大语言模型进行指令微调得到,因此,基于医学影像报告结构化模型对目标医学影像报告进行处理,可直接获得结构化信息,即,本技术提供的医学影像报告结构化方法为基于大语言模型的端到端的结构化方法,该方法实现过程简单,且能准确、高效、规范的提取出医学影像报告中蕴含的关键信息,另外,由于本技术提供的医学影像报告结构化方法只需要训练一个模型,且大语言模型展现出的强泛化学习能力使得少量数据微调就可以达到理想性能,因此,需要人工标注的数据量相对较少,进而,人工标注成本较低。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1