解剖结构中病变的图片报告示意图的生成的制作方法

文档序号:16151019发布日期:2018-12-05 17:39阅读:187来源:国知局

本发明涉及解剖结构中病变的图片报告示意图的生成。



背景技术:

放射学在护理过程中具有重要作用。在整个护理周期中,对每个患者进行多种成像研究。通常通过超过一种的成像模态来采集图像,所述成像模态包括计算机断层摄影、磁共振断层摄影、正电子发射断层摄影、超声和X射线。

针对每个患者,追踪异常部位随时间的发展是关键的。当需要考虑多个异常部位时,这种任务变得甚至更加复杂。必须评估每个异常部位并且每个异常部位可能与先前研究中的对应异常部位相关。

许多在研究时产生的报告中描述了每个异常部位的状态。该报告能够是结构化或者非结构化的。为了随时间追踪异常部位,人们因而必须解释这些报告的内容。这是乏味并且费时的任务,且易于出现人为错误。将不同报告中不同异常部位错误地组合可能导致误诊。

Reuven Schreiber等人的名称为Method and system for medical imaging reporting的EP-2169577 A1,公开了一种系统,所述系统将器官的报告模板与医学成像研究自动匹配,因而将诊断和图像嵌入其中,并且将经匹配的模板呈现给放射科医生以用于诊断。然而,那种系统不使用报告的文本来确定器官的位置或者属性。



技术实现要素:

具有一种能够识别在时间段上产生的多个文本报告中的对应异常部位的位置的系统是有利的。

因此,在一个方面中,本发明提供一种用于从报告中自动提取异常部位相对于解剖结构的位置的系统,所述系统包括:

-分词器,其用于将所述报告或者其部分分词,因而产生多个词元(token);以及

-分析器,其用于识别包括所述多个词元中的被识别词元的,描述所述异常部位相对于所述解剖结构的位置的语义结构。

使用所述系统,能够从在时间段上产生的多个报告的每个报告中提取所述异常部位相对于所述解剖结构的位置。所提取的位置可以由临床医生用于诊断目的。

在所述系统的实施例中,识别所述语义结构涉及将所述多个词元中的概念性词元与多个概念中的概念相比较,以便确定被识别词元。所述多个概念中的所述概念可以包括描述可能的解剖结构、它们的异常部位、以及异常部位相对于解剖结构的位置的概念。通过确定与描述所述异常部位相对于所述解剖结构的可能位置的概念相同的概念性词元,所述系统可以适于将所述异常部位相对于所述解剖结构的可能位置选择为所述异常部位相对于所述解剖结构的被识别的位置。

在所述系统的实施例中,将所述多个词元中的概念性词元与多个概念中的概念相比较涉及计算所述概念性词元和所述概念之间的概念相似性。所述多个概念中的所述概念可以包括描述可能的解剖结构、它们的异常部位、以及异常部位相对于解剖结构的位置的概念。通过确定与描述所述异常部位相对于所述解剖结构的可能位置的概念十分相似的概念性词元,所述系统可以适于将所述异常部位相对于所述解剖结构的可能位置选择为所述异常部位相对于所述解剖结构的被识别的位置。

在所述系统的实施例中,识别所述语义结构还涉及将描述所述概念性词元之间的关系的关系词元与所述多个概念中的所述概念之间的概念关系相比较,以便确定被识别的概念性词元之间的关系。所述多个概念中的所述概念,和所述多个概念中的所述概念之间的概念关系形成本体。通过包括关系词元与概念关系之间的比较,以及所述概念性词元和所述概念之间的比较,所述语义结构更加详细地描述了所述异常部位相对于所述解剖结构的被识别的位置,并且因此该识别是更加精确的。

在所述系统的实施例中,将所述关系词元与所述多个概念中的所述概念之间的所述概念关系相比较涉及计算所述关系词元和所述概念关系之间的关系相似性。

在实施例中,所述系统还适于在表示所述解剖结构的示意图上指示所述异常部位相对于所述解剖结构的位置,所述系统还包括映射器,所述映射器用于基于描述所述异常部位相对于所述解剖结构的位置的所识别的语义结构来注释表示所述解剖结构的所述示意图。所述异常部位相对于所述解剖结构的位置在表示所述解剖结构的示意图上的图形可视化针对临床医生是易于理解的,并且改进了与异常部位的研究和诊断相关的工作流程。

在实施例中,所述系统还包括提取器,所述提取器用于基于所识别的语义结构来提取关于被识别的异常部位的额外信息,所述额外信息包括,例如,所述异常部位的尺寸或者可触知性。所述额外信息可以由所述提取器结构化。或者,所述额外信息可以包括针对来自所述报告的文本的指示器以用于在显示器上突出显示。

在所述系统的实施例中,所述解剖结构是乳房或者腋窝。对妇女乳房和腋窝中异常部位的早期检测是妇女健康计划中的重要方面。

在另一方面中,本发明提供一种包括本发明所述的系统的工作站。

在另一方面中,提供一种从报告中自动提取异常部位相对于解剖结构的位置的方法,所述方法包括:

-分词步骤,其用于将所述报告或者其部分分词,因而产生多个词元;以及

-分析步骤,其用于识别包括所述多个词元中的被识别词元的,描述所述异常部位的位置的语义结构。

在所述方法的实现方式中,识别所述语义结构涉及将所述多个词元中的概念性词元与多个概念中的概念相比较,以便确定被识别词元。

在所述方法的实现方式中,识别所述语义结构还涉及将描述所述概念性词元之间的关系的关系词元与所述多个概念中的所述概念之间的概念关系相比较,以便确定被识别的概念性词元之间的关系。

在实现方式中,所述方法还适于在表示所述解剖结构的示意图上指示所述异常部位相对于所述解剖结构的位置,所述方法还包括映射步骤,所述映射步骤用于基于描述所述异常部位相对于所述解剖结构的位置的所识别的语义结构来注释表示所述解剖结构的所述示意图。

在实现方式中,所述方法还包括提取步骤,所述提取步骤用于基于所识别的语义结构来提取关于被识别的异常部位的额外信息,所述额外信息包括,例如,所述异常部位的尺寸或者可触知性。

在另一方面中,本发明提供一种将由计算机装置载入的计算机程序产品,所述计算机程序产品包括用于从报告中自动提取异常部位相对于解剖结构的位置的指令,所述计算机装置包括处理单元和存储器,所述计算机程序产品在被载入之后,向所述处理单元提供执行本发明所述的方法的步骤的能力。

本领域技术人员将认识到,可以以任何被认为是有用的方式将上文提及的本发明的实施例、实现方式、和/或方面中的两个或更多个相组合。

本领域技术人员基于该描述能够实现与所描述的所述系统或方法的修改和变型对应的所述系统、所述工作站、所述图像采集设备、所述方法和/或所述计算机程序产品的修改和变型。

本发明在独立权利要求中定义。有利实施例在从属权利要求中定义。

附图说明

借助于下文描述的实现方式和实施例并且参考附图,本发明的这些和其他方面将是显而易见的并且得到阐述,在其中:

图1示出了所述系统的示范性实施例的框图;

图2示出了示范性的非结构化报告;

图3图示了指示乳房示意图上的病变位置以及在结构化形式和非结构化形式中的额外信息的例子,所述额外信息如在示范性非结构化报告中突出显示的文本;

图4概要示出了所述方法的示范性流程图;以及

图5概要示出了所述工作站的示范性实施例。

相同的附图标记在所有附图中指代相似的部分。

具体实施方式

图1概要示出了系统SYS的示范性实施例的框图,系统SYS用于从报告中自动提取异常部位相对于解剖结构的位置,所述系统包括:

-分词器U10,其用于将所述报告或者其部分分词,因而产生多个词元;以及

-分析器U20,其用于识别包括所述多个词元中的被识别词元的,描述所述异常部位相对于所述解剖结构的位置的语义结构。

系统SYS的示范性实施例还包括:

-映射器U30,其用于基于描述所述异常部位相对于所述解剖结构的位置的所识别的语义结构来注释表示所述解剖结构的示意图;

-提取器U40,其用于基于所识别的语义结构来提取关于被识别的异常部位的额外信息,所述额外信息包括,例如,所述异常部位的尺寸或者可触知性;

-控制单元U60,其用于控制系统SYS的工作;

-用户接口U65,其用于用户和系统SYS之间的通信;以及

-存储器单元U70,其用于存储数据。

在系统SYS的实施例中,具有三个用于引入数据的输入连接器U81、U82和U83。第一输入连接器U81被布置为接收来自于数据存储器件的数据,所述数据存储器件诸如,但不限于,硬盘、磁带、闪存、光盘或者RIS/PACS系统。第二输入连接器U82被布置为接收来自于用户输入装置的数据,所述用户输入装置诸如,但不限于,鼠标或者触摸屏。第三输入连接器U83被布置为接收来自于诸如键盘的用户输入装置的数据。输入连接器U81、U82和U83连接到输入控制单元U80。

在系统SYS的实施例中,具有两个用于传出数据的输出连接器U91和U92。第一输出连接器U91被布置为将数据输出至数据存储器件,所述数据存储器件诸如硬盘、磁带、闪存、或者光盘、或者RIS/PACS系统。第二输出连接器U92被布置为将数据输出至显示器装置。输出连接器U91和U92经由输出控制单元U90接收各自的数据。

本领域技术人员将理解,具有许多方式将输入装置连接到系统SYS的输入连接器U81、U82和U83,以及将输出装置连接到系统SYS的输出连接器U91和U92。这些方式包括但不限于,有线和无线连接、诸如但不限于局域网(LAN)和广域网(WAN)的数字化网络、互联网、数字电话网络、以及模拟电话网络。

在实施例中,系统SYS包括存储器单元U70。系统SYS被布置为经由输入连接器U81、U82和U83中的任意输入连接器从外部装置接收输入数据,并且将所接收的输入数据存储在存储器单元U70中。将输入数据载入存储器单元U70允许由系统SYS的单元快速访问相关数据部分。所述输入数据包括所述报告。存储器单元U70可以由这样的装置实施:所述装置诸如但不限于,CPU的寄存器文件、高速缓冲存储器、随机访问存储器(RAM)芯片、只读存储器(ROM)芯片、和/或硬盘驱动器和硬盘。存储器单元U70还可以被布置为存储所述输出数据。所述输出数据包括异常部位的位置以及关于所述异常部位的额外信息。存储器单元U70也可以被布置为经由存储器总线U75从系统SYS的单元接收数据和/或向系统SYS的单元传送数据,系统SYS的单元包括分词器U10、分析器U20、映射器U30、提取器U40、控制单元U60以及用户接口U65。存储器单元U70还被布置为经由输出连接器U91和U92中的任意输出连接器使得外部装置能获得所述输出数据。将来自系统SYS的单元的数据存储在存储器单元U70中可以有利地改进系统SYS的单元的性能以及所述输出数据从系统SYS的单元到外部装置转移的速率。

在实施例中,系统SYS包括用于控制系统SYS的控制单元U60。控制单元U60可以被布置为从系统SYS的单元接收控制数据以及向系统SYS的单元提供控制数据。例如,在将所述报告或者其部分分词,并因而产生多个词元之后,分词器U10可以被布置为向控制单元U60提供控制数据“报告已被分词”,并且控制单元U60可以被布置为向分析器U20提供控制数据“识别描述异常部位相对于解剖结构的位置的语义结构”。或者,可以在系统SYS的其他单元中实施控制功能。

在系统SYS的实施例中,系统SYS包括用于实现用户和系统SYS之间通信的用户接口U65。用户接口U65可以被布置为接收用户输入,所述用户输入包括包含所述报告的文件的名称。任选地,所述用户接口可以接收用于确定异常部位和解剖结构的类型的用户输入。所述用户接口还可以被布置为显示表示所述解剖结构并且示出所述异常部位相对于所述解剖结构的位置的所注释的示意图。本领域技术人员将理解,在系统SYS的用户接口U65中可以有利地实施更多的功能。

参考包括对乳房摄影图像的描述的非结构化乳腺癌报告描述了本发明的方面、实施例以及实现方式。所述解剖结构为妇女的左乳房和右乳房。所述异常部位为在两个乳房的任一个中的肿瘤。本领域技术人员将理解,本发明的其他用途也是可行的,并且权利要求的范围不应当被解释为由本发明示范性的应用限制在所述报告。

在她/他的工作流程中,临床医生,即在本情况中的受训以分析乳房摄影检查的护理专家,需要从现有报告中提取所述异常部位的位置,因为需要重新检查在所述报告中发现的异常部位。图2示出了乳房的乳房摄影检查的示范性非结构化报告。

本发明的系统SYS能够向临床医生提供所需的异常部位的位置。这能够使用自然语言处理引擎来实施,所述自然语言处理引擎被布置用于分析所述报告的内容并且提取所需的信息。首先,由分词器U10将所述报告分词,这适于产生包含在所述报告中的多个词元,例如词语或者术语。使用由用户建立的词汇表,或者使用基于诸如SNOMED CT或者BI-RADS词汇表的属于乳腺癌的标准词汇表的词汇表,分析器U20适于分析所述多个词元以识别与对所述解剖结构、乳房、异常部位、肿瘤以及左乳房或右乳房中的肿瘤位置的描述相关的概念性词元。一个或多个相关的概念性词元可以定义描述所述异常部位相对于所述解剖结构的位置的语义结构。使用,例如,诸如正规表达式的简单字符串匹配技术,能够识别这些词元。概念性词元对应于来自所述词汇表的概念。能够使用也被称为相似性或者相似性测量的多种度量在分别与所述概念性词元匹配或者不匹配时从所述词汇表接受或者排除候选概念。

任选地,所述多个词元的关系词元可以用于确定概念性词元之间的关系,并且可以与来自所述词汇表的概念之间的关系相比较。来自SNOMED CT词汇表的概念之间的关系在SNOMED CT本体中定义。来自BI-RADS词汇表的概念之间的关系在基于BI-RADS的乳腺癌成像本体(BCIO)中定义。同样,能够使用多种度量在与所述关系词元匹配时从所述词汇表接受或者排除概念之间的候选关系。

在实施例中,识别描述所述异常部位相对于所述解剖结构的位置的语义结构包括检测与所述位置相关的异常部位的存在是否是否定的。如果与相对于所述解剖结构的位置相关的所述异常部位的存在是否定的,那么所述分析器未识别所述异常部位相对于所述解剖结构的位置,即,没有识别到描述所述异常部位相对于所述解剖结构的位置的语义结构。

图3图示了指示在乳房示意图31上的1号病变的位置。在乳房示意图31上的位置对应于在用于注释乳房示意图31的词汇表中的位置。乳房示意图31由映射器U30基于描述所述异常部位相对于所述解剖结构的位置的所识别的语义结构来注释。从图2所示的示范性报告中提取在右边乳晕区域中,稍微侧向的以乳头为中心的,推测的块状物的位置。

图3进一步图示了由系统SYS的提取器U40基于所识别的语义结构提取的,关于被识别的1号异常部位的额外信息32、33。额外信息32是非结构化的并且示出了在所述报告中被突出显示的文本。额外信息33是结构化的,并且包括额外信息的记录的名称为标识符、类型、偏侧性以及位置的信息栏的入口。这一记录的名称为深度的信息栏是空白的。

在实施例中,系统SYS的提取器U40包括:

-候选选择模块,其用于从文本中提取与用户潜在相关的短语的列表。这种模块能够访问一块领域的知识,例如本体,以确定在当前语境中什么是相关术语。例如,在乳腺癌领域中人们能够使用BI-RADS术语列表作为对相关术语建模的源词汇表。任选地,用户可以定义或者扩展所述词汇表。

-短语意义消歧模块,其决定在原始文本中给定候选短语在其语境下是否用在所意图的意义中。如果候选短语用在所意图的意义中,其就被所述消歧模块接受以用于进一步处理,否者其被拒绝。

-短语扩展模块,其用于通过在所述短语的句法邻域中搜索信息性形容词、副词等以扩展候选短语。

-否定检测模块,其用于核对所述报告中的候选短语在其语境下是否是被否定的。

-共同参考模块,其用于核对候选短语是否涉及之前论述过的项目。

-分组模块,其用于通过将候选短语映射至包含在背景本体中的,如BI-RADS中的元数据,以核对任意两个或更多个候选短语是否描述相同的实体。分组模块将候选短语的元数据相比较并且当它们对应于相同元数据时总结出,第一个和第二个短语涉及相同的实体。

例如,报告可以包括以下两个句子:(i)“There is a smooth focally enhancing mass measuring 1x2cm(存在测量为1x2cm的平滑聚焦增强块状物)”,以及(ii)“There is no evidence for suspicious microcalcifications(没有可疑微钙化的证据)”。所述报告由系统SYS处理。分词器U10输出以下的词元(管线符“︱”分隔各词元):“︱there︱is︱a︱smooth︱focally︱enhancing︱mass︱measuring︱1︱×︱2︱cm︱.︱there︱is︱no︱evidence︱of︱suspicious︱microcalcifications︱.︱”当将包括词语的词元取干后,所述词元为:“︱there︱is︱a︱smooth︱focal︱enhanc︱mass︱measure︱1︱×︱2︱cm︱.︱there︱is︱no︱evid︱of︱suspici︱microcalcif︱.︱”。提取模块的所述候选选择模块从这些句子中选择以下两个术语:“mass”和“microcalcif”。所述短语意义消歧模块决定这两个词语都用在所意图的意义中。所述短语扩展模块基于下述来扩展这两个词语:“︱smooth︱focal︱enhance︱mass︱measure︱1︱×︱2︱cm︱”和“︱suspici︱microcalcif︱”。所述否定检测模块发现第二个短语在否定短语“there is no evidence of(没有证据)”中出现。因而第二个短语被所述否定检测模块标记为是被否定的。所述共同参考模块检测到两个单词都不涉及先前使用过的另一术语。能够例如,通过在所述报告中突出显示被识别的短语,或者在独立的文本窗口中显示短语“Smooth focally enhancing mass measuring1x2cm(测量为1x2cm的平滑聚焦增强块状物)”,以将提取模块U40的发现可视化。

最后,所述分组模块通过将短语映射至背景本体而提取所述短语的额外元数据。例如,使得“左乳房病变”成为由提取单元U40在所述报告中发现的另一短语。在BI-RADS中定义的以下元数据被分配给每个短语:

所述分组模块将两个短语的元数据相比较并且总结出第一个和第二个短语涉及相同的实体:块状物。因此,呈现模块可被布置为呈现一个融合的实体而不是两个独立的实体,呈现为:“在左乳房中的测量为1x2cm的平滑聚焦增强块状物”。

本领域技术人员将理解,由提取单元U40使用的模块中的所有或者一些也可以在分析单元U20中实施或者由分析单元U20采用。

本领域技术人员将认识到,本发明所述的系统可以是在医生工作的许多方面中帮助她/他的有价值工具。而且,虽然使用所述系统的医学应用来说明了所述系统的实施例,但是也考虑所述系统的非医学应用。

本领域技术人员还将理解,系统SYS的其他实施例也是可行的。除其他外,可以重新定义所述系统的单元并且重新分配它们的功能。虽然所描述的实施例应用于医学图像,但是所述系统的与医学应用不相关的其他应用也是可行的。

系统SYS的单元可以使用处理器来实施。通常,它们的功能在软件程序产品的控制下来执行。在运行过程中,所述软件程序产品通常被载入像RAM的存储器中,并且从那里运行。所述程序可从背景存储器载入,所述背景存储器诸如ROM、硬盘、或者磁性和/或光学存储器,或者可以经由像互联网的网络载入。任选地,专用集成电路可以提供所描述的功能。

图4示出了从报告中自动提取异常部位相对于解剖结构的位置的方法M的实现方式的示范性流程图。所述方法开始于分词步骤S10,分词步骤S10用于将所述报告或者其部分分词,因而产生多个词元。在分词步骤S10之后,方法M继续进行至分析步骤S20,分析步骤S20用于识别包括所述多个词元中的被识别词元的,描述所述异常部位的位置的语义结构。在分析步骤S20之后,方法M继续进行至映射步骤S30,映射步骤S30用于基于描述所述异常部位相对于所述解剖结构的位置的所识别的语义结构来注释表示所述解剖结构的示意图。在映射步骤S30之后,方法M继续进行至提取步骤S40,提取步骤S40用于基于所识别的语义结构来提取关于被识别的异常部位的额外信息。在提取步骤S40之后,方法M结束。

本领域技术人员可改变一些步骤的顺序,加入一些任选步骤(例如,用户交互,其用于输入将在报告中搜索的异常部位),或者省略一些非强制性步骤,或者使用线程模型、多处理器系统或者多个处理来同时执行一些步骤,而不脱离本发明所意图的概念。任选地,可以将方法M的两个或更多个步骤组合成一个步骤。任选地,可以将方法M的步骤拆分成多个步骤。

图5概要示出了工作站WS的示范性实施例。所述工作站包括系统总线WS01。处理器WS10、存储器WS20、磁盘输入/输出(I/O)适配器WS30以及用户接口WS40操作性地连接到系统总线WS01。磁盘存储装置WS31操作性地耦合到磁盘I/O适配器WS30。键盘WS41、鼠标WS42以及显示器WS43操作性地耦合到用户接口WS40。由计算机程序实施的本发明的系统SYS被存储在磁盘存储装置WS31中。工作站WS00被布置为将所述程序和输入数据载入到存储器WS20中,并且在处理器WS10上执行所述程序。用户能够使用键盘WS41和/或鼠标WS42向工作站WS00输入信息。所述工作站被布置为向显示器装置WS43和/或磁盘WS31输出信息。本领域技术人员将理解,具有工作站WS的许多本领域中已知的其他实施例,并且本实施例用作说明本发明的目的,并且不能被解释为将本发明限制于这个具体实施例。

应当注意,上文提及的实施例说明而不是限制本发明,并且本领域技术人员将能够设计出备选实施例而不脱离所附权利要求的范围。在权利要求中,置于括号之间的任何附图标记不应被解释为限制权利要求。词语“包括”不排除未在权利要求或者描述中列出的元件或步骤的存在。在元件之前的词语“一”或“一个”不排除多个这种元件的存在。本发明能够借助于包括若干不同元件的硬件以及借助于编程计算机来实施。在列举若干单元的系统权利要求中,这些单元中的若干能够通过硬件或者软件的一个并且相同的记录来具体实现。词语第一、第二、第三等的使用并不指示任何顺序。这些词语将被解释为名称。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1