背景技术:
本发明涉及冠状动脉狭窄的无创性功能评估,并且更特别地涉及根据医学图像数据的冠状动脉狭窄的基于机器学习的无创性功能评估。
心血管疾病(CVD)是世界范围内的死亡的主要原因。在各种CVD之间,冠状动脉疾病(CAD)导致那些死亡中的几乎百分之五十。尽管在医学成像和其他诊断形式中的显著提高,但是CAD病人的提早的发病率和死亡率中的增加仍非常高。用于冠状动脉狭窄的诊断和管理的当前临床实践涉及视觉上地或者通过定量冠状动脉血管造影术(QCA)评估患病血管。这样的评估给临床医生提供对狭窄段和载瘤血管(parent vessel)的解剖概观,包括断面收缩(area reduction)、病变长度和最小管腔直径,但是不提供病变对通过血管的血流的影响的功能评估。通过将压力导丝插入到变窄的血管中来测量血流储备分数(FFR)已经被证明是用于指导血运重建决定的较好选项,因为与无创性血管造影术相比,FFR在标识局部缺血引起的病变中更有效。QCA仅评估狭窄的形态意义并且具有多个其他限制。基于压力导丝的FFR测量涉及与对将压力导丝插入到血管中所必需的干预相关联的风险,并且对于非常窄的狭窄,压力导丝可能诱发附加的压降。
近来,提出了使用数学方程在从医学图像提取的病人的冠状动脉血管的三维解剖模型中模拟血流的物理现象(physics)的机械模型。这样的方法依赖基于物理现象的数学方程来模拟休息时和充血时的生理学,从而允许人们在计算机上数字上解出方程并针对单个病人确定流和压降。最广泛使用的基于物理现象的模型是纳维斯托克斯方程,其是基于质量、动量和能量守恒的原理的非线性偏微分方程并且其被用来表征冠状动脉中的血液的流动。这常常与模拟解剖的上游(心脏、主动脉)和下游(心肌)区域的生理学的数学方程结合。依靠复杂性和临床使用案例,这些方法可以被用来合并各种规模的生理学模型。尽管已经针对血流提出了各种类型的基于物理现象的模型、边界条件和生理学假设,但是机械模型的共同主题是它们对用以明确地模拟各种生理学的相互作用的数学方程的使用。然而,这样的机械模型的缺点是与模型制备和基于物理现象的方程的数值解相关联的高计算代价和复杂性。另外,这样的机械模型通常仅合并解剖的和某些局部的生理学测量,并且省去其他有意义的测量。
技术实现要素:
本公开提供用于根据医学图像数据的对血液动力学指标的基于机器学习的评估的方法和系统。本发明的实施例提供了数据驱动的统计方法以根据来自单个病人的包括解剖、功能、诊断、分子和人口统计(hemodynamic)的信息中的一个或多个的输入参数或直接根据医学图像数据来计算一个或多个血液动力学指标,诸如血流储备分数(FFR)、冠状动脉血流储备(CFR)、瞬时无波比(instantaneous wave-free ratio)(IFR)、充血应力储备(HSR)、基底狭窄阻力(BSR)和微循环阻力指数(IMR)。本发明的实施例采用机器学习算法来学习在输入参数或输入医学图像数据和输出血液动力学指标之间的复杂映射。
在本发明的一个实施例中,接收包括感兴趣的狭窄的病人的医学图像数据。从病人的医学图像数据提取针对感兴趣的狭窄的特征的集合。使用被训练的基于机器学习的映射基于特征的被提取的集合来确定针对感兴趣的狭窄的FFR值。
在本发明的另一实施例中,接收包括感兴趣的狭窄的病人的医学图像。检测对应于感兴趣的狭窄和病人的冠状动脉树的图像块(patch)。使用被直接地应用于检测到的图像块的被训练的深度神经网络回归器来确定针对感兴趣的狭窄的FFR值。
参考以下详细描述和附图,本发明的这些和其他优势将对本领域那些普通技术人员而言是显然的。
附图说明
图1图示了根据本发明的实施例的用于确定FFR的训练基于机器学习的映射的方法;
图2图示了根据本发明的实施例的用于实现图1的方法的框架;
图3图示了表征狭窄的形状的几何特征;
图4图示了根据本发明的实施例的用于使用增强的基于图像的推进的岭回归来训练基于机器学习的映射的算法;
图5图示了根据本发明的实施例的特征选择算法;
图6图示了根据本发明的实施例的用于针对病人使用被训练的基于机器学习的映射确定FFR的方法;
图7、8和9图示了用于实现图6的方法的各种情况;
图10图示了用于使用被直接地应用于病人的医学图像数据的被训练的深度神经网络确定FFR的方法;
图11图示了针对特定的参数空间训练深度多层神经网络回归器;
图12图示了根据本发明的实施例的用于对象检测的训练深度神经网络的系列方法;
图13图示了根据本发明的实施例的将被训练的深度神经网络回归器应用于图像块以针对狭窄确定FFR值;以及
图14是能够实现本发明的计算机的高级框图。
具体实施方式
本发明涉及用于对针对冠状动脉狭窄的血液动力学指标的基于机器学习的评估的方法和系统,所述血液动力学指标诸如血流储备分数(FFR)。在本文中描述本发明的实施例以给出对用于评估冠状动脉狭窄的方法的视觉理解。数字图像常常包括一个或多个对象(或形状)的数字表示。在本文中常常在标识和操纵对象方面描述对象的数字表示。这样的操纵是在计算机系统的存储器或其他电路/硬件中完成的虚拟操纵。因此,应理解,可以在计算机系统内使用存储在计算机系统内的数据执行本发明的实施例。
血流储备分数(FFR)是用于确定冠状动脉狭窄的血液动力学意义的功能测量。FFR被定义为变窄的血管中的流对正常血管中的流的分数,所述两个流在最大充血时被确定。特别地,FFR可以被表达为:
这里,max指最大充血条件。Normal(正常)血管是假定的(即,如果狭窄不存在的话)。因为诸如正常血管不存在,所以通常使用替代的基于压力的公式化用于量化FFR。由于冠状动脉的自动调节机制,静止流在灌注压的范围中保持不变。通过降低微血管阻力来实现自动调节。为了经由压力测量来计算FFR,人们需要在最大充血状态中操作,其中压力与流(因为心肌阻力现在被固定在其最低值处并且可以不进一步改变)直接成比例。因此,流速率项可以由适当的灌注压项替代,所述灌注压项中的全部可以在变窄的血管中测得,没有对假定的正常血管的需要。在该情况下,FFR可以被计算为:
这里,Pd和分别为在心动周期上的平均远端压力和主动脉压力,并且Pv是静脉压力()。FFR在[0,1]的范围中变化,其中0.80通常是截止值,低于其狭窄被认为是血液动力学上有意义的(即,局部缺血的)。
除FFR之外,诸如压降、冠状动脉血流储备(CFR)、瞬时无波比(IFR)、充血应力储备(HSR)、基底狭窄阻力(BSR)和微循环阻力指数(IMR)之类的其他血液动力学指标可以被用来评估冠状动脉狭窄。在本文中将本发明的实施例描述为针对病人估计FFR。应理解,本发明不限于FFR估计,并且也可以类似地应用本发明的实施例来估计其他血液动力学指标。
本发明的实施例利用数据驱动的统计方法来根据来自单个病人的解剖、功能、诊断、分子和/或人口统计信息计算一个或多个血液动力学指标。本发明的实施例采用机器学习算法来学习输入参数(例如,解剖、功能和/或人口统计信息)和感兴趣的输出量(例如,FFR)之间的复杂映射。不同于基于机械模型的方法,本发明的实施例不依赖描述输入和输出之间的关系的先验假设模型。代之以,本发明的实施例经由使用机器学习算法从训练数据学习映射的统计方法来确定最优映射。
根据有利的实施例,用于确定FFR的基于机器学习的方法包括两个阶段:训练阶段和预测阶段。训练阶段是离线过程,在其期间汇集利用地面实况测量结果注释的训练数据的数据库。特别地,构造来自多个病人的具有无创地测得的FFR值的病变(狭窄)的数据库。在该数据库中,每个实例(即,无创地测得的FFR值)由多个特征表示,所述多个特征诸如解剖、功能、诊断、分子和/或人口统计测量结果。然后训练阶段通过在整个训练数据库上最小化预测和地面实况值之间的最优拟合来学习或训练在特征和地面实况值之间的映射。
预测阶段是在线过程,由此通过使用从训练阶段学习的映射来计算针对新的数据集(未被发现的数据)的FFR值。为了实现这点,从新的数据集提取所要求的特征并且将针对特征的值用作到被预学习的映射的输入。
图1图示了根据本发明的实施例的用于确定FFR的训练基于机器学习的映射的方法。使用图1的方法来实现产生用于确定FFR的被训练的映射的训练阶段。图2图示了根据本发明的实施例的用于实现图1的方法的框架。
参考图1,在步骤100处,接收训练数据。训练数据是来自多个病人的狭窄的数据库,其中每个狭窄具有地面实况FFR值。针对每个狭窄的地面实况FFR值可以是有创地测得的FFR值。图2图示了根据本发明的实施例的用于实现图1的方法的框架。如在图2中示出的那样,训练数据200可以包括针对每个训练实例的解剖数据202、功能数据204和人口统计数据206,以及针对每个训练实例的地面实况测量的FFR值208。解剖数据202可以包括狭窄的一个或多个医学图像。例如,解剖数据202可以包括使用一个或多个医学成像形式获得的医学成像数据,所述一个或多个医学成像形式诸如计算机断层扫描(CT)、X射线血管造影术、磁共振成像(MRI)、超声、血管内超声(IVUS)、光学相干断层扫描(OTC)等。功能数据204可以包括诸如血压、心率和ECG测量结果之类的功能测量结果,以及涉及针对病人的一个或多个医学成像测试的数据,诸如来自灌注扫描(例如,SPECT、PET等)的数据或与医学图像中的造影剂传播相关的数据。人口统计数据206可以包括人口统计信息,诸如年龄、性别、身高和体重等。尽管在图2中未示出,但是训练数据还可以包括各种其他类型的数据,诸如体外诊断数据、病人的基因型、病人的生活方式因素和病史。
在步骤110处,从训练数据提取特征。该特征提取步骤被示出为图2的步骤210。特别地,针对每个训练实例(即,每个测得的FFR值)提取特征的集合。针对每个训练实例的特征的集合可以包括解剖、功能、诊断、分子和/或人口统计的测量结果。可以从医学成像数据提取解剖特征。解剖特征可以包括表征狭窄的解剖测量结果,以及针对相关联的区域的其他解剖测量结果,所述相关联的区域诸如心脏、冠状动脉血管树、心肌和主动脉。取决于输入数据的源和类型,被提取的特征可以是二元的、数字的、分类的、顺序的、二项的、间隔、基于文本的或其组合。
根据有利的实现,从医学图像数据提取的解剖特征可以包括表征狭窄的几何形状(geometry)的参数,诸如狭窄的近端和远端血管的参考直径、狭窄内的最小管腔直径(MLD)、病变长度(LL)、狭窄的入口角度、入口长度、狭窄的出口角度、出口长度、被狭窄阻塞的直径的百分比以及被狭窄阻塞的面积的百分比。也可以提取表征狭窄的几何形状的附加参数或者可以组合各种参数以生成附加特征也是可能的。根据有利的实施例,可以使用在美国专利号8,526,699中描述的方法自动地提取表征狭窄的几何形状的特征,所述美国专利通过引用被并入本文中。图3图示了表征狭窄的形状的几何特征。特别地,图3示出近端血管的半径rprox、远端血管的半径rdist、狭窄的病变长度Lsten、狭窄的半径rsten、狭窄的入口角度β以及狭窄的出口角度γ。
从医学图像数据提取的解剖特征还可以包括表征狭窄的形态的参数,诸如钙化的特性、斑块的特性、血栓的特性、弥漫性疾病(即,沿着动脉的单个狭窄或弥漫性狭窄)的特性、全部或次全部(sub-total)闭塞(即,完全堵塞或部分堵塞)的存在以及心肌桥的存在。表征狭窄的形态的参数可以是指示存在或缺乏的二元参数或者是指示针对特定参数的分级的数字值。
从医学图像数据提取的解剖特征还可以包括表征承载狭窄的血管分支的几何形状的参数,诸如沿着分支的中心线取样的血管半径和断面、血管分支的末端半径和面积、中心线弯曲度测量结果、狭窄在分支中的位置(例如,在分支中的近端、中间或远端)、在感兴趣的狭窄近端的分支中的血管变窄的累积数量以及在感兴趣的狭窄近端的分支内的钙化的累积数量。
从医学图像数据提取的解剖特征还可以包括表征整个冠状动脉树的参数,诸如左或右优势的指示,与心肌质量相关联的冠状动脉面积的大小,每个冠状动脉分支的末端半径,整个冠状动脉树中的病变(狭窄)的数量,冠状动脉树的哪些段具有病变、二分叉(类型和成角)、三分叉(类型和成角)、已经植入的支架(stent)的数量和位置,以及旁路移植的数量和位置。每个二分叉和三分叉的“类型”指对每个二分叉和三分叉的作为预确定类型的集合中的一个的表征。
从医学图像数据提取的解剖特征还可以包括表征心脏解剖和功能的参数,诸如收缩末期容积(ESV)、舒张末期容积(EDV)、射血分数(EF)、心内膜容积、心外膜容积、心肌容积、小梁和乳头肌容积和质量、左和右心室容积和质量、造影剂衰减的特性(例如,针对来自医学图像序列的不同帧的每个体素的不同强度值)以及造影剂传播的特性(例如,用以传播造影剂的帧的数量)。
可以从针对与每个训练实例相关联的病人的功能测量结果和/或人口统计信息提取附加特征。这样的特征可以包括收缩血压、舒张血压、平均动脉压、休息时和/或应激期间的心率、从ECG痕迹导出的参数(例如,QRS持续时间、R-R间隔等)、心脏病既往史、瓣功能障碍既往史、瓣修复或更换既往史、身体质量指数(BMI)、身体表面积(BSA)、体重、身高、年龄以及性别。针对病人的既往史的特征可以是二元的,指示存在或不存在既往史,或者是分类的,提供对既往史种的类别的进一步指示。
除了从医学图像提取的解剖和形态特征之外,还可以从针对病人的一个或多个医学成像测试提取功能特征。例如,来自诸如SPECT、PET等的灌注扫描的数据可以被用来提取诸如表征在休息时和/或在应激期间在每个冠状动脉中的相对和/或绝对组织灌注的度量的特征。另一示例是使用血管造影术数据来提取造影剂传播的特性,其可以通过诸如来自时间-密度曲线的峰时间、峰密度和时间平均密度的度量而被量化。
除了上面描述的特征之外,还可以从被提取的特征计算出若干导出特征。这些导出特征可以被表示为被提取的特征的线性或非线性组合。例如,可以组合病变长度(LL)和最小管腔直径(MLD)以获得新的特征(LL/MLD^4),其然后可以被用在训练数据库中。更进一步地,可以利用主要从成像和其他诊断化验导出的如通过体内诊断化验(例如,知识心肌损伤、炎症等的级别的血清化验)测得的分子信息和关于堵塞的性质的(例如,纤维变性的、钙化的等)诊断信息来生成附加特征。
来自针对每个训练实例的医学图像数据的特征提取可以是完全自动化的、半自动化的、手动的或其组合。根据有利的实现,在完全自动化的特征提取方法中,一个或多个基础图像处理算法来首先检测感兴趣的解剖区域并且然后提取解剖特征。例如,图像处理算法可以自动地检测狭窄、冠状动脉血管、冠状动脉口、心室、心肌、小梁和乳突肌以及主动脉,并且然后从检测到的区域中的医学图像数据提取所有要求的解剖特征。可以使用在美国专利号8,526,699、美国公开专利申请号2013/0216110、美国专利号8,582,854和美国专利号8,116,548中描述的方法执行自动化的特征选择,所述专利中的每个通过引用被并入本文中。在半自动化方法下,特征中的某些可以被自动地提取,而某些其他特征可以被用户注释、编辑或改正。在手动方法下,特征由用户注释或测量。可以在医学图像扫描器上或在诸如成像工作站的另一设备上执行特征提取步骤。
回到图1,在步骤120处,使用机器学习算法训练地面实况FFR值和被提取的特征之间的映射。一旦训练数据库与地面实况汇集到一起,就通过使用机器学习算法确定输入特征和地面实况FFR值之间的映射。用来训练映射的机器学习算法的类型可以是有监督的、半监督的、直推式的或基于强化的学习算法。根据有利的实施例,被训练的映射是将被提取的特征与各种所学习的权重组合的所学习的经验模型。
在有利的实施例中,我们使用基于图像的推进的岭回归方法来训练映射。可以通过扩展在美国专利号7,949,173中描述的基于图像的推进的岭回归(IBRR)方法捕获使功能参数与输入测量结果相关的输出流形(manifold)的复杂性,所述专利通过引用被并入本文中。IBRR方法能够封装图像特征、图像上下文信息和解剖对象参数之间的非线性关系,所述解剖对象参数诸如在位置、定向和规模中相对于当前图像样本的差异。在本申请中,除了直接的基于图像的特征之外,输入测量空间还被扩展成包括表征狭窄的几何形状、形态、分支的几何形状、整个心脏树的几何形状、心脏解剖和功能和/或其他功能或人口统计信息的参数。在本申请中,输出空间是针对感兴趣的血液动力学指标(例如,压降、FFR、CFR、iFR、BSR、HSR、IMR)的值。被扩展的基于图像的推进的回归(EIBRR)最小化将回归输出保真项(预测的和地面实况输出之间的差异)和正则项组合的代价函数。EIBRR使用聚合与岭回归(吉洪诺夫正则化)组合的弱回归树桩(stump)的集合和增量(incremental)特征选择方案的加法(additive)输出函数。使用增量特征选择方案,EIBRR从可用的输入选择可以预测输出的特征的子集而丢弃与输出流形不相关的特征。EIBRR能够高效地模拟复杂的或非线性的流形。
在替代的实施例中,也可以使用其他机器学习算法来训练基于机器学习的映射,用于确定FFR或其他血液动力学指标。例如,可以使用诸如(线性的、非线性的或逻辑的)回归算法、决策树或图、关联规则学习、人工神经网络、支持向量机、归纳逻辑编程、贝叶斯网络、基于实例的学习、流形学习、子空间学习、深度学习、字典学习等的机器学习算法来训练基于机器学习的映射。
下面通过首先描述被扩展的基于图像的推进的回归(EIBR)训练方法并且然后描述EIBRR训练方法来更详细地描述EIBRR。
本文中使用以下记号:a 是标量,a是列向量,并且A是矩阵。由表示输入,由表示输出,由表示回归函数并且由表示训练数据点。进一步地,我们表示和。
EIBR最小化以下代价函数,其将回归输出保真项和子空间正则项组合:
其中λ 是正则化系数。
EIBR假设回归输出函数采取加法形式:
其中每个是驻留在字典集H 中的弱学习器(或弱函数),并且是强学习器(强函数)。推进是迭代算法,其利用的加法性质:在迭代t 时,将再多一个弱函数添加到目标函数。因此,
其中并且。
如下给出了最大地减少代价函数(或推进性能)的最优弱函数和它的权重系数(为了记法清楚略去下标t ):
其中
并且矩阵、和分别被定义为:、、。最后,EIBR调用收缩(其中收缩因数η =0.5),导致平滑的输出函数:。
使用整个输入特征集合将一维(1D)决策树桩构造为字典集H 的基元。将1D决策树桩与特征索引f 、特征值、决策阈值和二元方向指示符p (即,)相关联。这样的1D决策树桩可以被表达为:
针对基于图像的特征,给定适中的图像大小,可以通过改变它们的属性生成大量的图像特征。可以由M 表示特征的数量。通过调整阈值,例如,K 个均匀地间隔的级别,可以每个特征创建K 个决策树桩,使得2KM个1D决策树桩被创建。
将弱函数构造为堆叠q 个1D决策树桩的q 维(q -D)决策树桩。这可以被表达为:
因为将每个与不同的特征相关联,所以构造包含个弱函数的充分大的弱函流形是可能的。
推进起特征选择器的作用,使得在每轮推进处选择最大地降低在方程(5)中的代价函数的特征。然而,为了将推进算法变换成高效的实现,存在计算瓶颈,即在方程(6)中的最大化任务。该最大化任务需要贪婪特征选择方案,其可能评估太昂贵,因为其涉及针对每个推进轮评估个决策树桩。
EIBR通过将q-D回归问题分成q个依存的1D回归问题来利用增量特征选择方案。使用增量向量:
搜索最优以最大化,其在(7)中被类似地定义但是基于到目前为止处理的所有i ()维。增量选择方案需要利用某些开销计算来评估仅2qMNK个决策树桩,同时在一定程度上维持在输出维度之间的依存度。
上面描述的EIBR具有两个缺点。第一,使用在(3)中的子空间正则项是限制性的,其相当于关于输出变量的多变量高斯假设,针对真实数据其常常证明是非高斯结构。因此,泛化能力被妨碍。第二,弱函数可能太“弱”,因为其包括共享相同的权重系数的若干1D二元决策树桩。因此,训练过程可能花费长时间,并且被训练的回归函数使用过多弱函数,其可以影响运行速度。下面详细描述的EIBRR通过更换子空间正则化和增强弱函数的模拟强度来克服EIBR的缺点。
代替使用1D决策树桩作为基元,EIBRR方法使用回归树桩。回归树桩被定义为:
其中[.]是指示符函数,是具有索引f 的特征值,并且是均匀地间隔的区间。在方程(11)中,通过权重向量对所有权重简洁地编码,并且向量是单位矩阵的某列:仅一个元素是一并且所有其他元素是零。类似地,通过堆叠q 个不同的1D回归树桩来构造弱函数,即,
其中wj是针对第j 个回归树桩的权重向量。属于所有回归树桩的权重可以被进一步编码成权重矩阵。因为我们现在使用权重,所以我们省略在方程(4)中定义的回归输出函数中的公共系数,并且替代地如下表达回归函数:
验证可以通过组合多个决策树桩来形成回归树桩是容易的。这样的组合加强了弱函数的模拟能力并且因此使训练过程加速。经验证据示出,训练时间几乎与在弱函数中使用的级别的数量成反比。尽管使用回归树桩带来了过度拟合的风险,但是可以通过考虑回归树桩的模型复杂性来改善该风险。
也被称为吉洪诺夫正则化的岭回归是针对病态的线性方程系统的正则化的方法。将岭回归原理适配到推进的框架中以便使用EIBRR训练回归函数。回归输出函数的模型复杂性取决于它的权重矩阵。因为推进回归迭代地进行,所以在第t 个推进迭代处,执行仅涉及权重矩阵(为了记法清楚省略下标t )的以下岭回归任务:
因为权重矩阵W 中的权重向量与q 个不同的本地(local)矩形特征相关联,所以(14)中的优化隐含两个子任务:
1.给定分别具有选择器索引的q 个特征的集合,找出最优矩阵和最小代价;以及
2.找出具有相应的选择器索引属性的q 个特征的最优集合,其使最小代价最小化。这对应于特征选择。
(14)中的优化需要可能在计算上难以管理的贪婪特征选择。因此,求助于次最优的、但计算上经得起检验的增量特征选择方法可能是有利的。因此,我们引入以下“增量”向量和矩阵:
假设已经选择多达i -1个特征,即增量向量和权重向量是已知的,IBRR方法旨在找出使以下岭回归代价(本文中被称为EIBRR代价函数)最小化的弱函数:
可以导出,针对固定的fi,最优的权重向量是:
其中
因此,EIBRR方法搜索最优fi以使IBRR代价函数最小化。
当时,增量特征选择给出最优解。在该情况下,针对第j 个弱函数的最优权重wj,k是加权平均:
输出变量的维度的阶可以被随机地变更(permutate)以便提高鲁棒性并移除偏置。通过对字典集随机地取样(即,以较小的M '更换M )以及对训练数据集随机地取样(即,以较小的N '更换N )来增强效率也是可能的。
图4图示了根据本发明的实施例的用于使用EIBRR训练基于机器学习的映射的算法。在402处,初始化IBRR调整参数。特别地,设置规范化矩阵A 和B 、正则化系数λ 和收缩因数η 。这些可以被自动地或由用户手动地设置。还设置诸如迭代的最大数量Tmax和最小代价函数值Jmin之类的停止标准。还针对设置初始值和。
在404处,基于图像特征的集合来确定最优弱函数。最优弱函数被确定成使EIBRR代价函数(15)最小化。在图5中更详细地描述了步骤404。
在406处,基于在404中确定的最优弱函数更新回归函数。如在(13)中示出的那样,在每个迭代处通过将针对该迭代的最优弱函数添加到在前的回归函数来更新回归函数,使得最终的回归函数是针对所有迭代的弱函数的和。因此,当弱函数被确定时,其被添加到在前的回归函数。
在408处,基于被更新的回归函数评估近似误差和EIBRR代价函数。近似误差通过将由回归函数产生的基于输入训练数据的差异向量与已知的输出训练数据比较来测试回归函数。在(15)中表达了EIBRR代价函数。
在步骤410处,确定IBRR方法是否已经收敛。为了使方法收敛,确定是否满足停止条件。例如,如果代价函数小于最小代价函数Jmin,则可以实现收敛。当迭代的最大数量Tmax发生时、当近似误差小于某阈值时、当在前一步骤和当前步骤处的代价函数之间的差异小于某阈值时或当在前一步骤和当前步骤处的近似误差之间的差异小于某阈值时实现收敛也是可能的。如果在410处EIBRR算法尚未收敛,则算法返回到步骤404并重复步骤404、406和408直到收敛被实现。如果EIBRR已经在步骤510处收敛,则存储或输出被训练的回归函数。可以将由本方法产生的被训练的回归函数存储在计算机系统的存储器或贮存器中或输出供在确定新的病人数据集中的诸如FFR的血液动力学指标中使用。
图5图示了根据本发明的实施例的特征选择算法。该方法对应于图4的步骤404。在502处,设置弱函数的维度。如上面描述的那样,可以变更弱函数的维度以便提高鲁棒性并移除偏置。弱函数的维度确定使用多少图像特征来确定每个弱函数。
在504处,选择使EIBRR代价函数(15)最小化的图像特征。通过循环特征字典集M中的图像特征中的每个以找出使IBR代价函数(15)极其最小化的特征来选择图像特征。如在图5的503处示出的那样,从字典集M 取样减小的字典集M '并将其代替M 用于特征选择以便提高计算效率也是可能的。并且,如在图5的503处示出的那样,可以从训练集N 取样训练数据的减小集N '以便提高计算效率。
在步骤506处,更新弱函数。如上面描述的那样,通过堆叠q 个不同的1D回归树桩来构造弱函数。回归树桩中的每个使用图像特征。一旦在步骤504处选择了图像特征,弱函数就将当前特征以增量的方式增加到先前选择的特征。如在图5中示出的那样,在维度q上迭代步骤504和506。即,算法重复步骤504和506直到已经针对弱函数选择了q 个图像特征。一旦选择了q 个图像特征,就输出或存储弱函数。可以将由被选择的特征的组合产生的弱函数输出供在图4的EIBRR方法中继续使用。可以将弱函数存储在计算机系统的存储器或贮存器中。可以组合在图5的EIBRR方法的每个迭代中存储的弱函数以生成被训练的回归函数。
一旦训练了基于机器学习的映射,就将被训练的映射存储在计算机系统的存储器或贮存器中并然后将其用来针对新病人确定FFR值(或其他血液动力学指标值)。图6图示了根据本发明的实施例的用于针对病人使用被训练的基于机器学习的映射确定FFR的方法。
在步骤602处,接收包括感兴趣的狭窄的病人数据集。病人数据集包括病人的医学图像数据。医学图像数据可以包括来自任何医学成像形式的医学图像,所述医学成像形式诸如计算断层扫描(CT)、X射线血管造影术、磁共振成像(MRI)、超声、血管内超声(IVUS)、光学相干断层扫描(OTC)等。可以通过使用图像获取设备获得医学图像数据、直接地从图像获取设备接收医学图像数据或加载针对病人的被存储的医学图像数据来接收医学图像数据。病人数据集还可以包括诸如功能测量结果(例如,血压、心率、ECG等)的功能数据和人口统计数据以及可以从其提取特征的任何其他类型的数据。在某些情况下,病人数据集可以包括感兴趣的多个狭窄。
在步骤604处,针对感兴趣的狭窄从病人数据集提取特征。当存在感兴趣的多个狭窄时,针对感兴趣的每个狭窄提取特征的相应集合。特别地,针对感兴趣的狭窄提取了与针对训练数据中的每个训练实例提取的那些特征相同的特征。上面关于图1的步骤110描述了这些特征。根据有利的实现,可以使用全自动化特征提取方法来提取特征。例如,可以使用一个或多个基础图像处理算法来首先检测感兴趣的每个解剖区域并且然后提取解剖特征。例如,图像处理算法可以自动地检测狭窄、冠状动脉血管、冠状动脉口、心室、心肌、小梁和乳头肌以及主动脉,并且然后从被检测的区域中的医学图像数据提取所有要求的解剖特征。在一个实施例中,在医学图像数据中首先自动地检测感兴趣的冠状动脉狭窄,并且然后针对感兴趣的每个狭窄自动检测相应的特征集合。可以使用在美国专利号8,526,699、美国公开专利申请号2013/0216110、美国专利号8,582,854和美国专利号8,116,548中描述的方法执行自动化的特征提取,所述专利中的每个通过引用被并入本文中。根据其他可能的实现,特征中的某些可以被半自动地或由用户手动地提取。可以在医学图像扫描器上或在诸如成像工作站的另一设备上执行特征提取步骤。
在步骤606处,使用被训练的基于机器学习的映射基于被提取的特征针对感兴趣的狭窄确定FFR值。特别地,使用图1的方法基于训练数据训练的基于机器学习的映射被用来基于被提取的特征计算针对病人的狭窄的FFR值。根据有利的实施例,被训练的映射是将被提取的特征与各种所学习的权重组合的所学习的经验模型。如上面描述的那样,被训练的基于机器学习的映射可以是使用基于图像的推进的岭回归(例如使用在图4和5中图示的扩展的基于图像的推进的岭回归(EIBRR)方法)训练的回归函数。如果在病人数据集中存在感兴趣的多个狭窄,则使用针对感兴趣的每个狭窄提取的特征的相应集合针对感兴趣的每个狭窄确定相应的FFR值。在可能的实现中,被训练的映射可以计算FFR值连同置信区间。
在步骤608处,输出FFR值。例如,可以将FFR值显示在计算机系统的显示设备上。还可以将FFR值存储在计算机系统的存储器或贮存器上。
在可能的实施例中,用户可以利用图6的方法来通过适当地改变某些特征的值以反映治疗后情况来分析不同的治疗情况的效果。在该情况下,一旦在步骤608处输出FFR值,就从用户接收反映治疗情况的改变一个或多个特征的用户输入,并且使用被训练的基于机器学习的映射基于被修改的特征来重新计算FFR值。
图7、8和9图示了用于实现图6的方法的各种场景。如在图7中示出的那样,在一个实施例中,使用扫描器700(图像获取设备)用于图像获取702,并且将图像从扫描器700传送到工作站710。然后工作站710执行特征提取704和FFR计算706步骤,产生被预测的FFR值。如在图8中示出的那样,在另一实施例中,扫描器800执行图像获取802和特征提取804,并且仅将被提取的图像特征从扫描器800传送到工作站810。然后工作站执行随后的FFR计算806,产生被预测的FFR值。如在图9中示出的那样,在另一实施例中,扫描器900执行图像获取902、特征提取904和FFR计算906,产生被预测的FFR值。
随着更多的数据被收集,包含解剖、生理学和人口统计测量结果和/或特征连同地面实况有创FFR测量结果的训练数据库可能在大小方面增长。然后可以使用被更新的数据库来周期性地重新训练基于机器学习的映射。训练数据库中的新的实例可以来自未被发现的案例(即,过去尚未被用于训练或预测的案例)或来自过去被用于预测但是现在具有可用的有创FFR测量的案例。训练数据库可以是用于特定机构的本地数据库的中央数据库。在可能的实施例中,代替有创的血液动力学量(诸如FFR),训练数据库中的地面实况值可以由计算替代物替代。例如,可以由使用机械模拟方法数字地计算的FFR值更换或补充用于训练数据的地面实况FFR值。
根据可能的实施例,代替在训练阶段期间使用病人特定的几何形状来计算针对FFR的计算替代物,可以使用不是基于病人特定的数据的综合生成的几何形状。可以通过改变狭窄的形状、严重性、位置和数量连同冠状动脉血管树的一般模型中的主和侧分支的半径和位置来生成这样的几何形状。作为综合生成的几何形状的最简单的示例,人们可以使用具有变窄部分的直管来表示狭窄。可以通过改变综合几何形状(例如,狭窄的最小半径、入口角、出口角)以及改变流入或流出边界条件以计算FFR值来执行多个CFD仿真。使用综合生成的几何形状的一个优势是其不要求收集和处理病人特定的数据用于完成训练阶段,从而节省时间和代价两者。进一步地,不存在对可以被生成的综合几何形状的类型限制,从而覆盖宽范围的血管形状和拓扑。使用该方法,可以在没有任何病人特定的几何形状或图像数据的情况下执行整个训练阶段。通过引用被并入本文中的美国公开专利申请号2014/0024932描述了对综合生成的狭窄形状的CFD仿真的示例。
如上面描述的那样,各种特征可以被提取并被用来训练基于机器学习的映射和被用来确定FFR值。应理解,上面描述的方法自适应于可用的病人特征并且可以使用更多的或更少的特征。上面描述的方法也可以被类似地用于其他应用,诸如确定诸如肾动脉狭窄、主动脉狭窄、周围动脉狭窄等的其他血管狭窄的严重性,确定诸如脑动脉瘤、腹部主动脉瘤等的动脉瘤的破裂风险以及将心力衰竭病人分类为对心脏再同步治疗(CRT)的很可能的响应者或无响应者。
根据本发明的另一实施例,代替从医学图像数据提取特征,将机器学习算法直接应用在图像体素(体积块或体素的集合)上以学习那些体素和感兴趣的血液动力学量(例如,FFR)之间的关联。在该实施例中,可以在两个阶段中解决计算FFR(或感兴趣的其他血液动力学量)的问题。在第一阶段中,在输入3D医学图像中定位解剖上显著的图像块。可以使用边缘空间深度学习(MSDL)或边缘空间深度回归(MSDR)来定位感兴趣的图像块,所述MSDL和MSDR是训练一系列深度神经网络在具有增加的维度的一系列边缘参数空间中检测感兴趣的图像块的机器学习方法。在第二阶段中,针对包含狭窄的每个图像块连同包含其余的冠状动脉解剖的其他重叠块,深度神经网络训练的回归器被用来计算特定于该狭窄的FFR值。必要时,然后针对冠状动脉树内的每个狭窄重复本过程。
图10图示了用于使用被直接地应用于病人的医学图像数据的被训练的深度神经网络确定FFR的方法。参考图10,在步骤1002处,接收病人的医学图像数据。在有利的实现中,医学图像数据是3D医学图像,但是本发明不被限于其。医学图像数据可以包括来自任何医学成像形式的医学图像,所述医学成像形式诸如计算机断层扫描(CT)、X射线血管造影术、磁共振成像(MRI)、超声、血管内超声(IVUS)、光学相干断层扫描(OTC)等。可以通过使用图像获取设备获得医学图像数据、直接从图像获取设备接收医学图像数据或加载针对病人的被存储的医学图像数据来接收医学图像数据。
在步骤1004处,在医学图像数据中检测对应于病人的狭窄和冠状动脉树的图像块。根据有利的实现,定位图像块的集合以表示所有狭窄区域(围绕每个狭窄的某大小的图像块)、冠状动脉口(以每个口为中心的图像块)、冠状动脉血管(在管状冠状动脉结构周围的图像块)和冠状动脉二分叉和三分叉。
根据有利的实施例,可以使用被直接地应用于3D医学图像的体素的边缘空间深度学习(MSDL)或边缘空间深度回归(MSDR)来检测感兴趣的图像块,所述MSDL和MSDR是训练一系列深度神经网络在具有增加的维度的边缘参数空间的系列中检测感兴趣的图像块的机器学习方法。MSDL和MSDR利用深度学习来直接地从医学图像数据自动地学习高级领域特定的图像特征。
在MSDL和MSDR两者中,为了检测对象,将目标对象的参数空间分成具有增加的维度的一系列边缘搜索空间,并且针对每个边缘搜索空间训练相应的深度多层神经网络。在MSDL中,每个被训练的深度神经网络是有区别的,因为其针对搜索空间中的给定假设计算搜索空间中的假设正确的概率。在MSDR中,每个被训练的深度神经网络提供回归函数(回归器),其针对搜索空间中的每个假设计算从该假设到搜索空间中的对象的被预测的位姿参数的差异向量。
使用训练图像的数据库训练深度神经网络。为了训练深度神经网络,给定其中在训练图像的全部或子集中注释了目标对象的训练图像的数据库,参数化对象位置(位姿)并且建立边缘空间层级。例如,针对对象位置的参数的集合可以是严格(rigid)的平移(位置)、旋转(定向)和规模,并且边缘空间可以是平移、平移+旋转以及平移+旋转+缩放。从被注释的训练图像子集确定参数化空间的范围。接下来,在当前搜索空间中生成假设。针对第一搜索空间,直接地从当前范围生成假设,并且针对其他搜索空间,从具有从当前相应的范围取样的附加参数的当前假设集合增加来生成假设。给定针对当前搜索空间的假设的集合,训练深度多层神经网络,使通过相应的假设参数参数化的子图象作为输入并且使当前参数和针对当前搜索空间的目标或地面实况参数之间的差异作为输出。图11图示了针对特定的参数空间训练深度多层神经网络回归器。如在图11中示出的那样,P是当前参数空间(边缘空间),p(2)是参数空间中的假设的参数,根据其从图像空间I中的第i个图像Ii(p(2))生成图像。使用参数化的图像作为到多层深度神经网络1100的输入,并且由在当前参数空间P中的假设参数p(2)和地面实况参数p(1)之间的参数差异dp(2)和可选地置信测量给出有监督的输出。可以直接地关于对地面实况的差异(在该情况下p(1)是被注释的参流形)训练深度神经网络1100,或者可以关于朝向地面实况的位移训练深度神经网络1100。
针对深度神经网络架构和训练,可以使用各种类型的神经网络,诸如卷积神经网络(CNN)、堆叠的受限玻尔兹曼机(RBM)或堆叠的自动编码器(AE)。在RBM或AE的情况下,我们可以在使用被注释的训练图像的子集的有监督的训练之前,以无监督的方式使用(未被注释的)可用图像中的全部来预训练网络以确定表征来自大的数据库的数据的种类的代表性特征。在有利的实施例中,在两个阶段中使用堆叠的去噪自动编码器(DAE)训练深度神经网络。第一阶段是无监督的,其中训练多层深度神经网络中的每层以重新构造输入。在该阶段中,将类似于输入的虚拟层添加到输出,并且在该虚拟层中使输入的误差最小化。第二阶段是有监督的,并且使整个网络误差相对于从预训练的网络权重开始的输出训练数据最小化。DAE的一个特性是其在训练期间随机地省略某百分比(多达50%)的输入,这显著地增加了得到的回归器的鲁棒性。输出参数空间可以被使用线性函数直接地回归,或者其可以如解决多类分类问题那样相对于参数范围被离散。第二公式化具有可以直接地对输出概率编码并且可以生成多个假设的优势。
然后通过被训练的深度神经网络传播当前假设的集合,并且在可能的实施例中,可以使用相同的深度神经网络或通过新近被训练的深度神经网络迭代地细化假设的新集合。该迭代过程可以消除(不重叠的)远离解的样本并且生成更接近真正位置的样本以提高精度。给假设的新集合增加来自随后的边缘空间的新的参数,并且针对随后的边缘空间重复本过程。这产生针对边缘空间中的每个的相应的被训练的深度神经网络(回归器或有区别的深度神经网络)。
图12图示了根据本发明的实施例的用于对象检测的训练深度神经网络的系列方法。可以使用图12的方法来训练深度神经网络,用于检测对应于狭窄和冠状动脉树解剖的图像块。参考图12,在步骤1202处,接收训练图像。特别地,从数据库加载多个训练图像。利用感兴趣的对象的位姿(位置、定向和规模)注释训练图像的至少一个子集。此外,训练图像还可以包括未注释的图像。
在步骤1204处,训练第一深度神经网络以检测位置候选。在可能的实现中,第一深度神经网络可以是有区别的深度神经网络,其输入图像的体素作为假设并且针对每个体素计算中心在体素处的图像块是感兴趣的对象的概率。在另一可能的实现中,第一深度神经网络可以训练回归函数,其输入图像的体素作为假设,针对每个输入计算差异向量,产生针对每个输入体素计算的被预测的位置。在步骤1206处,通过被训练的第一深度神经网络传递训练样本并保持多个最好的位置候选。
在步骤1208处,给位置候选增加定向参数以生成位置-定向搜索空间中的假设。例如,可以通过将中心在位置候选处的每个图像块旋转到多个可能的旋转来针对每个位置候选生成多个位置-定向假设。可以通过被注释的训练数据中的地面实况对象的定向的范围来确定这些旋转的范围。
在步骤1210处,训练第二深度神经网络以检测位置-定向候选。在可能的实现中,第二深度神经网络可以是有区别的深度神经网络,其输入对应于位置-定向搜索空间中的假设的图像的图像块,并针对每个图像块计算图像块是感兴趣的对象的概率。在另一可能的实现中,第二深度神经网络可以训练回归函数,其输入对应于在位置-定向搜索空间中的假设的图像的图像块,并针对每个输入计算在位置-定向参数空间中的差异向量,产生被预测的位置和定向以及图像中的相应的图像块。在步骤1212处,通过被训练的第二深度神经网络传递位置-定向假设并保持多个最好的位置-定向候选。
在步骤1214处,给位置-定向候选增加缩放参数以在位置-定向-规模搜索空间中生成假设。例如,可以通过将对应于程序位置-定向候选的每个图像块缩放到多个可能的规模来针对每个位置-定向候选生成多个位置-定向-规模假设。可以通过在被注释的训练数据中的地面实况对象的规模的范围确定这些规模的范围。
在步骤1216处,训练第三深度神经网络以检测感兴趣的对象的完整的参流形(位置-定向-规模)。在可能的实现中,第三深度神经网络可以是有区别的深度神经网络,其输入对应于在位置-定向-规模搜索空间中的假设的图像的图像块并针对每个图像块计算图像块是感兴趣的对象的概率。在另一可能的实现中,第三深度神经网络可以训练回归函数,其输入对应于在位置-定向-规模搜索空间中的假设的图像的图像块并针对每个输入计算在位置-定向-规模参数空间中的差异向量,产生被预测的位置、定向和规模以及图像中的相应的图像块。
在图10的步骤1004中,当接收到病人的输入医学图像时,使用被训练的深度神经网络来检测对应于狭窄和冠状动脉树解剖的图像块。用于检测目标对象参数的过程类似于训练过程。所生成的假设的集合通过被训练的深度神经网络传播并通过边缘空间迭代地细化,产生定义每个目标图像块的位置、定向和规模参数。
返回到图10,在步骤1006处,针对狭窄通过将被训练的深度神经网络回归器直接地应用于检测到的图像块来确定FFR值。在该情况下将机器学习算法直接地应用在检测到的图像块上,其包含医学图像的原始结构连同来自步骤1004的相关联的标签。在训练在步骤1006中使用的深度神经网络回归器中,目标是学习那些图像块和针对特定的狭窄的感兴趣的血液动力学量(例如,FFR或压降)之间的关联。使用这样的方法,首先从图像提取解剖特征(诸如狭窄的半径、狭窄的长度等)不是必要的。
图13图示了根据本发明的实施例的将被训练的深度神经网络回归器应用于图像块以确定针对狭窄的FFR值。如在图13中示出的那样,深度神经网络1300从检测到的图像块1302输入DICOM数据(未经处理的体素)。深度神经网络是具有潜变量的三层1304、1306和1308以及输出狭窄特定的FFR值的第四层1310的多层神经网络。学习权重以将输入体素1302映射到潜变量的第一集合1304,将潜变量的第一集合1304映射到潜变量的第二集合1306,将潜变量的第二集合1306映射到潜变量的第三集合1308,以及将潜变量的第三集合1308映射到狭窄特定的FFR值1310。应理解,本发明不被限于在图13中示出的特定数量的层。
根据有利的实施例,可以如下训练用于确定狭窄的FFR值的深度神经网络回归器:(1)收集来自各种病人(例如,500+个)的医学图像(例如,心脏CT图像)但是没有匹配的FFR值的被训练的图像块的大集合(数据集A)。(2)收集来自各种病人(例如,200+个)的医学图像(例如,心脏CT图像)的具有被标识的狭窄图像块和相应的FFR值的被训练的图像块的大集合(数据集B)。(3)通过选择层数、每层单元数、学习速率以及初始随机权重来设置网络。可以实验上确定深度神经网络的这些设置。(4)使用受限玻尔兹曼机(RBM)对比散度或自动编码器算法,使用数据集A来逐层地训练(即,调整)深度神经网络的权重。在该步骤中不对最后一层执行训练。(5)使用梯度下降反向传播算法,使用数据集B来细化所有层(包括最后一层)的权重。在该步骤期间,可以对权重使用L1或L2正则化以避免过度拟合。
在图10的步骤1006中,一旦在1004中检测到图像块,就将被训练的深度神经网络回归器直接地应用于检测到的图像块,这产生针对每个狭窄的狭窄特定的FFR值。
返回到图10,在步骤1008处,输出FFR值。例如,可以将FFR值显示在计算机系统的显示设备上。还可以将FFR值存储在计算机系统的存储器或贮存器上。
可以在计算机上使用公知的计算机处理器、存储器单元、存储设备、计算机软件以及其他部件来实现上面描述的用于确定FFR的用于训练基于机器学习的映射的方法以及针对病人使用被训练的基于机器学习的映射确定FFR的方法。在图14中图示了这样的计算机的高级框图。可以使用图14的计算机实现图7、8和9的扫描器和工作站。计算机1402包含处理器1404,其通过执行定义计算机1402的整体操作的计算机程序指令来控制这样的操作。可以将计算机程序指令存储在存储设备1412(例如,磁盘)中并在期望执行计算机程序指令时将其加载到存储器1410中。因此,可以通过存储在存储器1410和/或贮存器1412中的计算机程序指令定义并通过执行计算机程序指令的处理器1404控制图1、4、5、6、10和12的方法的步骤。可以将诸如MR扫描设备、超声设备等的图像获取设备1420连接到计算机1402以向计算机1402输入图像数据。将图像获取设备1420和计算机1402实现为一个设备是可能的。图像获取设备1420和计算机1402通过网络无线地通信也是可能的。计算机1402还包括一个或多个网络接口1406,用于经由网络与其他设备通信。计算机1402还包括使能与计算机1402的用户交互的其他输入/输出设备1408(例如,显示器、键盘、鼠标、扬声器、按钮等)。可以将这样的输入/输出设备1408连同计算机程序的集合用作注释工具以注释从图像获取设备1420接收的量。本领域技术人员将认识到,实际的计算机的实现还可以包含其他部件,并且图14是出于说明性目的的对这样的计算机的部件中的某些的高级表示。
前述详细描述应被理解为在各个方面是说明性和示例性的而不是限制性的,并且本文中公开的发明的范围不应根据详细描述而是根据权利要求书被确定,如根据由专利法许可的完整篇幅解释的那样。应理解,本文中示出和描述的实施例仅说明本发明的原理,并且本领域那些技术人员可以在不脱离本发明的范围和精神的情况下实现各种修改。本领域那些技术人员可以在不脱离本发明的范围和精神的情况下实现各种其他特征组合。