3D各向异性的混合网络:将来自2D图像的卷积特征传递到3D各向异性体积的制作方法

文档序号:17667459发布日期:2019-05-15 22:48阅读:310来源:国知局
本申请有关于2017年11月2日提交的、序列号为62/580,477的美国专利申请,并且对该美国专利申请要求权益,并且要求该美国专利申请的优先权,所述美国专利申请的内容据此通过引用以其全部被并入以用于所有目的。本发明一般地涉及与用于将来自2d图像的卷积特征传递到3d各向异性体积的3d各向异性混合网络有关的方法、系统和装置。所公开的方法、系统和装置可以应用于例如根据dbt图像体积的乳腺病变检测,以及肝肿瘤分割应用。
背景技术
:3d体积图像(或“体积”)广泛地用于临床诊断、手术计划和生物医学研究。由这样的体积图像所提供的3d上下文信息对于可视化和分析感兴趣的对象而言是重要的。然而,给定所添加的维度,与2d图像相比,通过机器来解释3d体积是更加耗时的并且有时更难。许多常规的系统使用常规的神经网络(cnn)来提取人类或动物体组织中感兴趣的结构模式的表示。由于特殊的成像设置,许多成像模态伴随有各向异性的体素,意味着不是所有三个维度都具有相等的分辨率。例如,在数字乳腺断层摄影(dbt)、以及有时在计算机断层扫描(ct)的3d体积中,在xy平面/切片中的图像分辨率(或切片内分辨率)比z分辨率(或切片之间分辨率)的十倍大。因而,xy切片比z维度保持多得多的信息。在dbt图像中,仅仅可以确保xy平面内的空间信息。然而,xy切片之间的3d上下文,甚至在具有轻微未对准的情况下,仍承载用于分析的有意义的信息。由于以下原因,将3dcnn直接应用于这样的图像仍然是有挑战性的任务。首先,由于沿着每个维度的不同信息密度,对于小的内核而言,可能难以从各向异性体素中学习有用的特征。其次,与2d网络相比,理论上在3d网络中需要更多的特征。3d网络的能力受gpu存储器限制,gpu存储器约束网络的宽度和深度二者。第三,不像现今可以利用骨干网络的2d计算机视觉任务,所述骨干网络通过使用数百万2d图像而被预训练,3d任务大多数必须从零开始训练,并且因此遭受大3d数据集的缺乏。另外,高数据变化使得3d网络更难以训练。而且,在这样的具有相对小的上下文的小图像数据集上训练的3dcnn难以一般化到未看见的数据。除了利用和内核所构建的传统3d网络之外,存在用于学习来自各向异性体素的表示的其它常规方法。一些方法与2d网络分离地处理2d切片。为了更好地利用3d上下文,多于一个图像切片被用作针对2d网络的输入。还可以通过组合全卷积网络(fcn)架构与卷积lstm来顺序地查看2d切片,用以作为时间序列来查看相邻的图像切片,从而从抽象的2d上下文的序列中提炼3d上下文。还存在常规的方法,其应用各向异性卷积内核来在xy平面上分布比z轴上更多的学习能力。技术实现要素:如本文中各种实施例中所述的本发明描述了一种3d各向异性混合网络(ahnet),其用于将来自2d图像的卷积特征传递到3d网络以供用于在3d各向异性体积情况下的深度学习应用。这样的传递继承了用于切片内信息的所期望的强泛化能力,而同时自然地利用切片之间的信息来用于更有效的建模。焦点损失此外被用于更有效的端对端学习。本文中所述的技术可以应用于医学图像分析任务,诸如根据数字乳腺断层摄影体积的病变检测,以及从计算机断层扫描体积中的肝肿瘤分割。根据本发明的一些实施例,一种用于标识3d图像体积中的特征的计算机实现的方法包括将3d体积划分成2d切片并且将预训练的2d多通道全局卷积网络(mc-gcn)应用到所述2d切片直到收敛为止。在2dmc-gcn收敛之后,从2dmc-gcn中的第一特征编码器网络提取参数。所述参数被传递到3dah-net中的第二特征编码器网络。所述3dah-net被应用到3d体积以产生概率图(probabilitymap)。然后,通过使用所述概率图,生成(a)具有非最大值抑制的对象的坐标或(b)3d体积中感兴趣的对象的标签图(labelmap)中的一个或多个。根据其它实施例,一种用于标识3d图像体积中的特征的计算机实现的方法包括将3d数字乳腺断层摄影(dbt)体积划分成2d切变,并且将2dmc-gcn应用到所述2d切片直到收敛为止,其中所述2dmc-gcn利用对健康乳腺组织进行描绘的dbt图像切片而被预训练。在2dmc-gcn收敛之后,从2dmc-gcn中的第一特征编码器网络提取参数并且将所述参数传递到3dah-net中的第二特征编码器网络。所述3dah-net被应用到3d体积以产生病变存在的按体素的置信度图(confidencemap),其包括针对3d体积中每个体素的置信度评分,指示病变的存在或不存在。然后,所述按体素的置信度图被呈现为叠覆在3ddbt体积上。在本发明的其它实施例中,一种用于标识3d图像体积中的特征的系统包括2dmc-gcn、3dah-net和并行处理架构。所述2dmc-gcn包括2d特征编码器网络,而所述3dah-net包括3d特征编码器网络。所述3dah-net此外包括:解码器模块,其被配置成处理3d特征编码器的输出;金字塔体积池化模块,其被配置成处理解码器模块的输出以生成概率图金字塔;以及级联模块,其被配置成级联所述概率图金字塔与解码器模块的输出以生成概率图。所述并行处理架构被配置成将3d体积划分成2d切片并且将2dmc-gcn应用到所述2d切片直到收敛为止。在2dmc-gcn收敛之后,所述并行处理架构从2dmc-gcn中的2d特征编码器网络提取参数并且将所述参数传递到3dah-net中的3d特征编码器网络。所述并行处理架构于是将3dah-net应用到3d体积以生成概率图。从参考附图进行的对说明性实施例的以下详细描述中将使得本发明的附加的特征和优点显而易见。附图说明从当结合附图阅读的以下详细描述中最好地理解本发明的前述和其它方面。为了说明本发明的目的,在附图中示出有目前优选的实施例,然而,理解到本发明不限于所公开的特定手段。专利或申请文件包含至少一个用色彩执行的绘图。此专利或专利申请公布具有(多幅)彩色绘图的拷贝将在请求以及支付了必要费用的时候由专利局提供。在附图中所包括的是以下各图:图1图示了用于预训练2d编码器网络多通道全局卷积神经网络(mc-gcn)的网络架构;图2示出了3dah-net的示例架构,如可以在一些实施例中实现的那样;图3图示了变换2d卷积权重张量;图4示出了在来自2dgcn和具有从它传递的编码器权重的3dah-net的2个不同dbt体积上的网络响应的可视比较;图5示出了关于病变检测性能的自由响应操作特性(froc);图6a示出了来自3dah-net的示例肝病变分割结果;图6b示出了图6a中所呈现的分割的示例渲染;图7图示了根据本发明的一些实施例的用于标识3d图像体积中的特征的示例计算机实现的方法;以及图8提供了根据本发明的一些实施例的、可以被利用来执行与本文中所讨论的算法的执行有关的计算的并行处理存储器架构的示例。具体实施方式以下公开内容根据若干实施例而描述了本发明,所述若干实施例针对与用于将来自2d图像的卷积特征传递到3d各向异性体积的3d各向异性混合网络有关的方法、系统和装置。更具体地,本文中所述的技术公开了一种3d各向异性混合网络(ah-net)来从具有各向异性分辨率的图像学习信息性特征。为了获得3dah-net,首先训练2d全卷积resnet。所述2d网络可以利用预训练的权重来被初始化,并且使用多个2d图像切片作为输入。2d网络的特征编码器然后被变换到3d网络中,这通过利用一个添加的维度来扩展2d内核。然后,添加特征解码器子网络来提取3d上下文。所述特征解码器子网络包括具有和卷积的各向异性卷积块。利用密集的连接来组合不同的各向异性卷积块。跳过在特征编码器和解码器之间的连接。将金字塔体积池化模块堆叠在网络的结束处,在用于提取多尺度特征的最终输出层之前。由于ah-net可以利用2d网络,所述2d网络利用大的2d一般图像数据集、诸如imagenet被预训练,所以它更容易训练以及一般化。各向异性卷积块使得它能够利用3d上下文。具有如3d网络那样的端对端推断,关于对于处理每个3d体积所需要的gpu时间,ah-net运行得比常规多通道2d网络快得多。ah-net包括特征编码器和特征解码器。从2d网络所变换的编码器被设计用于从具有高分辨率的2d切片提取深度表示。利用密集连接的各向异性卷积块所构建的解码器负责利用3d上下文并且维持切片之间一致性。网络训练在两个阶段中执行:对编码器进行学习;然后3d解码器被添加并且被精细调谐,其中编码器参数被锁定。为了执行端对端硬体素挖掘,在一些实施例中使用焦点损失(fl)。如在本领域中一般已知的,fl最初被设计用于对象检测。对多通道2d特征编码器进行学习图1图示了用于预训练2d编码器网络多通道全局卷积神经网络(mc-gcn)的网络架构。resnet50被用作骨干网络,其利用imagenet图像被初始化。全局卷积网络模块和细化模块被添加到编码器网络,用于增大预训练期间接收域(receptivefield),以及增大对原始分辨率的输出响应图。convk×k/s表示卷积层,其具有在每个维度中的内核大小k和步幅大小s。上采样模块(up)包括conv投影层和双线性上采样层。在图1的示例中,训练2d多通道全局卷积网络(mc-gcn)以提取不同分辨率下的2d切片内特征。在一些实施例中,resnet50模型被用作骨干网络,其通过利用imagenet图像进行预训练而被初始化,尽管其它经预训练的网络将会类似地运作。然后利用从3d体积中提取的2d图像切片来对网络进行精细调谐。对该网络的输入是三个近邻切片(被看作rgb通道)。因而,resnet50的整个架构保持不变。多通道2d输入可以使得2d网络能够在早期阶段融合切片之间上下文。添加解码器,用以伴随编码器来将响应图升档到原始分辨率。本文中所述的示例采用解码器架构,所述解码器架构具有全局卷积网络(gcn)和细化块;然而,应当理解的是,在不同的实施例中可以采用类似的架构。gcn模块模拟大的k×k卷积内核,这通过将它分解成两个1-d内核(1×k和k×1)。包含以不同次序排列的1d内核的两个分支通过求和被合并。每个gcn模块的输出包含与最终输出相同数目的输出图。gcn所模拟的大内核确保网络在每个特征分辨率下具有大的接收域。每个细化块包含两个卷积,其在中间具有relu激活。每个细化块的输入还被添加到其输出以形成残余连接。在每个编码器分辨率层级的结束处,特征被馈送到gcn模块中,其中相应地具有63、31、15、9、7和5的内核大小。输出特征被馈送到细化块中,并且与从较低分辨率层级中上采样的特征求和。经求和的特征被馈送到另一细化块中,并且利用卷积和双线性上采样层而被上采样。最终输出具有与图像输入相同的分辨率。解码器仅仅具有小数量的参数,其具有很少的计算成本。轻量解码器使得编码器特征更容易被传递到3dah-net,因为特征学习的大多数依赖于编码器网络。将经学习的2d网络传递到3dahnet图2示出了3dah-net的示例架构,如可以在一些实施例中实现的那样。利用和卷积来从预训练的2d网络传递具有ah-resnet块的特征编码器。然后利用ah-net解码器来处理特征,所述ah-net解码器被设计有和卷积块。代替于级联地可以使用特征求和,用以利用较少的存储器消耗来支持更多的概率图。应当注意到,为了简要,该示例隐藏批量归一化和relu层。具有粗黑边界的块的权重变换自2dmc-gcn。在2dmc-gcn网络收敛之后,其编码器的参数被提取并且被传递到ah-net的对应编码器层。2dmc-gcn的解码器部分被丢弃,并且代替地,采用用于ah-net的新解码器,其包括密集连接的块的多个层级,其后是用于提取多尺度特征响应的金字塔体积池化模块。随机地初始化新解码器的参数。ah-net的输入和输出现在是3d补块,类似于其它常规的3dcnn。在图3中图示了卷积张量从2d到3d的变换,其目的在于在ah-net的编码器部分中逐切片地在3d体积上执行2d卷积。更具体地,图3图示了将2d卷积权重张量t2d变换到3dt3d,其中m和n分别是层的特征和通道的数目。第一层权重张量被变换到。通过添加额外的维度,可以变换其它卷积内核。标记在本公开内容中,2d卷积张量由标示,其中n、m、h和w分别表示输出通道的数目、输入通道的数目、第i个卷积层的高度和宽度。类似地,3d权重张量由标示,其中d是滤波器深度。标示张量的维度置换,导致新的张量,其中第一和第二维度被转换。在张量的第一和第二维度之间添加同一性维度,并且给出。卷积层被定义为,其中是内核大小;是每个方向上的步幅侧(side)。最大池化层通过maxpool来标示。当层在所有维度中具有为1的步幅大小的时候,省略步幅。输入层变换2dmc-gcn的输入层包含卷积权重张量,其继承自其resnet50骨干网络。2d卷积张量被变换为:以便形成3d卷积内核,其对3个近邻切片进行卷积。为了保持与2d网络一致的输出,在一些实施例中,仅仅步幅-2卷积被应用在xy平面上,并且步幅1被应用在第三维度上。这导致输入层。为了对z维度进行下采样,maxpool可以被应用以融合每对近邻切片。附加的maxpool用于保持与2d网络一致的特征分辨率。resnet块变换resnet50编码器中的所有2d卷积张量和被变换为:和以此方式,如图3中所示的所有resnetconv块仅仅在xy平面内的3d体积上执行2d按切片的卷积。利用conv来执行在resnet块之间的原始下采样。然而,在3d体积中,conv对于z维度上的每一步跳过切片。当图像沿着z维度仅仅具有小数量的切片的时候,这将会错失重要的信息,尤其是对于检测任务而言。为了解决该问题,使用conv,其后是maxpool用以在resnet块之间对3d概率图进行下采样,如在图2中的ah-下采样块中所示的。该maxpooling(最大池化)简单地沿着z方向、在2个近邻切片之间取最大响应。这允许在有限gpu存储器的情况下在3d数据上使用大且深的网络。各向异性混合解码器伴随经变换的编码器,添加各向异性3d解码器子网络来利用3d各向异性图像上下文。在解码器中,使用具有conv1×1×1、conv3×3×1和conv1×1×3的各向异性卷积块。首先利用被两层conv1×1×1围绕的conv3×3×1来将特征传到xy瓶颈块中。输出然后被转发到另一瓶颈块,其中conv1×1×3在中间并且在转发到下一块之前与它自身求和。该各向异性卷积块将3d卷积分解成2d和1d卷积。它从预先前(preprevious)的层接收输入,这通过首先使用2d卷积,保留详细的2d特征。conv1×1×3主要融合切片内特征,从而保持z维度输出一致。三个各向异性的卷积块被连接为密集连接的神经网络,这通过为所编码特征的每个分辨率使用特征级联。类似于linknet,从编码器的每个分辨率所接收的特征首先被投影来匹配较高编码器特征分辨率的特征数目,其通过使用conv1×1×1。它们然后通过使用3d三线性内插来被上采样,并且与来自较高分辨率的编码器特征求和。经求和的特征被转发到下一分辨率中的解码器块。在解码器网络的结束处,采用金字塔体积池化模块来获得多尺度的特征。首先通过使用4个不同的maxpooling(最大池化)层、即maxpool64×64×1、maxpool32×32×1、maxpool16×16×1和maxpool8×8×1来对最后的解码器块的输出特征进行下采样,用以获得概率图金字塔。conv1×1×1层用于将特征金字塔中的每个分辨率投影到单个响应通道。响应通道然后被内插到原始大小,并且与特征级联,然后进行下采样。通过在级联的特征上应用conv1×1×1投影层来获得最终输出。使用焦点损失来训练ahnet通过使用在预训练的编码器和随机初始化的解码器二者上的相同学习率来训练ah-net将会使得网络难以优化。为了训练3dah-net,首先锁定所有转移的参数。在优化中仅仅精细调谐解码器参数。所有参数于是可以被总共地精细调谐,然后共同地到整个ah-net。3d全卷积网络的训练倾向于在容易的体素上快速地早熟,并且缓慢地在硬体素上收敛,所述硬体素有时是医学图像中感兴趣的对象。例如,fcn将会快速地学习具有均匀分布的背景体素。对于小尺度的图案、诸如病变和对象边界,在平均损失中,数值误差倾向于是小的。它因而将会使得训练不敏感于在网络输出和地面真值图(groundtruthmap)之间的细微差异。焦点损失(fl),其得自针对对象检测的焦点损失,用于利用ah-net来执行硬体素挖掘。为了证明所提出的3dah-net的功效和效率,以下详细描述两个示例:来自数字乳腺断层摄影(dbt)体积的病变检测以及来自计算机断层扫描(ct)体积的肝肿瘤分割。关于l2损失的fl用于下述dbt体积示例中。下述ct体积示例中采用的fl的交叉熵形式可以在以下中找到:lin,t.,goyal,p.,girshick,r.b.,he,k.,&dollár,p.(2017).focallossfordenseobjectdetection.2017关于计算机视觉的ieee国际会议(iccv),2999-3007。假定l2损失用于回归图(regressionmap)的监督式学习,其中是预期针对l2损失的最大数值。聚焦参数对容易体素进行下加权。大的值将会使得训练更多聚焦于在硬体素上所生成的大数值误差。当l2损失几乎不减小的时候,在几个时期(epoch)之后,用fl取代原始l2损失。针对fl下更多的时期,训练损失将会保持下降,其中输出细节逐渐增强。演示示例在下述示例中,所有比较的网络利用β1=0.9、β2=0.999和来被优化。可以例如通过使用在以下文章中所描述的技术来执行该优化:kingma,d.p.,&ba,j.(2014).adam:amethodforstochasticoptimization.corr,abs/1412.6980。0.0005的初始学习率用于对2d多通道gcn进行精细调谐。然后,在2d网络被传递之后,学习率被增大到0.001用来对ah-net进行精细调谐。这基于以下经验发现:即3d网络一般需要更大的学习率来在合理量的时间内收敛。本文中所描述的每一个网络可以通过使用本领域中已知的任何深度学习框架(例如pi-torch)来被实现。对于下述第一示例,使用如下数据库:所述数据库包含全局地从12个不同站点获取的2809个3ddbt体积。dbt是乳腺x线摄影的高级形式,其使用低剂量的x-射线来对乳腺进行成像。不同于将3d信息叠加到一个2d图像中的2d乳腺x线摄影,dbt创建乳腺组织的3d图片,并且因此允许放射科医师读取这些图片并且更容易地检测乳腺癌,尤其是在稠密的乳腺组织中。dbt图像的xy平面具有0.085mm×0.085mm的高空间分辨率,其比1mm的z-维度大得多。z-维度中的结构不仅在成像过程期间被压缩,而且3d体积信息还由于成像伪像而具有大的变异。有经验的放射科医师对dbt体积中的病变加注释并且对其进行验证,所述dbt体积可能包含零到若干个病变。近似地利用3d限位框来对每个病变加注释。为了将所提出的网络训练为病变检测网络,可以生成3d多变量高斯热图,其具有与原始图像相同的大小,如其中p是3d坐标x,y,z;是每个病变3d限位框的中心坐标;是由3d限位框的高度、宽度和深度所确定的第i高斯的协变量矩阵。应当注意到,没有必要如一般的对象检测方法、诸如较快速rcnn那样直接预测限位框坐标,因为限定乳腺病变的确切边界有时是具有挑战性的。而且,与限位框相比,病变存在的按体素的置信度图对于临床决策支持而言可以是更有帮助的。数据库被随机分裂成训练和测试集,如在以下的表中所描述的:。更具体地,该表示出了在所评估的dbt数据集中体积的数目(#体积)、病变阳性体积的数目(#阳性)和病变的数目(#病变)。体积或3d补块在如下情况中被认为是阳性的:如果被放射科医师注释了至少一个病变。为了训练,提取256×256×32个3d补块。训练补块中的70%被采样为阳性,其中包括至少一个病变,这考虑在乳腺病变内的体素与没有乳腺病变的体素之间的平衡。利用网络训练来在线异步地对补块进行采样,从而形成迷你批次。连同所公开的网络一起,利用相同的架构和参数来训练2d和3du-net,作为两个基线比较。还利用具有三个输入通道的输入来训练2du-net。利用与ah-net相同的补块采样策略来训练3du-net。所有网络被训练直到收敛为止,然后用针对硬体素挖掘在章节3.4中所描述的焦点损失来取代l2损失函数。在以下的表中示出卷积层和参数的数目:网络#卷积层#参数2d-unet1528,254,5283d-unet155,298,768resnet505323,507,904gcn9423,576,758ah-net12327,085,500该表示出了分别在2d-unet、3d-unet、resnet50、gcn和ah-net中的卷积层数目(#卷积层)和模型浮点参数的数目(#参数)。resnet50在此处被示出为参照来与gcn比较,所述gcn其中添加了简单的解码器。使用2d网络、诸如mc-gcn和2du-net来处理3d体积涉及重复地馈送经复制的图像切片。因而,当它们用于处理3d体积的时候,它们可以比3d网络更慢。四个网络的gpu推断时间通过如下来被测量:对通过在nvidiagtx1080tigpu上对1000个推断求平均而计算的大小384×256×64的体积的3ddbt体积进行转发。在诸如体积切片之类的操作上所花费的时间不被包括在定时中。在以下的表中示出均值gpu时间(ms):2du-net3du-netmc-gcn3dah-netms699.32.3775.217.7ah-net的gpu推断是mc-gcn的43倍之快,尽管ah-net具有更多参数。速度增益可以大多数通过在多通道2d网络所需要的相同切片上避免重复卷积而被带来。在网络输出图上执行非最大抑制来获得病变位置。局部最大体素处的网络响应被视为生癌发现的置信度评分。图4示出了网络输出的可视比较。更具体地,该图示出了在来自2dgcn和具有从它传递的编码器权重的3dah-net的2个不同dbt体积上的网络响应的可视比较。每个体积利用xy平面(左上方)、xz平面(底部)和yz平面(右侧)的最大强度投影来被可视化。在左侧示出地面真值病变中心。在具有附加ah-net解码器的情况下,3dah-net可以有效地检测第一体积(上部的行)中的错失的病变,并且移除第二体积(下部的行)中的假阳性。通过变更阈值来过滤响应值,在假阳性率(fpr)和真阳性率(tpr)之间的平衡可以被控制。如果最大点驻留在放射科医师所注释的3d限位框中,则网络所检测到的病变被认为是正阳性发现。类似地,如果限位框包含最大点,则它可以被标示为被网络检测到。否则最大点被视为假阳性发现。通过绘制自由响应操作特性(froc)曲线来评估病变检测性能,其对照每体积所允许的假阳性的数目(#fp)来对真阳性率(tpr)进行度量。tpr表示已经成功被网络检测的病变的百分比。fpr表示网络预测的是假阳性的病变的百分比。如图5中所示,an-net以大边际胜过2d和3du-net二者。与2d网络(多通道gcn)的性能相比,3dah-net针对大多数阈值生成较高的tpr,除了在每体积0.05假阳性周围的区之外。值得注意的是,ah-net还获得几近50%的tpr,甚至当每体积仅仅允许0.01假阳性发现的时候。有趣的是,3d-unet的性能轻微地比2d-unet的性能更坏,尽管dbt体积具有三个维度。这可能由以下引起:dbt图像的各向异性分辨率以及受gpu存储器所约束的参数的有限数目。在以下的表中总结froc数目:。在该表中,在前五列中示出了所允许的假阳性(fp)发现的五个不同数目下所采样的真阳性率(tpr)。根据ct的肝和肝肿瘤分割从miccai2017(lits-challenge.com)中的肝病变分割挑战获得第二评估数据集,其包含131个训练和70个测试3d对比度增强的腹部ct扫描。肝病变是全世界最常见的癌症之一。估计有28,920人将死于肝病变,并且2017年将诊断出40,710个新病例。由于肝和病变二者的异质性和扩散性外观,肝和病变的自动分割是有挑战性的。而且,病变的数目、形状、位置在不同体积之间变化许多。由世界各地的各种临床站点提供数据和地面真值掩码(mask)。地面真值掩码包含肝和病变标签二者。大多数ct扫描包括各向异性分辨率:从0.45mm到6.0mm的切片之间分辨率范围,而切片内分辨率从0.55mm变化到1.0mm。所有扫描覆盖腹部区,但是可以延伸到头部和脚部。除了肝病变之外,其它疾病也可存在于这些数据中,这进一步增大任务困难。利用预训练的resnet50来训练mc-gcn,作为骨干网络。堆叠的2d切片的输入大小为512×512,其具有三个通道。在收敛之后,mc-gcn的编码器部分的权重被变换成3dah-net的对应层,然后通过使用具有大小192×192×64的3d补块来精细调谐所述3dah-net。其它层的权重被随机初始化。在这两个网络的训练中,在开始就使用交叉熵损失直到收敛为止,其然后被用于硬体素挖掘的焦点损失所取代。在以下的表中列出ah-net的性能,连同从lits挑战排行榜中所检索的其它六个位列顶端的提交。这些提交采用各种类型的神经网络架构:2d、3d、2d-3d混合的、以及模型融合。两个评估度量是适合的:(1)全局切块(dg),其是将所有体积组合到一个中的切块评分;(2)按情况的切块(dpc),其对每个单个情况的切块评分求平均。在两个掩码之间的切块评分被定义为:。结果在四个度量中的三个度量方面实现现有技术性能,包括病变的全局切块评分,肝的全局切块和按情况的切块的评分,这证明了ah-net用于切割具有不同各向异性分辨率的3d图像的有效性。图6a示出了来自3dah-net的示例肝病变分割结果。肝(用白点叠覆的黑线)和肝病变(用黑点叠覆的白线)的经分割的轮廓被叠覆在从不同定向所观看的3个切片上(轴向、冠状和矢状)。在图6b中以3d来渲染分割。作为上述技术的总结,图7是根据本发明的一些实施例的用于标识3d图像体积中的特征的示例计算机实现的方法700。开始于步骤705,3d体积被划分成多个2d切片。用于将体积划分成切片的技术在本领域中一般是已知的,并且因而,这些技术在本文中不被详细描述。每个切片的厚度可以基于例如以下来被选择:图像数据的保真度以及可用于处理的计算资源。继续参考图7,在步骤710处,2dmc-gcn被应用于2d切片直到收敛为止。如本领域中一般理解的,诸如2dmc-gcn之类的神经网络通过如下而“收敛”:调节神经网络的参数(例如节点的权重)直到在所期望的和实际的输出之间的误差被最小化为止。因而,在步骤710处,在2d切片上迭代地执行2dmc-gcn,直到误差被最小化为止。如以上参考图1所描述的,2dmc-gcn在一些实施例中可以包括多层残余网络,并且可以包括诸如全局卷积网络块和边界细化块之类的组件。在2dmc-gcn收敛之后,在步骤715处从2dmc-gcn中的第一特征编码器网络提取参数。接下来,在步骤720处,所提取的参数被传递到3dah-net中的第二特征编码器网络。取决于系统如何被集成,传递的方法可以变化。例如,在其中3dah-net和2dmc-gcn在单个可执行文件中被执行的实施例中,参数可以通过简单地将来自3dah-net的存储器引用传到2dmc-gcn而被“传递”。在其中在分离的可执行文件中执行3dah-net和2dmc-gcn的情况中,参数可以如下被传递:通过将参数从一个文件拷贝到另一个文件,或通过使3dan-net读取和解释由2dmc-gcn所生成的一个或多个输出文件。注意到,该后一实现方式还将会允许3dah-net和2dmc-gcn在经由因特网或另一网络所连接的不同计算系统上被执行。在步骤725处,3dah-net被应用到3d体积以产生概率图。如以上参考图2、在特征编码器网络的应用之后所描述的,3dan-net执行解码器网络,所述解码器网络包括各向异性的卷积块。每个各向异性的卷积块将多个3d内核应用到第二特征编码器网络的输出。简要地,3dah-net计算各向异性卷积块的输出的总和,并且将金字塔体积池化操作应用到输出各向异性卷积块的总和以产生概率图金字塔。然后,多个各向异性卷积块的输出的总和与概率图金字塔级联以产生概率图。返回到图7,在步骤730处,通过使用所述概率图,生成(a)具有非最大值抑制的对象的坐标或(b)3d体积中感兴趣的对象的标签图中的一个或多个。如以上所指出的,ah-net的输出是概率图。在诸如图7中所描绘的实施例中,本领域中一般已知的后期处理技术可以在概率图上被执行以得到具有非最大值抑制的对象的坐标,或对象的标签图,其通过使概率图阈值化。在其它实施例中,概率图可以用于得到病变存在的按体素的置信度图,其包括针对3d体积中每个体素的置信度评分,指示病变的存在或不存在。在一些实施例中,概率图被呈现为叠覆在3d体积上。例如,在一个实施例中,概率图被呈现为叠覆在3d体积上的热图。图8提供了根据本发明的一些实施例的、可以被利用来执行与本文中所讨论的算法的执行有关的计算的并行处理存储器架构800的示例。在本发明的实施例中可以使用该架构800,其中使用nvidia™cuda(或类似的并行计算平台)。所述架构包括经由总线815(例如pcie总线)连接的主机计算单元(“主机”)805以及gpu设备(“设备”)810。主机805包括中央处理单元,或“cpu”(图8中未示出),以及对于cpu可访问的主机存储器825。设备810包括图形处理单元(gpu)及其相关联的存储器820,所述相关联的存储器820在本文中被称为设备存储器。设备存储器820可以包括各种类型的存储器,其各自被优化用于不同的存储器使用。例如,在一些实施例中,设备存储器包括全局存储器、常量存储器和纹理存储器。深度学习应用的并行部分可以在架构800上被执行,作为“设备内核”或简单地“内核”。内核包括被配置成执行特定功能的参数化代码。并行计算平台被配置成基于参数、设置和用户提供的其它选择而跨架构800以最优方式执行这些内核。另外,在一些实施例中,并行计算平台可以包括附加功能性以允许以最优方式、在用户提供的最小限度输入的情况下的内核自动处理。对于每个内核所需的处理由(在以下更详细地描述的)线程块的网格来执行。通过使用并发的内核执行、流、以及与轻量事件的同步,图8的架构800(或类似的架构)可以用于并行化深度神经网络的训练。例如,在一些实施例中,3dah-net中的编码器的单独层可以在成像数据上并行地被执行。类似地,3dah-net的解码器模块可以被实现使得并行地进行各种操作。设备810包括一个或多个线程块830,所述线程块表示设备810的计算单元。术语线程块是指可以经由共享存储器协作并且同步它们的执行以协调存储器访问的线程的群组。例如,在图8中,线程840、845和850在线程块830中操作并且访问共享的存储器835。取决于所使用的并行计算平台,可以以网格结构来组织线程块。计算或计算系列于是可以被映射到该网格上。例如,在利用cuda的实施例中,计算可以被映射到一维、二维或三维网格上。每个网格包含多个线程块,并且每个线程块包含多个线程。例如,在图8中,以具有m+1行和n+1列的二维网格结构来组织线程块830。通常,相同网格的不同线程块中的线程不能与彼此通信或同步。然而,相同网格中的线程块可以同时在gpu内的相同的多处理器上运行。每个线程块中的线程的数目可以受硬件或软件约束所限制。在一些实施例中,训练数据的子集的处理或由本文中所讨论的算法所执行的操作可以由并行计算平台软件自动地在线程块上分区。然而,在其它实施例中,单独的线程块可以被选择并且配置成优化深度神经网络的训练。例如,在一个实施例中,每个线程块被指派具有近邻或重叠值的训练数据的子集。继续参考图8,寄存器855、860和865表示可用于线程块830的快速存储器。每个寄存器仅仅可由单个线程访问。因而,例如,寄存器855可以仅仅由线程840访问。相反,共享的存储器按线程块被分配,因此块中的所有线程可以访问相同的共享存储器。因而,共享的存储器835被设计成由线程块830中的每个线程840、845和850并行地访问。线程可以访问共享存储器835中的、由相同线程块(例如线程块830)内的其它线程从设备存储器820所加载的数据。设备存储器820由网格的所有块访问并且可以通过使用例如动态随机存取存储器(dram)被实现。每个线程可以具有一个或多个层级的存储器访问。例如,在图8的架构800中,每个线程可以具有三个层级的存储器访问。首先,每个线程840、845、850可以向其对应的寄存器855、860和865读取和写入。寄存器提供对线程的最快存储器访问,这是由于没有同步问题并且寄存器一般位于靠近执行线程的多处理器处。其次,线程块830中的每个线程840、845、850可以向对应于该块830的共享存储器835读取和写入数据。通常,线程访问共享存储器所需的时间超过寄存器访问所需的时间,这是由于在线程块中的所有线程之中同步访问的需要所致。然而,如同线程块中的寄存器,共享存储器典型地位于靠近执行线程的多处理器处。第三层级的存储器访问允许设备810上的所有线程向设备存储器读取和/或写入。设备存储器需要最长的访问时间,因为必须跨设备上操作的线程块来同步访问。因而,在一些实施例中,每个种子点的处理被编码使得它主要利用寄存器和共享的存储器并且仅仅在必要时利用设备存储器来将数据移进和移出线程块。本公开内容的实施例可以利用硬件和软件的任何组合被实现。例如,除了图8中所呈现的并行处理架构之外,标准计算平台(例如服务器、台式计算机等等)可以被特殊地配置以执行本文中讨论的技术。另外,本公开内容的实施例可以被包括在具有例如计算机可读、非暂时性介质的制品(例如一个或多个计算机程序产品)中。介质可已经在其中具体化了用于提供和促进本公开内容的实施例的机制的计算机可读程序代码。所述制品可以作为计算机系统的部分被包括或者被分离地出售。虽然在本文中已经公开了各种方面和实施例,但是对于本领域技术人员而言,其它方面和实施例将是显而易见的。本文中公开的各种方面和实施例用于说明的目的并且不意图是限制性的,其中真实的范围和精神由随后的权利要求指示。如本文中所使用的可执行的应用包括代码或机器可读指令,用于调节处理器以实现预定功能、诸如操作系统、上下文数据获取系统或其它信息处理系统的那些功能,例如响应于用户命令或输入。可执行过程是代码段或机器可读指令、子例程、或代码的其它不同区段、或者用于执行一个或多个特定过程的可执行应用的部分。这些过程可以包括接收输入数据和/或参数、在所接收的输入数据上执行操作和/或响应于所接收的输入参数而执行功能,以及提供结果得到的输出数据和/或参数。如本文中所使用的图形用户接口(gui)包括一个或多个显示图像,所述显示图像由显示处理器生成并且使能与处理器或其它设备的用户交互以及相关联的数据获取和处理功能。gui还包括可执行过程或可执行应用。可执行过程或可执行应用调节显示处理器以生成表示gui显示图像的信号。这些信号被供应到显示设备,所述显示设备显示图像以供用户查看。处理器,在可执行过程或可执行应用的控制下,响应于从输入设备接收的信号而操纵gui显示图像。以此方式,用户可以通过使用输入设备而与显示图像交互,从而使能与处理器或其它设备的用户交互。如本文中所使用的,术语“模块”可以是指以下中的任一个或二者:(i)使得电子设备接受各种输入并且生成某些输出的软件组件;或(ii)电子输入/输出接口,诸如面板、框架、文本框、窗口或gui的其它部分。本文中的功能和过程步骤可以自动地或者完全或部分地响应于用户命令而被执行。自动执行的活动(包括步骤)在没有用户对活动的直接发起的情况下、响应于一个或多个可执行指令或设备操作而被执行。各图的系统和过程不是排他性的。根据本发明的原理可以得到其它系统、过程和菜单以实现相同目标。尽管已经参考特定实施例描述了本发明,但是要理解到本文中所示和描述的实施例和变型仅仅用于说明目的。在不偏离本发明范围的情况下,可以由本领域技术人员实现对当前设计的修改。如本文中所述,可以通过使用硬件组件、软件组件和/或其组合来实现各种系统、子系统、代理、管理器和过程。本文中没有任何权利要求要素将在35u.s.c.112(f)的规定下被解释,除非通过使用短语“meansfor(用于……的构件)”明确地记载了该要素。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1