肝细胞癌大血管侵犯风险预测方法、系统、装置及介质与流程

文档序号:31796406发布日期:2022-10-14 17:36阅读:60来源:国知局
肝细胞癌大血管侵犯风险预测方法、系统、装置及介质与流程

1.本发明涉及计算机技术领域,尤其涉及一种肝细胞癌大血管侵犯风险预测方法、系统、装置及介质。


背景技术:

2.从临床经验看,在肝细胞癌(hepatocellular carcinoma,hcc)治疗过程中,高达30%以上的患者接受tace治疗后会发生大血管侵犯,而如果无法有效控制大血管侵犯的进展,患者的预后生存期会急剧缩短。因此,如果能提前预测大血管侵犯风险并提前采取治疗手段,能普遍提高肝细胞癌患者的预后生存期。
3.相关研究多针对已发生的微血管侵犯,即病理镜下可见的血管侵犯,但无法预测将来可能发生的大血管侵犯。
4.目前,对于hcc可能发生的大血管侵犯预测多仅运用了治疗过程中的临床指标和hcc本身的病灶信息,导致肝细胞癌大血管侵犯预测的准确性低。


技术实现要素:

5.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种肝细胞癌大血管侵犯风险预测方法、系统、装置及介质,能够提高肝细胞癌大血管侵犯风险预测的准确性。
6.一方面,本发明实施例提供了一种肝细胞癌大血管侵犯风险预测方法,包括以下步骤:
7.获取患者的临床数据和腹部ct图像;
8.对所述临床数据进行预处理得到临床指标特征;
9.将所述腹部ct图像进行第一图像特征提取处理得到目标区域特征,其中,所述目标区域特征包括肝脏特征和病灶特征;
10.将所述腹部ct图像进行第二图像特征提取处理得到组织特征;
11.将所述临床指标特征、所述目标区域特征和所述组织特征输入大血管侵犯风险预测模型得到预测结果。
12.根据本发明一些实施例,所述对所述临床数据进行预处理得到临床指标特征包括以下步骤:
13.对所述临床数据中的多个离散变量通过词嵌入方法进行编码得到多个离散变量特征;
14.对所述临床数据中的多个连续变量进行标准化处理得到多个连续变量特征;
15.融合多个所述离散变量特征和多个所述连续变量特征得到所述临床指标特征。
16.根据本发明一些实施例,所述将所述腹部ct图像进行第一图像特征提取处理得到目标区域特征包括以下步骤:
17.获取第一ct阈值和第二ct阈值,其中,所述第一ct阈值小于所述第二ct阈值;
18.根据所述第一ct阈值和所述第二ct阈值对所述腹部ct图像进行归一化处理得到标准腹部ct图像;
19.将所述腹部ct图像输入至残差网络进行特征提取得到所述目标区域特征。
20.根据本发明一些实施例,所述根据所述第一ct阈值和所述第二ct阈值对所述腹部ct图像进行归一化处理得到标准腹部ct图像包括以下步骤:
21.将所述腹部ct图像中ct值小于所述第一ct阈值的像素位设置为所述第一ct阈值;
22.将所述腹部ct图像中ct值大于所述第二ct阈值的像素位设置为所述第二ct阈值;
23.将所述腹部ct图像中ct值在所述第一ct阈值和所述第二ct阈值之间的像素位通过以下公式进行归一化:
[0024][0025]
其中,minmax(x)表示归一化后的ct值,x表示初始的ct值,a表示第一ct阈值,b表示第二ct阈值。
[0026]
根据本发明一些实施例,所述将所述腹部ct图像进行第二图像特征提取处理得到组织特征包括以下步骤:
[0027]
对所述腹部ct图像进行图像分割确定所述腹部ct图像中的肌肉区域和脂肪区域;
[0028]
根据所述肌肉区域和所述脂肪区域对所述腹部ct图像进行滤波、特征提取和特征归一化处理得到肌肉区域的组学特征和脂肪区域的组学特征;
[0029]
分别对肌肉区域的组学特征和脂肪区域的组学特征进行特征筛选得到肌肉特征和脂肪特征;
[0030]
融合所述肌肉特征和所述脂肪特征得到所述组织特征。
[0031]
根据本发明一些实施例,所述肝细胞癌大血管侵犯风险预测方法还包括以下步骤:
[0032]
将所述目标区域特征输入解码器得到病灶分割图像;
[0033]
将所述病灶分割图像反馈至所述残差网络修正所述目标区域特征。
[0034]
根据本发明一些实施例,所述连续变量特征通过以下公式计算:
[0035][0036]
其中,z表示连续变量特征,y表示连续变量,μ表示连续变量的均值,σ表示连续变量的方差。
[0037]
另一方面,本发明实施例还提供一种肝细胞癌大血管侵犯风险预测系统,包括:
[0038]
第一模块,用于获取患者的临床数据和腹部ct图像;
[0039]
第二模块,用于对所述临床数据进行预处理得到临床指标特征;
[0040]
第三模块,用于将所述腹部ct图像进行第一图像特征提取处理得到目标区域特征,其中,所述目标区域特征包括肝脏特征和病灶特征;
[0041]
第四模块,用于将所述腹部ct图像进行第二图像特征提取处理得到组织特征;
[0042]
第五模块,用于将所述临床指标特征、所述目标区域特征和所述组织特征输入大血管侵犯风险预测模型得到预测结果。
[0043]
另一方面,本发明实施例还提供一种肝细胞癌大血管侵犯风险预测装置,包括:
[0044]
至少一个处理器;
[0045]
至少一个存储器,用于存储至少一个程序;
[0046]
当所述至少一个程序被所述至少一个处理器执行,使得至少一个所述处理器实现如前面所述的肝细胞癌大血管侵犯风险预测方法。
[0047]
另一方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如前面所述的肝细胞癌大血管侵犯风险预测方法。
[0048]
本发明上述的技术方案至少具有如下优点或有益效果之一:首先获取患者的临床数据和腹部ct图像,对临床数据进行预处理得到临床指标特征,然后将腹部ct图像进行第一图像特征提取处理得到包括肝脏特征和病灶特征的目标区域特征,再将腹部ct图像进行第二图像特征提取处理得到组织特征,将临床指标特征、目标区域特征和组织特征输入大血管侵犯风险预测模型得到预测结果。由于肝细胞癌大血管侵犯的发生除了与病灶本身相关外,还与肝脏功能指标相关,本技术在提取出患者的肝脏特征后,结合能反映肝功能损伤相关情况的组织特征来进行大血管侵犯风险预测,能够提高预测的准确性。
附图说明
[0049]
图1是本发明实施例提供的肝细胞癌大血管侵犯风险预测方法流程图;
[0050]
图2是本发明实施例提供的肝细胞癌大血管侵犯风险预测系统示意图;
[0051]
图3是本发明实施例提供的肝细胞癌大血管侵犯风险预测装置示意图。
具体实施方式
[0052]
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或者类似的标号表示相同或者类似的原件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0053]
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、左、右等指示的方位或者位置关系为基于附图所示的方位或者位置关系,仅是为了便于描述本发明和简化描述,而不是指示或者暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0054]
本发明的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不能理解为指示或者暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0055]
本发明实施例提供了一种肝细胞癌大血管侵犯风险预测方法,参照图1,本发明实施例的肝细胞癌大血管侵犯风险预测方法包括但不限于步骤s100、步骤s200、步骤s200、步骤s400和步骤s500。
[0056]
步骤s100,获取患者的临床数据和腹部ct图像;
[0057]
步骤s200,对临床数据进行预处理得到临床指标特征;
[0058]
步骤s300,将腹部ct图像进行第一图像特征提取处理得到目标区域特征,其中,目标区域特征包括肝脏特征和病灶特征;
[0059]
步骤s400,将腹部ct图像进行第二图像特征提取处理得到组织特征;
[0060]
步骤s500,将临床指标特征、目标区域特征和组织特征输入大血管侵犯风险预测模型得到预测结果。
[0061]
在本实施例中,经研究表明,hcc转移和侵袭不仅受临床因素和病灶本身特性影响,还与肝硬化程度及肝功能损伤等情况相关。因此,本发明实施例提取出组织特征确定组织的异常代谢情况以反映肝功能损伤情况,在患者本身的肝脏特征和病灶特征的基础上,结合临床指标特征和组织特征利用深度学习网络进行大血管侵犯风险的预测,能够提高预测的准确性,也能减少由于患者个体肝脏差异带来的预测误差。
[0062]
在一些实施例中,大血管侵犯风险模型的输出层可以直接输出发生侵犯的概率值,使得医生可以根据该概率值判断是否采取治疗手段,以及根据概率值的大小判断严重程度,以确定对应的治疗手段。
[0063]
在一些实施例中,临床数据包括但不限于患者的肝功能分级、甲胎蛋白含量、是否乙肝病毒阳性、治疗手段、治疗药物等信息。
[0064]
根据本发明一些具体实施例,步骤s200包括但不限于以下步骤:
[0065]
步骤s210,对临床数据中的多个离散变量通过词嵌入方法进行编码得到多个离散变量特征;
[0066]
步骤s220,对临床数据中的多个连续变量进行标准化处理得到多个连续变量特征;
[0067]
步骤s230,融合多个离散变量特征和多个连续变量特征得到所述临床指标特征。
[0068]
在本实施例中,临床数据中包括多种指标信息,多种指标信息可以分为两类数据,一种是连续变量,另一种是离散变量。连续变量是可以采取连续值表示的信息,例如甲胎蛋白含量等。离散变量是只能采用整数或者自然数等离散值表示的信息,采用自然语言表述的文本数据也属于离散变量的一种,例如,肝功能分级、是否乙肝病毒阳性、治疗手段、治疗药物等。
[0069]
对于连续变量需要进行标准化处理,以实现基于深度学习网络的大血管侵犯风险预测模型对其进行准确识别。对连续变量的值进行标准化处理后得到连续变量特征,连续变量特征可以通过以下公式计算:
[0070][0071]
其中,z表示连续变量特征,y表示连续变量,μ表示连续变量的均值,σ表示连续变量的方差。示例性地,连续变量可以为甲胎蛋白含量,甲胎蛋白含量的均值和方差通过在前期计算大量的其他患者甲胎蛋白含量的均值和方差获得。
[0072]
对于离散变量需要将其转化为计算机可以识别的向量特征表示,对离散特征采取词嵌入(word embedding)方法进行特征映射是一种有效的特征编码方式,因此本发明实施例采取自然语言学习中的词嵌入方法对离散特征进行连续化处理,词嵌入方法包括但不限于word2vec、glove、fasttext等。具体地,利用提前训练好的命名实体模型分离出临床数据中的每一个离散变量,基于词嵌入方法对每一个离散变量进行特征编码,得到离散变量特征。
[0073]
然后通过一个全连接层综合得到的连续变量特征和离散变量特征,得到临床指标特征。
[0074]
根据本发明一些具体实施例,步骤s300包括但不限于以下步骤:
[0075]
步骤s310,获取第一ct阈值和第二ct阈值,其中,第一ct阈值小于第二ct阈值;
[0076]
步骤s320,根据第一ct阈值和第二ct阈值对腹部ct图像进行归一化处理得到标准腹部ct图像;
[0077]
步骤s330,将腹部ct图像输入至残差网络进行特征提取得到目标区域特征。
[0078]
在本实施例中,hu(hounsfield unit,亨氏单位)是ct值的单位。ct扫描图像的形成是x线穿透人体后发生衰减而形成。矩阵中的每个像素都可以由相应的ct值表示,所以一幅ct图像可以看作是由不同的ct值所组成。腹部ct图像中包含脂肪、气体、骨骼等多种不同密度的结构,一张腹部ct图像上的不同ct值跨度过多的hu,而肿瘤和肝脏的ct值跨度较窄,为去除病灶和肝脏之外的无关ct值影响,以提高目标区域特征提取的精度,因此通过设置第一ct阈值和第二ct阈值对腹部ct图像进行截断,使得残差网络着重针对病灶和肝脏相关的ct值进行分析,从而减少残差网络的计算复杂度,提高特征提取精度。
[0079]
具体地,步骤s320包括但不限于以下步骤:
[0080]
步骤s321,将腹部ct图像中ct值小于第一ct阈值的像素位设置为第一ct阈值;
[0081]
步骤s322,将腹部ct图像中ct值大于第二ct阈值的像素位设置为第二ct阈值;
[0082]
步骤s323,将腹部ct图像中ct值在第一ct阈值和第二ct阈值之间的像素位通过以下公式进行归一化:
[0083][0084]
其中,minmax(x)表示归一化后的ct值,x表示初始的ct值,a表示第一ct阈值,b表示第二ct阈值。
[0085]
根据本发明一些具体实施例,步骤s400包括但不限于以下步骤:
[0086]
步骤s410,对腹部ct图像进行图像分割确定腹部ct图像中的肌肉区域和脂肪区域;
[0087]
步骤s420,根据肌肉区域和脂肪区域对腹部ct图像进行滤波、特征提取和特征归一化处理得到肌肉区域的组学特征和脂肪区域的组学特征;
[0088]
步骤s430,分别对肌肉区域的组学特征和脂肪区域的组学特征进行特征筛选得到肌肉特征和脂肪特征;
[0089]
步骤s440,融合肌肉特征和脂肪特征得到组织特征。
[0090]
在本实施例中,鉴于肌肉、脂肪广泛分布于全腹,会对残差网络的特征提取造成不利影响,因此,本发明实施例可以通过经典影像组学方法提取肌肉和脂肪的组织特征。
[0091]
具体地,可以通过人工分割法、半自动分割法、自动分割等方法对腹部ct图像进行图像分割确定肌肉区域图像和脂肪区域图像。示例性地,采用半自动分割法的方式为:研究人员分别测定脂肪区域和肌肉区域的最长轴径,然后输入计算机进行自动分割。采用自动分割法的方式为:通过采集大量的腹部ct图像,然后在采集的腹部ct图像上进行图像区域和肌肉区域的标注得到样本数据,将样本数据分为训练集和测试集,将训练集输入深度学习网络并对深度学习网络进行训练,利用测试集对深度学习网络进行检验,当该深度学习网络的输出结果符合要求,则将其应用到本发明实施例中,对患者腹部ct图像进行脂肪和肌肉的自动分割。
[0092]
确定肌肉区域和腹部区域后,根据肌肉区域和腹部区域对腹部ct图像输入高斯滤波器、小波滤波器等得到平滑分割的肌肉区域图像和脂肪区域图像,然后分别对肌肉区域图像和脂肪区域图像进行特征提取得到对应的三维形状、灰度共生矩阵、灰度游程矩阵、灰度大小区域矩阵和灰度依赖矩阵等组学特征,对各种组学特征进行归一化处理后,采取logistic回归、lasso回归、主成分分析等方法进行特征筛选,以消除高度相关的特征,将筛选后的脂肪区域的组学特征和肌肉区域的组学特征作为数据流输入全连接层进行特征融合得到组织特征。
[0093]
根据本发明一些具体实施例,本发明实施的肝细胞癌大血管侵犯风险预测方法还包括以下步骤:
[0094]
步骤s600,将目标区域特征输入解码器得到病灶分割图像;
[0095]
步骤s700,将病灶分割图像反馈至残差网络修正目标区域特征。
[0096]
在本实施例中,通过解码器对目标区域图像中的肝脏特征进行解码得到病灶分割图像,然后将病灶分割图像作为正反馈数据输入值残差网络的输入端,使得网络残差模块能够加深对病灶区域的特征学习,在关注整个肝脏区域的同时更关注病灶区域,从而提高大血管侵犯风险预测模型的性能。
[0097]
根据本发明一些具体实施例,大血管侵犯风险预测模型结合注意力机制进行大血管侵犯风险预测。具体地,在大血管侵犯风险预测模型中,分别为输入的临床指标特征、目标区域特征和组织特征分配一个权重,结合每一个输入特征的权重,对输入特征进行融合,将融合后的特征输入到预测单元中得到预测结果。其中,大血管侵犯风险预测模型中各输入特征的权重以及预测单元的参数均通过前期获取的样本数据训练得到。
[0098]
另一方面,本发明实施例还提供一种肝细胞癌大血管侵犯风险预测系统,参照图2,肝细胞癌大血管侵犯风险预测系统包括:
[0099]
第一模块,用于获取患者的临床数据和腹部ct图像;
[0100]
第二模块,用于对临床数据进行预处理得到临床指标特征;
[0101]
第三模块,用于将腹部ct图像进行第一图像特征提取处理得到目标区域特征,其中,目标区域特征包括肝脏特征和病灶特征;
[0102]
第四模块,用于将腹部ct图像进行第二图像特征提取处理得到组织特征;
[0103]
第五模块,用于将临床指标特征、目标区域特征和组织特征输入大血管侵犯风险预测模型得到预测结果。
[0104]
可以理解的是,上述肝细胞癌大血管侵犯风险预测方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述肝细胞癌大血管侵犯风险预测方法实施例相同,并且达到的有益效果与上述肝细胞癌大血管侵犯风险预测方法实施例所达到的有益效果也相同。
[0105]
参照图3,图3是本发明一个实施例提供的肝细胞癌大血管侵犯风险预测装置的示意图。本发明实施例的肝细胞癌大血管侵犯风险预测装置包括一个或多个控制处理器和存储器,图3中以一个控制处理器及一个存储器为例。
[0106]
控制处理器和存储器可以通过总线或者其他方式连接,图3中以通过总线连接为例。
[0107]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非
暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于控制处理器远程设置的存储器,这些远程存储器可以通过网络连接至该肝细胞癌大血管侵犯风险预测装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0108]
本领域技术人员可以理解,图3中示出的装置结构并不构成对肝细胞癌大血管侵犯风险预测装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0109]
实现上述实施例中应用于肝细胞癌大血管侵犯风险预测装置的肝细胞癌大血管侵犯风险预测方法所需的非暂态软件程序以及指令存储在存储器中,当被控制处理器执行时,执行上述实施例中应用于肝细胞癌大血管侵犯风险预测装置的肝细胞癌大血管侵犯风险预测方法。
[0110]
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器执行,可使得上述一个或多个控制处理器执行上述方法实施例中的肝细胞癌大血管侵犯风险预测方法。
[0111]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0112]
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1