预测胰腺癌微环境中细胞表达的方法、电子设备、介质及系统

文档序号:30173489发布日期:2022-05-26 11:12阅读:213来源:国知局
预测胰腺癌微环境中细胞表达的方法、电子设备、介质及系统

1.本发明涉及医学图像处理领域,特别涉及一种预测胰腺癌微环境中细胞表达的方法、电子设备、介质及系统。


背景技术:

2.胰腺癌是一种常见的恶性肿瘤,治疗癌症的主要手段有手术、放疗、化疗和免疫治疗。患者在胰腺癌早期进行根治性手术,但大多数病例发生复发和转移。另外,胰腺癌对放疗、化疗的敏感性较差。
3.在胰腺癌的微环境是一个动态平衡的复杂系统,包括肿瘤细胞、浸润淋巴细胞、成纤维细胞、许多细胞因子和催化因子。胰腺癌微环境中不同的细胞表达影响着患者的疾病进展、预后、生存和疗效。在相关技术中,评价胰腺癌的微环境中细胞表达是依据术后的病理学标本,这种方法是侵袭性的,并且比较耗时。


技术实现要素:

4.本技术提供了一种预测胰腺癌微环境中细胞表达的方法、电子设备、介质及系统,可以无创且高效地预测胰腺癌微环境中细胞表达。
5.本技术的第一方面公开了一种预测胰腺癌微环境中细胞表达的方法,所述方法包括,获取胰腺的ct图像并标记肿块区域;提取所述肿块区域的影像组学特征,得到组学参数数据集,对于所述肿块组学参数数据集进行特征筛选,选取目标特征;获取对应于所述ct图像的细胞免疫组化染色切片,对所述细胞免疫组化染色切片进行分组,分组结果包括高表达组和低表达组;利用所述目标特征以及所述分组结果来训练xgboost分类器以获取预测模型;根据所述模型输出所述细胞表达。
6.在上述第一方面的一种可能的实现中,对于所述肿块组学参数数据集进行特征筛选包括,利用方差分析和spearman相关分析选取所述目标特征。
7.在上述第一方面的一种可能的实现中,对于所述肿块组学参数数据集进行特征筛选还包括,利用lasso回归分析选取所述目标特征。
8.在上述第一方面的一种可能的实现中,所述细胞为肿瘤浸润淋巴细胞,包括cd4+t,cd8+t和cd+20b细胞。
9.在上述第一方面的一种可能的实现中,所述细胞为成纤维细胞活化蛋白(fap)。
10.在上述第一方面的一种可能的实现中,对所述细胞免疫组化染色切片进行分组包括,对所述肿瘤浸润淋巴细胞进行评分,所述评分以生存作为预测变量,以所述cd4+t,cd8+t和cd+20b细胞的阳性表达占肿瘤内百分比作为自变量,建立cox回归模型,根据所述cox回归模型计算所述肿瘤浸润淋巴细胞评分;利用x-tile软件以生存作为结局,根据所述肿瘤浸润淋巴细胞评分将所述细胞免疫组化染色切片分为所述高表达组或所述低表达组。
11.在上述第一方面的一种可能的实现中,对所述细胞免疫组化染色切片进行分组包括,利用x-tile软件以生存作为结局,根据fap在肿瘤内百分比将所述细胞免疫组化染色切
片分为所述高表达组或所述低表达组。
12.在上述第一方面的一种可能的实现中,所述ct图像包括动脉期图像和门脉期图像,对于所述动脉期图像和所述门脉期图像均提取了1409个影像组学特征,组成所述组学参数数据集。
13.在上述第一方面的一种可能的实现中,所述方法还包括,将所述ct图像分为训练集和验证集,所述训练集用于构建所述预测模型,所述验证集用于验证所述预测模型。
14.本技术的第二方面公开了一种电子设备,所述设备包括存储有计算机可执行指令的存储器和处理器;当所述指令被所述处理器执行时,使得所述设备实施根据本技术第一方面的预测胰腺癌微环境中细胞表达的方法。
15.本技术的第三方面公开了一种计算机可读介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现本技术第一方面的所述的预测胰腺癌微环境中细胞表达的方法。
16.本技术的第四方面公开了一种预测胰腺癌微环境中细胞表达的系统,所述系统包括,采集模块,用于获取胰腺的ct图像并标记肿块区域;提取模块,提取所述肿块区域的影像组学特征,得到组学参数数据集,对于所述肿块组学参数数据集进行特征筛选,选取目标特征;分组模块,获取对应于所述ct图像的细胞免疫组化染色切片,对所述细胞免疫组化染色切片进行分组,分组结果包括高表达组和低表达组;训练模块,用于利用所述目标特征以及所述分组结果来训练xgboost分类器以获取预测模型;预测模块,用于根据所述模型输出所述细胞表达。
17.本技术的第五方面公开了一种计算机程序产品,所述计算机程序被处理器执行时实现本技术第一方面的所述的预测胰腺癌微环境中细胞表达的方法。
18.本技术提供的预测胰腺癌微环境中细胞表达的方法和装置,将对应于所述ct图像的细胞免疫组化染色切片根据高表达和低表达进行分组,并对ct图像进行影像组学特征提取以获取目标特征,根据分组结果和目标特征训练xgboost分类器以形成预测模型,利用训练好的模型可以预测胰腺ct图像中对应的微环境中的细胞表达,能够高效地筛选出对后续治疗有效的患者。
附图说明
19.图1为本技术一个实施例的预测胰腺癌中肿瘤浸润淋巴细胞表达的方法的流程示意图;
20.图2为本技术一个实施例中的预测肿瘤浸润性免疫细胞表达的方法200示意图;
21.图3a为本技术一个实施例中利用x-tile软件基于生存的患者分组和肿瘤浸润淋巴细胞截断值;
22.图3b为本技术一个实施例中的肿瘤浸润淋巴细胞评分高组和低组对应的生存差异示意图;
23.图4本技术一个实施例中胰腺癌肿瘤浸润淋巴细胞表达预测模型中的组学特征权重的条形图;
24.图5为本技术一个实施例的胰腺癌肿瘤浸润淋巴细胞表达预测模型在训练集和验证集上的roc曲线的示意图;
25.图6为本技术一个实施例的本技术的一个实施例的预测胰腺癌肿瘤浸润淋巴细胞的表达和对应影像学图像的示意图;
26.图7本技术一个实施例中胰腺癌成纤维细胞活化蛋白预测模型中的组学特征权重的条形图;
27.图8为本技术一个实施例的本技术的一个实施例的预测胰腺癌成纤维细胞活化蛋白表达和对应影像学图像的示意图;
28.图9为本技术一个实施例的的预测胰腺癌微环境中细胞表达的系统900的结构示意图;
29.图10为本技术的一个实施例的电子设备1000的框图。
具体实施方式
30.下面结合具体实施例和附图对本技术做进一步说明。可以理解的是,本公开的说明性实施例包括但不限于预测胰腺癌微环境中细胞表达的方法、电子设备、介质及系统,此处描述的具体实施例仅仅是为了解释本技术,而非对本技术的限定。此外,为了便于描述,附图中仅示出了与本技术相关的部分而非全部的结构或过程。
31.以下由特定的具体实施例说明本技术的实施方式,本领域技术人员可由本说明书所揭示的内容轻易地了解本技术的其他优点及功效。虽然本技术的描述将结合较佳实施例一起介绍,但这并不代表此发明的特征仅限于该实施方式。恰恰相反,结合实施方式作发明介绍的目的是为了覆盖基于本技术的权利要求而有可能延伸出的其它选择或改造。为了提供对本技术的深度了解,以下描述中将包含许多具体的细节。本技术也可以不使用这些细节实施。此外,为了避免混乱或模糊本技术的重点,有些具体细节将在描述中被省略。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
32.此外,各种操作将以最有助于理解说明性实施例的方式被描述为多个离散操作;然而,描述的顺序不应被解释为暗示这些操作必须依赖于顺序。特别是,这些操作不需要按呈现顺序执行。
33.除非上下文另有规定,否则术语“包含”,“具有”和“包括”是同义词。短语“a/b”表示“a或b”。短语“a和/或b”表示“(a和b)或者(a或b)”。
34.如这里所使用的,术语“模块”可以指代、是或者包括:专用集成电路(asic)、电子电路、执行一个或多个软件或固件程序的(共享、专用或组)处理器和/或存储器、组合逻辑电路和/或提供所描述的功能的其他合适的组件。
35.在一些情况下,所公开的实施例可以以硬件、固件、软件或其任何组合来实现。所公开的实施例还可以被实现为由一个或多个暂时或非暂时性机器可读(例如,计算机可读)存储介质承载或存储在其上的指令,其可以由一个或多个处理器读取和执行。例如,指令可以通过网络或通过其他计算机可读介质的途径分发。因此,机器可读介质可以包括用于以机器(例如,计算机)可读的形式存储或传输信息的任何机制、但不限于、软盘、光盘、光盘、只读存储器(cd-rom)、磁光盘、只读存储器(rom)、随机存取存储器(ram)、可擦除可编程只读存储器(eprom)、电可擦除可编程只读存储器(eeprom)、磁卡或光卡、闪存、或用于通过电、光、声或其他形式的传播信号(例如,载波、红外信号、数字信号等)通过因特网传输信息的有形的机器可读存储器。因此,机器可读介质包括适合于以机器(例如,计算机)可读的形
式存储或传输电子指令或信息的任何类型的机器可读介质。
36.在附图中,以特定布置和/或顺序示出一些结构或方法特征。然而,应该理解,可以不需要这样的特定布置和/或排序。在一些实施例中,这些特征可以以不同于说明性附图中所示的方式和/或顺序来布置。另外,在特定图中包含结构或方法特征并不意味着暗示在所有实施例中都需要这样的特征,并且在一些实施例中,可以不包括这些特征或者可以与其他特征组合。
37.应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元或是数据,但是这些单元或数据不应当受这些术语限制。使用这些术语仅仅是为了将一个特征与另一个特征进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一特征可以被称为第二特征,并且类似地第二特征可以被称为第一特征。
38.应注意的是,在本说明书中,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
39.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术的实施方式作进一步地详细描述。
40.胰腺癌是消化系统最常见的恶性肿瘤之一,通常采用手术、放疗、化疗等手段治疗。其中,虽然大约20%的患者可以进行根治性手术,但大多数病例发现时均已发现复发和转移。此外,胰腺癌对化疗和放疗的敏感性较差。因此胰腺癌5年生存率仍低于8%。胰腺癌微环境的各种成分成为寻找治疗新策略的突破,微环境的各种成分与患者的疾病进展、预后、生存和治疗具有极大的相关性。胰腺癌微环境包括肿瘤细胞、浸润淋巴细胞、成纤维细胞、许多细胞因子和催化因子。胰腺癌微环境浸润淋巴细胞的表达代表着患者的免疫状态,与患者的免疫治疗疗效显著相关,而成纤维细胞激活蛋白fap可作为胰腺癌的新的治疗靶点。
41.因此对于对胰腺癌的微环境中细胞表达进行评价,并指导胰腺癌的治疗,能够实现精准医疗、提高疗效,并且能减少医疗资源的浪费。
42.在相关技术中对于微环境中细胞表达的评估,通常依赖于术后的病理检查,即基于术后病理学标本。这种方法是有创的,而且并非所有患者都能经历手术治疗。术前的评估可以通过穿刺活检,但是由于该方法能获取的组织量极少导致评估不准确,并且会引起穿刺并发症,标本获取受操作者技术影响等因素,该方法评估的效果不佳。
43.为了解决上述问题,本技术的一个实施例提供了一种通过术前无创的的预测胰腺癌微环境中细胞表达的方法来评估微环境,以高效地筛选出对后续治疗有效的患者。
44.参考图1,方法100包括:
45.s110,获取胰腺的ct图像并标记肿块区域。
46.在影像组学技术中,利用ct可以观察胰腺肿块的大小、形态、边缘和密度,检查是否有占位性病变及周围组织的血管情况。对于确诊为胰腺癌的患者,可以对其进行手术切除,采集术前胰腺的ct图像。在一些实施方式中,胰腺癌可以通过术后病理结果确诊。
47.在一些实施方式中,获取的ct图像为ct增强图像。在增强ct扫描中,通常将造影剂静脉注入血管后,造影剂随着血液的流动流向各个器官和病灶。造影剂显影由三个时段,分别是动脉期、门脉期、和延迟期。动脉期指动脉血管充盈显影期,可以展现造影剂流入动脉
后所表现出来的特点;门脉期是指静脉血管充盈显影期,可以展现动脉期后血液经过门静脉时所表现出的特点;延迟期是在动脉期和门脉期之后所表现出的特点。注射造影剂后的动脉期时间范围在20-25秒,门脉期时间范围在60-70秒,延迟期时间范围在110-130秒。
48.s120,提取所述肿块区域的影像组学特征,得到组学参数数据集,对于所述肿块组学参数数据集进行特征筛选,选取目标特征。
49.影像组学特征包括原始特征和滤波类特征。滤波类特征基于6类滤波器,滤波类特征包括拉普拉斯高斯滤波(laplacian of gaussian)、小波分析(wavelet)、平方值(square)、平方根(square root)、对数(logarithm)特征和指数(exponential)特征。每一类特征值所包括的具体特征有一阶统计量(first order)、形状特征(shape)、纹理特征。
50.s130,获取对应于所述ct图像的细胞免疫组化染色切片,对所述细胞免疫组化染色切片进行分组,分组结果包括高表达组和低表达组。
51.如前所述,对于确诊为胰腺癌并已进行手术切除的患者,采集患者术前胰腺的ct图像,并获取术后的对应的细胞免疫组化染色切片,由扫描仪将每个免疫组化染色切片转换为数字病理图像。在划定肿瘤边界之后,可使用数字病理分析平台对切片中的某些细胞进行定量分析。根据细胞的量化结果将对应的细胞免疫组化染色切片进行分组。分组结果可以分为高表达组和低表达组。
52.s140,利用所述目标特征以及所述分组结果来训练xgboost分类器以获取预测模型。
53.xgboost(extreme gradient boosting)极度梯度提升,是一种基于gbdt(gradient boosting decision tree,梯度提升决策树)的算法。xgboost的一个应用就是进行数据特征挖掘分析。
54.将筛选出的目标特征输入至xgboost分类器进行训练和筛选,获取最相关的组学特征,形成预测模型。
55.s150,根据所述预测模型输出所述细胞表达。
56.利用建立好的预测模型,可以将胰腺ct图像输入至模型直接获取与该胰腺ct图像对应的微环境中的细胞表达,模型输出该ct图像对应的高表达或低表达的结果。在一些实施方式中,模型输出的结果为高表达的概率或为低表达的概率。
57.图1中的预测胰腺癌微环境中细胞表达的方法针对对应于ct图像的细胞免疫组化染色切片,根据高表达和低表达进行分组;并对ct图像进行影像组学特征提取以获取目标特征,根据分组结果和目标特征训练xgboost分类器以获取与微环境中某种成分最相关的影像组学特征,形成预测模型。利用训练好的模型可以预测胰腺ct图像中对应的微环境中的细胞表达。图1的方法利用影像组学来预测微环境,即通过术前无创的的预测胰腺癌微环境中细胞表达的方法来评估微环境,能够高效地筛选出对后续治疗有效的患者。
58.在一些实施方式中,ct图像包括动脉期图像和门脉期图像,对于每个患者,从动脉期图像和门脉期图像均提取了1409个影像组学特征,组成组学参数数据集。
59.在一些实施方式中,对于肿块组学参数数据集进行特征筛选包括,利用方差分析和spearman相关分析选取目标特征。在一些实施方式中,对于肿块组学参数数据集进行特征筛选还包括,利用lasso(least absolute shrinkage and selection operator,最小绝对收缩和选择算子)回归分析选取目标特征。
60.在一些实施方式中,图1中方法可应用于预测胰腺癌微环境中肿瘤浸润淋巴细胞的表达。肿瘤浸润淋巴细胞,包括cd4+t,cd8+t和cd+20b细胞。和预测单个肿瘤浸润淋巴细胞相比,考虑cd4+t,cd8+t和cd+20b这三种细胞,能够提高预测准确性。在一些示例中,对细胞免疫组化染色切片进行分组包括,对肿瘤浸润淋巴细胞进行评分,该评分以生存作为预测变量,以cd4+t,cd8+t和cd+20b细胞的阳性表达占肿瘤内百分比作为自变量,建立cox回归模型,根据所述cox回归模型计算所述肿瘤浸润淋巴细胞评分。再利用x-tile软件以生存作为结局,根据肿瘤浸润淋巴细胞评分将上述细胞免疫组化染色切片分为高表达组或低表达组。
61.cox回归模型,又称cox比例风险模型(cox proportional-hazards model)是一种半参数回归模型,同时研究多个风险因素和事件结局发生情况、发生时间的关系,cox回归模型同时评估几个因素对生存的影响,可以克服简单生存分析中单因素限制的不足。
62.在一些实施方式中,图1中方法可应用于预测胰腺癌微环境中纤维细胞活化蛋白fap的表达。在一些示例中,对细胞免疫组化染色切片进行分组包括,利用x-tile软件以生存作为结局,根据fap在肿瘤内百分比将细胞免疫组化染色切片分为高表达组或低表达组。
63.在一些实施方式中,可以采用训练集和验证集来验证所构建的模型的准确性。例如,对于来自不同患者的胰腺增强图像,可以按照图像的采集时间将其分为两组,即训练集和验证集。其中,训练集用于构建模型,验证集用于验证模型。
64.为了更好地说明图1中的方法100,本技术提供了两个示例i和ii。
65.示例i
66.目前,癌症免疫治疗在治疗许多恶性肿瘤方面具有显著的疗效,然而只有部分晚期实体瘤患者对免疫疗法有反应。肿瘤浸润性免疫细胞在癌症免疫治疗中发挥着重要作用,通过影像组学来预测胰腺癌微环境中的肿瘤浸润性免疫细胞表达能够高效地指导后续治疗。示例i提供了一种利用影像组学预测胰腺癌免疫环境中肿瘤浸润性免疫细胞表达的方法。图2示出了示例i中的预测肿瘤浸润性免疫细胞表达的方法200示意图。
67.s210,获取多个胰腺ct图像,并标记肿块区域。
68.在示例i中,收集了183个胰腺的ct图像样本。这些样本均为患者在术前采集,并且这些患者在术后均通过病理学确诊为胰腺癌。
69.s220,获取对应于所述ct图像的细胞免疫组化染色切片,建立肿瘤浸润淋巴细胞评分,根据所述淋巴肿瘤浸润淋巴细胞评分对所述细胞免疫组化染色切片进行分组。
70.cd4+t,cd8+t,cd+20b细胞是组成胰腺癌微环境最主要的免疫细胞。示例i中对这三个免疫细胞综合建立分值。在其它实施方式中,也可以对胰腺癌微环境中的单独的某个免疫细胞建立分值。通过病理学软件对cd4+t,cd8+t,cd+20b淋巴细胞进行量化,根据cd4+t,cd8+t,cd+20b淋巴细胞的面积比例,以患者生存作为结局,建立cox回归模型,再根据模型计算肿瘤浸润淋巴细胞评分。
71.表1示出了示例i中利用回归公式计算淋巴肿瘤浸润淋巴细胞评分的示例。
72.表1 cox回归分析肿瘤浸润淋巴细胞
[0073][0074]
肿瘤浸润淋巴细胞评分=0.0024
×
cd4+0.0269
×
cd8+0.0139
×
cd20
[0075]
图3a示出了示例i中183个胰腺的ct图像样本对应的患者的tils(tumor infiltrating lymphocyte score,肿瘤浸润淋巴细胞评分)分布。可以利用x-tile软件确定最佳tils截止值(0.73),可以根据截止值将患者分为tils高组和tils低组。图3b示出了tils高组和tils低组的生存差异示意图。图3b表明tils高组和tils低组的生存存在显著差异,p《0.0001。
[0076]
s230,提取所述肿块区域的影像组学特征,得到组学参数数据集,对于所述肿块组学参数数据集进行特征筛选,选取目标特征。
[0077]
对每个肿瘤区域进行动脉期和门脉期影像组学特征提取,包括一阶统计量、形状特征、灰度共生矩阵(glcm)特征、灰度依赖矩阵(gldm)特征、灰度行程长度矩阵(glrlm)特征、灰度尺度区域矩阵(glszm)特征和邻域灰度区域差分矩阵(ngtdm)特征,每种特征包含各种描述和统计值,每个病人每一期均提取了1409个组学特征,组成组学参数数据集。
[0078]
对胰腺肿瘤提取的组学特征采用方差分析、spearman相关性分析进行降维以筛选特征,排除组间无明显差异或与tils评分表达无明显关联的影像组学特征。从中选择了25个动脉期影像组学特征和12个门静脉期影像组学特征。
[0079]
s240,训练xgboost分类器以获取预测模型。
[0080]
利用xgboost分类器进行训练和进一步筛选,获得13个动脉期组学特征和7个门脉期组学特征,共计20个组学特征组成预测模型。
[0081]
图4列出了上述20个组学特征权重的条形图。图3中各特征的表达形式中a_b_c中,a代表特征所属的类别。其中,在小波滤波中,小波滤波可以由各维度的高通(h)和低通(l)滤波组合组成,包括wavelet-llh、wavelet-lhl、wavelet-lhh、wavelet-hll、wavelet-hlh、wavelet-hhl、wavelet-lll和wavelet-hhh。一阶统计量firstorder,包括minimum-roi中的灰度值的最小值、mean-roi内的中位灰度强度、maximum-roi内的最大灰度强度、skewness、interquartile range、median、total energy、10percentile、90percentile、root mean squared等;glcm(grey-level co-occurrence matrix)为灰度共生矩阵,表示的是灰度图像中某种形状的像素对,在全图中出现的次数,其中包括特征clustershade、imc1、imc2、correlation等。glszm(gray-level size zone matrix)为灰度尺度区域矩阵,保存了图像中所有灰阶的连通域大小和个数信息,其衡量的是图像中2d/3d连通域的大小和数目。
[0082]
s250,根据所述预测模型输出所述细胞表达。
[0083]
可以将ct图像输入至预测模型,模型输出该ct图像对应的高表达或低表达的结果,在一些实施方式中,模型输出的结果为高表达的概率或为低表达的概率。
[0084]
在一些实施方式中,可以采用训练集和验证集来验证所构建的模型的准确性。例如,在示例i中可以按照图像的采集时间将其分为两组,即训练集(136个)和验证集(47个)。
其中,训练集用于构建模型,验证集用于验证模型。在训练集中tils高组的数量和tils低组的数量分别为76和60。在验证集中tils高组的数量和tils低组的数量分别为24和23。
[0085]
图5示出了利用建好的预测模型在训练集和验证集上的roc曲线(receiver operating characteristic curve,受试者工作特征曲线)。
[0086]
roc曲线又称为感受性曲线(sensitivity curve)。曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应。roc曲线下面积(the area under the roc curve,auc)是指roc曲线与x轴、(1,0)-(1,1)围绕的面积。一般地,只要auc大于0.5,就证明该诊断试验具有一定的诊断价值。同时,auc越接近1,离(0,1)点越近,证明诊断试验的真实性越好。图5表明模型在训练集和验证集上的auc分别为0.93和0.79,说明预测模型的预测效果较佳。
[0087]
图6示出了使用示例i中建立的模型,预测胰腺癌肿瘤浸润淋巴细胞的表达的实例。图6a示出了患者m的横断面动脉期胰腺增强图像,其中可见胰头部一枚边界欠清的低密度肿块影(框线已标出)。利用示例i中的预测模型,可得该患者的胰腺癌肿瘤浸润淋巴细胞cd4,cd8和cd20的高表达概率为21%。图6b-d示出了患者m的d4,cd8和cd20染色免疫组化切片,可见视野内少量肿瘤浸润淋巴细胞浸润(
×
20)。图6e示出了患者n的横断面动脉期胰腺增强图像,其中可见胰头部一枚边界欠清的低密度肿块影(框线已标出)。利用示例i中的预测模型,可得该患者的胰腺癌肿瘤浸润淋巴细胞cd4,cd8和cd20的高表达概率为91.91%。图6f-h示出了患者n的d4,cd8和cd20染色免疫组化切片,可见视野内大量肿瘤浸润淋巴细胞浸润(
×
20)。图6的实例表明示例i中的预测模型可以利用影像组学很好地预测微环境中肿瘤浸润淋巴细胞的表达。
[0088]
示例ii
[0089]
在肿瘤微环境中,成纤维活化蛋白(fibroblast activation protein,fap)可在癌症相关纤维中选择性表达,fap在超过90%的上皮癌中选择性表达,但在健康组织中表达水平极低,fap的表达代表癌症相关纤维的水平。fap可直接促进成纤维细胞和其它类型的细胞(包括肿瘤细胞、内皮细胞和免疫细胞)的增殖和迁移,导致肿瘤侵袭性、细胞外基质降解、肿瘤血管生成和免疫监测的逃逸。因此fap可以被作为肿瘤治疗的靶点。因此,寻找一种新的治疗靶点成为提高胰腺癌患者疗效和预后的新策略。
[0090]
示例ii提供了一种利用影像组学预测胰腺癌环境中fap表达的方法600。
[0091]
方法600中的s610-s650和方法200中的s210-s250大致相同,以下仅论述两者的不同之处。在s610中,收集152个胰腺的ct图像样本。这些样本均为患者在术前采集,并且这些患者在术后均通过病理学确诊为胰腺癌。
[0092]
在s620中,获取所有患者的术后fap免疫组化染色切片,量化其表达,然后根据表达对胰腺癌患者进行分组。
[0093]
在s630中,对每个肿瘤区域进行门脉期影像组学特征提取,组成组学参数数据集。对胰腺肿瘤提取的组学特征采用方差分析、spearman相关性分析、和lasso回归进行降维以筛选特征,排除组间无明显差异或与评分表达无明显关联的影像组学特征。从中选择了17个门静脉期影像组学特征。
[0094]
在s640中,利用xgboost分类器进行训练和进一步筛选,获得13个门脉期组学特征,这些特征权重的条形图参见图7。
[0095]
在s650,根据所述模型输出所述细胞表达。在一些实施方式中,可以采用训练集和验证集来验证所构建的模型的准确性。例如,在示例ii中可以按照图像的采集时间将其分为两组,即训练集(94个)和验证集(58个)。其中,训练集用于构建模型,验证集用于验证模型。在训练集中tils高组的数量和tils低组的数量分别为36和58。在验证集中高组的数量和低组的数量分别为25和33。
[0096]
根据建好的预测模型在训练集和验证集上的roc曲线,模型在训练集和验证集上的auc分别为0.97和0.75,说明预测模型的预测效果较佳。
[0097]
图8示出了使用示例ii中建立的模型,预测fap表达的实例。图8a示出了患者x的横断面门脉期胰腺增强图像,其中可见胰体尾部可见一枚边界欠清的低密度肿块影(白色箭头处)。利用示例ii中的预测模型,可得该患者的fap低表达概率为73.66%。图8b示出了患者fap染色免疫组化切片量化图片,肿瘤区域内可见fap少量表达(
×
1)。图8c示出了患者y的横断面门脉期胰腺增强图像,其中可见胰体尾部一枚边界欠清的低密度肿块影(白色箭头处)。利用示例ii中的预测模型,可得该患者的fap高表达概率为96.83%。图8d示出了患者y的fap染色免疫组化切片量化图片,肿瘤区域内可见fap大量表达(
×
1)。图8的实例表明示例ii中的预测模型可以利用影像组学很好地预测微环境中fap表达。
[0098]
现在参考图9,图9示出了本技术的一个实施例的预测胰腺癌微环境中细胞表达的系统的结构示意图。预测胰腺癌微环境中细胞表达的系统900包括以下模块。
[0099]
采集模块910,用于获取胰腺的ct图像并标记肿块区域;
[0100]
提取模块920,用于提取所述肿块区域的影像组学特征,得到组学参数数据集,对于所述肿块组学参数数据集进行特征筛选,选取目标特征;
[0101]
分组模块930,用于获取对应于所述ct图像的细胞免疫组化染色切片,对所述细胞免疫组化染色切片进行分组,分组结果包括高表达组和低表达组;
[0102]
训练模块940,用于利用所述目标特征以及所述分组结果来训练xgboost分类器以获取预测模型;
[0103]
预测模块950,用于根据所述模型输出所述细胞表达。
[0104]
图9中的预测胰腺癌微环境中细胞表达的系统针对对应于ct图像的细胞免疫组化染色切片,根据高表达和低表达进行分组;并对ct图像进行影像组学特征提取以获取目标特征,根据分组结果和目标特征训练xgboost分类器以获取与微环境中某种成分最相关的影像组学特征,形成预测模型。利用训练好的模型可以预测胰腺ct图像中对应的微环境中的细胞表达。图9的系统利用影像组学来预测微环境,即通过术前无创的的预测胰腺癌微环境中细胞表达的方法来评估微环境,能够高效地筛选出对后续治疗有效的患者。
[0105]
现在参考图10,所示为根据本技术的一个实施例的电子设备1000的框图。电子设备1000可以包括一个或多个处理器1002,与处理器1002中的至少一个连接的系统控制逻辑1008,与系统控制逻辑1008连接的系统内存1004,与系统控制逻辑1008连接的非易失性存储器(nvm)1006,以及与系统控制逻辑1008连接的网络接口1010。
[0106]
处理器1002可以包括一个或多个单核或多核处理器。处理器1002可以包括通用处理器和专用处理器(例如,图形处理器,应用处理器,基带处理器等)的任何组合。在本文的实施例中,处理器1002可以被配置为执行根据如图1所示的各种实施例的一个或多个实施例。
[0107]
在一些实施例中,系统控制逻辑1008可以包括任意合适的接口控制器,以向处理器1002中的至少一个和/或与系统控制逻辑1008通信的任意合适的设备或组件提供任意合适的接口。
[0108]
在一些实施例中,系统控制逻辑1008可以包括一个或多个存储器控制器,以提供连接到系统内存1004的接口。系统内存1004可以用于加载以及存储数据和/或指令。在一些实施例中设备1000的内存1004可以包括任意合适的易失性存储器,例如合适的动态随机存取存储器(dram)。
[0109]
nvm/存储器1006可以包括用于存储数据和/或指令的一个或多个有形的、非暂时性的计算机可读介质。在一些实施例中,nvm/存储器1006可以包括闪存等任意合适的非易失性存储器和/或任意合适的非易失性存储设备,例如hdd(hard disk drive,硬盘驱动器),cd(compact disc,光盘)驱动器,dvd(digital versatile disc,数字通用光盘)驱动器中的至少一个。
[0110]
nvm/存储器1006可以包括安装在设备1000的装置上的一部分存储资源,或者它可以由设备访问,但不一定是设备的一部分。例如,可以经由网络接口910通过网络访问nvm/存储1006。
[0111]
特别地,系统内存1004和nvm/存储器1006可以分别包括:指令1020的暂时副本和永久副本。指令920可以包括:由处理器1002中的至少一个执行时导致设备1000实施如图1所示的方法的指令。在一些实施例中,指令1020、硬件、固件和/或其软件组件可另外地/替代地置于系统控制逻辑1008,网络接口1010和/或处理器1002中。
[0112]
网络接口1010可以包括收发器,用于为设备1000提供无线电接口,进而通过一个或多个网络与任意其他合适的设备(如前端模块,天线等)进行通信。在一些实施例中,网络接口1010可以集成于设备1000的其他组件。例如,网络接口1010可以集成于处理器1002的,系统内存1004,nvm/存储器1006,和具有指令的固件设备(未示出)中的至少一种,当处理器1002中的至少一个执行所述指令时,设备1000实现图1所示的各种实施例的一个或多个实施例。
[0113]
网络接口1010可以进一步包括任意合适的硬件和/或固件,以提供多输入多输出无线电接口。例如,网络接口1010可以是网络适配器,无线网络适配器,电话调制解调器和/或无线调制解调器。
[0114]
在一个实施例中,处理器1002中的至少一个可以与用于系统控制逻辑1008的一个或多个控制器的逻辑封装在一起,以形成系统封装(sip)。在一个实施例中,处理器1002中的至少一个可以与用于系统控制逻辑1008的一个或多个控制器的逻辑集成在同一管芯上,以形成片上系统(soc)。
[0115]
设备1000可以进一步包括:输入/输出(i/o)设备1012。i/o设备1012可以包括用户界面,使得用户能够与设备1000进行交互;外围组件接口的设计使得外围组件也能够与设备1000交互。
[0116]
在一些实施例中,用户界面可包括但不限于显示器(例如,液晶显示器,触摸屏显示器等),扬声器,麦克风,一个或多个相机(例如,静止图像照相机和/或摄像机),手电筒(例如,发光二极管闪光灯)和键盘。
[0117]
在一些实施例中,外围组件接口可以包括但不限于非易失性存储器端口、音频插
孔和电源接口。
[0118]
本技术的各方法实施方式均可以以软件、磁件、固件等方式实现。
[0119]
可将程序代码应用于输入指令,以执行本文描述的各功能并生成输出信息。可以按已知方式将输出信息应用于一个或多个输出设备。为了本技术的目的,处理系统包括具有诸如例如数字信号处理器(dsp)、微控制器、专用集成电路(asic)或微处理器之类的处理器的任何系统。
[0120]
程序代码可以用高级程序化语言或面向对象的编程语言来实现,以便与处理系统通信。在需要时,也可用汇编语言或机器语言来实现程序代码。事实上,本文中描述的机制不限于任何特定编程语言的范围。在任一情形下,该语言可以是编译语言或解释语言。
[0121]
至少一个实施例的一个或多个方面可以由存储在计算机可读存储介质上的表示性指令来实现,指令表示处理器中的各种逻辑,指令在被机器读取时使得该机器制作用于执行本文所述的技术的逻辑。被称为“ip核”的这些表示可以被存储在有形的计算机可读存储介质上,并被提供给多个客户或生产设施以加载到实际制造该逻辑或处理器的制造机器中。
[0122]
本技术的一个实施例公开了一种计算机可读介质,存储有可被一个或者多个处理器执行的一个或者多个程序,以实现本技术的的预测胰腺癌微环境中细胞表达的方法。
[0123]
本技术的一个实施例公开了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本技术的的预测胰腺癌微环境中细胞表达的方法。
[0124]
虽然通过参照本发明的某些优选实施例,已经对本发明进行了图示和描述,但本领域的普通技术人员应该明白,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1