1.本发明属于生物医药技术领域,具体涉及小分子标志物相关的产品在诊断疾病中的用途,更具体地,本发明涉及小分子标志物相关的产品在诊断子宫内膜癌中的用途。
背景技术:2.超过90%的子宫癌是子宫内膜癌(endometrial carcinoma,ec),起源于上皮,其余大多数子宫癌是间充质癌,起源于子宫肌层,少数是子宫内膜间质癌约占女性所有癌症的7%,女性罹患子宫内膜癌的终生风险为2.5%。ec是女性生殖系统常见的三大恶性肿瘤之一,占女性生殖系统恶性肿瘤的20%
‑
30%,近年来,在世界范围内,子宫内膜癌的发病率均呈现出明显上升的趋势,且逐渐趋于年轻化。ec作为女性生殖系统发病率较高的恶性肿瘤,多见于绝经后的女性,其主要危险因素是存在过多内源性或外源性雌激素而没有足够孕激素拮抗的临床情况。
3.为了提高ec患者的生存质量及改善患者的预后,早发现、早诊断、早治疗显得尤其重要。目前,尚没有筛查方法,只有在表现出临床症状如阴道出血、阴道排液和下腹疼痛时有妇科医生指导下进行临床诊断,针对子宫内膜癌的主要诊断手段分为影像学检查和子宫内膜活检和实验室诊断:
4.1、影像学检查
5.主要用于初步判断,经阴道超声检查为最常用的无创检查方法。当子宫内膜厚度大于5mm时,需要进行子宫内膜活检。腹盆腔磁共振(mri)检查是影像学检查中比较常用的,可以与黏膜下子宫肌瘤、子宫内膜息肉、子宫肉瘤、宫颈癌等鉴别。缺点是有些患者不宜磁共振检查,属于禁忌症和相对禁忌症。
6.2、子宫内膜活检
7.子宫内膜活检是子宫内膜癌的确诊方式,主要分为分段诊刮和宫腔镜下定位活检。分段诊刮是先刮取宫颈管的组织,再刮宫体部,将刮出物分别送检。明确病变的性质、部位、累及程度。缺点是容易造成假阳性,且手术过程中会牵拉子宫,有可能造成术后腹痛,需要好消炎治疗以预防感染。
8.3、实验室诊断方法
9.目前最常用的临床检测标记物是糖链抗原ca125、人附睾蛋白4(he4),其中,血清ca125对于有子宫外病变的患者,ca125有助于监测临床治疗效果,但是对于腹膜炎症或者放射损伤的患者,ca125可能会异常升高,而阴道孤立转移的患者ca125并不升高,因此在缺乏其他临床发现的时候不能预测复发,此外,ca125、he4的灵敏度均较低,不易有效地筛检病人。
10.因此,寻找一种方便、无创伤性、不需活检、灵敏性和特异性高的血清分析检测方法对提高ec患者的生存质量及改善患者的预后是十分必要的。
技术实现要素:11.本发明的目的在于:针对现有技术存在的不足,提供小分子标志物相关的产品及其在诊断子宫内膜癌中的应用,以便早期、准确、快速、无创性地判断受试者是否为子宫内膜癌患者或是否有较高的子宫内膜癌患病的风险。
12.为了实现上述目的,本发明采用了如下技术方案:
13.一方面,本发明提供了检测样本中生物标志物的试剂在制备诊断子宫内膜癌的产品中的应用。
14.进一步,所述生物标志物为marcksl1和rps4x。
15.进一步,所述检测样本中生物标志物的试剂包括检测样本中生物标志物的mrna表达水平的试剂、检测样本中生物标志物的蛋白表达水平的试剂。
16.进一步,所述试剂选自:特异性扩增所述生物标志物的引物、特异性识别所述生物标志物的探针、特异性结合所述生物标志物编码的蛋白的结合剂;
17.优选地,所述结合剂包括特异性结合所述生物标志物编码的蛋白的抗体、抗体功能片段、偶联抗体。
18.另一方面,本发明提供了一种用于诊断子宫内膜癌的产品。
19.进一步,所述产品包括检测生物标志物marcksl1和rps4x的试剂。
20.进一步,所述检测生物标志物marcksl1和rps4x的试剂选自:特异性扩增所述生物标志物marcksl1和rps4x的引物、特异性识别所述生物标志物marcksl1和rps4x的探针、特异性结合所述生物标志物marcksl1和rps4x编码的蛋白的结合剂;
21.优选地,所述结合剂包括特异性结合所述生物标志物marcksl1和rps4x编码的蛋白的抗体、抗体功能片段、偶联抗体。
22.进一步,所述产品包括试剂盒、芯片、试纸、高通量测序平台;
23.优选地,所述试剂盒包括qpcr试剂盒、elisa试剂盒、免疫印迹检测试剂盒、流式细胞分析试剂盒、免疫组化检测试剂盒、免疫层析检测试剂盒、电化学发光检测试剂盒。
24.另一方面,本发明提供了检测样本中生物标志物的试剂在制备子宫内膜癌诊断系统中的应用。
25.进一步,所述生物标志物为marcksl1和rps4x。
26.进一步,所述检测样本中生物标志物的试剂包括检测样本中生物标志物的mrna表达水平的试剂、检测样本中生物标志物的蛋白表达水平的试剂;
27.优选地,所述试剂选自:特异性扩增所述生物标志物的引物、特异性识别所述生物标志物的探针、特异性结合所述生物标志物编码的蛋白的结合剂;
28.更优选地,所述结合剂包括特异性结合所述生物标志物编码的蛋白的抗体、抗体功能片段、偶联抗体。
29.另一方面,本发明提供了一种子宫内膜癌的诊断系统。
30.进一步,所述诊断系统包含:
31.检测构件:所述检测构件用于检测所述生物标志物marcksl1和rps4x的表达水平;
32.结果判断构件:所述结果判断构件用于根据所述检测构件检测得到的所述生物标志物marcksl1和rps4x的表达水平的结果,输入受试者是否患有子宫内膜癌或患子宫内膜癌的风险;
33.优选地,所述生物标志物marcksl1和rps4x的表达水平包括所述生物标志物marcksl1和rps4x的mrna表达水平、所述生物标志物marcksl1和rps4x的蛋白表达水平。
34.进一步,所述检测构件包括qpcr试剂盒、elisa试剂盒、免疫印迹检测试剂盒、流式细胞分析试剂盒、免疫组化检测试剂盒、免疫层析检测试剂盒、电化学发光检测试剂盒、qpcr仪、elisa检测装置、免疫印迹检测装置、流式细胞分析装置、免疫组化检测装置、免疫层析检测装置、电化学发光检测装置;
35.所述结果判断构件含有输入模块、分析模块和输出模块;输入模块用于输入所述生物标志物marcksl1和rps4x的表达水平;分析模块用于根据所述生物标志物marcksl1和rps4x的表达水平,分析出受试者是否患有子宫内膜癌或患子宫内膜癌的风险;输出模块用于输出分析模块的分析结果。
36.本发明还提供了一种诊断子宫内膜癌的方法。
37.进一步,所述方法包括如下步骤:
38.(1)获取受试者的样本;
39.(2)检测受试者样本中所述的生物标志物marcksl1和rps4x的表达水平;
40.(3)将测得的所述生物标志物marcksl1和rps4x的表达水平与受试者的患病与否或患病风险进行关联;
41.(4)若与正常对照相比,所述生物标志物marcksl1的表达水平升高,所述生物标志物rps4x的表达水平降低,则该受试者被判断为具有患有子宫内膜癌的倾向、或者已经患有子宫内膜癌,或者子宫内膜癌被判断为复发、或者子宫内膜癌患者被判断为预后不良。
42.本发明中所述的用于诊断子宫内膜癌的产品或子宫内膜癌的诊断系统所针对的受试者的样本为体液、组织或排泄物。
43.进一步,所述排泄物包括痰液、唾液、尿液或粪便;
44.进一步,所述体液包括血液、细胞外液、组织液、淋巴液、脑脊液或房水;
45.进一步,所述体液为血液;
46.进一步,所述受试者的样本为血液。
47.本发明中所述的产品中包括的引物可以通过化学合成来制备,通过使用本领域技术人员熟知的方法参考已知信息来适当地设计,并通过化学合成来制备。本发明中所述的产品或诊断系统中的抗体,可以使用任何结构、尺寸、免疫球蛋白类别、起源等的抗体或其片段,只要它结合靶蛋白质即可。本发明的产品中包括的抗体或其片段可以是单克隆的或多克隆的。抗体片段指保留抗体对抗原的结合活性的抗体一部分或含有抗体一部分的肽。抗体片段可以包括f(ab
′
)2、fab
′
、fab、单链fv(scfv)、二硫化物键合的fv(dsfv)或其聚合物、二聚化v区(双抗体)、或含有cdr的肽。抗体可以通过本领域技术人员公知的方法来获得。例如,制备保留整个或部分靶蛋白质的多肽或整合编码它们的多核苷酸的哺乳动物细胞表达载体作为抗原。使用抗原免疫动物后,从经过免疫的动物获得免疫细胞并融合骨髓瘤细胞以获得杂交瘤。然后从杂交瘤培养物收集抗体。最后可以通过使用被用作抗原的标志物蛋白或其部分对获得的抗体实施抗原特异性纯化来获得针对标志物蛋白的单克隆抗体。
48.在本发明的上下文中,“子宫内膜癌的诊断”包括判断受试者是否患有子宫内膜癌、判断受试者患有子宫内膜癌的风险、判断子宫内膜癌患者是否已经复发、判断子宫内膜
癌患者的预后。
49.本发明中所述的生物标志物marcksl1和rps4x在ncbi中的gene id分别如下:
50.marcksl1(marcks like 1)在ncbi中的gene id为65108;
51.rps4x(ribosomal protein s4 x
‑
linked)在ncbi中的gene id为6191。
附图说明
52.以下,结合附图来详细说明本发明的实施方案,其中:
53.图1是基因在训练集中的表达情况图,其中,a图:marcksl1,b图:rps4x;
54.图2是基因在验证集中的表达情况图,其中,a图:marcksl1,b图:rps4x;
55.图3是基因在训练集中的roc曲线图,其中,a图:marcksl1,b图:rps4x,c图:marcksl1+rps4x;
56.图4是基因在验证集中的roc曲线图,其中,a图:marcksl1,b图:rps4x,c图:marcksl1+rps4x。
具体实施方式
57.本发明为了筛选可用于子宫内膜癌诊断的生物标志物,通过下载geo数据库和tcga数据库中与子宫内膜癌相关的样本数据,综合分析样本的基因表达谱,筛选在训练集的两个群组中呈现显著性差异表达的基因,并进一步分析所述差异表达的基因在验证集中的表达情况与诊断效能,从而发现适用于子宫内膜癌诊断的生物标志物。
58.在本发明上下文中,所使用的术语“生物标志物”是指化合物,优选为基因,与来自具有第二表型(例如没有疾病)的受试者或一组受试者的生物样品相比,它在来自具有第一表型(例如患有疾病)的受试者或一组受试者的生物样品中差异地存在(即增加或减少)。该术语通常是指一种基因的存在/浓度/含量或两种或更种基因的存在/浓度/含量,在本发明的具体实施例中,所述生物标志物为marcksl1和rps4x;
59.生物标志物可以在任何水平上差异地存在,但是一般以如下的水平存在,所述水平增加了至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%、或更多;或一般以如下的水平存在,所述水平减少了至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、或100%(即不存在),优选地,所述生物标志物以具有统计显著性(p﹤0.05)。
60.在本发明的上下文中,所使用的术语“样本”,是指获得自或衍生自受试者(例如感兴趣的个体)的组合物,其包含有待根据例如物理,生化,化学和/或生理特点来表征和/或鉴定的细胞和/或其它分子实体。例如,样本是指来源于感兴趣的受试者的任何样本,预计或已知其包含待表征的细胞和/或分子实体。样本包括但不限于,组织样本(例如肿瘤组织样本),原代或培养的细胞或细胞系、细胞上清、细胞裂解物、血小板、血清、血浆、玻璃体液、淋巴液、滑液、滤泡液、精液、羊水、乳液、全血、血液衍生的细胞、尿液、脑脊髓液、唾液、痰液、泪液、汗液、粘液、肿瘤裂解物、组织培养液、组织提取物、匀浆化的组织、肿瘤组织、细胞
提取物、及其组合。作为优选的实施方式,所述样本选自血液、血清、血浆,作为另一优选的实施方式,所述样本选自组织。
61.在本发明的上下文中,所使用的术语“受试者”,是指任何动物,还指人类和非人类的动物。非人类的动物包括所有脊椎动物,例如,哺乳动物,如非人灵长类动物(特别是高等灵长类动物)、绵羊、狗、啮齿类动物(如小鼠或大鼠)、豚鼠、山羊、猪、猫、兔、牛、和任何家畜或宠物;以及非哺乳动物,如鸡,两栖类,爬行动物等。在优选的实施方式中,所述受试者为人。
62.本发明提供了一种用于诊断子宫内膜癌的产品,所述产品中包含检测样本中本发明所述的生物标志物的试剂,并且可包含使用所述试剂盒判断受试者是否患有子宫内膜癌或患有子宫内膜癌的风险的说明书。
63.在本发明的一个实施方案中,产品可包含固体基片诸如芯片、载玻片、阵列等,其具有能够检测和/或定量固定在基片上的预定位置处的一种或多种样本生物标志物的试剂。作为说明性实例,可向芯片提供固定在离散的预定位置的试剂,以用于检测和定量样本中生物标志物的存在和/或浓度和/或量。如上所述,在患有子宫内膜癌的受试者的样本中发现所述生物标志物的水平降低或增加。芯片可被配置成使得仅当这些生物标志物中的一种或多种的浓度超过阈值时才提供可检测的输出(例如颜色的变化),所述阈值被选择或区分指示对照受试者的生物标志物的浓度和/或量和/或表达水平与指示患有或易患子宫内膜癌的患者的生物标志物的浓度和/或量和/或表达水平。因此,可检测到的输出(例如颜色的变化)的存在立即表明样本中包含显著降低水平或显著升高水平的生物标志物,表明受试者患有或易患子宫内膜癌。
64.在本发明中,所述生物标志物可以个别测定,或者在本发明的一个实施方案中,它们可以同时测定,例如使用芯片或基于珠的阵列技术。然后独立解读生物标志物的浓度,例如使用每种标志物的个别截留,或者它们组合进行解读。
65.正如熟练技术人员会熟知的,可以以不同方式实施和实现将生物标志物水平与某种可能性或风险关联起来的步骤。优选地,在数学上组合蛋白质和一种或多种其它标志物的测定浓度,并将组合值与根本的诊断问题关联起来。可以通过任何适宜的现有技术数学方法将标志物值的测定组合。
66.优选地,在生物标志物组合中应用的数学算法是一种对数函数。优选地,应用此类数学算法或此类对数函数的结果是单一值。根据根本的诊断问题,能容易地将此类值与例如个体关于子宫内膜癌的风险或与有助于评估子宫内膜癌患者的其它有意诊断用途关联起来。以一种优选的方式,此类对数函数是如下获得的:a)将个体进行分类入组,例如正常人、有患有子宫内膜癌风险的个体、患有子宫内膜癌的患者等等;b)通过单变量分析来鉴定在这些组之间差异显著的标志物;c)对数回归分析以评估标志物的可用于评估这些不同组的独立差别值;d)构建对数函数来组合独立差别值。在这种类型的分析中,标志物不再是独立的,而是代表一个标志物组合。
67.用于将标志物组合与疾病关联起来的对数函数优选采用通过应用统计方法开发和获得的算法。例如,适宜的统计方法是判别分析(da)(即线性、二次、规则da)、kernel方法(即svm)、非参数方法(即k
‑
最近邻居分类器)、pls(部分最小二乘)、基于树的方法(即逻辑回归、cart、随机森林方法、助推/装袋方法)、广义线性模型(即对数回归)、基于主分量的方
法(即simca)、广义叠加模型、基于模糊逻辑的方法、基于神经网络和遗传算法的方法。熟练技术人员在选择适宜的统计方法来评估本发明的标志物组合并由此获得适宜的数学算法方面不会有问题。在一个实施方案中,用于获得评估子宫内膜癌中使用的数学算法的统计方法选自da(即线性、二次、规则判别分析)、kernel方法(即svm)、非参数方法(即k
‑
最近邻居分类器)、pls(部分最小二乘)、基于树的方法(即逻辑回归、cart、随机森林方法、助推方法)、或广义线性模型(即对数回归)。
68.受试者工作特征曲线下面积(=auc)是诊断规程的性能或精确性的一项指标。诊断方法的精确性由它的受试者工作特征(roc)描述得最好。roc图是源自在观察的整个数据范围上连续改变决策阈的所有灵敏度/特异性对的线图。
69.实验室测试的临床性能取决于它的诊断精确性,或将受试者正确分类入临床有关亚组的能力。诊断精确性测量测试正确辨别所调查的受试者的两种不同状况的能力。此类状况是例如健康和疾病或者疾病进展对无疾病进展。
70.在每种情况中,roc线图通过对于决策阈的整个范围将灵敏度对1
‑
特异性绘图来描绘两种分布之间的交叠。y轴上是灵敏度,或真阳性分数[定义为(真阳性测试结果的数目)/(真阳性的数目+假阴性测试结果的数目)]。这也称作疾病或状况的存在的阳性。它仅仅自受影响亚组来计算。x轴上是假阳性分数,或1
‑
特异性[定义为(假阳性结果的数目)/(真阴性的数目+假阳性结果的数目)]。它是特异性的一项指标,而且完全自不受影响的亚组来计算。因为真和假阳性分数通过使用来自两个不同亚组的测试结果完全分开计算,所以roc线图不依赖于样品样本所涉及的疾病的流行程度。roc线图上的每个点代表一个对应于特定决策阈的灵敏度/1
‑
特异性对。
[0071]
以下通过具体的实施例进一步说明本发明的技术方案,具体实施例不代表对本发明保护范围的限制。其他人根据本发明理念所做出的一些非本质的修改和调整仍属于本发明的保护范围。
[0072]
实施例1与子宫内膜癌相关的生物标志物的筛选
[0073]
1、筛选方法
[0074]
(1)筛选所采用的数据及预处理的方法
[0075]
本实施例中筛选与子宫内膜癌相关的生物标志物的数据分别下载自geo数据库和tcga数据库,以“子宫内膜癌”为关键词搜索子宫内膜癌的公共基因表达数据和完整的临床注释,其中,从geo数据库下载了gse17025数据集的芯片数据及临床信息作为训练集,样本量为子宫内膜癌组:对照组=91:12;从tcga数据库下载了子宫内膜癌的rna
‑
seq数据及临床信息作为验证集,样本量为子宫内膜癌组:对照组=543:35;
[0076]
利用fastp软件双端序列自动检测模式对raw data进行接头处理;采用最低n碱基数量阈值为5,reads最低长度阈值为15,碱基质量阈值q15,低质量碱基百分比阈值为40%,以4个碱基为单位滑动窗口过滤,窗口平均质量阈值q20的条件对数据进行修剪和质控;分析使用软件默认参数,输出高质量的测序数据进行后续分析;分析得到的clean data使用icgc软件比对到人类参考基因组,参考基因组版本为grch38.d1.vd1,使用voom方法对来自于tcga数据库的数据进行标准化处理,使用rma方法对来自于geo数据库的数据进行标准化处理,通过platform文件对基因进行注释,合并去重取平均值。
[0077]
(2)子宫内膜癌中差异表达基因的分析
[0078]
使用r软件中的“limma”包(版本为3.36.5)对上述子宫内膜癌的geo数据和tcga数据进行差异表达基因的分析,其中,筛选标准为adj.p.val<0.05、|log2fc|>1,首先分别筛选在geo、tcga中呈显著性差异表达的基因,然后筛选geo和tcga两者共有且表达趋势一致的显著性差异表达基因进行后续的分析和验证。
[0079]
2、筛选结果
[0080]
筛选结果见图1a
‑
b、图2a
‑
b和表1,结果显示在训练集和验证集中,本发明涉及的生物标志物marcksl1、rps4x在子宫内膜癌中均表达呈现显著性的差异表达,其中,marcksl1在子宫内膜癌中表达上调,rps4x在子宫内膜癌中表达下调。
[0081]
表1基因在训练集和验证集中的表达情况
[0082][0083]
实施例2对筛选得到的生物标志物的诊断效能进行验证分析
[0084]
1、验证分析方法
[0085]
采用r包“proc”绘制受试者工作曲线(roc),分析经实施例1筛选得到的在对照组和子宫内膜癌组之间呈现显著性的差异表达的生物标志物marcksl1、rps4x、marcksl1+rps4x的auc值、敏感性、特异性,判断其对子宫内膜癌的诊断效能。其中,在评估分析单个生物标志物marcksl1、rps4x对子宫内膜癌的诊断效能时,使用基因的表达量(log2表达量)进行评估分析,选择最大的youden指数所对应的点作为其cutoff值,即最佳划分阈值通过youden指数最大的一点来确定;在评估分析联合的生物标志物marcksl1+rps4x对子宫内膜癌的诊断效能时,首先对基因marcksl1+rps4x进行logistics回归分析,在logistics回归分析中,自变量为marcksl1+rps4x,因变量为子宫内膜癌的患病情况,通过拟合出的回归曲线可以计算出每个个体患子宫内膜癌与否的概率,确定不同的概率划分阈值即可得到预测结果。最佳概率划分阈值通过youden指数最大的一点来确定,根据确定的概率划分阈值,可以分别计算得出marcksl1+rps4x检测在训练集和验证集的auc值、敏感性、特异性等。对得到的marcksl1、rps4x、marcksl1+rps4x的auc值、敏感性、特异性进行分析,以判断其诊断效能。
[0086]
2、验证分析结果
[0087]
marcksl1、rps4x在训练集和验证集中单独或者联合的诊断效能的结果见图3a
‑
c、图4a
‑
c和表2,结果显示,marcksl1+rps4x联合无论是在训练集中还是在验证集中都显示出较高的诊断效能,auc值分别为0.851、0.937,训练集中的敏感性和特异性分别为0.934、0.750,验证集中的敏感性和特异性分别为0.807、0.943,且显著优于单个基因marcksl1、rps4x的诊断效能。
[0088]
表2基因在训练集和验证集中的诊断效能
[0089][0090]
虽然为了清楚理解起见已通过图例和实例非常详细地描述了前述发明,但明显地,在所述权利要求的范围内可以作出某些改变和修改,所作出的这些改变和修饰也将落入本发明权利要求保护范围内。