本发明涉及一种生物学年龄检测试剂盒和生物学年龄检测系统,属于医学检测。
背景技术:
1、人口老龄化日趋严重,且存在个体差异,如何预判个体衰老和健康状态,及时采取有效的干预措施,是目前积极应对健康老龄化面临的重大挑战。衰老是一个受到遗传和环境共同影响的复杂过程。已发现一些衰老的细胞和分子标志与年龄和健康状态显著相关。这些研究中的年龄,通常指日历年龄,即根据个体自出生以来经过的时间测量。不会因生活方式、健康或疾病的改变而变化。而可以衡量组织和机体功能衰退、与年龄相关疾病的风险、发病率和死亡率的生物学年龄虽然没有明确定义,但其并不等同于日历年龄。因此,对于生物学年龄的评估测算,可能为我们提供一种预测和评估疾病风险的依据。
2、dna甲基化修饰作为一种重要的表观遗传学标记,参与调控染色质稳定性、基因表达等基础的生命活动,可能导致个体表型差异。已有大量研究表明dna甲基化异常和癌症、帕金森、糖尿病等复杂衰老疾病密切相关,dna甲基化检测对生物学、转化医学等研究具有重要意义。
3、端粒是维持染色体稳定十分必要的组成。端粒长度被认为是细胞衰老的分子钟,同时与年龄相关的代谢疾病存在关联。当端粒达到极短的长度时,会引发持久的dna损伤反应,同时诱发细胞衰老和/或细胞凋亡等细胞事件。因此,端粒长度被认为是生物学年龄判定的重要依据。
4、一些人群流行病学的研究表明,一些生理生化水平与年龄相关疾病也具有相关性。我们前期分析了身体质量指数(bmi)、血糖(fpg)、血脂和年龄之间的相关性,发现年龄与fpg、tc、hdl-c和ldl-c呈正相关,而与bmi呈负相关。从20岁到110岁,bmi、fpg、tc、hdl-c、tg和ldl-c水平均随年龄呈现不同的变化特征(diabetes metab syndr obes.2021aug 21;14:3711-3718.)。
5、目前,最常见的预测生物学年龄方法大都是基于单一的dna甲基化位点,以日历年龄作为结局,预测的本质上还是日历年龄。对于个体健康和衰老相关的生物学年龄判断缺乏生理生化状态的相关数据支持。因此有必要开发一种容易操作、价格适中、检测真正生物学年龄的检测试剂盒及检测系统。
技术实现思路
1、本发明要解决的技术问题是:提供一种生物学年龄检测试剂盒和生物学年龄检测系统。
2、为实现上述目的,本发明采用以下技术方案:
3、一种生物学年龄检测试剂盒,由与年龄相关的生化检测指标检测试剂、端粒长度检测试剂和外周血dna甲基化位点检测试剂组成;
4、其中生化检测指标是指谷丙转氨酶alt、谷草转氨酶got、alt\got、肌酐cr、空腹血糖fbg、总胆固醇tc、低密度脂蛋白ldl。
5、其中外周血dna甲基化位点是指:cg05442902(p2rx6),cg06493994(scgn),cg09809672(edaradd),cg19722847(ipo8),and cg22736354(nhlrc1)。
6、所述生化检测指标检测试剂包括:alt试剂、got试剂、glu试剂、cr试剂和ldl试剂。
7、表1:alt试剂组成
8、
9、表2:got试剂组成
10、
11、表3:glu试剂组成
12、 glu试剂成分 浓度 磷酸缓冲液,ph7.5 250mmol/l 苯酚 5mol/l 4-氨基安替比林 0.5mmol/l 葡萄糖氧化酶 >15ku/l 过氧化物酶 >3ku/l
13、表4:cr试剂组成
14、
15、表5:tc试剂组成
16、
17、表6:ldl试剂组成
18、
19、
20、hdaos:n-(2-羟基-3-磺丙基)-3,5-二甲氧基苯胺
21、4-aa:4-氨基安替比林
22、所述端粒长度检测试剂为端粒相对长度检测试剂盒(定量pcr法)dl50试剂盒(上海翼和生物型号:tl50)
23、表7:端粒相对长度检测试剂盒(定量pcr法)dl50试剂盒
24、
25、表8:端粒相对长度检测引物序列
26、(为商业试剂盒中的引物,序列表seq id no.1-seq id no.4)
27、
28、所述外周血dna甲基化位点检测试剂包括:红细胞裂解液(rbc lysis buffer)、蛋白酶k(proteinase k)、苯酚-氯仿、异丙醇、75%乙醇,以及检测cg09809672、cg19722847、cg22736354、cg05442902、cg06493994位点的引物序列。
29、5.根据权利要求4所述的一种生物学年龄检测试剂盒,其特征在于:所述引物序列为序列表seq id no.5至seq id no.14所示的核苷酸序列。
30、表9:甲基化位点引物序列(序列表seq id no.5-seq id no.14)
31、
32、本发明将所有生物学指标与年龄进行了spearman相关性分析(表10),结果表明,cg22736354(nhlrc1)、cg06493994(scgn)、glu、cr和got与年龄呈高度正相关,而cg05442902(p2rx6)、cg09809672(edaradd)、cg19722847(ipo8)、alt和alt/got与年龄呈负相关(***p<0.001)。tc与年龄呈中度正相关(**p<0.01)。ldl与年龄呈轻度正相关,而端粒长度与年龄呈负相关(*p<0.05)。因此,选取了5个dna甲基化位点、端粒长度和glu、cr、got、alt、alt/got、tc、ldl这些指标进行模型构建。
33、表10:年龄和生物学指标相关性分析
34、
35、
36、注释:ρ,spearman’s rho;***p<0.001;**p<0.01;*p<0.05
37、在本发明之前的已有研究大都采取单一的生化指标或dna甲基化位点进行评估生物学年龄,且对生物学年龄的评估是以实际年龄(日历年龄)作为标准进行拟合,并不能说明预测出来的即是生物学年龄。
38、本发明中,端粒长度被公认为是生物学年龄判定的重要依据。生化检测指标也在报道中发现随龄变化的趋势,且生化检测指标是判断疾病和健康状态的重要依据,有助于我们对于个体健康的评估,进而给出生物学年龄大于公历年龄还是小于公历年龄的判断。dna甲基化位点来自于已报道的经典horvath、levine和hannum三块经典表观遗传学时钟的交集共有位点,代表了个体基因和环境长期共同作用下的机体变化水平。因此选择这三个组合来进行生物学模型构建。
39、本发明在甲基化位点的选择上进行了特别的筛选。基于血液算法的hannum时钟和基于多组织算法的horvath时钟计算出的表观遗传学年龄(dnam年龄)与样本的日历年龄相关性高于r=0.90。levine时钟更进一步,用表型年龄预测取代了日历年龄预测,识别出更强大的衰老表观遗传生物标志物。因此,我们根据其功能特征和捕捉衰老特征的能力比较了这3个现有的经典表观遗传时钟,发现了五个共有的dna甲基化位点(cg05442902(p2rx6)、cg06493994(scgn)、cg09809672(edaradd)、cg19722847(ipo8)和cg22736354(nhlrc1))
40、本发明中的生物样本(外周血)来源:0-99岁个体来自陆军总医院体检中心,100-110岁个体来自广西自治区东兴市和上林县长寿村。自行采集。采集人:倪晓琳,地址:北京市东城区大华路1号北京医院,电话:010-58115081。
41、本发明的第二方面,提供一种生物学年龄检测系统,包括以下步骤:
42、s1,通过试剂盒获取生化检测指标值、端粒长度值和外周血dna甲基化位点值;
43、s2,获得alt\got值;
44、s3,采用袋装算法和决策树算法定性预测生物学年龄;
45、s4,采用rational quadratic算法定量预测生物学年龄。
46、所述s1的试剂盒由与年龄相关的生化检测指标检测试剂、端粒长度检测试剂和外周血dna甲基化位点检测试剂组成;
47、其中,与年龄相关的生化检测指标是指:谷丙转氨酶(alt)、谷草转氨酶(got)、alt\got、肌酐(cr)、空腹血糖(glu)、总胆固醇(tc)、低密度脂蛋白(ldl);
48、外周血dna甲基化位点是指:cg05442902(p2rx6),cg06493994(scgn),cg09809672(edaradd),cg19722847(ipo8),and cg22736354(nhlrc1)。
49、所述生化检测指标检测试剂为alt检测试剂、got检测试剂、glu检测试剂、cr检测试剂和ldl检测试剂;
50、所述端粒长度检测试剂为端粒相对长度检测试剂盒(定量pcr法)dl50试剂盒;
51、所述外周血dna甲基化位点检测试剂包括:红细胞裂解液(rbc lysis buffer)、蛋白酶k(proteinase k)、苯酚-氯仿、异丙醇、75%乙醇,以及序列表seq id no.5至seq idno.14所示的检测cg09809672、cg19722847、cg22736354、cg05442902、cg06493994位点的引物序列。
52、所述s2获得alt\got值,是外周血检测获得谷丙转氨酶和谷草转氨酶结果,然后计算谷丙转氨酶除以谷草转氨酶得到的数值。
53、所述s3采用袋装算法和决策树算法定性预测生物学年龄,具体如下:
54、本发明采用袋装树模型用于定性预测生物学年龄,该模型集成了装袋算法和分类决策树算法,是在分类决策树运行的基础上使用装袋算法。
55、首先应进行模型训练,将上述年龄相关变量(谷丙转氨酶alt、谷草转氨酶got、alt/got、肌酐cr、空腹血糖fbg、总胆固醇tc、低密度脂蛋白胆固醇ldl)纳入训练模型,训练目标为预测年龄大于或小于生物学年龄。
56、该模型的训练过程是:假设训练模型共有m个采样数据,每个采样数据包含所有需要预测的年龄相关变量,即m为样本的年龄相关变量集合,将含有以上数据的m个样本的数据集,先随机取出一个样本放入采样集中,再把该样本放回初始数据集,使得下次采样时该样本仍有可能被选中,这样,经过m次随机采样操作,我们得到含m个样本的采样集,初始训练集中有的样本在采样集里多次出现,有的则从未出现。我们可拟合出t个含m个训练样本的分类决策树,再将这些分类决策树t进行结合,在对预测输出进行结合时使用简单投票法,对t个模型的结果取平均值,得到袋装树的预测结果。
57、其公式表达为:
58、
59、对于分类决策树的训练,决策树预期结果是使用选定树计算的后验概率的最大加权平均值。如下公式所示,设h(x)为决策树的输出概率分布hi(x,cj)的一个样本,其中i=1…n是分类器的数量,cj,j=1…k是模型目标输出的结果的,即需要预测的年龄变量,它是使用树i给年龄相关变量特征x的预测标量cj的估计后验概率,最后使用多数投票获得结果聚合结果h(x)。
60、
61、上述公式中,概率分布hi的计算公式如下:
62、
63、其中,p(xi)是变量特征x出现的概率,n是分类的数目,本专利中分类数目为2。
64、在训练完成后,应按照特征数据的格式要求准备预测数据,代入训练完成的袋装树模型,预测受试者的实际年龄大于或小于实际年龄。
65、该方法流程图见图1所示。
66、表11:定性模型
67、
68、auc:roc曲线下的面积,auc越接近1.0,检测方法真实性越高。
69、所述s4采用rational quadratic算法定量预测生物学年龄,具体如下:
70、本发明选择rational quadratic方法作为本发明实际年龄定量预测模型(表12)。
71、首先应进行模型训练,将上述年龄相关变量(谷丙转氨酶alt、谷草转氨酶got、alt/got、肌酐cr、空腹血糖fbg、总胆固醇tc、低密度脂蛋白胆固醇ldl)纳入训练模型,训练目标是获得实际年龄数值。高斯过程回归(gaussian process regression,gpr)是使用高斯过程(gaussian process,gp)先验对数据进行回归分析的非参数模型(non-parametericmodel)。
72、高斯过程回归计算如下:设每个采样数据的每个年龄相关变量为xi,为每个年龄相关变量都引入一个服从高斯分布的潜向量f(xi),所有的f(xi)合起来是一组随机向量,其共同具有一个联合高斯分布。因此一个gp具有一个均值函数m(x)和一个核函数k(x,x’)。令每一个采样数据的年龄相关变量集合x=[x1,x2,…,xn]服从多元高斯分布x~n(μ,∑),其中x=[x1,x2,…,xm]为已知的特征向量,x′=[xm+1,xm+2,…,xn]为本模型的目标预测结果向量,本模型核函数为:
73、
74、训练过程结束后可通过均方误差验证预测的效果,当均方误差满足要求时,进入下一步实际年龄预测环节;未达到要求,一般应增加数据集样本量并重新开始训练过程,直到满足要求。均方误差mse的计算公式如下,本发明要求均方误差应小于80。
75、
76、公式中,为采样数据年龄相关变量真实数据集合,y为模型的预测值,n为样本量。本方法流程图2所示。
77、在训练完成后,应按照特征数据的格式要求准备预测数据,代入训练完成的rational quadratic方法模型,预测受试者的实际年龄数值。
78、表12:定量模型
79、
80、rmse:均方根误差;r-squared:拟合优度;mse:均方误差;mae:平均绝对误差
81、所述试剂盒由与年龄相关的生化检测指标检测试剂、端粒长度检测试剂和外周血dna甲基化位点检测试剂组成。
82、本发明的优点如下:本发明系统方法使用方便,准确率高,精确度强,能够同时快速定性和定量检测出受试者生物学年龄预测健康状态。