0059] 利用下列公式计算灵敏度(Sn)、特异性(Sp)、准确率(Acc)、二值相关系数 (MCC):
[0064] 公式中的TP,TN,FP,FN分别为在表2中的结果判断的出现的次数,分别为7,15, 1,0,代入上述公式,计算出的结果如表3所示。
[0065] 表 3
[0068] 表3中的MCC为评价模型预测的参数,越接近1说明预测模型越完美,越接近0说 明预测越随机,利用实施例2建立的模型对结果进行预测,MCC值0. 91接近1,证明此模型 是可靠的。
[0069] 因为模型是根据用药前的数据建立,因此适用于用药前的准确率要高于用药后的 准确率。但是由于用药后个体变化不一,也没有很明显的IRIS组的特异类型,因此对于用 药后没有进行模型构建。
[0070] 经实验证明,本实施例所列的特定基因在结核合并感染的艾滋病人血液中的PBMC 里表达量的线性组合能显著区分发生和不发生免疫重建炎性综合症的人群,因此这些基因 的线性组合可作为评价艾滋病人是否发生免疫重建炎性综合症的预警因子,使临床治疗更 加个性化。
[0071] 实施例3
[0072] (1)计算相对表达量
[0073] 分离PBMC外周血淋巴细胞,对PBMC进行裂解,提取总RNA。通过mRNA的polyA 特性,调取mRNA,对总RNA进行高通量测序。将测序产生的短序列(即二代高通量测序得 到的短序列)和人类基因表达数据库(ftp://ftp. ncbi. nlm. nih. gov/refseq/H_sapiens/ RefSeqGene/)比对,分别得到每个基因的相对表达量RPKM[即是将map到单个基因的read 数除以map到所有基因的所有read数(以million为单位)与RNA的长度(以KB为单 位),得到的值],计算公式如下:
[0075] 其中的C :代表比对到该基因的短序列条数,N :代表比对到所有基因的短序列条 数,L代表该基因的长度。
[0076] (2)计算相关系数
[0077] 得到每个基因的相对表达量RPKM之后,以ACTB基因 (ID :60)为参考,归一化处 理,在发生免疫重建炎性综合症的组别和未发生免疫重建炎性综合症的组别进行所有基因 的机器学习建模,挑选权重最大的、准确性最高的组合,最终选取如表4所不的9个基因作 为判断是否发生IRIS风险的指标(其中基因 ID用NCBI的标准基因号表示),通过对不同 因子权重的线性拟合得到相关系数,如表1所示。
[0078] 表 4
CN 105177130 A 说明书 9/12 页
[0080] (3)计算f(x)值,判断风险水平
[0081] 用以下公式计算每个样本的风险值:
[0082] f (X) = -25. 97422122-259. 8669408(CD79A)+13515. 90815(LCN2)+3335. 943735 ( FFAR2)+7311. 600215(SLEDl)-318. 4503906(CD22)+1692. 184761(ANKRD22)-247. 6957422( GP9)-2322. 113802(DEFA3)-1821. 5596(RGCC)
[0083] 其中(CD79A)、(LCN2)、(FFAR2)、(SLEDl)、(CD22)、(ANKRD22)、(GP9)、(DEFA3)和 (RGCC)代表各个基因的相对表达量,计算方法为:针对表4即前述的9个基因进行相对常 规的qRT-PCR方法,以ACTB基因 (ID :60)为参考,计算每个基因的qRT-PCR的Ct值与ACTB 基因的qRT-PCR的Ct值的比值。
[0084] 计算f (X)值,作为每个样本的评价指标。当f (X)值大于0. 5时,判断为高风险, 当值小于〇. 5时判断为低风险,当值等于0. 5时,判断为风险不确定。f (X)值越小于0. 5代 表风险越低,f (X)值越高于0. 5代表风险越高。
[0085] 实施例4
[0086] 本实施例对实施例3建立的用于评估艾滋病人发生免疫重建炎性综合症的模型 的方法进行了验证,具体包括如下步骤:
[0087] 根据实施例3的9个基因建立的线性模型,选取了 5组研究对象:7个确诊HIV 合并TB感染发生免疫重建炎性综合症的样本(HTI-P1-0-TA,HTI-P2-0A,HTI-P3-0A, ΗΤΙ-Ρ4-0Α,ΗΤΙ-Ρ5-0Α,ΗΤΙ-Ρ6-0Α,ΗΤΙ-1-42-0Α),7 个确诊 HIV 合并 TB 感染但不发生免疫 重建炎性综合症的样本(HT-P1-0A,HT-P3-0A,HT-P5-0A,HT-P7-0A,HT-P8-0A,HT-P9-0A, HT-2-28-0A),5 个单纯 HIV 感染的样本(H-P1-0A,H-P2-0A,H-P3-0A,H-P4-0A,H-3-83-0A), 2个单纯TB感染的样本(T-P1-0A,T-P2-0A),以及2个健康样本(C-1-LK7231A, C-2-LYW7302A),用高效抗逆转录病毒治疗(HAART)前后共46个样本(每人取样两次,第一 次取样是用药前,第二次取样是用药后二周)进行预测,评估结果如表2所示:
[0088] 表 5
CN 105177130 A 说明书 10/12 页
[0090] 表5中,H代表HIV单纯感染组,HTI代表HIV合并TB感染会发生IRIS组,HT代 表HIV合并TB感染不发生IRIS组,T代表单纯感染TB组,C代表健康对照组。TP,TN,FP, FN分别代表真阳性,真阴性,假阳性,假阴性。
[0091] 利用下列公式计算灵敏度(Sn)、特异性(Sp)、准确率(Acc)、二值相关系数 (MCC): CN 105177130 A 说明书 11/12 页
[0096] 公式中的TP,TN,FP,FN分别为在表2中的结果判断的出现的次数,分别为7,15, 1,0,代入上述公式,计算出的结果如表6所示。
[0097] 表 6
[0099] 表6中的MCC为评价模型预测的参数,越接近1说明预测模型越完美,越接近0说 明预测越随机,利用实施例2建立的模型对结果进行预测,MCC值0. 91接近1,证明此模型 是可靠的。
[0100] 因为模型是根据用药前的数据建立,因此适用于用药前的准确率要高于用药后的 准确率。但是由于用药后个体变化不一,也没有很明显的IRIS组的特异类型,因此对于用 药后没有进行模型构建。
[0101] 经实验证明,本实施例所列的特定基因在结核合并感染的艾滋病人血液中的PBMC 里表达量的线性组合能显著区分发生和不发生免疫重建炎性综合症的人群,因此这些基因 的线性组合可作为评价艾滋病人是否发生免疫重建炎性综合症的预警因子,使临床治疗更 加个性化。
[0102] 实施例5
[0103] 本实施例提供了一种筛选艾滋病人发生免疫重建炎性综合症的生物样品的系统, 包括:
[0104] 核酸提取装置,所述核酸提取装置用于提取所述生物样品中的核酸样本;
[0105] 核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相连,用于对所 述核酸样本进行分析,以便确定所述核酸样本的核酸序列;以及
[0106] 判断装置,所述判断装置与所述核酸序列确定装置相连,以便基于将测序产生的 短序列和人类基因表达数据库比对,分别得到DEFA3基因、S100A8基因、FFAR2基因、LCN2基 因、FCRLl基因、SLC25A37基因、CXCR2P1基因、RGCC基因和GMPR基因的相对表达量RPKM, 用于判断艾滋病人是否发生免疫重建炎性综合症;
[0107] 任选的,得到相对表达量RPKM之后是用公式计算后得到风险值f(x),然后用于判 断艾滋病人是否发生免疫重建炎性综合症,所述公式为:
[0108] f(x) = 40-0. 301926548369785 (DEFA3)+0. 00490277165036895 (S100A8) +0.560530444576423 (FFAR2)+1.63850558112781 (LCN2)-〇. 142277506530434 (FC RLl)+0. 410319980880293(SLC25A37)+0. 190096182111239(CXCR2P1)-〇. 199495833744442 (RGCC)-O. 370577325294511 (GMPR)。
[0109] 用风险值f(x)判断艾滋病人是否发生免疫重建炎性综合症的准则为:
[0110] 当f (X)值大于0. 5时,判断为高风险,当f (X)值小于0. 5时判断为低风险