本发明涉及基因
技术领域:
,特别涉及一种肺癌预测系统。
背景技术:
:2013年,世界卫生组织下属国际癌症研究机构发布报告,指认大气污染为普遍和主要的环境致癌物,导致人类发生肺癌的风险增大。为了尽早采取相应的防治措施,需对肺癌的发生首先进行预测。但是,通过传统的组织活检系统预测肺癌,预测过程复杂且成本高昂。技术实现要素:本发明的主要目的是提出一种肺癌预测系统,旨在提出一种预测方便,成本低廉的肺癌预测系统。为实现上述目的,本发明提出的肺癌预测系统,包括:获取模块,用以获取SHOX2基因中标志物的甲基化程度,所述标志物为SHOX2基因中chr3:157821233-157821604位之间的CpG位点;以及,判断模块,用以比较所述标志物的甲基化程度与设定阈值,当所述标志物的甲基化程度低于所述设定阈值时,判断肺癌发生。优选地,所述标志物为SHOX2基因中chr3:157821233-157821604位之间的第50、60、68、86、106、116、120、126、223、227和235位的CpG位点。优选地,所述设定阈值为其中,ai(i=1,2,…,11)分别为SHOX2基因中chr3:157821233-157821604位之间第50、60、68、86、106、116、120、126、223、227和235位的单个CpG位点的甲基化程度阈值,a1为0.04~0.1,a2为0.011~0.016,a3为0.08~0.16,a4为0.065~0.12,a5为0.11~0.3,a6为0.15~0.4,a7为0.13~0.28,a8为0.04~0.14,a9为0.11~0.16,a10为0.1~0.17,a11为0.01~0.4;Xi(i=1,2,…,11)分别对应SHOX2基因中chr3:157821233-157821604位之间的第50、60、68、86、106、116、120、126、223、227和235位的CpG位点,当某一CpG位点的甲基化程度参与比较时,对应所述CpG位点的Xi取值为1,否则取值为0。优选地,所述标志物为SHOX2基因中chr3:157821303-157821353位之间的CpG位点。优选地,所述标志物为SHOX2基因中chr3:157821303-157821353位之间的第86、106、116、120和126位的CpG位点。优选地,所述设定阈值为其中,ai(i=1,2,…,5)分别为SHOX2基因中chr3:157821233-157821604位之间第86、106、116、120和126位的单个CpG位点的甲基化程度阈值,a1为0.065~0.12,a2为0.11~0.3,a3为0.15~0.4,a4为0.13~0.28,a5为0.04~0.14;Xi(i=1,2,…,5)分别对应SHOX2基因中chr3:157821303-157821353位之间的第86、106、116、120和126位的CpG位点,当某一CpG位点的甲基化程度参与比较时,对应所述CpG位点的Xi取值为1,否则取值为0。优选地,所述获取模块还包括检测装置,所述检测装置用以检测SHOX2基因中所述标志物的甲基化程度。优选地,所述检测装置包括:提取单元,用以提取包括所述SHOX2基因的DNA样品;转化单元,用以通过亚硫酸盐将DNA中未甲基化CpG位点的C转化为U,得到转化产物;扩增单元,用以通过聚合酶链式反应PCR扩增所述转化产物,获得扩增产物;消化单元,用以通过虾碱性磷酸酶SAP消化所述扩增产物,获得消化产物;转录和酶切单元,用以转录和酶切所述消化产物,获得包括短链RNA的转录和酶切产物;测定单元,用以通过质谱方法测定所述短链RNA,获得所述SHOX2基因中标志物的甲基化程度。优选地,所述扩增单元包括涵盖所述SHOX2基因中标志物CpG位点的引物。优选地,所述引物包括引物对,所述引物对的正向引物选自SEQIDNO.2,相应的反向引物选自SEQIDNO.3;或,所述引物对的正向引物选自SEQIDNO.4,相应的反向引物选自SEQIDNO.5;或,所述引物对的正向引物选自SEQIDNO.6,相应的反向引物选自SEQIDNO.7。优选地,所述检测装置还包括:纯化单元,用以通过树脂纯化所述转录和酶切产物,纯化所述短链RNA。优选地,所述质谱方法为飞行质谱方法。优选地,所述肺癌预测系统还包括:输出模块,用于输出所述获取模块和/或判断模块的运行结果。本发明技术方案中,获取模块获取SHOX2基因中chr3:157821233-157821604位之间的CpG位点的甲基化程度,判断模块比较标志物的甲基化程度与设定阈值,当标志物的甲基化程度低于设定阈值时,判断肺癌发生,通过对相关基因中标志物甲基化程度的获取和判断实现对肺癌的预测,提出了一种预测方便、成本低廉的肺癌预测系统。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。图1为本发明一实施例中肺癌预测系统的模块示意图;图2为本发明一实施例中肺癌预测系统的检测装置的示意图;图3为本发明一实施例中肺癌预测系统中示例位点的甲基化状态在癌症人群和正常人群中的分布状态示意图;图4为本发明一实施例中肺癌预测系统中受试者血液DNA示例位点的甲基化程度平均值的ROC曲线图。本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明提出一种肺癌预测系统。肺癌是发病率和死亡率增长最快,对人群健康和生命威胁最大的恶性肿瘤之一,特别是随着大气污染的日益严重,肺癌发病率进一步增长。表观遗传学证实,DNA的甲基化程度与某些癌症发生的风险具有高度相关性,随着基因技术的发展,通过获取受试者体液中基因标志物的甲基化程度,可有效预测相关癌症发生的风险。在本发明实施例中,如图1所示,肺癌预测系统包括:获取模块10,用以获取SHOX2基因中标志物的甲基化程度,,标志物为SHOX2基因中chr3:157821233-157821604位之间的CpG位点;以及,判断模块20,用以比较标志物的甲基化程度与设定阈值,当标志物的甲基化程度低于设定阈值时,判断肺癌发生。基因是具有遗传效应的脱氧核糖核酸DNA片段,DNA是一种长链聚合物,其组成单位为四种包含不同碱基的脱氧核苷酸,其中,四种碱基分别为腺嘌呤A、胸腺嘧啶T、胞嘧啶C和鸟嘌呤G。在DNA中,通过磷酸p连接的C和G形成CpG位点。在DNA甲基转移催化酶的催化作用下,CpG位点中的胞嘧啶脱氧核苷酸转化为5-甲基胞嘧啶,即DNA的甲基化。甲基化程度是指某一CpG位点发生甲基化的概率或某一CpG位点已发生甲基化的比例。甲基化程度的变化会通过改变染色质结构及稳定性、改变转录因子结合活性等方式改变基因的表达情况。一般而言,低甲基化程度有利于基因的表达,高甲基化程度抑制基因的表达。肺癌发生的风险与SHOX2基因中chr3:157821233-157821604位之间CpG位点的甲基化程度有关,低水平的SHOX2基因中chr3:157821233-157821604位之间CpG位点的甲基化程度导致基因表达活跃,从而导致肺癌发生风险增大。其中,chr3:157821233-157821604位指SHOX2基因中第3条染色体上的第157821233位至第157821604位,这两个位置之间共有372个碱基,其序列表如SEQIDNO.1所示。通过获取模块10获取SHOX2基因中chr3:157821233-157821604位之间CpG位点的甲基化程度,通过判断模块20比较标志物的甲基化程度与设定阈值,当标志物的甲基化程度低于设定阈值时,判断肺癌发生。其中,获取模块10可直接获取已知的SHOX2基因中标志物的甲基化程度信息;也可通过检测受试者的体液,获取SHOX2基因标志物的甲基化程度,后文中将详细阐述。获取模块10和判断模块20可以是硬件设备和/或软件程序,设置在固定或移动终端上,通过有线连接、无线传输或接收手动输入数据等方式获取标志物的甲基化程度,并进行相应的判断,实现实时或远程预测肺癌。本发明技术方案中,获取模块10获取SHOX2基因中标志物,即chr3:157821233-157821604位之间CpG位点的甲基化程度,判断模块20根据SHOX2基因中标志物的甲基化程度预测肺癌,当SHOX2基因中标志物的甲基化程度低于设定阈值时,基因表达活跃,判断发生肺癌。通过基因技术,提出了一种预测方便、成本低廉的肺癌预测系统。在本发明的一优选实施例中,标志物为SHOX2基因中chr3:157821233-157821604位之间的第50、60、68、86、106、116、120、126、223、227和235位的CpG位点,即SHOX2基因中第3条染色体上第157821233位至第157821604位之间的第50、60、68、86、106、116、120、126、223、227和235位的CpG位点。通过获取模块10获取上述CpG位点的甲基化程度,供判断模块20预测肺癌。在本优选实施例中,设定阈值为其中,ai(i=1,2,…,11)分别为SHOX2基因中chr3:157821233-157821604位之间第50、60、68、86、106、116、120、126、223、227和235位的单个CpG位点的甲基化程度阈值,a1为0.04~0.1,a2为0.011~0.016,a3为0.08~0.16,a4为0.065~0.12,a5为0.11~0.3,a6为0.15~0.4,a7为0.13~0.28,a8为0.04~0.14,a9为0.11~0.16,a10为0.1~0.17,a11为0.01~0.4;Xi(i=1,2,…,11)分别对应SHOX2基因中chr3:157821233-157821604位之间的第50、60、68、86、106、116、120、126、223、227和235位的CpG位点,当某一CpG位点的甲基化程度参与比较时,对应所述CpG位点的Xi取值为1,否则取值为0。上述阈值ai(i=1,2,…,11)是根据实验的统计学分析确定的。判断模块20在比较甲基化程度的获取值与阈值时,可选择上述CpG位点中的某一个、某几个的组合或全部位点的甲基化程度获取值进行判断。当选择某一个CpG位点的甲基化程度获取值时,以SHOX2基因中chr3:157821233-157821604位之间的第223位的CpG位点为例(下文中称为示例位点),该示例位点对应的甲基化程度阈值为a9,即仅考虑该示例位点的甲基化程度,当判断模块20通过比较得出甲基化程度的获取值小于a9时,判断肺癌发生。a9的取值范围为0.11~0.16,上述范围内的值均可以作为阈值,而预测的特异性和敏感性与所选择的具体阈值有关。所选定的阈值越低,预测的特异性越高,敏感性越低,即预测结果的漏检率越高,假阳性率越低;而所选定的阈值越高,预测的敏感性越高,特异性越低,即预测结果的假阳性率越高,漏检率越低。综合考虑敏感性和特异性,优选的阈值a9为0.11~0.16范围内的居中值0.14。同理,综合考虑敏感性和特异性,其它CpG位点的甲基化程度阈值ai的优选值为相应阈值范围内的居中值,即a1优选为0.07,a2优选为0.014,a3优选为0.12,a4优选为0.09,a5优选为0.21,a6优选为0.25,a7优选为0.21,a8优选为0.09,a10优选为0.14,a11优选为0.23。当选择某几个CpG位点的组合时,所选择的CpG位点对应的Xi值取值为1,未被选择的CpG位点对应的Xi值取值为0,根据计算甲基化程度的阈值,进而与甲基化程度的获取值比较。例如,当考虑SHOX2基因中chr3:157821233-157821604位之间的第50、60、86位的CpG位点,即Xi=1(i=1,2,4),Xi=0(i=3,5,6,7,8,9,10,11),则M=(a1+a2+a4)/3,其中,a1、a2、a4分别为SHOX2基因中chr3:157821233-157821604位之间的第50、60、86位的CpG位点的甲基化程度阈值。当选择全部CpG位点进行判断时,Xi=1(i=1,2,…,11),相应的甲基化程度的阈值为在本发明的另一优选实施例中,标志物为SHOX2基因中chr3:157821303-157821353位之间的CpG位点。通过获取模块10获取SHOX2基因中chr3:157821303-157821353位之间CpG位点的甲基化程度,即第3条染色体上的第157821303位至第157821353位,这两个位置之间的CpG位点,通过判断模块20比较标志物的甲基化程度与设定阈值,当标志物的甲基化程度低于设定阈值时,判断肺癌发生。在本发明的又一优选实施例中,标志物为SHOX2基因中chr3:157821303-157821353位之间的第86、106、116、120和126位的CpG位点。相应的,设定阈值为其中,ai(i=1,2,…,5)分别为SHOX2基因中chr3:157821233-157821604位之间第86、106、116、120和126位的单个CpG位点的甲基化程度阈值,a1为0.065~0.12,a2为0.11~0.3,a3为0.15~0.4,a4为0.13~0.28,a5为0.04~0.14;Xi(i=1,2,…,5)分别对应SHOX2基因中chr3:157821303-157821353位之间的第86、106、116、120和126位的CpG位点,当某一CpG位点的甲基化程度参与比较时,对应所述CpG位点的Xi取值为1,否则取值为0。同理,综合考虑敏感性和特异性,阈值的优选值为相应阈值取值范围的居中值,即a1优选为0.09,a2优选为0.21,a3优选为0.25,a4优选为0.21,a5优选为0.09。上述优选实施例中,如图1所示,获取模块10还包括检测装置11,用以检测SHOX2基因中标志物的甲基化程度。存在多种检测装置11,以检测SHOX2基因中标志物的甲基化程度。在一具体实施例中,检测装置11基于限制性内切酶的甲基化分析方法检测SHOX2基因中chr3:157821233-157821604位之间CpG位点的甲基化程度,包括甲基化敏感限制性内切酶-PCR/Southern法,即通过采用甲基化敏感限制性内切酶将DNA切割为大小不同的片段,并进行PCR/Southern分析进行检测。在另一具体实施例中,检测装置11基于分析经重亚硫酸盐处理过的样品的甲基化程度的方法进行检测,包括重亚硫酸盐测序、甲基化特异性PCR、焦磷酸测序以及结合重亚硫酸盐的限制性内切酶法等。在又一具体实施例中,检测装置11基于全基因组的甲基化分析方法、即甲基化图谱分析,检测SHOX2基因中标志物的甲基化程度,从而实现大样本量、多个位点的检测,具体包括可实现多重CpG检测的基于MassARRAY技术的飞行质谱分析法,基于高通量测序的分析法或基于芯片的甲基化图谱分析法等。在本发明的一优选实施例中,检测装置11基于Sequenom公司提供的飞行质谱方法检测标志物的甲基化程度,如图2所示,检测装置11包括:提取单元111,用以提取包括所述SHOX2基因的DNA样品;转化单元112,用以通过亚硫酸盐将DNA中未甲基化CpG位点的C转化为U,得到转化产物;扩增单元113,用以通过聚合酶链式反应PCR扩增所述转化产物,获得扩增产物;消化单元114,用以通过虾碱性磷酸酶SAP消化所述扩增产物,获得消化产物;转录和酶切单元115,用以转录和酶切所述消化产物,获得包括短链RNA的转录和酶切产物;测定单元116,用以通过质谱方法测定所述短链RNA,获得所述SHOX2基因中标志物的甲基化程度。在一具体示例中,随机选取共18名受试者,其中9名为肺癌患者,9名为正常受试者,并采集其血液和唾液样品,通过检测装置11检测SHOX2基因中标志物的甲基化程度。首先,通过提取单元111从受试者的血液和唾液样品中提取包括SHOX2基因的DNA样品,并对所提取的DNA样品进行质检,以保证后续检测的顺利进行。提取单元11包括武汉昌美生物技术有限公司的“唾液DNA提取纯化试剂盒(一管法)QT-275”,以提取受试者唾液中的DNA,以及“QIAGEN血细胞DNA提取试剂盒51104”,以提取受试者血液中的DNA。提取完成后,提取单元111通过琼脂糖凝胶电泳检测所提取DNA的纯度及其是否降解,或通过超微量分光光度计NanoDrop检测所提取DNA的浓度及纯度。其次,通过转化单元112将DNA样品中未甲基化的CpG位点的C转化为U,而甲基化的C保持不变。具体可使用ZYMO公司的“EZDNAMethylation-Kit试剂盒D5001”,通过其中的亚硫酸盐与C反应,实现对未甲基化的CpG位点的转化处理,得到转化产物。然后,扩增单元113通过聚合酶链式反应PCR扩增上述转化产物,以获得足量的标志物,便于后续的检测。扩增单元113包括PCR仪“ABIGeneAmp9700384Dual”,具体的PCR反应体系如下表所示:反应物体积(μL)ddH2O1.4210×PCRBuffer,含20mmolMgCl20.50dNTP0.04酶0.04正向引物/反向引物2转化产物1总计5其中,包括正向引物/反向引物的引物对分别选自SEQIDNO.2和SEQIDNO.3,该引物对采用高效液相色谱法HPLC合成。需要注意的是,扩增单元113还可以包括涵盖SHOX2基因中标志物CpG位点的其它引物,例如,引物对中的正向引物/反向引物还可分别选自SEQIDNO.4和SEQIDNO.5,或分别选自SEQIDNO.6和SEQIDNO.7。本具体示例中,采用SEQIDNO.2和SEQIDNO.3为正向引物/反向引物,相应的PCR反应条件如下表所示:其中,引物退火温度与所选择引物的Tm值,即两段互补的碱基序列解链50%时的温度值有关,当采用其它引物时,需根据引物对其进行相应的调整。通过PCR反应,对所要检测的标志物进行扩增,得到扩增产物。在PCR反应过程中,由未甲基化的C转化而来的U进一步转化为T。然后,消化单元114对上述扩增产物进行消化,以除去多余的dNTPs和引物,避免对后续检测造成干扰。本具体示例中,消化单元114的反应体系如下表所示:相应的反应条件如下表所示:温度时间37℃20min85℃5min25℃保温然后,转录和酶切单元115对上述消化产物进行转录和酶切,转录使消化产物中的双链DNA转变为单链RNA,从而避免在后续的质谱检测过程中,双链DNA打开而影响测定结果。酶切使长链的RNA转变为小片段RNA,一方面满足质谱方法对被测分子大小的限制条件;另一方面使每个CpG位点分开,以便逐个分析每个CpG位点的甲基化程度。具体的反应体系如下表所示:反应物体积(μL)RNase-freeddH2O3.215×T7Polymerasebuffer0.89TCleavageMix0.22DTT0.22T7RNA&DNAPolymerase0.40RNaseA0.06总计5相应的反应条件为37℃温育3小时。最后,测定单元116通过质谱方法测定短链RNA,由于未甲基化的CpG位点中的C最终转化为T,而甲基化的CpG位点中的C保持不变,从而产生了分子量的差异,通过检测这种分子量的差异,计算出某一CpG位点的甲基化程度,进而得出SHOX2基因中标志物的甲基化程度。本具体示例中,采用飞行质谱方法,具体通过基质辅助激光解析电离飞行时间质谱法获取质谱峰,进一步根据质谱峰图得出甲基化程度。测定单元16包括质谱点样仪MassARRAYNanodispenserRS1000、质谱分析仪MassARRAYCompactSystem、相关试剂EpiTYPERRTCompleteReagentSet以及相关的Epityper软件。为了进一步提高检测的精度,检测装置11中还包括纯化单元117,通过树脂纯化转录和酶切产物,纯化短链RNA,具体为将反应产物的384孔板中加入20μL三蒸水,在离心机中以2000r/min离心3min,加入树脂,在反转摇匀仪上进行树脂纯化反应15min,脱盐,反应完成后在离心机中以2000r/min离心3min;将脱盐处理后的样品点在样品靶上,自然结晶,获得纯化产物。纯化单元117处理转录和酶切产物后,再由测定单元116测定其甲基化程度。分析该肺癌预测系统得出的判断结果,如图3所示,以SHOX2基因中的示例位点为例。其中,纵坐标表示检测所得的示例位点的甲基化程度,左右两箱图分别对应癌症患者和正常受试者的数据值统计情况。样本总数N为18,癌症患者和正常受试者的数据值统计学p值为0.030416,该统计学p值小于0.05,表明癌症患者和正常受试者之间示例位点的甲基化水平存在显著性差异,即该示例位点能很好地区分癌症人群和正常人群。如图4所示,为受试者血液DNA的SHOX2基因中示例位点甲基化程度平均值的ROC曲线图,其中,阈值a9取为优选的0.14。横坐标表示假阴性率,纵坐标表示真阴性率,样本总数N为18,曲线下面积AUC(AreaUnderCurve)值为0.78125。AUC值的理论范围为0~1,随着AUC值的增大,检测的特异性和敏感性越高,图4中得出的AUC值表明该肺癌预测系统具有较好的特异性和敏感性。综上所述,在本具体示例的18名受试者中,示例位点在肺癌患者中的甲基化程度平均值均显著低于正常受试者25-45%,并且是统计学显著的。在本发明的一优选实施例中,如图1所示,肺癌预测系统还包括:输出模块30,用于输出获取模块10和/或判断模块20的运行结果。通过输出模块30输出肺癌预测系统运行过程中各模块的运行结果,以供分析和判断,为后续的肺癌防治提供相应的指导信息。以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的
技术领域:
均包括在本发明的专利保护范围内。序列表SEQIDNO.1:CGAGGATCGCGAATATTCCGCTTGAACCTGTTGATCTCTGTGGGTTAAGCGTTTAGGGTCGAGTCTGCGTTTCCACGAGGGAGGGCGAAGAGAGAACAGAAAGAGCGGTTGCTTTCGCCCGCCACCGGAGGCTGGTTTTCCGCCTCCTGCCTTCTGGCCCGGCTTGGGCGGCGAGCCCTTTGGGCAGCCAACATGGCGTGGGCGCCTGTGCTCGTGCGACCCCGGTCGGGCAGGCGGGACGGAGATTACCTGGCTGTCCAGGGGACCTTATGCAGGGTTTGGCCCGAGCCCAGGGGCAGCGAGGGGCGTCTGCGGATGCGGCTCCCTGTGCGGCACAACACCGGGGTCTGTTGCTCTCGCTGATACCTTTCGSEQIDNO.2:AGGAAGAGAGATTTGTTGATTTTTGTGGGTTAAGSEQIDNO.3:CAGTAATACGACTCACTATAGGGAGAAGGCTCCCTACATAAAATCCCCTAAACAASEQIDNO.4:GGTTAAATTTTGTATAAGGTTTTTSEQIDNO.5:ATTTGTTGATTTTTGTGGGRRAAGSEQIDNO.6:TAAGGTTTTTTGGATAGTTAGGTASEQIDNO.7:AATATTTTGTTTGAATTTGTTGA当前第1页1 2 3