利用下一代测序方法的靶蛋白的聚类定量方法及其用途与流程

文档序号:20214877发布日期:2020-03-31 11:41阅读:421来源:国知局
利用下一代测序方法的靶蛋白的聚类定量方法及其用途与流程

本发明涉及一种利用下一代测序方法的靶蛋白的聚类定量方法及其用途。



背景技术:

虽然对构成样本的多重蛋白质进行分析的技术、对样本中所包含的蛋白质进行定量的信息以及对定量状态进行综合的信息,即,用于产生蛋白质表达谱(profile)的技术以及用于对靶蛋白进行识别的技术伴随着物理学、生物化学以及生物信息学的发展而得到了广泛的开发,但是因为现有的方法或设备具有与使用及维护费用、易用性、准确度、灵敏度、检查时间以及过程自动化等相关的问题,因此急需开发出更加有效的新方法以及设备。

最近开发出的2-d凝胶电泳及质谱分析测定技术,使得少量包含的血浆成分的测定变得可能。但是,这种技术要求执行用于对以高浓度存在的蛋白质的血浆/血清进行去除的高工作量的初步分类协议(参考:anderson,proteomics(3005);andersonandanderson,electrophoresis(1991);gygiandaebersold,curropinchembiol(3000);liotta,etal.,jama(3001);yates,trendsgenet(3000);andadkin,etal.,molcellproteomics(3002))。此外,这种测定需要耗费大量的时间,而且执行上述方法所需的必要装备的购买和维护也需要投入大量的费用。

虽然如血浆蛋白质组等生物样本的蛋白质组在疾病诊断以及治疗监测方面非常有望成为便于使用的标本,但是现有的测定以及技术具有包括如灵敏度限制、时间以及效率限制以及相关的高额成本等在内的多种缺点。而且,现有的测定以及技术无法充分地将生物样本作为生物标记用的原料使用。例如,电泳及质谱分析都是基于蛋白质大小以及电荷对血浆蛋白质进行分离,而基于蛋白质的其他物性的测定以及技术目前仍处于空白状态。在本行业中,急需开发出能够获得并使用样本的蛋白质组学表达谱的方法,而且也正在为克服上述的现有技术中的缺点而不断努力。

适配体(aptamer)是指对靶蛋白具有较高的特异性结合能力的、靶化合物或蛋白质的特异性单链核酸配体。作为适配体的制造方法,使用最为广泛的是“指数富集的配体系统进化(selex,systematicevolutionofligandsbyexponentialenrichment)”方法。指数富集的配体系统进化(selex)方法是一种与对靶分子具有较高的特异性结合能力的核酸蛋白质的生物外展开相关的方法,在于1990年06月10日申请的美国专利申请第07/536,428号(目前已废弃)、美国专利第5,475,096号(发明的名称:“nucleicacidligands”)以及美国专利第5,270,163号(发明的名称:“nucleicacidligands”)等中记载有相关的信息。

指数富集的配体系统进化(selex)方法的基础在于,核酸具有形成多种不同的二维以及三维结构所需的充足的能力以及实质上对任意化学化合物(无论单体或聚合体)起到配体作用(即,形成特异性结合对)所需的、可在单体内使用的化学多功能性(chemicalversatility)。能够将具有任意大小或组成的蛋白质作为靶分子使用。作为利用价值极高的配体,正在大量开展有关于适配体的研究,但是适配体的常规筛选方法的限制在于,只能以已知蛋白质或物质作为对象实施。

本发明人提出了能够将包含未知蛋白质或已知蛋白质的复合样本作为对象筛选出与蛋白质进行结合的单链核酸(分子结合核酸)并对与分子结合核酸进行结合的靶分子进行定量的方法等。即,通过用于产生蛋白体表达谱的逆-指数富集的配体系统进化(reverse-selex)(参阅韩国注册专利第10-0670799号)、基于分子结合核酸的生物芯片(参阅韩国专利注册第10-0464225号)、利用基于分子结合核酸的生物芯片的生物学意义分析技术(参阅韩国专利注册第10-0924048号),提出了利用单链核酸产生蛋白质组学表达谱的方法以及与构成生物样本的多重蛋白质进行结合的分子结合核酸的选定方法等。

在本发明中,公开一种利用下一代序列分析技术(nextgenerationsequencing,ngs)对样本中的蛋白质进行聚类定量的方法等。



技术实现要素:

本发明的目的在于提供一种分析对象样本中的靶蛋白的聚类定量方法。

本发明的另一目的在于提供一种通过对2种以上的分析对象样本中的靶蛋白进行聚类定量以及比较而筛选出生物标记候选蛋白质的方法。

本发明的另一目的在于提供一种分析对象样本中的靶蛋白与靶核酸的同时分析方法。

本发明的其他目的或具体的目的将在后续的内容中进行公开。

在一方面,本发明提供一种分析对象样本中的靶蛋白的聚类定量方法,包括:(a)通过利用存在于分析对象样本中的靶蛋白聚类的特异性适配体文库对上述分析对象样本进行处理”),形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的复合体聚类的步骤;(b)将上述复合体聚类从未结合适配体分离的步骤;以及,(c)通过利用下一代序列分析技术(nextgenerationsequencing,ngs)对上述复合体聚类的各个适配体的序列进行分析而对上述复合体聚类的各个适配体进行定量,从而对上述复合体聚类的各个靶蛋白进行定量的步骤。

在上述方法中,上述适配体文库,能够通过(i)制备出因为包括随机序列而具有与多种不同的蛋白质的潜在结合能力的适配体池;(ii)通过使上述适配体池以及与上述步骤(a)相同的分析对象样本的靶蛋白聚类发生反应,对各个适配体与各个靶蛋白之间的特异性结合进行诱导,从而形成复合体聚类;(iii)通过对未结合的适配体进行去除,分离出上述复合体聚类;以及,(iv)对上述复合体聚类的适配体进行扩增;的方式获得。

此外,在上述方法中,构成上述适配体文库的各个适配体能够共同地在5’区域以及3’区域具有包括已知序列的保留区域并在其中间区域具有包括任意的随机序列的可变区域。

此外,在上述方法中,上述分析对象样本能够是对上述样本中大量存在的蛋白质进行去除的加工样本。

此外,在上述方法中,上述步骤(c)能够通过在从上述复合体聚类的适配体制备出双链脱氧核糖核酸(dna)聚类之后利用下一代序列分析技术对上述双链脱氧核糖核酸(dna)聚类进行分析的方式执行。此时,通过使构成上述适配体文库的各个适配体共同地在5’区域以及3’区域具有包括已知序列的保留区域并在其中间区域具有包括任意的随机序列的可变区域,能够利用1组正向引物以及逆向引物执行上述双链脱氧核糖核酸(dna)聚类的制备。

此外,在上述方法中,通过在对分析对象样本中不存在的2种以上的外部标准蛋白质进行定量之后以不同的定量值(即,浓度)添加到在上述步骤(a)中利用上述适配体文库进行处理之前的上述分析对象样本,并在上述步骤(a)中作为适配体文库使用追加包含上述外部标准蛋白质的适配体的适配体文库,上述步骤(c)中对靶蛋白的定量,能够通过在获得上述外部标准蛋白质的适配体定量结果的同时获得靶蛋白的适配体定量结果,并对上述外部标准蛋白质的适配体定量结果以及靶蛋白的适配体定量结果进行比较的方式执行。

此外,在上述方法中,上述适配体能够是脱氧核糖核酸(dna)的单链核酸或核糖核酸(rna)的单链核酸。

此外,在上述方法中,上述靶蛋白聚类能够是未知蛋白质聚类、已知蛋白质聚类或由未知蛋白质和已知蛋白质混合而成的聚类。

此外,在上述方法中,还能够包括:当上述靶蛋白聚类中的特定蛋白质为未知蛋白质时,利用包含于适配体文库中的上述未知蛋白质的特异性适配体对上述未知蛋白质进行分离和识别的步骤。

此外,在上述方法中,上述步骤(c)中的定量,能够通过在对各个适配体中的由相同序列构成的读长(read)进行计数的同时,对因为体现出下一代序列分析技术的错误率而可以视为与上述读长相同序列的序列进行计数,并在将其与上述读长的系数值进行合算之后利用上述合算值对靶蛋白进行定量的方式执行。对上述读长等的计数,能够通过将对构成上述适配体文库的各个适配体的序列进行分析而获得的各个适配体的已知序列作为参考序列,对上述参考序列以及上述复合体聚类的各个适配体的序列的分析结果进行比较的方式执行。

在另一方面,本发明提供一种作为生物标记的候选蛋白质的筛选方法,包括:(a)通过利用存在于分析对象样本中的靶蛋白聚类的特异性适配体文库对上述分析对象样本进行处理,形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的复合体聚类的步骤;(b)将上述复合体聚类从未结合适配体分离的步骤;以及,(c)通过对上述复合体聚类的各个适配体的序列进行分析而对上述复合体聚类的各个适配体进行定量,从而对上述复合体聚类的各个靶蛋白进行定量的步骤;其中,还包括:(i)对与上述分析对象样本不同的分析对象样本同样执行上述步骤(a)至步骤(c)的步骤;以及,(ii)通过对上述2种分析对象样本在上述步骤(c)中获得的各个靶蛋白的定量结果进行比较,决定定量结果存在差异的一个以上的靶蛋白的步骤。

在上述方法中,作为上述适配体文库能够对上述2种分析对象样本使用相同的适配体文库。

此外,在上述方法中,作为上述适配体文库对上述2种分析对象样本使用相同的适配体文库,其中,上述适配体文库,能够通过(i)制备出因为包括随机序列而具有与多种不同的蛋白质的潜在结合能力的适配体池;(ii)通过使上述适配体池与上述2种分析对象样本中的某一种样本的靶蛋白聚类发生反应,对各个适配体与各个靶蛋白之间的特异性结合进行诱导,从而形成复合体聚类;(iii)通过对未结合的适配体进行去除,分离出上述复合体聚类;以及,(iv)对上述复合体聚类的适配体进行扩增;的方式获得。

此外,在上述方法中,构成上述适配体文库的各个适配体能够共同地在5’区域以及3’区域具有包括已知序列的保留区域并在其中间区域具有包括任意的随机序列的可变区域。

此外,在上述方法中,上述2种分析对象样本能够是对上述各个样本中大量存在的蛋白质进行去除的加工样本。

此外,在上述方法中,上述步骤(c)能够通过在从上述复合体聚类的适配体制备出双链脱氧核糖核酸(dna)聚类之后利用下一代序列分析技术对上述双链脱氧核糖核酸(dna)聚类进行分析的方式执行。此时,通过使构成上述适配体文库的各个适配体共同地在5’区域以及3’区域具有包括已知序列的保留区域并在其中间区域具有包括任意的随机序列的可变区域,能够利用1组正向引物以及逆向引物执行上述双链脱氧核糖核酸(dna)聚类的制备。

此外,在上述方法中,通过在对分析对象样本中不存在的2种以上的外部标准蛋白质进行定量之后以不同的定量值添加到在上述步骤(a)中利用上述适配体文库进行处理之前的上述分析对象样本,并在上述步骤(a)中作为适配体文库使用追加包含上述外部标准蛋白质的适配体的适配体文库,上述步骤(c)中能够通过在获得上述外部标准蛋白质的适配体定量结果的同时获得靶蛋白的适配体定量结果,并对上述外部标准蛋白质的适配体定量结果以及靶蛋白的适配体定量结果进行比较的方式对靶蛋白进行定量,同样在上述步骤(i)中通过在对上述另一个分析对象样本中不存在的2种以上的外部标准蛋白质进行定量之后以不同的定量值添加到利用上述适配体文库进行处理之前的上述另一个分析对象样本,并作为上述适配体文库使用追加包含与上述外部标准蛋白质相关的适配体的适配体文库,能够通过在获得上述外部标准蛋白质的适配体定量结果的同时获得靶蛋白的适配体定量结果,并对上述外部标准蛋白质的适配体定量结果以及靶蛋白的适配体定量结果进行比较的方式对靶蛋白进行定量,而上述步骤(ii)能够通过对上述2种分析对象样本的靶蛋白定量结果进行比较的方式执行,其中,添加到上述2种分析对象样本中的上述外部标准蛋白质是相同的蛋白质为宜。

此外,在上述方法中,上述适配体是脱氧核糖核酸(dna)的单链核酸或核糖核酸(rna)的单链核酸为宜。

此外,在上述方法中,上述靶蛋白聚类能够是未知蛋白质聚类、已知蛋白质聚类或由未知蛋白质和已知蛋白质混合而成的聚类。

此外,在上述方法中,还能够包括:当上述靶蛋白聚类中的特定蛋白质为未知蛋白质时,利用包含于适配体文库中的上述未知蛋白质的特异性适配体对上述未知蛋白质进行分离和识别的步骤。

此外,在上述方法中,上述步骤(c)中的定量以及上述步骤(i)中的定量,能够通过在对各个适配体中的由相同序列构成的读长(read)进行计数的同时,对因为体现出下一代序列分析技术的错误率而可以视为与上述读长相同序列的序列进行计数,并在将其与上述读长的系数值进行合算之后利用上述合算值对靶蛋白进行定量的方式执行。此时,同样能够将已决定序列的参考序列用于读长等的计数。

在又一方面,本发明提供一种作为生物标记的候选蛋白质的筛选方法,包括:(a)通过利用2种分析对象样本即测试样本以及比较样本中的某一种样本的靶蛋白聚类的特异性适配体文库分别对上述分析对象样本进行处理,在各个样本中分别形成各个样本的靶蛋白聚类中的各个蛋白质以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的复合体聚类,接下来在各个样本中分别将上述复合体聚类从未结合适配体分离之后,在各个样本中将上述所分离出的复合体聚类的适配体转换成双链脱氧核糖核酸(dna)聚类的步骤;(b)将在上述测试样本以及比较样本中获得的双链脱氧核糖核酸(dna)聚类之间共同存在的双链脱氧核糖核酸(dna)从在测试样本中获得的双链脱氧核糖核酸(dna)聚类中去除的步骤;以及,(c)通过利用下一代序列分析技术对上述已去除共同存在的双链脱氧核糖核酸(dna)聚类之后的测试样本的剩余双链脱氧核糖核酸(dna)进行分析,在对上述聚类中的各个双链脱氧核糖核酸(dna)序列进行分析同时获得各个双链脱氧核糖核酸(dna)的丰度(abundance)的步骤。

此外,在上述方法中,上述步骤(c)能够通过对剩余的双链脱氧核糖核酸(dna)进行扩增并利用下一代序列分析技术对上述扩增物进行分析的方式执行。

此外,在上述方法中,上述步骤(b)能够通过ssh(suppressionsubtractivehybridization,抑制消减杂交)方法或dsn(duplex-specificnuclease,双链特异性核酸酶)方法执行。

在又一方面,本发明提供一种分析对象样本中的靶核酸与靶蛋白的同时分析方法,其特征在于,包括:(a)(i)通过从分析对象样本获得包含靶蛋白聚类的蛋白质样本并利用上述所获得的蛋白质样本中的靶蛋白聚类的特异性适配体文库对上述蛋白质样本进行处理,形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的聚合体聚类,接下来在将上述复合体聚类从未结合适配体分离之后,将上述所分离出的复合体聚类的适配体转换成双链脱氧核糖核酸(dna)的步骤,(ii)从与上述分析对象样本相同的分析对象样本获得包含靶核酸的核酸样本,接下来将上述核酸样本中的靶核酸转换成双链脱氧核糖核酸(dna)的步骤;(b)对源自于上述适配体的双链脱氧核糖核酸(dna)和源自于上述靶核酸的双链脱氧核糖核酸(dna)片段进行混合的步骤;以及,(c)通过利用下一代序列分析技术对上述混合物中的各个双链脱氧核糖核酸(dna)的序列进行分析,在获得各个双链脱氧核糖核酸(dna)的序列信息的同时决定各个双链脱氧核糖核酸(dna)的丰度(abundance)的步骤;借此,能够同时执行靶蛋白和定量以及靶核酸的序列分析和定量。

在上述方法中,上述靶核酸能够是基因组脱氧核糖核酸(gdna)、核糖核酸(rna)或上述之混合物。

此外,在上述方法中,上述基因组脱氧核糖核酸(gdna)能够是具有序列缺失、序列插入、单核苷酸多态性(snp)以及甲基化胞嘧啶中的一种以上的基因组脱氧核糖核酸(gdna)。

此外,在上述方法中,上述核糖核酸(rna)能够是信使核糖核酸(mrna)、前信使核糖核酸(pre-mrna)、非编码核糖核酸(ncrna,noncodingrna)或上述之混合物。

此外,在上述方法中,上述靶蛋白能够是已知蛋白质或未知蛋白质,上述靶核酸能够是已知核酸或未知核酸。

此外,在上述方法中,能够从上述步骤(a)的适配体的双链脱氧核糖核酸(dna)或核酸的双链脱氧核糖核酸(dna)片段制备出测序文库(sequencinglibrary),上述步骤(b)能够通过对上述测序文库进行混合的方式执行。

此外,在上述方法中,通过在对分析对象样本中不存在的2种以上的外部标准蛋白质进行定量之后以不同的定量值添加到在上述步骤(a)中利用上述适配体文库进行处理之前的上述分析对象样本,并在上述步骤(a)中作为适配体文库使用追加包含上述外部标准蛋白质的适配体的适配体文库,上述步骤(c)中对靶蛋白的定量,能够通过在获得上述外部标准蛋白质的适配体定量结果的同时获得靶蛋白的适配体定量结果,并对上述外部标准蛋白质的适配体定量结果以及靶蛋白的适配体定量结果进行比较的方式执行。

此外,在上述方法中,通过在对分析对象样本中不存在的2种以上的外部标准核酸进行定量之后以不同的定量值添加到在上述步骤(a)中获得上述核酸样本之前的分析对象样本,上述步骤(c)中对靶核酸的定量,能够通过在获得上述外部标准核酸的定量结果的同时获得靶核酸的定量结果,并对上述外部标准核酸的定量结果以及靶核酸的定量结果进行比较的方式执行。

此外,在上述方法中,上述靶核酸尤其能够是前信使核糖核酸(premrna)或信使核糖核酸(mrna)。

此外,在上述方法中,上述适配体文库,能够通过(i)制备出因为包括随机序列而具有与多种不同的蛋白质的潜在结合能力的适配体池;(ii)通过使上述适配体池以及与上述步骤(a)相同的分析对象样本的靶蛋白聚类发生反应,对各个适配体与各个靶蛋白之间的特异性结合进行诱导,从而形成复合体聚类;(iii)通过对未结合的适配体进行去除,分离出上述复合体聚类;以及,(iv)对上述复合体聚类的适配体进行扩增;的方式获得。

此外,在上述方法中,构成上述适配体文库的各个适配体能够共同地在5’区域以及3’区域具有包括已知序列的保留区域并在其中间区域具有包括任意的随机序列的可变区域。

此外,在上述方法中,上述分析对象样本能够是对上述样本中大量存在的蛋白质进行去除的加工样本。

此外,在上述方法中,上述核酸样本能够是对核糖体核糖核酸(rrna)进行去除的核酸样本。

此外,在上述方法中,通过使构成上述适配体文库的各个适配体共同地在5’区域以及3’区域具有包括已知序列的保留区域并在其中间区域具有包括任意的随机序列的可变区域,能够利用1组正向引物以及逆向引物执行上述双链脱氧核糖核酸(dna)聚类的制备。

此外,在上述方法中,上述适配体能够是脱氧核糖核酸(dna)的单链核酸或核糖核酸(rna)的单链核酸。

此外,在上述方法中,上述靶蛋白是未知蛋白质、已知蛋白质或未知蛋白质和已知蛋白质的混合物。较佳地,还能够包括:当上述靶蛋白聚类中的特定蛋白质为未知蛋白质时,利用包含于适配体文库中的上述未知蛋白质的特异性适配体对上述未知蛋白质进行分离和识别的步骤。

此外,在上述方法中,上述步骤(c)中对靶蛋白或靶核酸的定量,能够通过在对源自于各个适配体的各个双链核酸或源自于各个靶核酸的各个双链核酸片段中的由相同序列构成的读长(read)进行计数的同时,对在体现下一代序列分析技术的错误率的前提下可以视为与上述读长相同序列的序列进行计数,并在将其与上述读长的系数值进行合算之后利用上述合算值对靶蛋白或靶核酸进行定量的方式执行。对上述读长等的计数,能够通过将对源自于上述适配体的各个双链核酸序列或源自于上述靶核酸的各个双链核酸片段的序列进行分析而获得的各个已知序列作为参考序列,对上述参考序列以及源自于上述适配体的各个双链核酸的序列的分析结果或源自于上述靶核酸的各个双链核酸片段的序列的分析结果进行比较的方式执行。

接下来,将对本发明进行详细的说明。

本发明的一方面涉及一种分析对象样本中的靶蛋白的聚类定量方法。

适用本发明的靶蛋白的聚类定量方法,包括:(a)通过利用存在于分析对象样本中的靶蛋白聚类的适配体文库对上述分析对象样本进行处理而形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的复合体聚类的步骤;(b)将上述复合体聚类从未结合适配体分离的步骤;以及,(c)通过对上述复合体聚类的各个适配体的序列进行分析而对上述复合体聚类的各个适配体进行定量,从而对上述复合体聚类的各个靶蛋白进行定量的步骤。

适用本发明的方法,是一种通过使适配体文库与分析对象样本中的靶蛋白聚类发生反应而形成各个靶蛋白以及对各个靶蛋白特异性的各个适配体之间的复合体,从而整体上形成靶蛋白聚类以及对靶蛋白聚类特异性适配体文库聚类之间的复合体聚类,接下来在将上述复合体聚类的各个适配体转换成双链脱氧核糖核酸(dna)之后利用下一代序列分析技术对上述各个适配体的双链脱氧核糖核酸(dna)进行测序,从而对靶蛋白进行聚类定量的方法。

随着2000年代初期人类基因组计划(humangenomeproject)的顺利完成,急需开发出一种低成本、高速、大容量的核酸序列分析技术,因此在2007年前后,ilumina(设备名称:genomeanalyzer系列)、roche(设备名称:系列)、lifetechnology(设备名称:系列)等公司陆续推出了利用下一代序列分析(ngs)技术的产品。上述下一代序列分析(ngs)技术是一种将通过对基因组脱氧核糖核酸(dna)进行片段化而获得的脱氧核糖核酸(dna)文库在基板或油包水(磁珠)上按照各个片段进行空间分离,接下来在利用聚合酶链反应(pcr)进行扩增而形成各个片段的克隆之后以大量并列方式对几十万个乃至几十亿个克隆同时执行测序反应,从而同时读取各个克隆的序列的方式。上述测序反应是一种以各个克隆的单一脱氧核糖核酸(dna)片段作为模板,在通过pcr(polymerasechainreaction,聚合酶链反应)将单核苷酸逐个进行拼接的同时通过物理化学方式对此时产生的信号进行检测的方法。在各个片段中读取到的序列信息即读长(read)将与已分析获得的参考序列(referencesequence)进行比较并通过生物信息学技法进行排序和组合,从而构成整体基因组序列(naturegenetics,2010,11:31-46;trendsingenetics,2008,24(3):133-141;genomics,2008,92:255-264)。包括上述文献在内,在本说明书中引用的所有文献均应视为构成本说明书的一部分。

当在适用本发明的方法中使用上述下一代序列分析(ngs)对构成复合体的适配体的序列进行测试时,能够对相同序列的读长(read)或可以视为相同序列的读长的数量进行计数,而因为上述读长的数量能够体现出上述适配体进行特异性结合的靶蛋白的丰度(abundance),因此最终能够对靶蛋白进行定量。

但是,因为在测序反应过程中执行聚合酶链反应(pcr)时聚合酶所导致的误差、通过物理化学方式对信号进行检测的过程中出现的误差等,因此下一代序列分析(ngs)的测序误差率约为0.1至2%左右,据了解,上述错误率(errorfrequency)在roche公司的454gsjunior中为1%(10-2)、在ilumina公司的hiseq中为0.1%(10-3)、在lifetechnology公司的solid中为2%(2×10-2)(foxetal.,nextgeneratsequenc&applic2014,1:1)。

因此,在考虑到如上所述的下一代序列分析(ngs)的错误率的前提下,只有将不是相同序列但可以视为相同序列的读长序列看做相同的适配体,才能够提升上述适配体进行特异性结合的靶蛋白的定量准确度。

在适用本发明的方法中,为了实现上述目的(即,通过将可以视为相同序列的读长序列看做相同的适配体而提升上述适配体的靶蛋白的定量准确度),作为适配体文库使用了5’区域以及3’区域由包括已知序列的保留区域构成且其中间区域由包括不同随机序列的可变区域构成的适配体的文库,从而在考虑到下一代序列分析(ngs)设备的错误率的前提下,在保留区域序列中允许2%以下的序列不一致,从而将与保留区域的不一致率为2%以下的读长序列(包括与保留区域完全相同的序列)作为有效读长并排除剩余序列之后,再将上述有效读长的可变区域中的序列不一致率为2%以下的有效读长视为相同读长(即,视为相同适配体)用于靶蛋白的定量。通过按照如上所述的方式考虑下一代测序(ngs)错误率,能够提升通过适配体测序的靶蛋白定量的准确性,而如上所述的在考虑到错误率的前提下决定有效读长的标准,能够根据适用于本发明的方法中的下一代测序(ngs)技术(或设备)的错误率进行适当的调整。

在本说明书中,“读长(read)”是通过下一代测序(ngs)进行分析的各个双链片段的序列。因为各个双链片段是从适配体分离且上述适配体持有靶蛋白的定量信息,因此能够根据对由相同序列或可以视为相同序列的序列构成的读长进行技术的结果进一步获得靶蛋白的定量信息。

在适用本发明的方法中,分析对象样本能够是因为包含或可能包含需要检测的靶蛋白而有必要进行检测的混合物或溶液形态的任意的样本。样本不仅能够是从人体或动物获取的生物样本,还能够是通过对上述生物样本进行加工而提升靶蛋白浓度的加工样本,进而还能够是包含或可能包含靶蛋白的如水、食品、产业废水、环境污染因子、毒性因子等有必要进行检测的样本。如上所述的样本能够包含适当的稀释剂、缓冲溶液。

此外,在适用本发明的方法中,分析对象样本较佳地能够是从人体或动物获取的生物样本或其加工样本。生物样本能够是如血液、尿液、唾液、精液、羊水、淋巴液、痰液、组织、滑液、细胞或细胞提取物等因为包含或可能包含需要检测的靶蛋白而有必要进行检测的从人体或动物获取的样本。加工样本能够是利用蛋白质提取试剂盒对如血浆、血清或生物样本等中的蛋白质浓度进行提升的样本、组织提取物、从组织获取的细胞、细胞溶解物或细胞培养物等。此外,加工样本能够是从生物样本对在上述生物样本中大量存在且作为靶蛋白的利用价值(例如能够作为特定疾病的生物标记使用的可能性等)较低的蛋白质进行去除的加工样本。例如,因为血液样本中的蛋白质总量的99.9%为极少数的几种特定的蛋白质,因此如上所述的大量存在蛋白质作为靶蛋白的利用价值通常较低(mol.cell.prot.(2006)5(10):1727-1744)。而当使用从生物样本中去除大量存在的蛋白质之后的加工样本时,能够提升利用价值较高的靶蛋白的检测灵敏度。在包括人类在内的哺乳动物的血液样本中,如上所述的大量存在的蛋白质的实例包括如白蛋白、免疫球蛋白g(igg)、免疫球蛋白a(iga)、转铁蛋白(transferrin)、纤维蛋白原等。如上所述的大量存在的蛋白质,能够通过在本行业中公知的方法(例如免疫亲和消除法(immuno-affinitydepletion))或使用市售的适当的试剂盒(安捷伦科技有限公司的多重亲和去除系统(multipleaffinityremovalsystem)等)进行去除。

在适用本发明的方法中,上述步骤(a)中的适配体文库,能够通过如下述实施例所述的(i)制备出因为由不同的多种序列(即,随机序列)构成而具有与多种不同的蛋白质的潜在结合能力的适配体池;(ii)通过使上述适配体池以及与上述步骤(a)相同的分析对象样本的靶蛋白聚类发生反应,对各个适配体与各个靶蛋白之间的特异性结合进行诱导,从而形成复合体聚类;(iii)通过对未结合的适配体进行去除,分离出上述复合体聚类;以及,(iv)对上述复合体聚类的适配体进行扩增;的方式获得。

在上述适配体文库的制备过程中,上述步骤(i)中的包括多种不同序列的适配体池,通常是指单链的核糖核酸(rna)或脱氧核糖核酸(dna)寡核苷酸核酸池,而上述寡核苷酸通常包括如上所述的由已知序列构成的5’端保留区域和3’端保留区域以及上述两者之间的由随机序列构成的可变区域。上述由已知序列构成的保留区域中,能够包括可供正向/逆向引物结合的序列、核糖核酸(rna)聚合酶的启动子序列、用于执行克隆等操作的限制酶识别序列等。因为上述由随机序列构成的可变区域通常是由40~60个核苷酸构成,因此包括5’端区域以及3’端区域在内的寡核苷酸的整体长度通常为60~120个核苷酸的长度。如上所述的寡核苷酸的合成属于本行业公知的技术,其合成方法包括固相寡核苷酸合成技术以及如三酯合成法等液相合成技术等。相关具体信息能够参考文献[nucl.acidres.14:5399-5467,1986]、文献[tet.lett.27:5575-5578,1986]、文献[nucl.acidres.4:2557,1977]、文献[lett.,28:2449,1978]等。此外,也能够利用市售的自动化脱氧核糖核酸(dna)合成装置,在利用上述装置时,能够获得包含1014-1016个寡核苷酸的、充分包含多种不同的适配体的适配体池。此外,当作为适配体池使用核糖核酸(rna)池时,能够通过利用t3、t4、t7等核糖核酸(rna)聚合酶对脱氧核糖核酸(dna)池进行转录的方式获得核糖核酸(rna)池进行使用。

此外,在制备上述适配体文库时,为了上述步骤(iii)中的复合体聚类的分离,能够通过适用本行业中公知的适当方法,如利用适当的洗涤缓冲液执行1次以上的洗涤步骤去除上述未结合的适配体。在按照如上所述的方式对未结合的适配体进行去除并“选择”性地分离出复合体聚类之后,能够通过仅对上述复合体聚类的适配体进行“扩增”而制备出适配体文库。虽然在适用本发明之方法的上述步骤(a)中能够直接使用仅执行1次如上所述的选择和扩增的适配体文库,但是也能够通过重复执行上述选择和扩增过程2次以上,即,通过重复执行使仅对上述复合体聚类的适配体进行扩增而获得的适配体文库再次与分析对象样本的靶蛋白聚类发生反应而重新形成复合体聚类并对复合体聚类进行分离以及仅对上述复合体的适配体再次进行扩增的过程2次以上,使用对分析对象样本的靶蛋白聚类的特异性结合能力得到提升的适配体文库。但是,因为通过使适配体文库更加多样化地体现出分析对象样本中的靶蛋白而对多种不同的靶蛋白进行聚类检测以及分析为宜,因此与重复执行上述选择以及扩增过程的方式相比,通过仅执行1次选择以及扩增过程并利用多种不同的洗涤缓冲液执行2次以上的洗涤步骤的方式制备适配体文库为宜。作为洗涤溶液能够购买使用在本行业中广泛使用的产品或经过适当调配后使用,而上述洗涤溶液中通常包含表面活性剂和/或盐。作为表面活性剂,能够使用如sds、tween30、tween40、tween60、tween80、tritonx-405、tritonx-100、tetronic908、cholesterolpeg900、polyoxyethyleneetherw-1、span20、span40、span85或上述之混合物,作为盐,能够使用如锂、纳、钾以及铵的醋酸盐、乳酸盐、柠檬酸盐、磷酸盐、硝酸盐、硫酸盐、氯化物盐或上述之混合物(ssc、sspe等)。尤其是,作为洗涤溶液,能够使用如tbst溶液(10mmtris-cl,ph8.0,150mmnacl,0.05%tween20)、pbst溶液(pbs,ph7.0,0.05%tween20)或包含tween20、tween30等的sspe溶液(0.2mphosphatebuffer,2.98mnacl,20mmedta,ph7.4)等,也能够使用1~600mm的edta溶液等。。

此外,在适用本发明的方法中,“靶蛋白聚类”是指2种以上的不同蛋白质的集合体,当将按照如上所述的方式利用适配体池对分析对象样本进行处理之后分离出所有复合体并对上述复合体的适配体进行扩增而获得的适配体池作为适配体文库进行使用时,能够对相当多的靶蛋白进行聚类检测。因此,靶蛋白聚类能够是由至少500种以上的蛋白质构成的蛋白质聚类,较佳地能够是由1000种以上、更较佳地能够是由1500种以上、更更较佳地能够是由2000种以上的蛋白质构成的蛋白质聚类。上述适配体池中的各个适配体,在需要时也能够使用通过适用本发明的方法或适用众所周知的基于构建细菌人工染色体文库(baclibrary)的克隆测序方法(genomeres.2001mar;11(3):483-496)预先决定其序列的适配体。

此外,在本发明中,上述步骤(a)中的“靶蛋白聚类的特异性适配体文库”是指能够通过与上述靶蛋白聚类进行特异性结合而对靶蛋白进行聚类检测的适配体的集合体。因此,当靶蛋白聚类的大小是由如1000种靶蛋白构成时,适配体文库也将由至少1000种以上的适配体构成。其中,之所以说“将由至少1000种以上的适配体构成”,是因为当使某个特定靶蛋白与适配体池发生反应时,并不是只有某1种特定适配体与上述靶蛋白进行特异性结合,而是可能会有2种以上的特定适配体与上述靶蛋白进行特异性结合。通常,构成适配体池的适配体的类型将多于构成靶蛋白聚类的靶蛋白的类型。

在适用本发明的方法中,适配体是指与抗体相同的能够与靶蛋白进行特异性结合的核酸配体,因此只要能够与靶蛋白进行特异性结合,适配体也能够是部分或完整的双链脱氧核糖核酸(dna)或双链核糖核酸(rna)适配体。即便如此,作为适配体使用特异性结合能力较高的单链脱氧核糖核酸(dna)适配体或单链核糖核酸(rna)适配体为宜,尤其是使用单链核糖核酸(rna)适配体为宜。单链适配体能够是为了对化学·物理·酶分解具有抵抗力而在碱基位置上进行化学变形(修饰)的适配体。在适用本发明的下述实施例中,利用2’f-ctp以及2’f-utp制备出了所有的c以及u为fc(2'-f被修饰的c)以及fu(2'-f被修饰的u)的核糖核酸(rna)池并将其适用于适配体文库的制备。

在适用本发明之方法的上述步骤(a)中通过使分析对象样本的靶蛋白聚类和适配体文库发生反应而借助于构成上述蛋白质聚类的各个靶蛋白与构成适配体文库的各个适配体之间的特异性结合形成复合体聚类之后,在适用本发明之方法的步骤(b)中需要对上述复合体聚类与上述未结合适配体进行分离。如上所述的复合体聚类从未结合适配体的分离,能够通过在本行业中公知的任意方法执行。例如,能够通过利用包含对蛋白质具有较高结合亲和性的硝化纤维膜(nitrocellulosemembrane)的反应溶液(上述反应溶液例如能够由60mmtriscl(ph7.4)、5mmkcl、100mmnacl、1mmmgcl2、0.1%nan3的组成构成)对分析对象样本进行处理而使其发生反应,从而使分析对象样本中的靶蛋白被吸附到硝化纤维膜中,接下来通过利用特异性适配体文库对其进行处理而诱导复合体的形成,然后在通过利用适当的洗涤缓冲液进行洗涤而去除未结合或非特异性结合的适配体之后对只结合有复合体的硝化纤维膜进行回收,从而实现复合体聚类的分离。此外,在如上所述的复合体聚类的分离中也能够使用硝化纤维滤网以及尼龙膜结构。具体来讲,在通过向包含适配体文库的反应溶液添加样本而使其发生反应之后,利用由硝化纤维滤网以及尼龙膜构成的结构体对上述反应混合溶液进行处理并施加适当的压力,此时适配体与蛋白质复合体将残留在硝化纤维滤网上,而未结合的单链核酸将残留在尼龙膜上。通过在对上述硝化纤维滤网进行回收之后利用适当的洗涤缓冲液进行洗涤,能够去除未结合或费特异性结合的适配体,从而获得复合体聚类。其中,关于洗涤缓冲液以及利用上述洗涤缓冲液的洗涤步骤,能够参阅与上述适配体文库的制备相关的说明内容。

在适用本发明的方法中,在通过步骤(b)分离出复合体聚类之后,将执行通过利用下一代序列分析(ngs)技术对上述复合体聚类的各个适配体序列进行分析而对上述复合体聚类的各个适配体进行定量并进一步对上述复合体聚类的各个靶蛋白进行定量的上述步骤(c),而为了能够利用如上所述的下一代序列分析(ngs)技术执行序列分析,需要将复合体的适配体转换成双链形态的脱氧核糖核酸(dna)片段,这能够通过在本行业中公知的技术轻易地实现。例如,当适配体为核糖核酸(rna)单链适配体时,能够通过在对上述单链核糖核酸(rna)进行逆转录而制备出互补脱氧核糖核酸(cdna)之后对上述互补脱氧核糖核酸(cdna)执行1次单向聚合酶链反应(one-waypcr)的方式实现。当为了利用下一代序列分析(ngs)技术执行序列分析而需要将样本的量放大到适当的量或需要对样本中微量存在的靶蛋白进行检测时,能够通过以上述互补脱氧核糖核酸(cdna)等作为对象重复执行几次或几十次聚合酶链反应(pcr)的方式放大样本的量。当通过重复执行几次或几十次聚合酶链反应(pcr)的方式放大样本的量并将其作为下一代序列分析(ngs)技术中的测序文库使用时,读长的数量也将随着所执行的聚合酶链反应(pcr)的次数呈比例增加,因此在通过读长的数量对靶蛋白进行定量时需要考虑上述聚合酶链反应(pcr)的次数。

在执行如上所述的聚合酶链反应(pcr)时,如果适用本发明的适配体文库是5’区域以及3’区域由包括已知序列的保留区域构成且其中间区域由包括不同随机序列的可变区域构成的适配体的集合体,则能够利用1组正向引物以及逆向引物执行。

在适用本发明的方法中,通过在对分析对象样本中不存在的2种以上的外部标准蛋白质进行定量之后以不同的定量值(即,浓度)添加到在上述步骤(a)中利用上述适配体文库进行处理之前的上述分析对象样本,并在上述步骤(a)中作为适配体文库使用追加包含上述外部标准蛋白质的适配体的适配体文库,上述步骤(c)中能够通过在获得上述外部标准蛋白质的适配体定量结果的同时获得靶蛋白的适配体定量结果,并对上述外部标准蛋白质的适配体定量结果以及靶蛋白的适配体定量结果进行比较的方式计算出靶蛋白的定量值。当以不同的定量值(浓度)将2种以上的上述外部标准蛋白质添加到样本中时,能够绘制出表现出上述外部标准蛋白质的浓度以及对应的定量值即读长数量之间的相关关系的标准曲线,而通过将靶蛋白的读长数量代入到上述标准曲线中,能够计算出靶蛋白的浓度。外部标准蛋白质能够以不同的定量值使用几种至几百种,此时所计算出的靶蛋白的定量值将更加准确。除了外部标准蛋白质不应存在于分析对象样本之外,为了避免与其进行特异性结合的适配体与分析对象样本中的靶蛋白结合,上述外部标准蛋白质的类似物(analog)同样不存在于上述分析对象样本中为宜。如上所述的外部标准蛋白质,能够通过对当前已完成基因组测序的生物物种的遗传信息与获得分析对象样本的生物物种的遗传信息进行比较的方式做出适当的选择。在适用本发明的下述实施例中,将源自于人类心肌梗塞患者的血清等作为分析对象样本,并将不可能有类似物存在的源自于拟南芥的5种植物蛋白质分别以0.01pg/ml、1.0pg/ml、100.00pg/ml、10.0ng/ml以及1.0ug/ml的定量值(浓度)添加到分析对象样本中使用。通过使用如上所述的外部标准蛋白质,还能够在样本准备(例如靶蛋白的提取等)等过程中对差异(variation)等进行精度管理(qualitycontrol)。

在本说明书中,“定量”是包括相对定量以及决定定量的含义。相对定量是指如各个定量值相对于所有定量值之整体平均值的比例(ratio)或各个定量值相对于特定定量值的比例(ratio),绝对定量是指如适用上述外部标准蛋白质或下述外部标准核酸的情况下利用定量值与浓度之间的标准曲线计算出浓度的结果。

在适用本发明的方法中,靶蛋白聚类能够是未知蛋白质聚类、已知蛋白质聚类或上述之混合物聚类。

此外,在本发明中,还能够包括:当靶蛋白聚类中的特定蛋白质为未知蛋白质时,利用上述蛋白质的特异性适配体(包含于适配体文库中)对上述蛋白质进行分离并利用本行业中公知的方法(例如基质辅助激光解析离子化-飞行时间质谱(maldi-tof)等)对上述蛋白质的氨基酸进行测序,从而对上述蛋白质进行识别的步骤。通过如上所述的靶蛋白的识别,能够提供有用的疾病特异性生物标记的候选等。

在适用本发明的方法中,在对从各个适配体获得的读长进行计数时,如上所述,能够将由相同序列以及在考虑到下一代序列分析(ngs)错误率的前提下的“可以视为相同序列的序列”构成的读长作为相同适配体的读长进行计数,但是也能够在适配体文库的各个适配体中将已决定的序列作为参考序列对读长进行计数。此时,各个适配体的参考序列较佳地能够由通过如上所述的适用本发明的方法从与分析对象生体样本相同的样本中获得的序列构成。

在另一方面,本发明涉及一种通过对2种分析对象样本适用如上所述的方法并对从各个样本中获得的定量结果进行分析而筛选出作为生物标记的候选蛋白质的方法。其中,2种分析对象样本是相互之间具有比较价值的样本,例如能够是患者(或患者组)的样本以及正常人(或正常人组)的样本。

首先,在适用本发明的方法中,生物标记是用于提供包括人类在内的哺乳动物的疾病信息的生物标记。如上所述的生物标记在样本中的存在与否和/或存在量,在健康的个体和患有疾病的个体之间存在差异,因此能够用于对健康的个体和患有疾病的个体进行区分。继而,在本发明中,生物标记是其存在与否和/或存在量会在2种分析对象样本中呈现出差异,从而能够用于对作为分析对象的2种样本(或上述样本的来源生物物种或生物个体)进行区分,并借此在药物处方的适当与否判断(例如抗癌药伴随式诊断)、药物依从性、对药物处理的体外细胞反应与否或程度、生物物种的分类或识别等方面为人类提供有价值的信息的任意的所有生物标记。

在本发明中,“生物标记候选”是指具有作为生物标记使用的可能性的生物标记,是能够在用于发掘生物标记的后续研究中使用的候选。当如上所述的生物标记候选的使用价值通过后续的研究得到证实时,能够转换成生物标记进行使用。例如,特定疾病的生物标记候选能够适用于以患有上述疾病的患者组以及正常人组作为对象的临床研究,当因为如上所述的临床研究具有统计学意义而可以证实其利用价值时,能够转换为生物标记并实际作为用于对上述疾病进行诊断的生物标记使用。

适用本发明的作为生物标记的候选蛋白质的筛选方法,具体包括:(a)通过利用存在于分析对象样本中的靶蛋白聚类的特异性适配体文库对上述分析对象样本进行处理,形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的复合体聚类的步骤;(b)将上述复合体聚类从未结合适配体分离的步骤;以及,(c)通过对上述复合体聚类的各个适配体的序列进行分析而对上述复合体聚类的各个适配体进行定量,从而对上述复合体聚类的各个靶蛋白进行定量的步骤;其中,还包括:对与上述分析对象样本不同的分析对象样本同样执行上述步骤(a)至步骤(c)的步骤;以及,通过对上述2种分析对象样本在上述步骤(c)中获得的各个靶蛋白的定量结果进行比较,决定定量结果存在差异的一个以上的靶蛋白的步骤。

在适用本发明的方法中,作为上述步骤(a)中的适配体文库对上述2种分析对象样本使用相同的适配体文库为宜。其中,相同的适配体文库是指具有相同的适配体组成以及浓度的适配体文库。当使用相同的适配体文库时,因为各个靶蛋白的适配体相同(即,因为是由相同序列构成的适配体),因此靶蛋白和靶蛋白的适配体之间的结合力也将相同,从而不会出现因为结合力而导致定量结果的差异,所以,通过如上所述的方式获得的定量结果能够更加有效地用于对生物标记候选进行筛选。

此外,在适用本发明的方法中,与上述适用本发明的靶蛋白的聚类定量方法相同,也能够将2种分析对象样本中均不存在的2种以上的外部标准蛋白质以不同的定量值(即,浓度)分别添加到2种分析对象样本中,并将上述外部标准蛋白质的定量结果适用于靶蛋白的定量。与其相关的详细信息,能够参阅与上述适用本发明的靶蛋白的聚类定量方法相关的说明内容。

此外,在适用本发明的方法中,还能够包括:当靶蛋白为未知蛋白质时,利用上述蛋白质的特异性适配体对上述蛋白质进行分离和识别的步骤。与其相关的详细信息,同样能够参阅与上述适用本发明的靶蛋白的聚类定量方法相关的说明内容。

关于其他适用本发明的生物标记候选蛋白质的筛选方法中没有进行具体说明的技术事项,对上述适用本发明的靶蛋白的聚类定量方法进行说明的内容同样有效,具体可以参阅相关的部分。

在另一方面,本发明能够提供一种通过对上述方法进行少许变形而能够更加轻易地筛选出生物标记候选蛋白质的方法。

适用本发明的上述方法,是从在某一种样本获得的双链脱氧核糖(dna)中,去除通过对2种分析对象样本中共同存在的蛋白质的适配体执行逆转录和聚合酶链反应(pcr)或聚合酶链反应(pcr)而获得的双链脱氧核糖(dna),从而仅对剩余蛋白质的双链脱氧核糖(dna)进行检测的方法。

2种分析对象样本中共同存在的蛋白质作为生物标记候选蛋白质的利用价值较低。即,能够作为生物标记使用的可能性较低。因此,适用本发明的方法能够不对共同存在的蛋白质进行检测。

具体来讲,适用本发明的方法,包括:(a)通过从2种分析对象样本分别获得包含靶蛋白聚类的蛋白质样本并利用上述所获得的蛋白质样本中的靶蛋白聚类的特异性适配体文库对上述蛋白质样本进行处理,形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的聚合体聚类,接下来在将上述复合体聚类从未结合适配体分离之后,将上述所分离出的复合体聚类的适配体转换成双链脱氧核糖核酸(dna)聚类的步骤,(b)从在2种分析对象样本中某一种样本获得的双链脱氧核糖核酸(dna)聚类中,去除在2种分析对象样本分别获得的双链脱氧核糖核酸(dna)聚类中共同存在的双链脱氧核糖核酸(dna)的步骤;以及,(c)通过利用下一代序列分析(ngs)技术仅对上述某一种样本的剩余双链脱氧核糖核酸(dna)聚类进行分析,在对各个双链脱氧核糖核酸(dna)序列进行分析的同时获得各个双链脱氧核糖核酸(dna)的丰度(abundance)的步骤。

在源自于各个样本的双链脱氧核糖核酸(dna)聚类中共同存在的双链脱氧核糖核酸(dna),是各个样本中共同存在的蛋白质的双链脱氧核糖核酸(dna)。在对如上所述的共同的双链脱氧核糖核酸(dna)进行去除之后,剩余的双链脱氧核糖核酸(dna)为相应样本中特异的(即,只存在于上述样本中的)双链脱氧核糖核酸(dna),因此能够仅体现出相应样本的特异性蛋白质相关的信息。上述蛋白质本身能够直接作为生物标记候选蛋白质。此时,2种分析对象样本中去除共同的双链脱氧核糖核酸(dna)之后进行分析的样本是上述2种样本中相对更有价值的样本为宜。例如,当适用本发明的方法的目的在于筛选出疾病生物标记候选蛋白质时,上述样本为源自于患者(或患者组)的样本,而源自于正常人(正常人组)的样本为剩余样本。在包括权利要求书在内的本说明书中,为了说明的便利将利用下一代序列分析(ngs)技术进行分析的样本称之为测试样本,而将剩余的不进行分析的样本称之为比较样本。

在适用本发明的方法中,从在测试样本获得的双链脱氧核糖核酸(dna)聚类中去除在2种分析对象样本分别获得的双链脱氧核糖核酸(dna)聚类中共同存在的双链脱氧核糖核酸(dna)的步骤,能够通过如ssh(suppressionsubtractivehybridization,抑制消减杂交)方法执行。上述抑制消减杂交(ssh)方法是由ludadiatchenko等在文献[procnatlacadsciusa.1996jun11;93(12):6025-6030]中提出的方法,是一种将测试样本的双链脱氧核糖核酸(dna)分为检测子(tester)1和检测子2之后分别适用特异性适配体,接下来将比较样本的双链脱氧核糖核酸(dna)作为驱赶子(driver)对测试样本以及比较样本之间共同存在的双链脱氧核糖核酸(dna)进行杂交,从而避免上述杂交的双链脱氧核糖核酸(dna)发生指数式扩增(exponentialamplication),仅使测试样本中的dna发生指数式扩增的方法。借此,能够获得以对测试样本特异性的双链脱氧核糖核酸(dna)为中心扩增的产物。上述ludadiatchenko等的文献与本说明书中的其他文献相同,应视为本说明书的一部分,有关抑制消减杂交(ssh)方法的具体概念和流程,能够参阅上述文献的图1或本说明书的附图、实施例等。

此外,在适用本发明的方法中,上述共同的双链脱氧核糖核酸(dna)的去除步骤也能够通过利用dsn(duplex-specificnuclease,双链特异性核酸酶)的方法执行。上述方法是bogdanovaea等通过文献[nucleicacidsresearch,2004,vol.32,no.3e37]提出的方法,是一种在对测试样本的双链脱氧核糖核酸(dna)和比较样本的双链脱氧核糖核酸(dna)进行杂交之后利用双链特异性核酸酶(dsn)进行去除,然后仅对剩余的双链脱氧核糖核酸(dna)进行指数式扩增的方法。与利用双链特异性核酸酶(dsn)的方法相关的具体信息,也能够参阅上述文献以及本说明书的附图、实施例等。

在通过如上所述的方法对共同的双链脱氧核糖核酸(dna)进行去除并仅对测试样本的剩余的双链脱氧核糖核酸(dna)进行扩增之后利用下一代序列分析(ngs)技术对上述扩增物进行测序以及定量时,双链脱氧核糖核酸(dna)的定量值越高,就表示测试样本中与上述双链脱氧核糖核酸(dna)对应的蛋白质的量越多,因此能够按照定量值较高的顺序获得利用价值高的生物标记候选。

关于其他适用本发明的上述方法中没有进行具体说明的技术事项,对上述适用本发明的靶蛋白的聚类定量方法进行说明的内容以及对上述适用本发明的生物标记候选蛋白质的筛选方法进行说明的内容同样有效,具体可以参阅相关的部分。

在另一方面,本发明涉及一种利用下一代序列分析(nsg)对靶核酸和靶蛋白同时进行分析的方法。

适用本发明的利用下一代序列分析(nsg)的分析对象样本中的靶核酸与靶蛋白的同时分析方法,包括:(a)(i)通过从分析对象样本获得包含靶蛋白聚类的蛋白质样本并利用上述所获得的蛋白质样本中的靶蛋白聚类的特异性适配体文库对上述蛋白质样本进行处理,形成各个靶蛋白以及与其进行特异性结合的各个适配体之间的复合体,从而形成靶蛋白与适配体之间的聚合体聚类,接下来在将上述复合体聚类从未结合适配体分离之后,将上述所分离出的复合体聚类的适配体转换成双链脱氧核糖核酸(dna)的步骤,(ii)从与上述分析对象样本相同的分析对象样本获得包含靶核酸的核酸样本,接下来将上述核酸样本中的靶核酸转换成双链脱氧核糖核酸(dna)的步骤;(b)对源自于上述适配体的双链脱氧核糖核酸(dna)和源自于上述靶核酸的双链脱氧核糖核酸(dna)片段进行混合的步骤;以及,(c)通过利用下一代序列分析(ngs)技术对上述混合物中的各个双链脱氧核糖核酸(dna)的序列进行分析,在获得各个双链脱氧核糖核酸(dna)的序列信息的同时决定各个双链脱氧核糖核酸(dna)的丰度(abundance)的步骤。

适用本发明的同时分析方法的目的在于通过适用可执行核酸的序列分析以及包括相同序列的核酸定量的下一代序列分析(ngs)技术而对样本中的靶蛋白和靶核酸同时进行分析,是一种在将样本中的靶蛋白的适配体转换成可适用下一代序列分析(ngs)技术的双链脱氧核糖核酸(dna)并将样本中的核酸转换成双链核酸片段之后对两者进行混合,然后利用下一代序列分析(ngs)对样本中的蛋白质和核酸同时进行分析的方法。在适用下一代序列分析(ngs)执行同时分析时,能够同时获得特定分析对象样本中的靶蛋白和靶核酸的定量信息,同时还能够获得靶蛋白的特异性适配体的序列和靶核酸的序列。

在适用本发明的同时分析方法中,分析对象样本能够是因为包含或可能包含需要检测的靶蛋白和靶核酸而有必要进行检测的任意的混合物或溶液。较佳地,是生体样本。关于其他与分析对象样本相关的内容,对上述适用本发明的靶蛋白的聚类定量方法进行说明的内容同样有效,具体可以参阅相关内容。

此外,在适用本发明的同时分析方法中,关于与上述步骤(a)的步骤(i)中将上述复合体聚类从未结合适配体分离的过程,对上述适用本发明的靶蛋白的聚类定量方法进行说明的内容同样有效,具体可以参阅相关内容。

此外,在适用本发明的同时分析方法中,在上述步骤(a)的步骤(i)中将复合体聚类的适配体转换成双链脱氧核糖核酸(dna)的步骤,能够通过当复合体聚类的适配体为核糖核酸(rna)单链核酸适配体时对其进行逆转录而制备出单链互补脱氧核糖核酸(cdna)并对其执行1次单向聚合酶链反应(one-waypcr)的方式实现。而当适配体为脱氧核糖核酸(dna)单链核酸时,能够通过直接执行1次单向(one-way)聚合酶链反应(pcr)的方式实现。此外,当为了利用下一代序列分析(ngs)技术执行序列分析而需要将样本的量放大到适当的量时,也能够通过以互补脱氧核糖核酸(cdna)等作为对象重复执行几次或几十次聚合酶链反应(pcr)的方式放大样本的量。如上所述的逆转录和/或聚合酶链反应(pcr)能够在从复合体聚类解离出适配体聚类之后对上述适配体聚类执行,但是因为在逆转录和聚合酶链反应(pcr)过程中执行的加热过程会使适配体聚类从复合体聚类解离,所以不执行上述单独的解离过程亦可。此时的聚合酶链反应(pcr)如上述适用本发明的靶蛋白的聚类定量方法相关的说明内容所述,在正向以及逆向引物结合部位由已知序列的保留区域构成时,能够利用1组引物执行。因为源自于适配体的双链脱氧核糖核酸(dna)是可适用下一代序列分析(ngs)技术的适当大小的片段,因此不需要执行对其进行片段化的步骤。

在适用本发明的同时分析方法中,靶核酸包括基因组脱氧核糖核酸(gdna)和/或核糖核酸(rna)。基因组脱氧核糖核酸(gdna)包括具有如缺失、插入、单核苷酸多态性(snp)、甲基化等表观遗传学变化的基因组脱氧核糖核酸(gdna)。当需要对甲基化基因组脱氧核糖核酸(gdna)进行分析时,能够在按照本行业中公知的方法(例如重亚硫酸盐(bisulfite)处理)进行适当的预处理之后适用于下一代序列分析(ngs)。关于利用下一代序列分析(ngs)技术的脱氧核糖核酸(dna)甲基化分析的更详细的内容,能够参考文献[cancerres.67(2007)8511-8518]、文献[cancermetastasisrev(2011)30:199-210]、文献[biology(basel).2016mar;5(1):3]、文献[jvisexp.2015;(96):52488]等,而关于插入、缺失、单核苷酸多态性(snp)等的下一代序列分析(ngs),能够参考文献[cancergenet.2013dec;206(12):432-440]、文献[frontbioengbiotechnol.2015;3:92]、文献[plosone,20149:e104652]、文献[naturereviewsgenetics,2011,12:443-451]等。基因组脱氧核糖核酸(gdna)能够在通过如酚-氯仿抽提方法(phenol-chloroformextractionmethod)等本行业中公知的方法(molecularecologynotes(2003)3,317-320;jforensicsci,may2009,54(3):599-607)或利用市售的试剂盒(如dnazoltmreagent、purelinktmgenomicdnaminikit等)进行分离之后再通过声波降解法(sonication)等方式随机(random)地片段化成一定范围的长度(通常为1kb以下),接下来利用下一代序列分析(ngs)技术对其序列进行分析。

当靶核酸为核糖核酸(rna)时,包括用于对蛋白质进行加密的信使核糖核酸(mrna)、进行剪接之前的前信使核糖核酸(pre-mrna)、对剪接(splicing)进行管理的核小核糖核酸(snrna,smallnuclearrna)、对核糖体核糖核酸(rrna)的修饰(modification)进行管理的核仁小核糖核酸(snorna,smallnucleolarrna)、对转录后步骤的基因表达调节进行管理的微小核糖核酸(mirna,microrna)或piwi蛋白互作核糖核酸(pirna,piwi-interesting)等。如上所述的核糖核酸(rna)也能够在通过本行业中公知的方法(jmoldiagn.2008may;10(3):203-211;preparativebiochemistry&biotechnologyvol.34,no.3,pp.209-214,2004)或市售的试剂盒(trizoltmreagent、rneasytmffpekit、purelinktmffpernaisolationkit、recoveralltmtotalnucleicacidisolationkit等)对全核糖核酸(rna)或需要进行分析的核糖核酸(rna)(如信使核糖核酸(mrna))进行分离之后将上述核糖核酸(rna)转换成双链互补脱氧核糖核酸(cdna),接下来利用下一代序列分析(ngs)技术对其序列进行分析。较佳地,在对生体样本中的全核糖核酸(rna)进行分离并将上述全核糖核酸(rna)作为适用下一代序列分析(ngs)技术的样本使用时,因为核糖体核糖核酸(rrna)占全核糖核酸(rna)中的大部分(通常为95%),因此通过利用本行业中公知的方法或适当的市售试剂盒(ribominustm、ribozerotm等)进行去除,能够对全核糖核酸(rna)中剩余的相对少量存在的如信使核糖核酸(mrna)、前信使核糖核酸(pre-mrna)、核小核糖核酸(snrna)或微小核糖核酸(mirna)等非编码核糖核酸(ncrna,noncodingrna)等核糖核酸(rna)适用下一代序列分析(ngs)技术,从而更加容易地执行上述序列分析和定量。当作为靶核酸只需要对信使核糖核酸(mrna)进行分析时,因为信使核糖核酸(mrna)包括polya,因此能够利用被固定到如磁珠等支撑体中的polyt寡核苷酸仅分离出信使核糖核酸(mrna)并执行下一代序列分析(ngs),而作为靶核酸只需要对如微小核糖核酸(mirna)等小分子核糖核酸(smallrna)进行分析时,能够通过利用凝胶电泳(gelelectrophoresis)的大小选择(sizeselection)法分离出微小核糖核酸(mirna)并利用下一代序列分析(ngs)技术执行分析。对于如信使核糖核酸(mrna)或前信使核糖核酸(pre-mrna)等长度较长的核糖核酸(rna),在合成互补脱氧核糖核酸(cdna)之前为了适用下一代序列分析(ngs)技术而将其片段化成适当的大小为宜,而对于相对少量存在的核糖核酸(rna),在对上述互补脱氧核糖核酸(cdna)进行扩增之后利用下一代序列分析(ngs)技术对上述扩增物进行分析为宜。

*此外,靶核酸能够是包括未知序列的基因组脱氧核糖核酸(gdna)上的任意基因或包括未知序列的如信使核糖核酸(mrna)等任意的核糖核酸(rna),也能够是包括未知序列的特定基因或核糖核酸(rna)或上述基因或核糖核酸(rna)的扩增物。如上所述,靶核酸能够是需要执行序列分析和/或定量的样本中的任意核酸。

此外,在适用本发明的同时分析方法中,能够在通过对上述步骤(a)中的适配体的双链脱氧核糖核酸(dna)或核酸的双链脱氧核糖核酸(dna)片段添加衔接子等而分别制备出测序文库(sequencinglibrary)之后对上述测序文库进行混合,然后通过对上述测序文库混合物适用下一代序列分析(ngs)设备而执行分析。如果以ilumina公司的下一代序列分析(ngs)设备为例进行说明,能够通过对脱氧核糖核酸(dna)片段进行末端修复(endrepair)和腺苷接合(da-tailing)以及衔接子(adapter)附加等制备出测序文库。如上所述的测序文库用于将脱氧核糖核酸(dna)片段文库转换成可利用下一代序列分析(ngs)设备执行序列分析的状态,在上述内容中以ilumina公司的下一代序列分析(ngs)设备为例进行了说明,但是能够根据不同的下一代序列分析(ngs)设备按照相应制造企业的协议将双链脱氧核糖核酸(dna)片段转换制备成测序文库。

此外,在适用本发明的同时分析方法中,对于上述步骤(a)中的各个样本即适配体的双链脱氧核糖核酸(dna)和核酸的双链脱氧核糖核酸(dna)片段,能够在向上述双链脱氧核糖核酸(dna)添加衔接子的同时添加用于对混合之前的来源样本进行区分的条码(barcode)。如上所述的条码在将基因组脱氧核糖核酸(gdna)和核糖核酸(rna)与靶蛋白同时进行分析时也能够为了对上述核酸样本进行区分而导入到从各个样本获得的双链脱氧核糖核酸(dna)片段中,而在对核糖核酸(rna)进行分析时也能够为了对各个核糖核酸(rna)样本(如微小核糖核酸(mirna)等小分子核糖核酸(smallrna)样本和信使核糖核酸(mrna)样本)进行区分而导入到从各个样本获得的双链脱氧核糖核酸(dna)片段中。如上所述的条码是较短长度(通常为6-bp)的脱氧核糖核酸(dna),为了能够对样本进行区分而以针对不同样本包含特有序列的方式制备。在利用下一代序列分析(ngs)技术对多重样本进行序列分析时使用如上所述的条码对样本进行区分的方法为本行业中公知的信息,例如能够参考[mol.ecol.19,2455-473(2010)]、文献[biology2012,1(3),895-905]等。

此外,在适用本发明的同时分析方法中,与上述适用本发明的靶蛋白的聚类定量方法相同,通过将分析对象样本中不存在(其类似物(analog)也不存在)的2种以上的外部标准蛋白质以不同的定量值添加到在上述步骤(a)中分为蛋白质样本和核酸样本之前的上述分析对象样本并将上述外部标准蛋白质的特异性适配体包含到上述适配体文库中,能够将上述外部标准蛋白质的检测结果用于靶蛋白的定量。与其相关的详细信息,能够直接参阅与上述适用本发明的靶蛋白的聚类定量方法相关的说明内容。

此外,在适用本发明的同时分析方法中,与为了对靶蛋白进行定量而使用上述2种以上的外部标准蛋白质的方式相同,在对核酸进行定量时也能够将分析对象样本中不存在的2种以上的外部标准核酸以不同的定量值添加到上述步骤(a)的分析对象样本。此时,外部标准核酸的定量值也能够有效地用于靶核酸的定量。如上所述的外部标准核酸能够在考虑需要进行定量的靶核酸的前提下以与上述靶核酸对应的适当大小制备,例如当靶核酸为信使核糖核酸(mrna)且其大小为1kb时能够以800b至1200b的大小制备。此外,当外部靶核酸为同类核酸时,即,当靶核酸为信使核糖核酸(mrna)时,作为外部标准核酸能够制备3’端接合有polya的核糖核酸(rna)。如上所述的外部标准核酸与上述外部标准蛋白质相同,能够通过对当前已完成基因组测序的生物物种的遗传信息与获得分析对象样本的生物物种的遗传信息进行比较的方式做出适当的选择。如上所述的外部标准核酸与外部标准蛋白质相同,能够用于在样本准备等过程中对差异(variation)等进行精度管理(qualitycontrol)。如上所述的外部标准核酸能够以不同的定量值不受限制地使用2种以上的几种乃至几百种。

在适用本发明的同时分析方法中,与上述适用本发明的靶蛋白的聚类定量方法相同,能够将与各个靶蛋白的适配体以及各个靶核酸对应的已决定序列的参考序列用于上述步骤(c)中的定量以及测序中,还能够包括:当靶蛋白为未知蛋白时利用上述未知蛋白质的适配体进行分离和识别的步骤。

关于其他适用本发明的同时分析方法中没有进行具体说明的技术事项,对上述适用本发明的靶蛋白的聚类定量方法进行说明的内容同样有效,具体可以参阅相关的部分。

如上所述,通过本发明能够提供利用下一代序列分析(ngs)技术对分析对象样本的靶蛋白进行聚类定量的方法等。

附图说明

图1是对人类血清蛋白质样本中大量存在的蛋白质进行去除之后的电泳结果;

图2以及图3是通过对各个分子结合核酸一级文库执行抑制消减杂交(ssh)而制造二级文库的过程的模式图及其整体流程图;

图4是通过对各个分子结合核酸一级文库适用双链特异性核酸酶(dsn)而制造二级文库的过程的整体流程图;

图5是对通过适用双链特异性核酸酶(dsn)而获得的二级文库的消减化程度进行电泳评估的结果;

图6是在分析样本s以及比较样本c中分别对构成分子结合核酸以及文库的分子结合核酸的碱基序列以及出现频率进行计算的结果;

图7是通过分子结合核酸二级文库中的1,149个分子结合核酸对分析样本即心肌梗塞患者血清以及比较样本即不稳定型心绞痛患者血清进行分析而获得的100个分子结合核酸的分布结果图表;

图8是利用通过分子结合核酸二级文库中的1,149个分子结合核酸对分析样本即心肌梗塞患者血清以及比较样本即不稳定型心绞痛患者血清进行分析而获得的100个分子结合核酸对样本进行聚类的结果图;

图9是分析样本即心肌梗塞患者血清以及比较样本即不稳定型心绞痛患者血清中有助于生物学意义分析的特定分子结合核酸的电泳分析结果(a)以及上述电泳谱带的密度图表(b);

图10是通过对与抗癌物质处理细胞以及未处理细胞的结合程度进行分析而选择出分子结合核酸并利用荧光物质进行标记之后对抗癌物质处理细胞以及未处理细胞进行观察的结果;

图11是对所选择的肝癌细胞株特异性分子结合核酸的肝癌细胞株(hep3b)的特异性结合进行确认的结果;

图12是在利用肝癌细胞株(hep3b)分子结合核酸-小干扰核糖核酸(sirna)细胞周期蛋白依赖性激酶2(cdk2)复合体(complex)以多种不同的方法对肝癌细胞株进行处理之后对细胞周期蛋白依赖性激酶2(cdk2)信使核糖核酸(mrna)进行分析的结果。

具体实施方式

接下来,将结合具体的实施例对本发明进行详细的说明。下述实施例只是对本发明进行的示例性说明,并不是为了对本发明的范围进行限定。

<实施例1>单链核酸文库的制备

<实施例1-1>单链核酸文库的寡核苷酸以及引物

为了制备用于与包含靶蛋白聚类的生物样本(分析样本以及比较样本)进行反应的单链核酸文库,制备了如下述<一般式i>结构的寡核苷酸(随机单链核酸)(韩国,bioneer)。

首先,在构成上述<一般式i>结构的单链核酸文库的寡核苷酸中,寡核苷酸由5’保留区域-可变区域-3’保留区域构成。

<一般式i>寡核苷酸结构:

5’-gggagagcggaagcgtgctgggccn50cataacccagaggtcgatggatcccccc-3’

上述下划线部分的碱基序列是由单链核酸文库的已知序列构成的固定区域即保留区域,可变区域即50个碱基的n50在各个位置上包含相同浓度的a、g、t、c等碱基。

通过以上述<一般式i>的寡核苷酸作为模板执行聚合酶链反应(pcr)而制备出了双链脱氧核糖核酸(dna)文库。此时所使用的引物为如下所示的ds正向引物(序列编号1)以及ds逆向引物(序列编号2)。

ds正向引物:

5’-ggggctaatacgactcactatagggagagcggaagcgtgctggg-3’(序列编号1)

ds逆向引物:

5’-ggggcatcgacctctgggttatg-3’(序列编号2)

上述ds正向引物(序列编号1)能够与上述<一般式i>结构的单链脱氧核糖核酸(dna)寡核苷酸的5’端的下划线部分的序列进行互补结合。此外,序列编号1中的下划线部分为用于噬菌体t7的核糖核酸(rna)聚合酶的t7启动子序列。

用于聚合酶链反应(pcr)的上述ds逆向引物(序列编号2)能够与上述<一般式i>结构的单链脱氧核糖核酸(dna)寡核苷酸的3’端下划线部分的序列进行互补结合。

聚合酶链反应(pcr,polymerasechainreaction)是以上述<一般式i>结构的单链核酸文库作为模板,利用上述ds正向引物(序列编号1)以及上述ds逆向引物(序列编号2)执行。

具体来讲,在将1,000pmole单链核酸文库、2,600pmoleds引物对(ds正向引物、ds逆向引物)与60mmkcl、10mmtris-cl(ph8.3)、3mmmgcl2、0.5mm脱氧核糖核苷三磷酸(dntp)(脱氧腺苷三磷酸(datp)、脱氧胞苷三磷酸(dctp)、脱氧鸟苷三磷酸(dgtp)以及脱氧胸苷三磷酸(dttp))以及0.1u耐热脱氧核糖核酸聚合酶(taqdnapolymerase)(珀金埃尔默,加利福尼亚州福斯特城)进行混合并执行聚合酶链反应(pcr)之后,利用qiaquick-spin聚合酶链反应(pcr)纯化柱(凯杰公司,加利福尼亚州查茨沃思)进行纯化。借此,制备出包含t7启动子的双链核酸脱氧核糖核酸(dna)。

相应的聚合酶链反应(pcr)产物为包含t7启动子的双链脱氧核糖核酸(dna),其一半结构式如下述<一般式ii>所示。

<一般式ii>聚合酶链反应(pcr)产物:

5’-gggggctaatacgactcactatagggagagcggaagcgtgctgggccn50cataacccagaggtcgatcccc-3’

在下述内容中记述的用于逆转录酶-聚合酶链反应(rt-pcr)的引物为“rs正向引物(序列编号3)”以及“rs逆向引物(序列编号4)”,其碱基序列如下所述。

rs正向引物:

5’-cggaagcgtgctgggcc-3’(序列编号3)

rs逆向引物:

5’-tcgacctctgggttatg-3’(序列编号4)

<实施例1-2>单链核酸核糖核酸(rna)文库的制备

在本实施例中,制备出用于与生体样本(分析样本以及比较样本)进行反应的核糖核酸(rna)单链核酸文库。上述核糖核酸(rna)单链核酸文库为包含变形的核苷酸即2’-f-置换嘧啶的核糖核酸(rna)文库,利用在<实施例1-1>中制备的<一般式ii>结构的pcr产物将包含2’-f-置换嘧啶的核糖核酸(rna)单链核酸通过durascribet7transcriptionkit(epicentre,美国)执行生体外转录并通过合成以及纯化完成制备。

具体来讲,在将300pmoles上述所制备出的双链脱氧核糖核酸(dna)、50mmtris-cl(ph8.0)、12mmmgcl2、5mm二硫苏糖醇(dtt)、1mm亚精胺(spermidine)、0.002%tritonx-100、4%peg8000,5ut7核糖核酸聚合酶(rnapolymerase)以及1mm(三磷酸腺苷(atp)、三磷酸鸟苷(gtp))以及3mm(2’f-ctp、2’f-utp)进行混合并在37℃条件下进行6~12小时的反应之后,利用bio-spin6色谱柱(bio-radlaboratories,加利福尼亚州赫拉克勒斯)进行纯化,接下来利用uv光谱仪对纯化得到的核酸的量及其纯度进行了分析。

<实施例1-3>精度管理以及测定用外部标准物质的制备

利用如下述表1所示的由密歇根州立大学植物基因组学会(plantgenomicsofmichiganstateuniversity,http://genomics.msu.edu/plant_specific/)提供的在人类中不存在(其类似物(analog)也不存在)的a、b、c、d以及e等5种类型的植物(拟南芥)特异性蛋白质,通过大肠杆菌表达系统制备出外部标准蛋白质之后使用。

表1植物特异性蛋白质

<实施例2>分子结合核酸一级文库的制备

<实施例2-1>分子结合核酸一级文库的制备

为了制备分子结合核酸一级文库,将包含蛋白质聚类的生体样本即血清作为样本使用,其中,将心肌梗塞患者的血清作为分析样本并将不稳定型心绞痛患者的血清作为比较样本使用。

为了提升有利用价值的靶蛋白的检测灵敏度,按照制造企业所提供的方法利用marc色谱柱(安捷伦科技有限公司,美国)去除患者血清中过量存在的蛋白质之后作为实际试验的样本使用。去除过量存在的蛋白质之后的分析样本和对照样本的电泳结果如图1所示。

为了制备分子结合核酸一级文库,首先制备上述分析样本(去除心肌梗塞患者血清中过量存在的蛋白质之后的样本)的蛋白质聚类的特异性核糖核酸(rna)单链核酸池,接下来使上述特异性核糖核酸(rna)单链核酸池与去除过量存在的蛋白质之后的分析样本以及对照样本进行反应,从而制备出各个样本的分子结合核酸一级文库,然后利用上述以及文库制备出用于执行下一代序列分析(ngs)的测序文库。

在制备样本的特异性单链核酸池时,首先通过使在上述<实施例1>中合成的核糖核酸(rna)单链核酸文库与去除心肌梗塞患者血清中过量存在的蛋白质之后的分析样本发生反应而形成蛋白质与核糖核酸(rna)单链核酸的复合体,然后通过利用相同的洗涤缓冲液重复执行洗涤过程而去除未结合或非特异性核糖核酸(rna)单链核酸。接下来对复合体池进行分离,然后利用上述<实施例1>的rs正向引物以及rs逆向引物通过逆转录酶-聚合酶链反应(rt-pcr,reversetranscription-pcr)对通过从复合体解离出核糖核酸(rna)单链核酸而获得的核糖核酸(rna)单链核酸池进行扩增,再按照与上述实施例1相同的方法对上述扩增物进行生体外转录,从而获得核糖核酸(rna)单链核酸池。

接下来,将对上述核糖核酸(rna)单链核酸池的制备过程进行详细的说明。

首先,在将300μl通过上述<实施例1-2>中制备的300pmolrna文库以1014碱基序列/ml的浓度添加到反应溶液(50mmhepes,ph7.5,125mmnacl,5mmkcl,5mmngcl2,1mmedta,0.05%tween-30)并在80℃条件下进行10分钟的加热,接下来在冰上放置10分钟。

通过将所使用的单链核酸的5倍的酵母转移核糖核酸(yeasttrna,生命技术公司)以及0.2%的牛血清白蛋白(bsa,bovineserumalbumin,默克公司)添加到上述反应溶液而制备出非特异性反应阻断缓冲溶液。

在将血清蛋白质固定到硝化纤维膜(nc,nitrocellulosemembrane)片(0.3×0.3mm2)之前,向已添加上述核糖核酸(rna)文库的反应溶液添加100mm二硫苏糖醇(dtt)60μl,并向上述非特异性反应阻断缓冲溶液添加100mm二硫苏糖醇(dtt)、10%牛血清白蛋白(bsa)400μl。

在1.5ml的结合反应管中,对反应溶液(50mmhepes,ph7.5,125mmnacl,5mmkcl,5mmngcl2,1mmedta,0.05%tween-30)60μl和所制备的血清蛋白质600μg进行混合。在轻敲(tapping)之后执行快速离心(quick-spin),使得硝化纤维(nc)膜完全沉浸到反应溶液中。在100rpm下利用搅拌器进行40分钟的混合。

在常温条件下对硝化纤维(nc)膜进行10分钟的干燥处理之后投入到新的1.5ml管中。在添加上述非特异性反应阻断缓冲溶液300μl并在100rpm下利用搅拌器进行40分钟的混合之后将硝化纤维(nc)膜移动到新的1.5ml管中。在添加500μl的反应溶液并在100rpm下利用搅拌器进行10分钟的混合之后将硝化纤维(nc)膜移动到新的1.5ml管中。在再次添加500μl的反应溶液并在100rpm下利用搅拌器进行10分钟的混合之后将硝化纤维(nc)膜移动到新的1.5ml管中。接下来为了去除未结合血清蛋白质,利用反应溶液执行了洗涤步骤。

接下来,添加已添加上述核糖核酸(rna)单链核酸池的反应溶液(100ng/μl)5μl和结合缓冲溶液195μl并在300rpm下利用搅拌器进行40分钟的混合之后将硝化纤维(nc)膜移动到新的1.5ml管中。在添加反应溶液500μl并在100rpm下利用搅拌器进行10分钟的混合之后将硝化纤维(nc)膜移动到新的1.5ml管中。在再次添加反应溶液500μl并在100rpm下利用搅拌器进行10分钟的混合之后将硝化纤维(nc)膜移动到新的1.5ml管中。

在将硝化纤维(nc)膜放置在沃特曼滤纸(whatmanfilterpaper)上之后在常温下进行10分钟的干燥处理。将干燥后的硝化纤维(nc)膜投入到新的1.5ml管中之后添加焦碳酸二乙酯(depc)灭菌纯净水50μl。通过在95℃的微量恒温仪(heatblock)中放置10分钟而对核糖核酸(rna)进行洗脱。通过轻敲(tapping)对附着在膜上的核糖核酸(rna)进行洗脱并在快速离心(quick-spin)之后放置在冰上。接下来移动到聚合酶链反应(pcr)管中并执行下一个过程,即,利用上述<实施例1>的rs正向引物以及rs正向引物执行逆转录反应以及聚合酶链(pcr)反应,再按照与上述<实施例1>相同的方法执行生体外转录,从而制备出核糖核酸(rna)单链核酸池。上述的与人类血清样本蛋白质结合的分子结合核酸一级文库的制备,是通过在使人类血清样本的蛋白质与核糖核酸(rna)文库发生反应之后利用多种不同的洗涤缓冲液(0至1×的反应溶液,0至5%的tween-30或0至600mm的edta溶液)重复执行洗涤过程的单次选择过程执行。

分子结合核酸一级单链核酸文库的制备,是通过使按照如上所述的方式获得的核糖核酸(rna)单链核酸池以如上所述的方法与上述各个分析样本以及比较样本分别发生反应而去除未结合或非特异性核糖核酸(rna)单链核酸之后对与蛋白质的复合体池进行分离,然后将核糖核酸(rna)单链核酸从上述复合体池解离的方式执行。此时,仅执行1次洗涤过程。

接下来,通过对上述分子结合核酸核糖核酸(rna)单链核酸进行逆转录而制备互补脱氧核糖核酸(cdna),然后对上述互补脱氧核糖核酸(cdna)执行1次单向聚合酶链反应(one-waypcr)而获得双链脱氧核糖核酸(dna)片段,然后按照后续说明的方式对其执行了下一代序列分析(ngs)。

<实施例2-2>包含外部标准蛋白质的样本的分子结合核酸一级文库的制备

为了将上述实施例1的外部标准蛋白质用于对分析样本或对照样本的靶蛋白的定量,首先利用通过<实施例1>合成的核糖核酸(rna)单链核酸文库按照标准指数富集的配体系统进化(selex)方法(ellington,a.d.andj.w.szostak.1990.invitroselectionofrnamoleculesthatbindspecificligands.nature346:818-822;gold,l.,p.allen,j.binkley,d.brown,d.schneider,s.r.eddy,c.tuerk,l.green,s.macdougal,andd.tasset.1993.rna:theshapeofthingstocome,pp.497-510.in:r.f.gestelendandj.f.atkins(eds.).thernaworld,coldspringharborpress,coldspringharbor,n.y.)获得与各个外部标准蛋白质进行特异性结合的核糖核酸(rna)单链核酸,然后通过适用众所周知的基于构建细菌人工染色体文库(baclibrary)的克隆测序方法(genomeres.2001mar;11(3):483-496)决定其序列。

在将通过上述<实施例1>制备的4种外部标准蛋白质按照a为0.01pg/ml、b为1.0pg/ml、c为100.0pg/ml、d为10.0ng/ml、e为1.0ug/ml的浓度分别添加到分析样本以及比较样本中之后作为本实施例的分析对象样本使用。此外,通过向需要与上述样本进行反应的核糖核酸(rna)单链核酸池添加与各个外部标准蛋白质进行特异性结合的核糖核酸(rna)单链核酸,制备出需要与样本进行反应的核糖核酸(rna)单链核酸池。接下来,在使分别按照不同的浓度分别上述5种外部标准蛋白质的各个样本与已添加上述外部标准蛋白质的核糖核酸(rna)单链核酸的核糖核酸(rna)单链核酸池进行反应之后按照与上述<实施例2-1>相同的方法制备分子结合核酸一级文库并对其进行1次逆转录以及单向聚合酶链反应(pcr),然后按照后续说明的方式对其执行了下一代序列分析(ngs)。

<实施例3>分子结合核酸二级文库的制备

<实施例3-1>利用抑制消减杂交(ssh)的分子结合核酸二级文库的制备

按照如图2以及图3所示的步骤执行了抑制消减杂交(ssh)分子结合核酸二级文库的制备。

通过以在上述<实施例2>中制备的分析样本的蛋白质的分子结合核酸一级核糖核酸(rna)文库和比较样本的蛋白质的分子结合核酸一级核糖核酸(rna)文库作为模板执行逆转录酶-聚合酶链反应(rt-pcr),从而制备出脱氧核糖核酸(dna)池。上述逆转录酶-聚合酶链反应(rt-pcr)是按照标注方法执行。

具体来讲,为了执行逆转录(reversetranscription),将包含一级文库的反应液36μl移动到聚合酶链反应(pcr)管中,并在添加5×逆转录缓冲溶液10μl、rs逆向引物(25pmol/μl)溶液1μl进行混合。利用聚合酶链反应(pcr)装置使上述混合液在65℃下进行5分钟的反应之后在25℃下进行10分钟的反应。在制备出包含焦碳酸二乙酯(depc)灭菌纯净水1.5μl、30mm脱氧核糖核苷三磷酸(dntp)1μl、逆转录酶(amvrtase)(10u/μlbeams,cat.no.4001l)0.5μl的混合液之后向完成反应的聚合酶链反应(pcr)管添加3μl,从而使最终体积达到60μl。利用聚合酶链反应(pcr)装置使上述聚合酶链反应(pcr)管在37℃下进行40分钟的反应之后在95℃下进行5分钟的反应。

接下来,按照如下所述的方式执行聚合酶链反应(pcr)。在为了对生成物即互补脱氧核糖核酸(cdna)进行扩增而执行聚合酶链反应(pcr)扩增反应时,首先向逆转录(rt)反应物60μl添加10×聚合酶链反应(pcr)缓冲溶液10μl、30mm脱氧核糖核苷三磷酸(dntp)1μl、ds正向引物(25pmol/μl)1μl、ds逆向引物(25pmol/μl)1μl、耐热聚合酶(taqploymerase)(5u/μl)0.5μl、三级灭菌纯净水36.5μl,从而制备出最终体积为100μl的聚合酶链反应(pcr)混合液。在利用聚合酶链反应(pcr)设备重复执行25次在95℃下5分钟的初步变性、在95℃下40秒的变性、在55℃下40秒的结合、在72℃下40秒的延伸过程,之后,在72℃下执行最终延伸反应。

在将聚合酶链反应(pcr)生成物移动到1.5ml管中之后通过添加100μld.w.使体积增加到300μl,然后添加相同体积的苯酚:氯仿:异戊醇(phenol:chloroform:isoamylalcohol)300μl。在利用漩涡振荡器(vortex)进行混合之后在13,000rpm下进行1分钟的离心分离,然后将其上清液移动到新的1.5ml管中。在添加2倍体积的100%乙醇以及0.1倍体积的3m乙酸钠(sodiumacetate)(ph5.2)进行混合之后,在-30℃下保存最少60分钟或在80℃下保存最少10分钟。将所保存的管在4℃、13,000rpm下进行10分钟的离心分离之后去除上清液。添加70%乙醇600μl,接下来在4℃、13,000rpm下进行5分钟的离心分离之后去除上清液。

在对上述管进行干燥之后添加三级灭菌纯净水40μl进行溶液。在向2.5%琼脂糖胶(agarosegel)加样5μl并加样60bpladderdnamarker3μl之后,以100bp谱带作为基准利用alphaimagerprogram(bio-rad公司,美国)进行定量。

将与通过上述方式制备的分析样本蛋白质结合的分子结合核酸一级文库的聚合酶链反应(pcr)产物作为“初步检测子”,并从上述初步检测子制备出用于抑制消减杂交(ssh)的检测子,然后将对与比较样本蛋白质结合的分子结合核酸一级文库进行聚合酶链反应(pcr)的产物作为驱赶子。

通过按照标准方法执行聚合酶链反应(pcr),从初步检测子制备出检测子1以及检测子2。其中,在制备检测子1时使用了新设计的由衔接子1和rs正向引物(序列编号5中的下划线部分)构成的ssh正向引物(ssh正向引物_检测子1,序列编号5)以及rs逆向引物,而在制备检测子2时使用了rs正向引物以及由衔接子2和rs逆向引物(下划线部分)构成的ssh逆向引物(ssh逆向引物_衔接子2,序列编号6)。

ssh正向引物_检测子1:

5’-tcgagcggccgcccgggcaggtcggaagcgtgctgcc-3’(序列编号5)

ssh逆向引物_检测子2:

5’-cagcgtggtcgcggccgaggttcgacctctgggttatg-3’(序列编号6)

在对1.5μl的30ng检测子1、1.5μl的600ng驱赶子聚合酶链反应(pcr)产物、1.0μl4×杂交溶液(300mmhepesph7.5,2mnacl,0.8mmedta)进行混合之后以4.0μl的反应体积在60℃下执行约12小时的第1次杂交,此外在对1.5μl的30ng检测子2(序列编号6)、1.5μl的600ng驱赶子聚合酶链反应(pcr)产物、1.0μl4×杂交溶液进行混合并以4.0μl的反应体积在95℃下进行5分钟的处理之后在60℃下执行约12小时的第1次杂交。为了说明的便利,将前者称之为“检测子1杂交溶液”并将后者称之为“检测子2杂交溶液”。

小心地将检测子2杂交溶液投入到驱赶子杂交溶液中进行混合,接下来在将上述杂交溶液(检测子2杂交溶液和驱赶子杂交溶液的混合杂交溶液)重新投入到检测子1杂交溶液中并利用移液管均匀混合之后在60℃下执行12小时的第2次杂交。驱赶子溶液是通过在对1.0μl的130μg驱赶子、1.0μl4×杂交溶液、2μl水进行混合之后添加少量的矿物油(mineraloil)并利用聚合酶链反应(pcr)装置在98℃下进行90秒的处理的方式制备。在向已完成第2次杂交反应的溶液添加耐热聚合酶(taqpolymerase)之后在75℃下执行5分钟的延伸(extension)反应,从而通过在第2次杂交产物的双链核酸的5’端以及3’端的粘性末端(cohesiveend)追加碱基而转换成钝圆末端(bluntend)。

利用如下所述的经过设计的“衔接子1引物”(序列编号7)以及“衔接子2引物”(序列编号8),按照标准方法对已完成延伸反应的溶液执行聚合酶链反应(pcr)。

衔接子1引物:

5’-tcgagcggccgcccgggcaggt-3’(序列编号7)

衔接子2引物:

5’-cagcgtggtcgcggccgaggt-3’(序列编号8)

利用“rs正向引物”(序列编号3)以及“rs逆向引物”(序列编号4),按照标准方法对通过上述过程获得的聚合酶链反应(pcr)产物执行巢式聚合酶链反应(nestedpcr)。

对上述聚合酶链反应(pcr)扩增产物执行下一代序列分析(ngs)。

<实施例3-2>利用双链特异性核酸酶(dsn)的分子结合核酸二级文库的制备

按照如图4所示的步骤,利用双链特异性核酸酶(dsn,duplex-specificnuclease)通过消减化制备出分子结合核酸二级文库。

为了制备上述利用双链特异性核酸酶(dsn)的分子结合核酸二级文库,将通过<实施例2>制备的分析样本蛋白质的分子结合核酸核糖核酸(rna)文库的逆转录酶-聚合酶链反应(rt-pcr)产物作为检测子使用,并将比较样本蛋白质的核糖核酸(rna)分子结合核酸文库的逆转录酶-聚合酶链反应(rt-pcr)产物作为驱赶子使用。

在使用上述ssh正向引物_检测子1以及上述ssh逆向引物_检测子2作为引物对检测子执行聚合酶链反应(pcr)之后,再使用上述ssh正向引物_检测子1执行聚合酶链反应(pcr),从而获得检测子双链脱氧核糖核酸(dna)。使用rs正向引物以及rs逆向引物对驱赶子执行聚合酶链反应(pcr),从而获得双链脱氧核糖核酸(dna)。

对通过上述过程制备的双链脱氧核糖核酸(dna)进行杂交之后利用双链特异性核酸酶(dsn)进行处理。具体来讲,在制备出双链脱氧核糖核酸(dna)100ng/μl并分别将1.5μl分装到聚合酶链反应(pcr)管中之后追加投入1μl的4×杂交溶液以及1.5μl的蒸馏水,然后利用矿物油(mineraloil)进行覆盖。在98℃下进行3分钟的加热之后在60℃下进行4小时的杂交。在完成杂交之后,将60℃预热的5μl的2×dsn缓冲液(100mmtrishclph8.0,10mmmgcl2,2mm二硫苏糖醇(dithiothreitol))添加到混合反应物。接下来,添加0.25kunitzunits的双链特异性核酸酶(dsn)(wako公司,日本)进行反应。在反应30分钟之后添加10μl的5mmedta结束反应。

向上述反应结果物60μl添加10×聚合酶链反应(pcr)缓冲溶液10μl、30mm脱氧核糖核苷三磷酸(dntp)1μl、ssh正向引物_检测子1(25pmol/μl)1μl、ssh逆向引物_检测子2(25pmol/ul)1μl、耐热聚合酶(taqploymerase)(5u/μl)0.5μl、三级灭菌纯净水36.5μl,从而制备出最终体积为100μl的聚合酶链反应(pcr)混合液。在利用聚合酶链反应(pcr)设备重复执行25次在95℃下5分钟的初步变性、在95℃下40秒的变性、在55℃下40秒的结合、在72℃下40秒的延伸过程,之后,在72℃下执行最终延伸反应。接下来,利用1μl的核酸外切酶i(exonucleasei)进行处理并执行40分钟的反应,从而去除剩余的单链核酸。

利用“rs正向引物”(序列编号3)以及“rs逆向引物”(序列编号4),按照标准方法对通过上述过程获得的扩增物执行巢式聚合酶链反应(nestedpcr)。

对上述聚合酶链反应(pcr)扩增产物执行下一代序列分析(ngs)。

<实施例3-4>消减化的评估

为了对分子结合核酸一级文库的消减化程度进行评估,在将血清样本处理固定到硝化纤维(nc)膜之后,利用已消减化的利用双链特异性核酸酶(dsn)的分子结合核酸二级文库进行处理而使其发生反应。将与血清蛋白质结合的分子结合核酸从上述硝化纤维(nc)膜分离之后将其作为模板执行逆转录酶-聚合酶链反应(rt-pcr),然后通过电泳对其结果进行确认。

在本实施例中,作为分析样本使用了心肌梗塞患者的血清,作为比较样本使用了不稳定型心绞痛患者的血清。通过实施消减化而获得的分子结合核酸文库的评估结果如图5所示。在分析样本中形成了较强的谱带而在比较样本中形成了较弱的谱带,这说明分析样本已经借助于比较样本实现消减化。

<实施例4>分子结合核酸文库的碱基测序以及出现频率测定

通过对在上述实施例中制备出的分子结合核酸一级文库的逆转录酶-聚合酶链反应(rt-pcr)产物即双链脱氧核糖核酸(dna)池以及分子结合核酸二级文库的逆转录酶-聚合酶链反应(rt-pcr)产物即双链脱氧核糖核酸(dna)池适用下一代序列分析(ngs,nextgenerationsequencing)技术,测定出上述分子结合核酸的碱基序列和出现频率。

下一代序列分析(ngs)是以上述脱氧核糖核酸(dna)池作为对象利用hiseq3000(illumina公司)执行。

利用在上述实施例中制备出的脱氧核糖核酸(dna)池以及truseqdnasamplepreparationkitv.2(illumina公司)制备出测序文库。具体来讲,在按照制造企业的协议进行136ng的脱氧核糖核酸(dna)执行末端修复(endrepair)、腺苷追加、衔接子附加之后执行聚合酶链反应(pcr)。除追加腺苷碱基的步骤之外,在各个步骤中利用truseq试剂盒中包含的agencourtampurexpbeads(beckman-coulter公司,美国)进行洗涤。接下来按照制造企业的协议利用试剂盒中包含的聚合酶链反应(pcr)引物执行15轮(cycles)聚合酶链反应(pcr),从而制备出测序文库。

利用qubit荧光计(fluorometer)(英杰公司)对上述聚合酶链反应(pcr)产物即测序文库进行定量。在hiseq3000的cbotclusterstation中,以向各个样本添加3ng聚合酶链反应(pcr)产物的5pm浓度在流动池(flowcell)中进行杂交。通过在cbot中对分子结合核酸文库中的每个单一脱氧核糖核酸(dna)执行28次桥式扩增(bridgeamplification)而形成聚类。在对各个聚类进行线性化之后与测序序列进行杂交。将上述流动池(flowcell)加样到hiseq3000,接下来利用可对碱基序列进行分析的hiseq3000的单读长80碱基对配方(singleread80basepairrecipe)对73单读长碱基(singlereadbases)以及7复合碱基(multiplexedbases)执行分析。利用illumina实时分析(realtimeanalysis,rta)执行图像生成以及分析,从而实时地对碱基响应档案(base-callfiles)以及品质分数进行确认。

在完成正向以及逆向链的测序之后,利用制造企业(illumina公司)的casava软件执行品质分析,再额外利用自主开发的软件(aptacdss,biois)分析系统执行下游(downstream)分析。

在品质分析的匹配(matching)步骤中,以在构成单链核酸文库的寡核苷酸的<一般式i>结构中包含5’保留区域(17bp)、可变区域(50bp)以及3’保留区域(17bp)的序列的74碱基对(bp)的模式作为基准进行比较分析。过滤(filtering)步骤是对与上述模式不一致的任意序列进行排除的步骤。在模式匹配过程中,在各个保留区域中容许了一个不一致。为了执行下游分析,为保留区域序列仅保留50bp的可变区域序列并在过滤之后排除。将逆向补充标签与正向序列标签结合。对分子结合核酸计数循环读长(countroundread)进行计数的过程,是通过循环富集分析(roundenrichmentanalysis)方式执行。利用上述品质分析以及计数循环结果,对构成上述文库的特定分子结合核酸的碱基序列以及出现频率进行测定。

对各个分子结合核酸的脱氧核糖核酸(dna)池的15,000,000至18,000,000个单一脱氧核糖核酸(dna)执行序列分析。

通过对分别构成利用分析样本s制备的分子结合核酸一级文库和利用比较样本c制备的分子结合核酸一级文库的5,395个分子结合核酸的碱基序列以及出现频率的比率进行比较,确认两者互不相同图6。

在对构成通过抑制消减杂交(ssh)工程制备的分子结合核酸二级文库的分子结合核酸进行碱基序列分析时,利用由在上述分子结合核酸一级文库测定出的分子结合核酸碱基序列构成的参考碱基序列(referencesequence)以及ebi网站(http://www.ebi.ac.uk/tools/msa/clustalo/)omegacluster执行聚类分析。

通过对上述分析样本以及比较样本进行比较分析,测定出能够代表分析样本的分子结合核酸共计1,148个。

<实施例4-2>分子结合核酸的生物学意义测定

将心肌梗塞患者的血清(10例)作为分析样本并将不稳定型心绞痛患者的血清(21例)作为比较样本进行分析表2。利用在上述实施例中测定出的1,149个分子结合核酸的碱基序列构成参考序列。将从样本与1,149个分子结合核酸文库发生反应之后形成的蛋白质-分子结合核酸复合体池中分离出的分子结合核酸池的逆转录酶-聚合酶链反应(rt-pcr)产物即双链脱氧核糖核酸(dna)作为核酸样本,制备出测序文库。接下来,通过下一代序列分析(ngs)产生读长并与上述参考序列进行比较,从而对分子结合核酸的出现频率进行分析。利用生物学意义测定系统的可通过1,149个分子结合核酸的出现频率对心肌梗塞患者以及不稳定型心绞痛以统计学方法进行区分的分子结合核酸的分布如图7所示。

利用对上述分析样本(10例)以及比较样本(10例)分别执行分析的结果,构建出分析样本以及比较样本的数据库(db),接下来在通过单向方差分析(one-wayanova)技法确定能够良好地对两个组进行区分的分子结合核酸之后将所确定的分子结合核酸的出现频率转换成4*[(出现频率-最小)/(最大-最小)]-2的结果如图7所示。

利用所选定的分子结合核酸的出现频率进行分层聚类的结果如图8所示。如图8所示,心肌梗塞患者的血清以及不稳定型心绞痛患者的血清分别形成独立的聚类,据此可知,能够利用与人类血清蛋白质进行结合的分子结合核酸的出现频率对患者进行区分。

表2心血管疾病患者的临床信息

如上述结果所示,通过在构成生体样本的多重蛋白质、所结合的分子结合核酸以及利用下一代序列分析(ngs)技术测定出的生体样本中对蛋白质的表达谱进行探索以及分析,能够对与分析样本即心肌梗塞患者的血清蛋白质进行特异性结合且具有生物学意义的分子结合核酸进行选定。其中关于序列编号为768(自行为分子结合核酸分配的编号)的分子结合核酸,通过对其与分析样本即心肌梗塞患者的血清以及比较样本即不稳定型心绞痛患者的血清的结合程度进行评估,可以得知其仅与心肌梗塞患者的血清进行特异性反应图9。

<实施例4-4>其他分子结合核酸的选定以及用途探索

<4-4-1>抗癌药反应蛋白质的分子结合核酸

分子结合核酸选定

为了对可实现药物反应性监测的分子结合核酸以及蛋白质进行调查,制备出利用抗癌物质阿霉素(doxorubin)进行处理的细胞以及未处理细胞的全蛋白质作为生体样本。作为对象的癌细胞株为肝癌细胞株hep3b样本,并利用阿霉素对肝癌细胞株培养液进行处理使其最终浓度达到5ug/ml。在进行处理的4小时之后,确认阿霉素被吸收到细胞内部。

获取在利用阿霉素进行处理之后培养6小时的细胞(分析样本)以及未处理区细胞(比较样本),并对全蛋白质进行分离。利用在<实施例1>中制备的单链核酸文库,制备出与各个细胞株进行结合的分子结合核酸一级文库。通过按照如上述<实施例3>所述的方式对上述所制备的文库进行抑制消减杂交(ssh),筛选获得所制备出的分析样本肝癌细胞株的抑制消减杂交(ssh)分子结合核酸文库。

确认分子结合核酸的结合能力

通过使上述筛选获得的分子结合核酸池与癌细胞株hep4b分析样本以及比较样本进行反应而制备出分析样本结合分子结合核酸池以及比较样本结合分子结合核酸池,然后利用下一代序列分析(ngs)技法进行测序并产生蛋白质表达谱。

通过对以上述分析样本以及比较样本作为对象产生并蓄积的蛋白质表达谱进行方差分析(anova)验证,选定与分析样本进行特异性结合的分子结合核酸并在细胞水准上对其结合能力进行观测。通过利用罗丹明(rhodamine)染色试剂对上述所选定的分子结合核酸进行标记而对处理区细胞以及未处理区细胞进行染色,利用荧光显微镜进行观察的结果如图10所示,可以确认分子结合核酸与处理区细胞进行特异性结合。

<4-4-2>肝癌细胞株特异性分子结合核酸

分子结合核酸选定

利用在<实施例1>中制备的单链核酸文库对肝癌细胞株hep3b以及gibco肝细胞(hepatocyte)样本进行处理,制备出与各个细胞株进行结合的分子结合核酸一级文库。通过对上述所制备的文库进行抑制消减杂交(ssh),筛选获得所制备出的肝癌细胞株的抑制消减杂交(ssh)分子结合核酸文库。

通过使上述筛选获得的分子结合核酸池与癌细胞株hep3b分析样本以及gibco肝细胞(hepatocyte)比较样本进行反应而制备出hep3b结合分子结合核酸池以及gibco肝细胞(hepatocyte)结合分子结合核酸池,然后利用下一代序列分析(ngs)技法产生细胞表面表达谱。

确认分子结合核酸的结合能力

通过对以癌细胞株hep3b分析样本以及gibco肝细胞(hepatocyte)比较样本作为对象产生并蓄积的蛋白质表达谱进行方差分析(anova)验证,选定与肝癌细胞株hep3b进行特异性结合的分子结合核酸并在细胞水准上对其结合能力进行观测图11。为了对所选定的分子结合核酸与肝癌细胞株(hep3b)以及gibco肝细胞(hepatocyte)的结合能力进行确认,在将特定分子结合核酸结合到上述细胞之后对所结合的分子结合核酸进行扩增以及电泳,其结果显示属于与肝癌细胞株进行特异性结合的核酸。

通过利用罗丹明(rhodamine)染色试剂对上述所选定的分子结合核酸进行标记而对肝癌细胞株hep3b以及gibco肝细胞(hepatocyte)进行染色,利用荧光显微镜进行观察的结果如图11所示,可以确认其与肝癌细胞株hep3b进行特异性结合而与gibco肝细胞(hepatocytes)几乎不会结合。

分子结合核酸的应用

接下来,制备出对因为在癌细胞中大量表达而被认定为肿瘤遗传基因的cdk2遗传基因的功能进行阻碍的cdk2小干扰核糖核酸(sirna)。接下来通过将其与肝癌细胞株特异性分子结合核酸结合,开发出对肝癌细胞株起到特异性作用的复合体并对其功能进行了确认。

制备出hep3b分子结合核酸-cdk2小干扰核糖核酸(sirna)复合体(complex),并通过转染(transfection)方法或直接处理(directtreatment)导入到细胞中。以100nm或260nm的浓度对hep3b分子结合核酸-cdk2小干扰核糖核酸(sirna)复合体(complex)进行处理,或为了进行比较而仅对cdk2小干扰核糖核酸(sirna)进行处理。使用肝癌细胞株hep3b并在处理3天之后在各个样本中分离出全核糖核酸(rna),接下来对cdk2小干扰核糖核酸(sirna)的表达进行了比较分析。相关结果如图12所示。

图12中的第一道为以100nm对hep3b分子结合核酸-cdk2小干扰核糖核酸(sirna)复合体(complex)进行处理的结果,而第二道为以260nm进行处理的结果。第3道为100nm的cdk2小干扰核糖核酸(sirna)的处理结果,而第4道为未处理组。

在转染(transfection)的情况下与未处理组相比,在hep3b分子结合核酸-cdk2小干扰核糖核酸(sirna)复合体(complex)以及cdk2小干扰核糖核酸(sirna)中均呈现出了cdk2信使核糖核酸(mrna)量的减少。但是在直接处理(directtreatment)的情况下,可以发现与未处理组以及小干扰核糖核酸(sirna)处理组相比,在hep3b分子结合核酸-cdk2小干扰核糖核酸(sirna)复合体(complex)处理组中呈现出了cdk2信使核糖核酸(mrna)量的相对减少。通过上述结果可以得知,在hep3b分子结合核酸-cdk2小干扰核糖核酸(sirna)复合体(complex)中,包含于复合体(complex)中的分析性分子结合核酸通过与包含于肝癌细胞株hep3b中的蛋白质结合而移动到细胞内部并起到小干扰核糖核酸(sirna)的作用,从而减少了cdk2信使核糖核酸(mrna)的量。

<实施例5>与分子结合核酸结合的蛋白质的分离以及识别

通过对按照不同疾病组构成的分子结合核酸的数据库进行比较分析,决定有助于生物学意义分析的有利用价值的斑点(spot)之后制备出了与其对应的分子结合核酸。利用上述分子结合核酸对与上述分子结合核酸进行特异性结合的蛋白质进行了分离和识别。

具体来讲,在所选定的分子结合核酸的一端接合生物素(biotin)之后使其与链霉亲和素(streptavidin)进行反应,接下来通过与血清样本进行反应而获得血清蛋白质-分子结合核酸复合体,然后利用固定有生物素的支撑体从样本中分离出相应的复合体。接下来对通过电泳形成的谱带进行分离,从而对血清蛋白质进行识别。利用maldi-tof-tof对与所分离出的单链核酸进行结合的蛋白质的氨基酸序列进行测序。可以确认分子结合核酸以及上述分离识别出的蛋白质的解离常数(kd)小于30×10-9

<实施例7>生体样本的分析-核酸与蛋白质的同时分析

下一代序列分析(ngs,nextgenerationsequencing)是基于芯片(chip)以及基于聚合酶链反应(pcr)双端(pairedend)方法,是通过对全长的基因组进行片段化之后对上述片段进行杂交(hybridization)而进行超高速测序的方法。利用下一代序列分析(ngs),能够产生与基因组相关的大量信息。

利用下一代序列分析(ngs)技术,能够快速地对在人类组的2~5%中出现的等位基因性状信息即单核苷酸多态性(snp:singlenucleotidepolymorphism)以及因为单核苷酸多态性而导致的原生(wildtype)氨基酸变形形态即氨基酸突变(aminoacidmutation)进行分析。全基因组测序(wgs,wholegenomesequencing)是利用下一代序列分析(ngs)方法将全长的基因组序列以10×、30×、50×等多种倍数读取人类基因组的方法,而全外显子组测序(wes,wholeexomesequencing)是在上述全基因组测序(wgs)中仅对参与蛋白质生成的基因部分进行测序的方法,目标区域测序(ts,targetsequencing)则是在上述全基因组测序(wgs)中仅对参与靶分子生成的基因部分进行测序的技术。因此,所生成数据的大小顺序为wgs>wes>ts。但是,将较小的部分作为分析对象时的优点在于,能够对大量的样本进行测序。metseq是用于对基因的脱氧核糖核酸甲基化(dnamethylation)进行测定的测序技术,而rnaseq是用于基因表达即脱氧核糖核酸转录组(dnatranscriptome)的测序技术。结构变异(sv,structuralvariation)是指在变异过程中因为插入(insertion)、倒置(inversion)、易位(translocation)等导致的在染色体的较大单位(脱氧核糖核酸,dnasegment)上发生的变异,与其相关的信息同样能够通过下一代序列分析(ngs)产生。

利用下一代序列分析(ngs)技术同时产生蛋白质以及核酸信息的过程如下所述。

构建参考序列

首先,需要利用包含拟分析核酸的碱基序列以及拟分析蛋白质的适配体的分子结合核酸的碱基序列构建参考序列。在本实施例中,利用1,149个分子结合核酸的碱基序列以及拟分析的下述核酸的碱基序列构建参考序列。

<实施例7-1>蛋白质分析

通过分离生体样本而制备出用于蛋白质分析的样本。将所制备的蛋白质样本与核糖核酸(rna)分子结合核酸池接触,并对所形成的蛋白质-分子结合核酸复合体池进行分离。具体来讲,将蛋白质样本附着在硝化纤维(nc)盘上并使其在反应溶液内与包含适配体的分子结合核酸池接触,然后利用洗涤溶液对所形成的蛋白质-分子结合核酸复合体池进行洗涤。通过上述过程去除未结合或非特异性结合分子结合核酸之后对盘进行分离。通过将附着在盘中的从与蛋白质结合的分子结合核酸池获得的分子结合核酸作为对象执行逆转录以及聚合酶链反应(pcr)而得到脱氧核糖核酸(dna)池。利用所获得的脱氧核糖核酸(dna)池136ng以及truseqdnasamplepreparationkitv.2(illumina公司)执行末端修复(endrepair)、腺苷追加、衔接子附加以及聚合酶链反应(pcr)。除追加腺苷碱基之外,在各个步骤中利用truseq试剂盒中包含的agencourtampurexpbeads(beckman-coulter)进行洗涤。接下来按照制造企业的协议利用试剂盒中包含的聚合酶链反应(pcr)引物执行15次聚合酶链反应(pcr),从而制备出测序文库。

<实施例7-2>脱氧核糖核酸(dna)分析

为了对核酸信息进行分析,在对靶基因进行扩增的过程中需要对寡核苷酸进行特殊的设计。上述寡核苷酸的目的在于同时对多种靶进行扩增,能够使用靶-特异性序列(靶杂交核苷酸序列)以及5’-侧翼装配间隔子(flankingassemblyspacer)序列(重叠序列)。

为了制备出能够在特定温度下进行退火的最适当长度的多目标位点装配序列(mtas,multipletargetlociassemblysequencing)寡核苷酸,本发明人使用了计算机应用程序primerplex2.75软件(premierbiosoft,美国)。寡核苷酸探针是从靶-特异性序列(靶杂交核苷酸序列)以及5’-侧翼装配间隔子(flankingassemblyspacer)序列(重叠序列)制备。探针的长度约为25bp,能够在tm60℃下退火。

为了各个靶基因组位点(genomiclocus),设计成包含单核苷酸多态性(snp)位置在内的7bp的间隙(gap)的状态(即,单核苷酸多态性(snp)位置的左侧,3bp;单核苷酸多态性(snp)位置,1bp;以及单核苷酸多态性(snp)位置的右侧,3bp)。为了便于设计,将间隙的间隔调节为0~3bp。虽然装配间隔子是以任意序列制备,但是为了计算出寡核苷酸之间的重叠区域(overlappingregions)的温度值(temperaturevalue),基于最近邻法(nearestneighbormethods;bmcgenomics.2016;17:486.)决定了在装配序列上存在的退火区域。

利用公知的方法从生体样本中分离制备出核酸样本。利用qiaamp脱氧核糖核酸(dna)提取试剂盒(qiagen,德国)从人类血清样本提取出脱氧核糖核酸(dna)(基因组脱氧核糖核酸(gdna))。

具体来讲,为了分离出基因组脱氧核糖核酸(gdna),将血清食疗1.5ml投入到微型离心分离管中并与蛋白酶(protease)k30μl以及缓冲溶液180μl混合,然后在56℃下进行1小时的反应。在利用qiaamp吸附柱(spincolumn)对通过如上所述的方式获得的反应液进行纯化之后,利用缓冲溶液进行2次洗涤。接下来,利用在70℃下预热的缓冲溶液60μl进行溶解并提取出基因组脱氧核糖核酸(gdna),然后保管在-30℃条件。利用qubitdsdnahsassaykit以及qubit2.0(lifetechnologies公司,美国)对所提取出的各个基因组脱氧核糖核酸(gdna)进行定量。

利用在-30℃下保管的基因组脱氧核糖核酸(gdna)10ng以及17个靶基因的面板引物(panelprimer)制备出用于执行下一代序列分析(ngs)的文库。相应面板引物(panelprimer)如下述表3所示。

利用ionampliseqlibrarykit2.0(lifetechnologies公司)制备出用于执行下一代序列分析(ngs)的文库。

具体来讲,为了从在样本中提取出的脱氧核糖核酸(dna)中仅获得靶基因突变发生区域,利用上述面板引物(panelprimer)池进行了扩增。在对5xhifi反应混合物4μl和面板引物(panelprimer)池10μl、脱氧核糖核酸(dna)10ng进行混合之后利用灭菌蒸馏水进行补充直至总反应液达到30μl,从而制备出混合反应液。利用聚合酶链反应(pcr)设备重复执行21次在99℃下2分钟、在99℃下15秒、在60℃下4分钟的过程,从而对所制备出的混合反应液进行扩增。向所获得的扩增产物添加2μl的fupa试剂(thermofisherscientific公司,美国;用于部分切割以及磷酸化),然后执行在60℃下10分钟、在55℃下10分钟、在60℃下30分钟的反应,从对扩增产物的两侧末端进行部分切割。向部分切割的扩增产物添加ionp1adapter2μl、ionxpressbarcode2μl,并执行在22℃下40分钟、在72℃下10分钟的反应,从而将测序衔接子和用于对样本进行区分的条码结合到扩增产物中。向已结合测序衔接子和条码的扩增产物添加45μl的ampurexp溶液进行洗涤,然后利用agilentdna1000chip进行定量,从而制备出测序文库。

<实施例7-3>核糖核酸(rna)分析

在分别采集1.5ml的血清样本之后在常温条件下以10,000g进行5分钟的离心分离,然后对细胞进行回收。接下来利用rneasyplusminikit(qiagen公司)提取出所回收细胞的全核糖核酸(rna)。利用nanodroptm1000分光光度计(spectrophotometer)(nanodroptechnologies,wilmington,德国,美国)在260nm以及280nm下对所提取出的核糖核酸(rna)的浓度和品质(quality)进行测定。

利用大规模同步技术对从样本的核糖核酸(rna)核酸试料制备出的互补脱氧核糖核酸(cdna)文库进行了分析。例如,使用了如mrna-seqsamplepreparationkit(illumina公司)等产品,并按照制造企业的协议或经过少量变形制备出了互补脱氧核糖核酸(cdna)文库。在血浆互补脱氧核糖核酸(cdna)的末端修复步骤中使用了5倍稀释的克列诺(klenow)脱氧核糖核酸(dna)聚合酶。为了对末端修复且腺苷酰化的生成物进行纯化,使用了pcr纯化试剂盒qiaquickminelutekit(qiagen公司,美国)。使10被稀释的成对末端衔接子(adapter)与血浆互补脱氧核糖核酸结合,且为了对结合衔接子之后的生成物进行纯化而利用ampurexp磁珠(agencourt公司,美国)执行了2次纯化过程。接下来利用agilentdna1000chip进行定量,从而制备出测序文库。

<实施例7-4>微小核糖核酸(mirna)分析

在人类血清样本中通过小分子核糖核酸(smallrna)测序(sequencing)对全基因微小核糖核酸(genome-widemirna)进行了分析比较。利用mirvanamirnaisolationkit(ambion公司,austin,tx)从血清样本提取出小分子核糖核酸丰富的全核糖核酸(rna),然后利用illumina文库制备协议(librarypreparationprotocol)(illumina公司,美国加利福尼亚州圣地亚哥)制备除了微小核糖核酸(mirna)文库。利用illumina衔接子(adaptor;6-碱基条码(basebarcode))对各个文库进行索引化。利用6%tbe尿素聚丙烯酰胺凝胶凝胶(tbeureapolyacrylamidegel)对小分子核糖核酸(smallrna)文库进行大小分级(sizefractionation),并在从凝胶切开获得150至160碱基对(basepair)组分(fraction)之后进行纯化。接下来利用agilentdna1000chip对所纯化的微小核糖核酸(mirna)进行定量,从而制备出测序文库。

虽然能够通过对从上述所划分的生体样本中分离出的核酸样本和上述所分离出的蛋白质-分子结合核酸复合体池进行混合的方式制备测序文库,但是在本实施例中是通过对分别制备的测序文库进行混合的方式对碱基序列进行测定。通过将构成上述所制备的测序文库的核酸碱基序列与上述参考序列进行比较分析,对其出现频率进行测定。

为了确认是否能够将下一代序列分析(ngs)用测序文库适用于测序,利用agilentbioanalyzer2100(agilent公司,美国)设备以及高灵敏度芯片(highsensitivitychip)对所制备的文库的长度和量进行测定,将长度为100至400bp、量为100pmol/ul以上的文库用于测序。此外,利用高灵敏度芯片(highsensitivitychip)对文库的精度进行管理。

如上所述,利用qubit荧光计(fluorometer)(invitrogen公司)对按照各个样本进行混合并结合相应样本的条码序列的聚合酶链反应(pcr)产物进行定量。在hiseq3000的cbotclusterstation中,以向各个样本添加3ng聚合酶链反应(pcr)产物的5pm浓度在流动池(flowcell)中进行杂交。通过利用cbot的桥式扩增(bridgeamplification)对各个单一脱氧核糖核酸(dna)进行28次扩层而形成聚类。在对各个聚类进行线性化之后与测序序列进行杂交。将相应的流动池(flowcell)加样到hiseq3000。接下来将上述流动池(flowcell)利用可对碱基序列进行分析的hiseq3000的单读长80碱基对配方(singleread80basepairrecipe)对73单读长碱基(singlereadbases)以及7复合碱基(multiplexedbases)进行分析。利用illumina实时分析(realtimeanalysis,rta)执行图像生成以及分析,从而实时地对碱基响应档案(base-callfile)以及品质分数进行确认。

在完成正向以及逆向链的测序之后,利用illumina公司的casava软件执行品质分析,再额外利用自主开发的软件分析系统和参考率列执行下游(downstream)分析。

因为构成上述所确定的测序文库的核酸的出现频率能够体现出靶分子即核酸以及蛋白质的信息,因此能够在生物学意义测定系统中利用上述分析结果确定生体样本的生物学意义。上述生物学意义测定系统的生物学意义是指上述样本或采集上述样本的人体的生理学变化,是根据上述临床检查值在预防、诊断、治疗、缓解和处置等健康管理方面做出决策(decisionmaking)的过程中需要的信息。

表3靶基因及引物

上述表3中分别包括187个正向以及逆向引物,且按照在上述表3中记载的顺序分配序列编号9至序列编号382。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1