专利名称:新型检测sars典型基因变异的寡核苷酸芯片套组的制作方法
技术领域:
本发明涉及基因的单核苷酸突变(SNP)、插入突变和缺失突变检测领域,更具体地,涉及一种通用寡核苷酸芯片,以及包括该芯片的检测SARS病毒典型基因变异的寡核苷酸芯片套组。
背景技术:
严重急性呼吸系统综合症(sever acute respiratory syndrome,SARS)是一种危害人类健康的全球性新型疫病,临床表现出发热、干咳、呼吸急促等类似呼吸道疾病(如感冒)症状,而病理变化表现为非典型的肺炎。该病传播迅速,死亡率较高,主要通过近距离接触感染。目前世界范围内报道发生该病的国家有28个,疫情严重的地区有我国的广东,香港和北京等地。
2003年3月21日香港大学从SARS患者体内分离到一株冠状病毒,而后经过与荷兰科学家的共同工作,最终确定这种变异性的冠状病毒就是引起SARS的真正病原。本次分离的SARS病毒基因组虽然与其他动物冠状病毒结构模式一样,但核酸序列与已知的各种冠状病毒相距较远,最高仅有50%-60%同源性,对病毒各个编码蛋白核酸进化分析发现SARS病毒为一独立分枝,是一种新的冠状病毒。根据确定的SARS病毒的基因组序列和相关的特性,在短短的半年时间里,已经开发了数种用于SARS病毒的检测方法,主要的方法有三种分子检测方法(PCR检测),PCR可以检测出在各种样本(血液、粪便、呼吸道分泌物、组织切片)中的SARS病毒的遗传物质。免疫学方法(抗体检验)有免疫荧光和酶联免疫两种手段,它们具有速度快(一般1-2小时)、操作简单、成本低等特点。细胞学方法(细胞培养)是最早发展的实验室检测手段,从SARS患者所采集的样本(如呼吸道分泌物、血液或者粪便)中的病毒,可以通过感染性细胞培养并产生出病毒,能够在电子显微镜下直接观察到病毒颗粒,因而十分准确。
SARS病毒是一种RNA病毒,具有RNA病毒的一些共同的特性,如RNA病毒的序列多变,由于冠状病毒发生变异,导致了各地“非典”患者出现了不尽相同的临床表现和反应,尽管冠状病毒会发生变异,但因病毒要维持自身的主要功能,所以其主要部分并不会出现大的改变。SARS的变易主要表现为单点核苷酸突变(SNP),小段的插入和缺失突变。流行病学调查表明,SARS病毒发生高频率的突变位点有27个,这些位点的突变跟病毒的流行病学有着密切的关系。建立和发展能够同时检测SNP、插入和缺失突变的方法和相关的产品,对于了解SARS病毒与临床特征之间的关系具有重要的意义。
以前用于检测SNP、插入和缺失突变主要是基于PCR的一些方法,具有较高的灵敏度和特异性,但是这些方法的通量较低,不能做到高通量的筛查。最近几年发展起来的寡核苷酸基因芯片是一种高通量的分析基因的表达和变异的方法,一次可以对多个位点进行分析。寡核苷酸芯片是指将众多的人工合成的一段寡核苷酸片段按照一定点阵排列并以共价键结合于基片表面,形成一种微阵列。利用核酸碱基互补配对的原理,进行核酸杂交。当待检测样品中的目标核酸为荧光基团标记时,通过扫描芯片杂交的结果可反映出液相待测样品中核酸的种类及含量。该技术的最大优点是检测通量大。另外,对于检测核酸序列差异较大的基因,这种技术也十分有效,如Roche公司用这种方法开发了一种检测人体对药物反应的基因芯片,并已投放市场,但是用这种方法检测在DNA水平差异较小的基因,比如SARS病毒的点突变、插入和缺失突变就比较困难,需要分析芯片杂交后的信号强弱才能确定,在应用上受到很大的限制。
最近,文献公开了一种利用基因芯片进行细菌分型检测的方案(Elena Busti,Roberta Bordoni,Bianca Castiglioni,Paolo Monciardini,MargheritaSosio,Stefano Donadio,Clarissa Consolandi,Luigi RossiBemardi,Cristina Battagliaand Gianluca De Bellis(2002)Bacterial discrimination by means of a universal arrayapproach mediated by LDR(ligase detection reaction)BMC Microbiology,2,27.)。该方案利用了通用寡核苷酸芯片和连接反应体系进行检测,包括通用寡核苷酸芯片,该芯片上的点阵排列的一组交联寡核苷酸片段,长度为40-50核苷酸左右,包括一段位于5’端人工编码序列和位于3’端的一段间隔序列。间隔序列是15-20个碱基的多聚A,人工编码序列是20-25个人工设计的、与待检测位点的核苷酸序列无关的寡核苷酸序列。3′端经过氨基修饰,通过氨基共价偶连在片基上,制成芯片;在连接反应体系中,除了作为待检测的模板、高温DNA连接酶外,还有区分探针和普通探针。所述区分探针和普通探针是根据待测核酸序列和待测位点多样性比较,相应设计两条特异性的探针,一条为区分探针,长度一般为20-25个碱基,与待检测位点的上游序列完全互补(含检测位点),在3’端带上荧光标记,5’端带有羟基。另外一条普通探针,普通探针由两部分序列组成,3’端的20-25个碱基与待检测位点的下游基因序列完全互补,5’端为一段20-25个碱基与通用寡核苷酸芯片上相应交联寡核苷酸人工编码序列互补的序列,3’端为磷酸修饰。该反应体系利用高温DNA连接酶的特异性,只有区分探针和普通探针与模板完全配对才能连接上,带上荧光标记。通过普通探针的与通用寡核苷酸芯片上相应交联寡核苷酸人工编码序列互补的序列与芯片上的对应交联寡核苷酸杂交,扫描后,相应点出现信号,根据对应的交联寡核苷酸序列代表的区分序列可以确定待检测位点。这种检测策略的核心有两点(1)高温DNA连接酶对于连接位点附近的核苷酸序列要求非常严格,只有严格碱基互补配对才能连接上,杂交后出现的信号是有和无的区别,分析结果容易;(2)交联寡核苷酸序列是人工设计的,与检测目标不存在序列相关性,这样既可以避免检测目标序列与芯片杂交时潜在的交叉杂交和误杂交。
这种方法主要是根据细菌的16S的细微差别来设计,每个细菌选取一定数目,特异的点设计区分探针,根据杂交信号可以区分细菌的不同种属。在探针设计时,所要检测的位点在区分探针上,如果应用这种设计检测单核苷酸多态性、插入或缺失突变,需要设计的区分探针很多;其次,由于该方案所述通用寡核苷酸芯片上的交联寡核苷酸片段为人工设计的序列,该序列为随机排列,并没有限定G、C在序列中比例,依照此方案设计的芯片在检测过程中易出现由于交联寡核苷酸片段中C、G核苷酸比例不同,引起Tm温度不一致,导致杂交特异性不强和专一性不高的问题,芯片很难在统一的杂交条件下,获得良好结果。本发明针对这些不足,在设计上做了改进,并应用于同时检测SARS单点突变、插入和缺失突变的检测和试剂盒的开发。
发明内容
本发明的目的之一是提供了一种通用寡核苷酸芯片,包括片基、人工合成的的寡核苷酸片段。这些片段按照点阵排列方式固定于片基之上,为一组长度在30-60个碱基范围的寡核苷酸序列,片段之间的碱基差异度为40-60%,至少包括位于5’端的长度为15-30个碱基人工编码序列和位于3’端的长度为15-30个碱基的间隔序列,片基上寡核苷酸片段密度为1-1000个点/平方厘米。
本发明的目的之二是提供一种高通量、特异性检测SARS病毒典型基因变异的套组。将需要检测的位点放在普通探针上,需要进行荧光标记的探针数量减少,结果检测一个位点(包括插入和缺失突变)只需要一条荧光标记的探针,并可同时检测基因的单点突变、插入和缺失突变。该套组包括(I)上述通用寡核苷酸芯片;(II)普通探针,为一组长度在35-60个碱基范围的寡核苷酸片段,包括位于5’端的长度为15-30个碱基的人工编码区序列和位于3’端的能与被检测的目的基因突变位点和突变位点下游序列互补的序列;(III)区分探针,为一组长度在20-35个碱基范围并带有标记物的寡核苷酸片段,它们与为被检测的目的基因突变位点的上游序列互补;(IV)DNA连接酶;(V)洗涤溶液;(VI)杂交溶液。
具体实施例方式通用寡核苷酸芯片制备设计一组长度在30-60个碱基范围的序列,这部分序列由两部分组成,分别是间隔序列和人工编码序列。间隔序列靠近3’端,为长度在15-30个碱基多聚寡核苷酸A或T;人工编码序列靠近5’端,长度为15-30个碱基,为人工编码的序列,采用计算机随机设计和验证,符合与已知生物(尤其是检测目标生物)的基因组无同源性的要求。人工编码序列之间的碱基差异度为40~60%,即这些序列用NCBI(美国国立生物技术信息中心)网上的Blast(Basic Local Alignment Search Tool)进行比对时各序列之间的相同碱基数不超总碱基数的40~60%。经过反复试验,我们认为最优化的方案是把序列中的碱基G和碱基C的比例控制在总碱基数的56-68%,并且用相关引物设计软件如primer Premier 5.0 DEMO、OLIGO 6.65 DEMO、Array Designer 2.03 Demo等,控制该序列的Tm值(一个完整的双链DNA序列裂解一半时所需的温度)在63~65℃之间。实验结果证明,该方案实施可避免样品检测中误杂交及假阳性信号的出现,并且获得结果最为稳定,结果可见
图1。
芯片的片基为玻璃,亦可选用硅芯片、陶瓷材料、金属、聚二氟乙烯膜或醋酸纤维膜,或经醛基、硫基基团或其它基团修饰的基片。可以手工点样、也可以用商品化的芯片自动点样系统点样,制造成寡核苷酸阵列。寡核苷酸阵列的密度为1-1000个点/平方厘米。阵列中除了检测用的探针外,还可以设计一些对照用的阳性探针和阴性探针。
SARS典型基因变异检测套组和检测包括连接反应的寡核苷酸探针片段,连接反应的核酸模板,DNA连接反应,芯片杂交与洗涤,芯片检测和数据分析。
一、连接反应的寡核苷酸探针片段连接反应的寡核苷酸探针片段分为两组,普通探针和区分探针,以下简称探针I和探针II。探针I即普通探针,为一组长度在35-60个碱基范围的寡核苷酸片段,其5’端是15-30个碱基的人工编码序列,3’-端是与被检测的突变位点及其下游序列互补序列,每个检测位点可以设计三条普通探针,包括一条阳性普通探针,一条阴性普通探针和一条对照普通探针,3’端为羟基修饰;探针II即区分探针,为一组长度在20-35个碱基范围的寡核苷酸片段,其核苷酸序列能够与待测位点的上游(不包括待测位点)序列配对,5’末端带有修饰基团磷酸,3’末端带有标记物。所述标记物可以是放射性同位素、生物素或荧光基团(Cy3或Cy5)。
二、连接反应的模板连接反应的核酸模板是SARS病毒的RNA,经过反转录或反转录-PCR后的DNA分子。
三、DNA连接酶DNA连接酶,包括Taq DNA连接酶,Pfu DNA连接酶和T4 DNA连接酶。
四、杂交溶液杂交溶液为本领域公知的技术,一般可以选用6×SSC溶液和0.1%SDS溶液。
五、洗涤溶液洗涤溶液为本领域公知的技术,一般可以选用1)洗涤液I6×SSC,0.1%SDS溶液;2)洗涤液II4×SSC,0.1%SDS溶液;3)洗涤液III2×SSC,0.1%SDS溶液;4)洗涤液IV0.1×SSC溶液。
检测方法包括下述步骤(1)反转录或反转录-PCR;(2)连接反应;(3)芯片杂交-洗涤;(4)芯片杂交和数据分析。
一、反转录或反转录-PCR抽提SARS病毒RNA。用适当的随机六聚体引物进行反转录或反转录-PCR制备DNA。
二、DNA连接反应以反转录的cDNA第一链作为模板,用DNA连接酶将普通探针和区分探针进行连接。连接反应的条件是94℃,30秒;54-68℃,4分钟,循环40次。
三、芯片杂交-洗涤(1)将含有连接产物的杂交溶液在37℃与寡核苷酸芯片杂交,60分钟以上。
(2)杂交完毕后用洗涤溶液安以下次序洗涤为结合的探针,洗涤液I,室温5分钟,洗涤液II,室温5分钟,洗涤液III,室温5分钟,洗涤液IV,室温5分钟后置于50毫升的离心管中500转/分钟离心5分钟。
四、芯片检测照DNA芯片扫描仪操作指南进行芯片扫描。扫描结果用相应的软件读取数据,分析结果。
下面结合具体实施例进一步阐述本发明。应理解,下述实施例仅用于说明本发明而不用于对本发明的范围进行限制。
应用实例SARS病毒典型基因变异检测芯片套组一、SARS病毒的典型变异位点流行病学和序列测定表明,SARS病毒有9个高突变位点(nt),包括nt 9404、nt 9479、nt 17564、nt 19838、nt 21721、nt 22222、nt 27827、一个插入突变位点即在nt 27857处插入了53个碱基、一个缺失突变位点即在nt 27884处缺失了29个碱基。将这些高突变位点作为这次芯片检测的目标。表1列出了这些突变位点及其附近的核苷酸序列。
表1 SARS分型检测中的突变位点及其附近的核苷酸序列位点 序列 (斜粗体字母为突变位点及插入和缺失序列)9404ctactacttt atgaaattca gacgtgt(/c)ttt tggtgagtac aaccatgttg tt529479ttttgatgtc tttcactata ctctgtc(/t)tgg taccagctta cagctttctg cc5217564 gacaataagc taaaagcaca caaggat(/g)aag tcagctcaat gcttcaaaat gt5219838 tacaaaagag aagccccagc acatgta(/g)tct acaataggtg tctgcacaat ga5221721 gtttcatact attaatcata cgtttgg(/a)caa ccctgtcata ccttttaagg at5222222 tacagccttt tcacctgctc aagacat(/c)ttg gggcacgtca gctgcagcct at5227827 cttgtatttc tctatgcagt tgcatat(/c)gca ctgtagtaca gcgctgtgca tc5227857 gcactgtagt acagcgctgt gcatctaata aacctcatgt gcttgaagat ccttgtaagg60(插tacaacacta ggggtaatac ttatagcact gcttggcttt gtgctctagg aaaggtttta120入突变) c121
27884 gcactgtagt acagcgct gtgcatctaatc ctactggtta ccaacctgaa tggaatataa60(缺ggtacaacac taggggtaat acttatagca at 92失突变)二、交联寡核苷酸片段这些寡核苷酸片段3’端修饰基团是氨基,用于寡核苷酸片段与片基的交联。核苷酸序列的5’端为由人工设计的一段长度为25个碱基的寡核苷酸序列,与检测目标没有序列相关性;3’端是18个多聚A。将29种寡核苷酸片段分别溶于1%吗啡啉水溶液或2×SSC溶液中,制备成浓度为100pmole/μ溶液用来点样。表2列出了这些寡核苷酸片段的序列。
表2芯片制造用寡核苷酸序列编号 检测突变位点 序列1 9404 gatgatcgac gagacactct cgccaaaaaa aaaaaaaaaa aaa432 9404 cggtcgacga gctgccgcgc aagataaaaa aaaaaaaaaa aaa433 9404*gacattcgcg atcgccgccc gctttaaaaa aaaaaaaaaa aaa434 9479 cggtatcgcg accgcatccc aatctaaaaa aaaaaaaaaa aaa435 9479 gctcgaagag gcgctacaga tcctcaaaaa aaaaaaaaaa aaa436 9479*caccgccagc tcggcttcga gttcgaaaaa aaaaaaaaaa aaa437 17564cgactccctg tttgtgatgg accacaaaaa aaaaaaaaaa aaa438 17564cttttcccgt ccgtcatcgc tcaagaaaaa aaaaaaaaaa aaa439 17564*ggctgggtct acagatcccc aacttaaaaa aaaaaaaaaa aaa431019838gaacctttcg cttcaccggc cgatcaaaaa aaaaaaaaaa aaa431119838tttcggcacg cgcgggatca ccatcaaaaa aaaaaaaaaa aaa431219838*ctcggtggtg ctgacggtgc aatccaaaaa aaaaaaaaaa aaa431321721tcaacgtgcc agcgccgtcc tgggaaaaaa aaaaaaaaaa aaa43
1421721 gcgaaggaac tcgacgtgga cgccgaaaaa aaaaaaaaaa aaa431521721*cggggatacc gatctcgggc gcacaaaaaa aaaaaaaaaa aaa431622222 ggagcttacg ccatcacgat gcgataaaaa aaaaaaaaaa aaa431722222 cgtggcggtg cggagtttcc ccgaaaaaaa aaaaaaaaaa aaa431822222*cgatccaacg cactggccaa acctaaaaaa aaaaaaaaaa aaa431927827 ctgaatcctc caaccgggtt gtcgaaaaaa aaaaaaaaaa aaa432027827 ttcggcgctg gcgtaaagct tttggaaaaa aaaaaaaaaa aaa432127827*gtaaatctcc agcggaaggg tacggaaaaa aaaaaaaaaa aaa4322插入突变阳性 ccccaaacgt accaagcccg cgtcgaaaaa aaaaaaaaaa aaa4323插入突变阴性 gagacaaagg tctgcgccag caccaaaaaa aaaaaaaaaa aaa4324插入突变对照 ccccggatag ctgacgaggc ttacgaaaaa aaaaaaaaaa aaa4325缺失突变阳性 tccggacagg ttggggtgcg tttggaaaaa aaaaaaaaaa aaa4326缺失突变阴性 agtcgaagtg ggcggcgtca gactcaaaaa aaaaaaaaaa aaa4327缺失突变对照 caccaccagt gccgctacca caacgaaaaa aaaaaaaaaa aaa43点样对照标记28 ccggctttga actgctcacc gatctaaaaa aaaaaaaaaa aaa43cy329杂交对照 ccctttagtg agggttaatt gcgcaaaaaa aaaaaaaaaa aaa43*表示杂交阴性的对照探针。
三、寡核苷酸探针I和探针II对应一个待检测位点可以设计3-4条寡核苷酸探针I,其5’端的人工设计序列可与芯片上对应的交联寡核苷酸序列进行特异性配对,3’端的一段序列与检测目标位点及下游序列配,详细序列见表3。
一个待检测位点只需要1条标记的寡核苷酸探针II,其序列与检测目标位点上游序列配对。两个末端分别为磷酸修饰基团和荧光标记基团,详细序列见表4。
表3寡核苷酸探针I序列对应突编号寡核苷酸序列*变位点I19404tggcgagagt gtctcgtcga tcatcctact actttatgaa attcagacgt gt 52I29404atcttgcgcg gcagctcgtc gaccgctact actttatgaa attcagacgt gc 52I39404aaagcgggcg gcgatcgcga atgtcctact actttatgaa attcagacgt ga 52I49479agattgggat gcggtcgcga taccgtttga tgtctttcac tatactctgt c 51I59479gaggatctgt agcgcctctt cgagctttga tgtctttcac tatactctgt t 51I69479cgaactcgaa gccgagctgg cggtgtttga tgtctttcac tatactctgt a 51I717564gtggtccatc acaaacaggg agtcgacaat aagctaaaag cacacaagga t 51I817564cttgagcgat gacggacggg aaaagacaat aagctaaaag cacacaagga c 51I917564aagttgggga tctgtagacc cagccacaat aagctaaaag cacacaagga a 51I10 19838gatcggccgg tgaagcgaaa ggttcaaaag agaagcccca gcacatgta 49I11 19838gatggtgatc ccgcgcgtgc cgaaaaaaag agaagcccca gcacatgtg 49I12 19838ggattgcacc gtcagcacca ccgagaaaag agaagcccca gcacatgtt 49I13 21721tcccaggacg gcgctggcac gttgagtttc atactattaa tcatacgttt gg 52I14 21721cggcgtccac gtcgagttcc ttcgcgtttc atactattaa tcatacgttt ga 52I15 21721tgtgcgcccg agatcggtat ccccggtttc atactattaa tcatacgttt gt 52I16 22222atcgcatcgt gatggcgtaa gctccagcct tttcacctgc tcaagacat 49I17 22222ttcggggaaa ctccgcaccg ccacgagcct tttcacctgc tcaagacac 49I18 22222taggtttggc cagtgcgttg gatcgagcct tttcacctgc tcaagacaa 49I19 27827tcgacaaccc ggttggagga ttcagttgta tttctctatg cagttgcata t 51I20 27827ccaaaagctt tacgccagcg ccgaattgta tttctctatg cagttgcata c 51I21 27827ccgtaccctt ccgctggaga tttacttgta tttctctatg cagttgcata a 51I22 27857cgacgcgggc ttggtacgtt tggggtactg gttaccaacc tgaatggaat at 52I23 27857tggtgctggc gcagaccttt gtctcaaacc tcatgtgctt gaagatcctt gt 52I24 27857cgtaagcctc gtcagctatc cggggtgaag atccttgtcc tactggttac ca 52I25 27884ccaaacgcac cccaacctgt ccggaactgt agtacagcgc tgtgcatcta at 52I26 27884gagtctgacg ccgcccactt cgacttaagg tacaacacta ggggtaatac tt 52
I2727884 cgttgtggta gcggcactgg tggtgtaagg tacaacacta ggggtaatac tg 52注斜体及划线部分字母用来表示与片基上的交联寡核苷酸互补的序列表4寡核苷酸探针II序列(5’端是磷酸基团,3’端是荧光基团)编号对应突变位点 核苷酸序列II1 9404 ttttggtgag tacaaccatg ttgtt 25II2 9479 tggtaccagc ttacagcttt ctg 23II3 17564 aagtcagctc aatgcttcaa aatgtt 26II4 19838 tctacaatag gtgtctgcac aatgactg28II5 21721 caaccctgtc atacctttta agga24II6 22222 ttggggcacg tcagctgcag c 21II7 27827 gcactgtagt acagcgctgt gc 22II8 27857(插入突变)aaggtacaac actaggggta atact 25II9 27884(缺失突变)atagcactgc ttggctttgt gctct 25四、芯片制造用于芯片制造的寡核苷酸片段,溶于适当水溶液中,制备成100pmole/μl。用微阵列点样仪点样于相应的玻片上。固定、封闭等操作同普通芯片制备。
五、连接反应样品(可以经PCR放大)100fmol核苷酸探针I2pmol(每条寡核苷酸片段2pmole)
核苷酸探针II2pmol(每条寡核苷酸片段2pmole)DNAligase Buffer2微升Taq DNA ligase 4个单位加双蒸水至总体为20μl连接反应条件(94℃,30sec;58~64℃,4min)×40循环。
六、杂交与洗涤杂交杂交溶液是含有连接产物的6×SSC和0.1%SDS溶液。
杂交反应是芯片在杂交盒中避光,于37℃下杂交60分钟以上。
洗涤杂交后的芯片依次用6×SSC和0.1%SDS溶液,4×SSC和0.1%SDS溶液,2×SSC和0.1%SDS溶液,0.1×SSC溶液洗涤,每次5分钟。
七、芯片扫描与数据分析在洁净室中用ScanArray Express扫描,将信号转换成图像文件。照各种商用软件、包括自主开发的分析软件分析各个位点的荧光信号,确定基因组上相应位点的核苷酸。
八、检测结果一例SARS病毒典型基因突变的检测结果,如图1所示,图1a中第1排的12个点是点样对照点,获得到这排信号说明在芯片的制备中已经成功地将通用寡核苷酸片段点样液固定在片基上;图1a中第5和10排时芯片在杂交时的阳性对照点,获得到这排信号说明在用芯片检测中的连接、杂交和洗涤反应顺利进行;图1a中第2、3、4、6、7、8和9共七排,分别对应检测SARS病毒的7个典型基因突变位点,每个位点重复四次,具体对应突变位点和碱基类型如图1b所示。根据芯片的扫描结果,我们判读出该SARS病毒的基因型是T9404C9479T17564G19838A21721C22222C27827,与DNA序列测定的结果完全一致。
序列表<110>上海生物芯片有限公司<120>新型检测SARS典型基因变异的寡核苷酸芯片套组<160>74<210>1<211>43<212>DNA<213>人工序列<400>1gatgatcgac gagacactct cgccaaaaaa aaaaaaaaaa aaa 43<210>2<211>43<212>DNA<213>人工序列<400>2cggtcgacga gctgccgcgc aagataaaaa aaaaaaaaaa aaa 43<210>3<211>43<212>DNA<213>人工序列<400>3gacattcgcg atcgccgccc gctttaaaaa aaaaaaaaaa aaa 43<210>4<211>43<212>DNA<213>人工序列<400>4cggtatcgcg accgcatccc aatctaaaaa aaaaaaaaaa aaa 43<210>5<211>43<212>DNA<213>人工序列<400>5gctcgaagag gcgctacaga tcctcaaaaa aaaaaaaaaa aaa 43
<210>6<211>43<212>DNA<213>人工序列<400>6caccgccagc tcggcttcga gttcgaaaaa aaaaaaaaaa aaa 43<210>7<211>43<212>DNA<213>人工序列<400>7cgactccctg tttgtgatgg accacaaaaa aaaaaaaaaa aaa 43<210>8<211>43<212>DNA<213>人工序列<400>8cttttcccgt ccgtcatcgc tcaagaaaaa aaaaaaaaaa aaa 43<210>9<211>43<212>DNA<213>人工序列<400>9ggctgggtct acagatcccc aacttaaaaa aaaaaaaaaa aaa 43<210>10<211>43<212>DNA<213>人工序列<400>10gaacctttcg cttcaccggc cgatcaaaaa aaaaaaaaaa aaa 43<210>11<211>43<212>DNA<213>人工序列
<400>11tttcggcacg cgcgggatca ccatcaaaaa aaaaaaaaaa aaa 43<210>12<211>43<212>DNA<213>人工序列<400>12ctcggtggtg ctgacggtgc aatccaaaaa aaaaaaaaaa aaa 43<210>13<211>43<212>DNA<213>人工序列<400>13tcaacgtgcc agcgccgtcc tgggaaaaaa aaaaaaaaaa aaa 43<210>14<211>43<212>DNA<213>人工序列<400>14gcgaaggaac tcgacgtgga cgccgaaaaa aaaaaaaaaa aaa 43<210>15<211>43<212>DNA<213>人工序列<400>15cggggatacc gatctcgggc gcacaaaaaa aaaaaaaaaa aaa 43<210>16<211>43<212>DNA<213>人工序列<400>16ggagcttacg ccatcacgat gcgataaaaa aaaaaaaaaa aaa 43<210>17<211>43
<212>DNA<213>人工序列<400>17cgtggcggtg cggagtt tcc ccgaaaaaaa aaaaaaaaaa aaa 43<210>18<211>43<212>DNA<213>人工序列<400>18cgatccaacg cactggccaa acctaaaaaa aaaaaaaaaa aaa 43<210>19<211>43<212>DNA<213>人工序列<400>19ctgaatcctc caaccgggtt gtcgaaaaaa aaaaaaaaaa aaa 43<210>20<211>43<212>DNA<213>人工序列<400>20ttcggcgctg gcgtaaagct tttggaaaaa aaaaaaaaaa aaa 43<210>21<211>43<212>DNA<213>人工序列<400>21gtaaatctcc agcggaaggg tacggaaaaa aaaaaaaaaa aaa 43<210>22<211>43<212>DNA<213>人工序列<400>22ccccaaacgt accaagcccg cgtcgaaaaa aaaaaaaaaa aaa 43
<210>23<211>43<212>DNA<213>人工序列<400>23gagacaaagg tctgcgccag caccaaaaaa aaaaaaaaaa aaa 43<210>24<211>43<212>DNA<213>人工序列<400>24ccccggatag ctgacgaggc ttacgaaaaa aaaaaaaaaa aaa 43<210>25<211>43<212>DNA<213>人工序列<400>25tccggacagg ttggggtgcg tttggaaaaa aaaaaaaaaa aaa 43<210>26<211>43<212>DNA<213>人工序列<400>26agtcgaagtg ggcggcgtca gactcaaaaa aaaaaaaaaa aaa 43<210>27<211>43<212>DNA<213>人工序列<400>27caccaccagt gccgctacca caacgaaaaa aaaaaaaaaa aaa 43<210>28<211>43<212>DNA
<213>人工序列<400>28ccggctttga actgctcacc gatctaaaaa aaaaaaaaaa aaa 43<210>29<211>43<212>DNA<213>人工序列<400>29ccctttagtg agggttaatt gcgcaaaaaa aaaaaaaaaa aaa 43<210>30<211>52<212>DNA<213>人工序列<400>I1tggcgagagt gtctcgtcga tcatcctact actttatgaa attcagacgt gt52<210>31<211>52<212>DNA<213>人工序列<400>I2atcttgcgcg gcagctcgtc gaccgctact actttatgaa attcagacgt gc52<210>32<211>52<212>DNA<213>人工序列<400>I3aaagcgggcg gcgatcgcga atgtcctact actttatgaa attcagacgt ga52<210>33<211>51<212>DNA<213>人工序列<400>I4agattgggat gcggtcgcga taccgtttga tgtctttcac tatactctgt c 51
<210>34<211>51<212>DNA<213>人工序列<400>I5gaggatctgt agcgcctctt cgagctttga tgtctttcac tatactctgt t 51<210>35<211>51<212>DNA<213>人工序列<400>I6cgaactcgaa gccgagctgg cggtgtttga tgtctttcac tatactctgt a 51<210>36<211>51<212>DNA<213>人工序列<400>I7gtggtccatc acaaacaggg agtcgacaat aagctaaaag cacacaagga t 51<210>37<211>51<212>DNA<213>人工序列<400>I8cttgagcgat gacggacggg aaaagacaat aagctaaaag cacacaagga c 51<210>38<211>51<212>DNA<213>人工序列<400>I9aagttgggga tctgtagacc cagccacaat aagctaaaag cacacaagga a 51
<210>39<211>49<212>DNA<213>人工序列<400>I10gatcggccgg tgaagcgaaa ggttcaaaag agaagcccca gcacatgta49<210>40<211>49<212>DNA<213>人工序列<400>I11gatggtgatc ccgcgcgtgc cgaaaaaaag agaagcccca gcacatgtg49<210>41<211>49<212>DNA<213>人工序列<400>I12ggattgcacc gtcagcacca ccgagaaaag agaagcccca gcacatgt t 49<210>42<211>52<212>DNA<213>人工序列<400>I13tcccaggacg gcgctggcac gttgagtttc atactattaa tcatacgttt gg52<210>43<211>52<212>DNA<213>人工序列<400>I14cggcgtccac gtcgagttcc ttcgcgtttc atactattaa tcatacgttt ga52<210>44<211>52
<212>DNA<213>人工序列<400>I15tgtgcgcccg agatcggtat ccccggtttc atactattaa tcatacgttt gt52<210>45<211>49<212>DNA<213>人工序列<400>I16atcgcatcgt gatggcgtaa gctccagcct tttcacctgc tcaagacat49<210>46<211>49<212>DNA<213>人工序列<400>I17ttcggggaaa ctccgcaccg ccacgagcct tttcacctgc tcaagacac49<210>47<211>49<212>DNA<213>人工序列<400>I18taggtttggc cagtgcgttg gatcgagcct tttcacctgc tcaagacaa49<210>48<211>51<212>DNA<213>人工序列<400>I19tcgacaaccc ggttggagga ttcagttgta tttctctatg cagttgcata t 51<210>49<211>51<212>DNA
<213>人工序列<400>I20ccaaaagctt tacgccagcg ccgaattgta tttctctatg cagttgcata c 51<210>50<211>51<212>DNA<213>人工序列<400>I21ccgtaccctt ccgctggaga tttacttgta tttctctatg cagttgcata a 51<210>51<211>52<212>DNA<213>人工序列<400>I22cgacgcgggc ttggtacgtt tggggtactg gttaccaacc tgaatggaat at52<210>52<211>52<212>DNA<213>人工序列<400>I23tggtgctggc gcagaccttt gtctcaaacc tcatgtgctt gaagatcctt gt52<210>53<211>52<212>DNA<213>人工序列<400>I24cgtaagcctc gtcagctatc cggggtgaag atccttgtcc tactggttac ca52<210>54<211>52<212>DNA<213>人工序列
<400>I25ccaaacgcac cccaacctgt ccggaactgt agtacagcgc tgtgcatcta at52<210>55<211>52<212>DNA<213>人工序列<400>I26gagtctgacg ccgcccactt cgacttaagg tacaacacta ggggtaatac tt52<210>56<211>52<212>DNA<213>人工序列<400>I27cgttgtggta gcggcactgg tggtgtaagg tacaacacta ggggtaatac tg52<210>57<211>25<212>DNA<213>人工序列<400>II1ttttggtgag tacaaccatg ttgtt 25<210>58<211>23<212>DNA<213>人工序列<400>II2tggtaccagc ttacagcttt ctg23<210>59<211>26<212>DNA<213>人工序列<400>II3
aagtcagctc aatgcttcaa aatgtt 26<210>60<211>28<212>DNA<213>人工序列<400>II4tctacaatag gtgtctgcac aatgactg 28<210>61<211>24<212>DNA<213>人工序列<400>II5caaccctgtc atacctttta agga 24<210>62<211>21<212>DNA<213>人工序列<400>II6ttggggcacg tcagctgcag c 21<210>63<211>22<212>DNA<213>人工序列<400>II7gcactgtagt acagcgctgt gc 22<210>64<211>25<212>DNA<213>人工序列<400>II8aaggtacaac actaggggta atact 25<210>65
<211>25<212>DNA<213>人工序列<400>II9atagcactgc ttggctttgt gctct 25<210>66<211>52<212>DNA<213>sars9404位点突变及突变周围序列<222>(27)<223>n=c或t<400>9404ctactacttt atgaaattca gacgtgnttt tggtgagtac aaccatgttg tt52<210>67<211>52<212>DNA<213>sars9479位点突变及突变周围序列<222>(27)<223>n=c或t<400>9479ttttgatgtc tttcactata ctctgtntgg taccagctta cagctttctg cc52<210>68<211>52<212>DNA<213>sars17564位点突变及突变周围序列<222>(27)<223>n=g或t<400>17564gacaataagc taaaagcaca caagganaag tcagctcaat gcttcaaaat gt52<210>69<211>52<212>DNA<213>sars19838位点突变及突变周围序列<222>(27)
<223>n=a或g<400>19838tacaaaagag aagccccagc acatgtntct acaataggtg tctgcacaat ga52<210>70<211>52<212>DNA<213>sars21721位点突变及突变周围序列<222>(27)<223>n=g或a<400>21721gtttcatact attaatcata cgtttgncaa ccctgtcata ccttttaagg at52<210>71<211>52<212>DNA<213>sars22222位点突变及突变周围序列<222>(27)<223>n=c或t<400>22222tacagccttt tcacctgctc aagacanttg gggcacgtca gctgcagcct at52<210>72<211>52<212>DNA<213>sars27827位点突变及突变周围序列<222>(27)<223>n=c或t<400>27827cttgtatttc tctatgcagt tgcatangca ctgtagtaca gcgctgtgca tc52<210>73<211>121<212>DNA<213>sars27857位点插入突变<400>27857gcactgtagt acagcgctgt gcatctaata aacctcatgt gcttgaagat ccttgtaagg60tacaacacta ggggtaatac ttatagcact gcttggcttt gtgctctagg aaaggtttta120c121<210>74
<211>92<212>DNA<213>sars27884位点缺失突变<400>27884gcactgtagt acagcgctgt gcatctaatc ctactggtta ccaacctgaa tggaatataa60ggtacaacac taggggtaat acttatagca ct 9权利要求
1.一种通用寡核苷酸芯片,包括片基,人工合成的寡核苷酸片段,以点阵排列方式固定于片基之上,所述寡核苷酸片段为一组长度在30-60个碱基范围的寡核苷酸序列,片段之间碱基差异度为40-60%,至少包括一段位于5’端的人工编码序列和一段位于3’端的间隔序列,所述人工编码序列的碱基为随机排列,序列中的G、C碱基比例为56-68%;所述间隔序列为多聚寡核苷酸A或T。
2.根据权利要求1所述的一种通用寡核苷酸芯片,其特征在于所述及的人工编码序列为15-30个碱基。
3.根据权利要求1所述的一种通用寡核苷酸芯片,其特征在于所述及的间隔序列为15-30个碱基。
4.根据权利要求1所述的一种通用寡核苷酸芯片,其特征在于所述及的片基包括玻璃、硅芯片、陶瓷材料、金属、聚二氟乙烯膜或硝酸纤维膜。
5.根据权利要求1所述的一种通用寡核苷酸芯片,其特征在于所述及的片基是经醛基或硫基基团修饰。
6.根据权利要求1所述的一种通用寡核苷酸芯片,其特征在于所述及交联寡核苷酸片段,3’端经氨基修饰,以共价键偶联于片基上。
7.根据权利要求1所述的一种通用寡核苷酸芯片,其特征在于所述及的点阵排列的交联寡核苷酸片段密度为1-1000个点/平方厘米。
8.一种新型检测SARS典型基因变异的寡核苷酸芯片套组,包括DNA连接酶、杂交溶液和洗涤溶液,其特征在于还包括(a)权利要求1-7中任一项所述的检测SARS病毒典型基因变异的寡核苷酸芯片;(b)普通探针,为一组35-60个碱基的寡核苷酸片段;(c)区分探针,为一组20-35个碱基带有标记物的寡核苷酸片段。
9.根据权利要求8所述的一种新型检测SARS典型基因变异的寡核苷酸芯片套组,其特征在于所述及的普通探针至少包括一段位于5’端15-30个碱基人工编码区序列和一段位于3’端与被检测的目的基因突变位点和突变位点下游序列互补的序列,长度为20-30个碱基。
10.根据权利要求9所述的一种新型检测SARS典型基因变异的寡核苷酸芯片套组,其特征在于所述及的人工编码序列与权利要求1-7中任一项所述的检测SARS病毒典型基因变异的寡核苷酸芯片上对应的交联寡核苷酸片段人工编码序列互补。
11.根据权利要求8所述的一种新型检测SARS典型基因变异的寡核苷酸芯片套组,其特征在于所述及的带有标记物的区分探针的序列与被检测的目的基因突变位点的上游序列互补。
12.根据权利要求8所述的一种新型检测SARS典型基因变异的寡核苷酸芯片套组,其特征在于所述及的带有标记物的区分探针,该标记物为放射性同位素、生物素或荧光基团。
13.根据权利要求8所述的一种新型检测SARS典型基因变异的寡核苷酸芯片套组,其特征在于所述及的DNA连接酶为T4-DNA连接酶、Pfu DNA连接酶、Taq DNA连接酶。
14.根据权利要求9或11所述的一种新型检测SARS典型基因变异的寡核苷酸芯片套组,其特征在于所述及的突变位点包括nt 9404、nt 9479、nt 17564、nt 19838、nt 21721、nt 22222、nt 27827、nt 27857和nt 27884。
全文摘要
本发明公开了一种通用寡核苷酸芯片,包括片基和人工合成的寡核苷酸片段,这些片段按照点阵排列方式固定于片基之上,交联寡核苷酸片段密度为1-1000个点/平方厘米。本发明还提供了检测SARS病毒典型基因变异的寡核苷酸芯片套组,包括DNA连接酶、杂交溶液、洗涤溶液,通用寡核苷酸芯片、普通探针和区分探针。该套组用于检测SARS病毒基因的单点突变、插入和缺失突变。
文档编号C12Q1/68GK1611612SQ20031010836
公开日2005年5月4日 申请日期2003年10月31日 优先权日2003年10月31日
发明者刘建华, 龙伟红, 顾笑梅, 肖华胜, 张庆华, 赵国屏, 杨宏钧 申请人:上海生物芯片有限公司