1.本发明属于dna合成技术领域,主要涉及一种长片段基因的生物合成方法及应用。
背景技术:2.近些年来,合成生物学发展迅猛,基因合成在合成生物学中具有关键的作用,包括异源蛋白表达、基因改造和修饰以及全基因组合成等。dna合成是合成生物学领域中最重要的支撑技术之一,通过基因合成,不仅可以获得自然界中存在的基因,也可以对密码子进行优化,或按照人们的意愿随意对基因进行改造,大大提升了人们对基因和蛋白的操纵能力。
3.目前,人工合成基因的方法是将化学合成的短链寡核苷酸拼接组装获得长链dna。然而,该方法仍然存在限制其发展的技术瓶颈。例如,化学方法合成短链寡核苷酸的方法错误率高,大量使用有毒、易燃的有机试剂,污染大成本高,且化学合成体系无法与随后基于生物酶催化的基因拼接和纠错技术兼容,实现化学寡核苷酸(oligo)合成到生物长片段基因组装需要大量的人工操作,进一步增加了基因合成成本。特别是长的基因,化学法合成的oligo短,样品池里oligo种类多,造成后面组装的复杂性,提高了拼接的难度。
4.目前,生物法合成dna属于研究初期阶段,已报道的结果仅可以合成10nt核苷酸,其效率无法比拟现有的化学合成技术。生物合成的瓶颈在于尚无成熟的合成工艺,无法实现更长寡核苷酸链的合成。此外,长片段dna的合成工艺方法包括生物法合成短链dna、长链dna组装、基因纠错,如何实现这几步反应的高效兼容是生物法合成长片段基因的现有技术瓶颈。因此,迫切需要研究新的技术工艺以克服生物法全合成dna的局限性,以应用于现代分子生物学、基因工程以及合成生物学。
技术实现要素:5.本发明所要解决的问题是如何实现全生物法合成长片段基因,并保证合成步骤的高效兼容性。
6.为了解决以上技术问题,本发明提供了一种长片段基因的生物合成方法及应用。
7.本发明提供的长片段基因的生物合成方法,包含以下步骤:
8.(1)短链寡核苷酸合成:利用末端脱氧核苷酸转移酶合成短链dna,所述短链dna为50-100nt的单链dna;
9.所述末端脱氧核苷酸转移酶为a)、b)、c)或d)的蛋白质:
10.a)氨基酸序列是seq id no.2的蛋白质;
11.b)氨基酸序列是seq id no.2第404-785位的蛋白质;
12.c)在a)或b)所示的蛋白质的羧基端或/和氨基端融合蛋白标签得到的融合蛋白;
13.d)将seq id no.2所示的氨基酸序列经过氨基酸残基的取代和/或缺失和/或添加得到的具有末端脱氧核苷酸转移酶活性的蛋白质;
14.(2)dna组装:利用酶促反应将所述短链dna组装拼接得到长片段dna。
15.上述方法中还包括对所述dna组装得到的长片段dna进行dna纠错的步骤。
16.上述方法中,所述dna纠错可利用识别碱基错配的核酸内切酶和/或错配结合酶进行。
17.上述方法中,所述利用末端脱氧核苷酸转移酶合成短链dna具体可为:
18.a.固定:链霉亲和素磁珠与单链dna启动子在30℃下结合20min;
19.b.反应:50mm pbs,0.25mm cocl2,0.25mm 3
’‑
oh被o-氨基修饰的核苷酸,1.5mg/ml末端脱氧核苷酸转移酶tdt变体酶(来源于白喉雀)反应30min;
20.c.脱保护:用0.7m hono脱保护2min,重复一次;再用磷酸盐buffer洗两遍;
21.d.重复(b)(c),直至合成所需的短链dna(寡核苷酸oligo)。
22.上述方法中,所述短链寡核苷酸合成、所述dna组装和所述dna纠错均在水相中进行。
23.上述方法中,所述dna组装可为聚合酶组装法(polymerase cycling assembly,pca)。
24.上述方法中,所述聚合酶组装法可利用组合物进行,所述组合物可由通用引物和载体组成,所述通用引物可由gene-28a-上引和gene-28a-下引组成,所述gene-28a-上引可为核苷酸序列是序列表中序列4的单链dna分子,所述gene-28a-上引可为核苷酸序列是序列表中序列5的单链dna分子,所述载体可为pet28a(+)。
25.上述方法中,所述dna纠错可为:通过热变性,让合成的基因重新退火,使错配位点暴露,错配位点被错配特异性核酸内切酶或错配结合酶识别并切除,所得的基因片段经交叠延伸pcr反应组装成完整基因。
26.本发明还提供了用于生物合成长片段dna的产品。
27.本发明提供的用于生物合成长片段dna的产品,所述产品含有上述方法中所述末端脱氧核苷酸转移酶,dna组装酶和dna纠错酶。
28.上述产品中,所述dna组装酶可为dna聚合酶或者dna连接酶,所述dna纠错酶可为核酸内切酶或错配结合酶。
29.所述产品还含有上述方法中所述的组合物。
30.上述方法或产品在生物合成长片段dna中的应用也属于本发明的保护范围。
31.上述应用中,所述生物合成可为全生物合成。
32.所述长片段基因核苷酸数量可为300-3000bp,优选的长片段基因核苷酸数量为500-2000bp,优选的长片段基因核苷酸数量为500-1000bp。
33.本发明提供了一种长片段基因的生物合成方法及应用。该方法利用生物酶合成寡核苷酸,不但解决了化学合成短链dna的成本高、污染大等问题,还进一步解决了传统基因合成方法中短链dna合成与长链dna拼接纠错技术不兼容的问题。此外,传统基因合成中,合成一个750bp的gfp基因,需要将基因分为长度约60nt的反向互补的短链dna,约18条序列。本发明提供的的生物合成技术可以直接合成100nt以上的短链dna,因此,同样合成750bp的gfp基因,生物法最少需要分为10条序列,可以进一步降低拼接成本。
附图说明
34.图1为pca法分组的100nt的oligo琼脂糖凝胶电泳图。
35.图2为pca短连接片段的琼脂糖凝胶电泳检测结果。
36.图3为pca连接片段的琼脂糖凝胶电泳检测结果。
37.图4为egfp-pet-28a的测序验证结果。
具体实施方式
38.下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
39.下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
40.下述实施例中所用的末端脱氧核苷酸转移酶为tdt变体酶,是氨基酸序列为seq id no.2的的蛋白质,按照如下方法制备:
41.1.表达载体的构建
42.可以合成序列表中所示的氨基酸序列的所有基因序列均可用于表达载体的构建。本实施例将ncbi记载的上述物种中编码tdt蛋白的基因序列构建至表达载体pet-28a(+)酶切位点ndei和xhoi之间,得到重组质粒,命名为pet-28a(+)-tdt。pet-28a(+)为实施例所述,表达载体并不仅限于此,所有可以用于表达蛋白的载体均包括。实施例中所述为ndei和xhoi酶切位点,酶切位点并不仅限于此,表达载体中可用于构建表达基因片段的酶切位点均包括。
43.2.基因的表达
44.为了体外检测tdt酶活性,在大肠杆菌中对该酶进行外源表达及纯化。实施例中所述的宿主菌为e.coli bl21(de3),但是宿主菌并不仅限于此,所有可以用于表达蛋白的宿主均包括。
45.(1)将大肠杆菌表达型重组质粒pet-28a(+)-tdt转入e.coli bl21(de3)中,获得重组菌。采用卡那霉素抗性平板进行阳性克隆筛选(kan+,100mg/ml),37℃过夜培养;
46.(2)挑单克隆至5ml lb液体培养基中(kan+,100mg/ml),37℃、220r/min培养至od600为0.6-0.8。将5ml lb培养基中菌液转接至800ml 2yt培养基中(kan+,100mg/ml),37℃、220rpm培养至od600为0.6-0.8时,降温至16℃,加iptg至终浓度0.5mm,诱导表达16h;
47.(3)将上述培养菌液收集到收菌瓶中,5500r/min离心15min;
48.(4)弃上清,用35ml蛋白缓冲液(50mm tris-hcl,2mm edta,0.1%triton x-100,ph7.4)将所得菌体沉淀悬起,倒入50ml离心管中,-80℃冰箱保存。
49.3、蛋白纯化
50.(1)破菌:采用高压低温破碎仪,在压力1200bar,4℃条件下对于上述3得到的菌体沉淀破菌2次。4℃、10000r/min离心45min,取离心后的沉淀、上清,制样;
51.(2)纯化:上清液经0.45μm微孔滤膜抽滤,进行镍亲和层析纯化,具体步骤如下:
52.a:柱平衡:挂上清前,先用ddh2o洗2个柱体积,再用蛋白缓冲液平衡ni亲和层析柱1个柱体积;
53.b:上样:将上清按0.5ml/min流速缓慢经过ni亲和层析柱,再重复一次;
54.c:洗脱杂蛋白:采用蛋白缓冲液冲洗1个柱体积,再用50ml含50mm咪唑的蛋白缓冲
液去洗脱结合较强的杂蛋白,取前几滴流穿样品,制样;
55.d:洗脱目的蛋白:分别用20ml含100mm,200mm,300mm咪唑蛋白缓冲液将目的蛋白洗脱下来,取前几滴流穿样品,制样,12%sds-page检测。
56.(3)浓缩换液:将收集到的目的蛋白用50ml amicon超滤管(30kda,millipore公司)离心浓缩(4℃、3400r/min),浓缩至1ml。加10ml蛋白缓冲液,浓缩至1ml,重复该过程1次,得到纯化蛋白tdt。
57.(4)用nondrop 2000微量分光光度计检测浓缩后蛋白浓度,为4mg/ml。即得到纯化浓缩的tdt蛋白。
58.pet28a-tdt含有带mbp标签的重组tdt变体酶基因,重组tdt变体酶基因的核苷酸序列是seq id no.1,编码seq id no.2所示的蛋白质重组tdt变体酶。
59.实施例1、egfp基因分段及寡核苷酸(oligo)生物合成
60.该实施例以egfp基因(序列表中seq id no.3所示)作为长片段dna阐明本发明的全生物合成长片段dna的方法。具体步骤如下:
61.1.egfp基因分段
62.本发明的基因分段以100 nt为起始长度,基于聚合酶链式反应拼接方法进行分段。分段原理是基于序列5’到3’进行分段,每段长度在82-100 bp之间,各段之间末端重叠,重叠区段的长度为15-25 bp,设置的有通用引物,分段时将通用引物的序列加到基因序列的前后,保证碱基数是3的倍数egfp加完通用引物后的长度为881 bp。分段借助于dnawork软件最后分段数为偶数。
63.基于聚合酶的聚合酶链式反应(pca)分段如表1所示。
64.表1基于pca拼接法的基因分段
[0065][0066]
2.寡核苷酸链(oligo)生物合成
[0067]
反应体系:100 mm nacl,0.25 mm cocl2,50 mm kac,10 mm mg(ac)2,ph 6.8。底物:1μm生物素标记的4 nt dna启动子(引发链)(带有生物素标记的长度为4 nt的单链dna,包含256种启动子,也就是包括核苷酸序列是表1各个片段的第1-4位核苷酸的4nt单链dna,例如正向a1序列选的启动子和核苷酸序列是5
’‑
ccgc-3’)。
[0068]
(1)结合:链霉亲和素磁珠(海狸生物22308-10)与带有生物素标记的4ntdna启动子在30℃下在2x结合buffer中结合20min得到结合有启动子的磁珠。其中2x结合buffer的溶质为:10mm tris-hcl、1m nacl 1mm edta、0.01%tween-20,溶剂为水。
[0069]
(2)反应:将结合有启动子的磁珠加入反应体系使其在反应体系中的含量为2μm,在30℃反应30min。该反应体系是以50mm pbs为溶剂、以cocl2、3
’‑
oh被o-氨基修饰的核苷酸和末端脱氧核苷酸转移酶tdt变体酶为溶质配制成的液体。该反应体系含有0.25mm cocl2,0.25mm 3
’‑
oh被o-氨基修饰的核苷酸,1.5mg/ml末端脱氧核苷酸转移酶tdt变体酶。
[0070]
(3)脱保护:向步骤(2)的反应体系中加入亚硝酸溶液,使反应体系中的亚硝酸含量为0.7m,30℃反应2min,重复一次;再用磷酸盐缓冲液洗两遍。
[0071]
(4)重复(2)和(3),直至合成所需的引物链(表1的片段),分别得到24种单链寡核苷酸(oligo)溶液,每种单链寡核苷酸溶液含有一种单链寡核苷酸(溶质),该一种单链寡核苷酸为核苷酸序列如表1的10种单链寡核苷酸(oligo)。单链寡核苷酸溶液中的单链寡核苷酸含量为10μm。
[0072]
(5)合成完后,进行核酸电泳验证。
[0073]
基于聚合酶的聚合酶链式反应(pca)分段dna(核苷酸序列如表1)的核酸电泳的条带如图1。说明合成了核苷酸序列分别如表1的10种单链寡核苷酸(oligo)。
[0074]
实施例2、长片段dna合成组装及纠错
[0075]
寡核苷酸组装方法采用如下方法:基于聚合酶的聚合酶链式反应(pca)。
[0076]
针对pca方式的dna合成组装方法,是将寡核苷酸进行pca组装,pca组装好的长片段再进行纠错。具体是1)pca法组装;2)将pca组装后胶回收产物加入t7核酸内切酶i,在37℃下温育30min,65℃失活20min;3)再对上一步的产物进行重叠pcr,获得正确率高的长dna片段。
[0077]
1.pca体系通用引物设计
[0078]
本发明将不同的载体都设有通用的引物,合成任何基因都可以用同一对引物p载体和基因,如下表2。本发明以将egfp构到pet-28a(+)上为例,将881bp的整个基因分为两段:一段为408bp命名为egfp-1(为序列表中序列6所示的核苷酸序列)、一段为496bp命名为egfp-2(为序列表中序列7所示的核苷酸序列)。这两段之间包含有23bp的同源序列。
[0079]
表2通用引物序列
[0080]
引物名称序列gene-28a-上引ctctagaaataattttgtttaactttaagaaggagatataccatgggcagcagccatcgene-28a-下引gcttcctttcgggctttgttagcagccggapet28a-上引caaagcccgaaaggaagctgagttggctgcpet28a-下引ccttcttaaagttaaacaaaattatttctagaggggaattgttatccgc
[0081]
2.pca法组装长链dna具体步骤:
[0082]
1)混合oligo的制备
[0083]
将表1的正向a1、反向b1、正向a2和反向b2的单链寡核苷酸溶液各取2.5μl混合得到的液体命名为egfp-1的oligos。
[0084]
表1的正向a3、反向b3、正向a4、反向b4、正向a5和反向b5的单链寡核苷酸溶液各取2.5μl混合得到的液体命名为egfp-2的oligos。
[0085]
将两段中的oligo预混,其中egfp-1的oligos为表1的正向a1、反向b1、正向a2和反向b2,egfp-2的oligos为表1的正向a3、反向b3、正向a4、反向b4、正向a5和反向b5,根据所分基因片段的引物数量进行混样,每种oligo加入2.5μl。(注:混样时,基因片段的分段要注意每段基因要小于600bp。)
[0086]
2)进行pca组装反应。反应体系和反应条件如表3和表4。
[0087]
表3pca法的反应体系
[0088][0089]
egfp-1的oligos的pca组装反应分为2步,第一步为混样,第二步的反应体系如表3所示,第二步反应体系中的上引为gene-28a-上引溶液(浓度为10μm),下引反向b2(浓度为10μm),反应条件如表4。得到408bp的pca产物,命名为egfp-1(核苷酸序列为序列表中序列6的单链dna)的pca产物。
[0090]
egfp2的oligos的pca组装反应分为2步,第一步为混样,第二步的反应体系(表3)除了与egfp-1合成的上引和下引不同外,其它组分均相同。第二步反应体系中的上引为正向a3(浓度为10μm),下引为gene-28a-下引溶液(浓度为10μm),反应条件均如表4。得到496bp的pca产物,命名为egfp-2(核苷酸序列为序列表中序列7的单链dna)的pca产物。
[0091]
表4反应条件
[0092][0093]
pca连接片段(egfp-1、egfp-1)的琼脂糖凝胶电泳检测结果如图2所示。
[0094]
3)pca产物回收,使用zymoclean
tm gel dna recovery kit(购自:zymo research,货号:d4008)
[0095]
4)错配蛋白法纠错egfp-1、egfp-2
[0096]
将自大肠杆菌的错配结合蛋白emuts(ecomuts)与his标签融合表达,以带nickel的磁珠基质,将muts融合蛋白固定在带nickel的磁珠上。将需要纠错的dna通过变性退火将错误暴露出来,利用muts蛋白特异性识别并结合错配碱基对的双链dna能力,可以将错误的dna链去除。
[0097]
(1)将所有的oligo混合,再进行慢退火。退火程序如下表5;
[0098]
表5 dna片段慢退火反应条件
[0099]
温度时间 95℃5min 30℃30s变温速率0.1℃/s12℃∞ [0100]
(2)取样品相同体积的带nickel的磁珠,用相同体积的纠错buffer清洗磁珠两遍,去上清,加入emuts纠错蛋白酶,30℃900rpm振荡10min,混匀,将emuts融合蛋白固定在带nickel的磁珠上;
[0101]
(3)除去上清,加入步骤(1)慢退火后的基因片段,混匀,利用emuts蛋白特异性识别并结合错配碱基对的双链dna能力,将错误的dna链去除。纠错5min左右,取上清。
[0102]
5)dna片段组装连接
[0103]
将egfp-1的回收的dna片段和egfp-2的回收的dna片段进行混合,再基于同源臂进行连接。dna片段的重叠pcr反应步骤为:先加入模板egfp-1、egfp-2,dna聚合酶,水,然后进行5个循环的扩增,得到产物1。反应体系及反应条件如表6和表7所示。
[0104]
表6 dna片段的重叠pcr反应体系1
[0105][0106]
表7 dna片段的重叠pcr反应条件1
[0107][0108]
6)pcr扩增
[0109]
将步骤2得到的产物1按照表8的反应体系和表9的反应条件进行重叠pcr反应,得到pcr产物。
[0110]
表8 dna片段的重叠pcr反应体系2
[0111][0112]
表9 dna片段的重叠pcr反应条件2
[0113][0114][0115]
7)pcr产物回收
[0116]
使用zymoclean
tm gel dna recovery kit。pca连接片段的琼脂糖凝胶电泳检测结果如图3所示。
[0117]
8)酶切法纠错
[0118]
先对回收的dna片段进行慢退火(如上表5),再加入t7核酸内切酶i1μl(购自碧云天公司,货号:d7080m),37℃下温育30min内,65℃失活20min,目的是识别错误进行切割,再加入t7核酸外切酶1μl(构自新海基因公司,货号:c5021)25℃反应30min,75℃失活20min,目的是将错误进行切碎,得到产物2,再对产物2进行重叠pcr得到产物3,重叠pcr步骤如步骤下:
[0119]
表10 dna片段的重叠pcr反应体系
[0120][0121]
表11 dna片段的重叠pcr反应条件
[0122][0123]
9)pcr扩增
[0124]
将步骤8得到的产物3按照表9的反应体系和表10的反应条件进行重叠pcr反应,得到pcr产物。
[0125]
10)pcr产物回收
[0126]
pca产物回收,使用zymoclean
tm gel dna recovery kit(购自:zymo research,货号:d4008)。
[0127]
3.生物合成长片段dna-egfp基因的验证
[0128]
将步骤2回收的pcr产物构建连接在pet-28a(+)载体上,具体方法如下:
[0129]
1)以上述步骤2回收的pcr产物为模板,以表3的gene-28a-上引和gene-28a-下引为引物进行pcr,得到基因的pcr产物;以pet-28a(+)为模板,以表3的pet28a-上引和pet28a-下引为引物进行pcr,得到载体的pcr产物;
[0130]
2)将基因的pcr产物和载体的pcr产物进行连接,将连接产物转至大肠杆菌bl21(de3)感受态细胞,过夜培养;将长出的单克隆进行菌落pcr,验证是否构建成功;
[0131]
3)将构建成功的菌送测序,验证是否完全正确。
[0132]
测序结果如图4所示。表明步骤2回收的pcr产物序列正确,核苷酸序列是序列表中序列3。采用本发明的生物合成长片段dna的方法可以合成717bp的长片段dna。
[0133]
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本技术欲包括任何变更、用途或对本发明的改进,包括脱离了本技术中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。