一种复杂dna的合成方法及其应用
技术领域
1.本发明涉及dna合成技术领域,具体涉及一种复杂dna的合成方法及其应用。
背景技术:2.随着基因工程和合成生物学的发展和广泛应用,dna合成技术已成为农业、食品、医药、材料等领域普遍使用的技术。目前,基因合成的方法主要包括连接酶法和pcr法,现有的pcr法和连接酶法主要适用于常规dna序列的合成,对于存在大量重复序列、gc含量较高或较低、存在复杂二级结构的序列的合成效率和准确性均较差。然而,在进行生物体的基因修饰、全基因合成等操作时,上述复杂dna的合成也经常涉及。因此,开发能够适用于复杂dna合成的方法具有重要意义。
技术实现要素:3.本发明的目的是提供一种复杂dna的合成方法及其应用,该方法能够弥补传统pcr法和连接酶法的不足,用于存在大量重复序列、gc含量较高或较低、存在复杂二级结构等复杂dna的合成。
4.具体地,本发明提供以下技术方案:
5.本发明提供一种复杂dna的合成方法,该方法包括:
6.对待合成dna进行序列分析,确定其含有的分割序列的位置以及ii型限制性内切酶和iis型限制性内切酶完整识别位点信息,所述分割序列为在第一ii型限制性内切酶完整识别序列中缺少其切割后所形成粘性末端一侧的碱基所得到的序列,
7.根据序列分析结果,选择拟使用的第一ii型限制性内切酶、第二ii型限制性内切酶和iis型限制性内切酶,其中,第一ii型限制性内切酶和第二ii型限制性内切酶为不同的ii型限制性内切酶,
8.所述待合成dna的序列中不含有所选择的第一ii型限制性内切酶、、第二ii型限制性内切酶和iis型限制性内切酶的完整识别序列,
9.在选择的第一ii型限制性内切酶对应的分割序列的最后一个碱基之后将待合成dna分割为n个序列片段,依次记为a1、a2、a3至an,n>1且为整数,
10.在序列片段a1的3’末端添加碱基,以使其能够被选择的第一ii型限制性内切酶第二ii型限制性内切酶酶切,在序列片段an的5’末端添加碱基以使其能够被选择的iis型限制性内切酶酶切、且酶切后形成第一ii型限制性内切酶对应的粘性末端、3’末端添加第二ii型限制性内切酶的完整识别序列,在序列片段a2‑
a
n
‑1的5’末端添加碱基以使其能够被选择的iis型限制性内切酶酶切、且酶切后形成第一ii型限制性内切酶对应的粘性末端、3’末端添加碱基以使其能够被选择的第一ii型限制性内切酶和第二ii型限制性内切酶酶切,
11.分别合成添加碱基后的所述序列片段,利用所述序列片段经添加碱基所形成的限制性内切酶完整识别序列对应的限制性内切酶进行酶切后,连接各酶切产物。
12.本发明通过将待合成序列分成更短的序列片段,在序列片段的末端引入原始序列
中不存在的ii型限制性内切酶和iis型限制性内切酶的识别位点,利用ii型限制性内切酶和iis型限制性内切酶的配合作用,将各序列片段连接得到待合成dna。对于含有较多重复序列、gc含量较高或较低、含有复杂二级结构的复杂dna序列,利用上述方法能够显著提高dna合成的效率和准确性。
13.优选地,所述分割序列为缺少所述第一ii型限制性内切酶完整识别序列的5’或3’末端1
‑
2个碱基的序列。进一步优选地,所述分割序列为5
‑
6个碱基的序列。
14.优选地,在序列片段a1的3’末端添加碱基以使其沿5’至3’方向依次形成所述第一ii型限制性内切酶和所述第二ii型限制性内切酶的完整识别序列,所述第一ii型限制性内切酶和所述第二ii型限制性内切酶的完整识别序列之间间隔6个任意碱基,在序列片段an的5’末端沿5’至3’方向依次添加所述iis型限制性内切酶的完整识别位点以及与所述第一ii型限制性内切酶经酶切后形成粘性末端配对的碱基、3’末端添加所述第二ii型限制性内切酶的完整识别序列,在序列片段a2‑
a
n
‑1的5’末端沿5’至3’方向依次添加所述iis型限制性内切酶的完整识别位点以及与所述第一ii型限制性内切酶经酶切后形成粘性末端配对的碱基、3’末端添加碱基以使其沿5’至3’方向依次形成所述第一ii型限制性内切酶和所述第二ii型限制性内切酶的完整识别序列,所述第一ii型限制性内切酶和所述第二ii型限制性内切酶的完整识别序列之间间隔6个任意碱基。
15.在进行序列片段的酶切连接时,首先将序列片段两两分组,具体地:除序列片段a1外,依次将相邻的两个序列片段分为一组,在每组中,利用所选择的第一ii型限制性内切酶和第二ii型限制性内切酶双酶切排序靠前的序列片段,利用所选择的iis型限制性内切酶和第二ii型限制性内切酶双酶切排序靠后的序列片段,将各组经酶切的两个序列片段连接后,再依次对得到的连接片段进行编号,将相邻的两个连接片段分为一组,在每组中,利用所选择的第一ii型限制性内切酶和第二ii型限制性内切酶双酶切排序靠前的片段,利用所选择的iis型限制性内切酶和第二ii型限制性内切酶双酶切排序靠后的片段,将各组经酶切的两个片段连接后,重复上述步骤,直至获得除序列片段a1外的所有序列片段的连接产物。
16.进一步地,将除序列片段a1外的所有序列片段的连接产物利用所选择的iis型限制性内切酶和第二ii型限制性内切酶双酶切后与经所选择的第一ii型限制性内切酶和第二ii型限制性内切酶双酶切的序列片段a1连接,得到待合成dna。
17.本发明中,所述第一ii型限制性内切酶为切割后产生5’端突出的4个碱基粘性末端的ii型限制性内切酶。
18.优选地,所述第一ii型限制性内切酶优选为选自aflii、agei、bamhi、bsshii、bglii、ecori、hindiii、mlui、ncoi、spei、sali、xbai、xhoi、noti、asci中的一种或多种。
19.对于上述各种ii型限制性内切酶,优选的分割序列如下:对于aflii,所述分割序列为cttaa或ttaag,对于agei,所述分割序列为accgg或ccggt,对于bamhi,所述分割序列为ggatc或gatcc,对于bsshii,所述分割序列为gcgcg或cgcgc,对于bglii,所述分割序列为agatc或gatct,对于ecori,所述分割序列为gaatt或aattc,对于hindiii,所述分割序列为aagct或agctt,对于mlui,所述分割序列为acgcg或cgcgt,对于ncoi所述分割序列为ccatg或catgg,对于spei,所述分割序列为actag或ctagt,对于sali,所述分割序列为gtcga或tcgac,对于xbai,所述分割序列为tctag或ctaga,对于xhoi,所述分割序列为ctcga或
tcgag,对于noti,所述分割序列为gcggcc或ggccgc,对于asci,所述分割序列为ggcgcg或cgcgcc。
20.对于第二ii型限制性内切酶,本发明没有特殊要求,仅满足待合成的目标序列中不含有该酶的识别位点即可。
21.本发明中,所述iis型限制性内切酶优选为选自bbsi、bsai、bsmbi中的一种或多种。
22.本发明还提供所述复杂dna的合成方法在生物体的基因修饰、人工基因组合成、蛋白质生产、生物大分子药物制备中的应用。
23.其中,所述生物大分子药物包括但不限于核酸药物(包括疫苗等)、蛋白质药物(包括抗体等)。
24.本发明的有益效果在于:本发明提供的复杂dna的合成方法中,首先利用dna序列中包含的特定碱基作为分割序列,将待合成dna分割为若干个短片段,通过添加辅助碱基形成完整的ii型限制性内切酶和iis型限制性内切酶识别位点,形成的ii型限制性内切酶及iis型限制性内切酶原本并不存在于待合成序列中,通过分别合成各短片段,再利用形成的完整识别位点对短片段进行酶切处理后,获得匹配的粘性末端,实现短片段之间的连接。本发明的dna合成方法为复杂dna序列的合成提供了简便、快速的方法,具有较高的合成效率和准确性。
附图说明
25.图1为本发明实施例2中待合成序列的重复序列分析结果。
26.图2为本发明实施例2中待合成序列的酶切位点分析。
27.图3为本发明实施例2中各序列片段5’和3’末端经添加碱基后形成的限制性内切酶识别位点情况。
28.图4为本发明实施例2中两个序列片段的酶切、连接过程的示意图。
29.图5为本发明实施例2中各序列片段连接过程的示意图。
30.图6为本发明实施例2中将合成的seq id no.1所示dna片段构建至puc57(2.7kb)商业化载体后的酶切电泳验证结果。
31.图7为本发明实施例2中合成的seq id no.1所示dna片段的3个一代测序反应示意图。
具体实施方式
32.以下实施例用于说明本发明,但不用来限制本发明的范围。
33.实施例1
34.本实施例提供一种复杂dna的合成方法,具体步骤如下:
35.(1)对待合成dna进行序列分析,确定其含有的分割序列的位置以及含有的ii型限制性内切酶和iis型限制性内切酶完整识别位点的情况和识别位点的具体位置,其中,分割序列为缺少第一ii型限制性内切酶完整识别序列的5’或3’末端部分碱基的序列(缺少第一ii型限制性内切酶切割后所形成粘性末端一侧的碱基),不同ii型限制性内切酶对应的分割序列如表1所示;
36.表1限制性内切酶及其对应的分割序列
37.ii型限制性内切酶名称分割序列afliicttaa或ttaagageiaccgg或ccggtbamhiggatc或gatccbsshiigcgcg或cgcgcbgliiagatc或gatctecorigaatt或aattchindiiiaagct或agcttmluiacgcg或cgcgtncoiccatg或catggspeiactag或ctagtsaligtcga或tcgacxbaitctag或ctagaxhoictcga或tcgagnotigcggcc或ggccgcasciggcgcg或cgcgcc
38.(2)根据步骤(1)的序列分析结果,选择拟使用的第一ii型限制性内切酶、第二ii型限制性内切酶和iis型限制性内切酶(bbsi、bsai、bsmbi中的一种),可选的第一ii型限制性内切酶为切割后产生5’端突出的4个碱基粘性末端的ii型限制性内切酶,具体如表1所示,第一ii型限制性内切酶、第二ii型限制性内切酶为不同的酶,且待合成dna的序列中不能含有所选择的第一、第二ii型限制性内切酶和iis型限制性内切酶的完整识别序列;
39.在选择的第一ii型限制性内切酶对应的分割序列的最后一个碱基之后将待合成dna分割为n个序列片段,依次标记为a1、a2、a3至an,n>1且为整数;
40.在序列片段a1的3’末端添加碱基以使其沿5’至3’方向依次形成第一ii型限制性内切酶和第二ii型限制性内切酶的完整识别序列,第一ii型限制性内切酶和第二ii型限制性内切酶的完整识别序列之间间隔6个任意碱基,在序列片段an的5’末端沿5’至3’方向依次添加所述iis型限制性内切酶的完整识别位点以及与所述第一ii型限制性内切酶经酶切后形成粘性末端配对的碱基、3’末端添加所述第二ii型限制性内切酶的完整识别序列,在序列片段a2‑
a
n
‑1的5’末端沿5’至3’方向依次添加所述iis型限制性内切酶的完整识别位点以及与第一所述ii型限制性内切酶经酶切后形成粘性末端配对的碱基、3’末端添加碱基以使其沿5’至3’方向依次形成第一ii型限制性内切酶和第二ii型限制性内切酶的完整识别序列,第一ii型限制性内切酶和第二ii型限制性内切酶的完整识别序列之间间隔6个任意碱基;
41.(3)分别合成步骤(2)中添加碱基后的各序列片段。除序列片段a1外,依次将相邻的两个序列片段分为一组,在每组中,利用所选择的第一ii型限制性内切酶和第二ii型限制性内切酶双酶切排序靠前的序列片段,利用所选择的iis型限制性内切酶和第二ii型限制性内切酶双酶切排序靠后的序列片段,将各组经酶切的两个序列片段连接后,再依次对得到的连接片段进行编号,将相邻的两个连接片段分为一组,在每组中,利用所选择的第一
ii型限制性内切酶和第二ii型限制性内切酶双酶切排序靠前的片段,利用所选择的iis型限制性内切酶和第二ii型限制性内切酶双酶切排序靠后的片段,将各组经酶切的两个片段连接后,重复上述步骤,直至获得除序列片段a1外的所有序列片段的连接产物。
42.(4)将除序列片段a1外的所有序列片段的连接产物利用所选择的iis型限制性内切酶和第二ii型限制性内切酶双酶切后与经所选择的第一ii型限制性内切酶和第二ii型限制性内切酶双酶切的序列片段a1连接,得到待合成dna。
43.实施例2
44.本实施例利用实施例1提供的复杂dna的合成方法对复杂dna进行合成。
45.seq id no.1所示序列中含有大量的重复序列(图1),以至于单纯依赖pcr手段来获得整段序列非常困难,而且从1000
‑
5000bp这一4000bp的区域内没有任何可以利用的单一酶切位点(图2),给序列构建带来极大的难度。另外,经序列分析,发现“ggatct”的结构,给同尾酶(bamhi
‑
bglii)的拼接带来了可能性,但是该序列末端的bglii酶切位点的存在给同尾酶拼接带来了限制,若利用该同尾酶结构会将序列切断。
46.因此,利用实施例1提供的合成方法对seq id no.1所示序列进行合成。
47.经序列分析显示,该序列中存在多个ggatc,该序列结构可作为bamhi的分割序列,且该序列中不含有bamhi、hindiii、bbsi的完整识别序列,因此,选择bamhi作为第一ii型限制性内切酶,hindii作为第二ii型限制性内切酶,并辅助iis型限制性内切酶bbsi进行设计;
48.在ggatc的最后一个碱基(c)之后将待合成dna分割为9个序列片段,分别为序列片段1(seq id no.1的1位至1092位),序列片段2(seq id no.1的1093位至1560位),序列片段3(seq id no.1的1561位至2184位),序列片段4(seq id no.1的2185位至2808位),序列片段5(seq id no.1的2809位至3432位),序列片段6(seq id no.1的3433位至4056位),序列片段7(seq id no.1的4057位至4680位),序列片段8(seq id no.1的4681位至5304位),序列片段9(seq id no.1的5305位至5892位)。
49.在序列片段1的3’末端添加碱基cnnnnnnaagctt(其中n为任意碱基)以使得3’末端沿5’至3’方向依次形成所选择的第一ii型限制性内切酶bamhi和第二ii型限制性内切酶hindiii的完整识别序列,在第2
‑
8个序列片段的5’末端沿5’至3’方向依次添加iis型限制性内切酶bbsi的完整识别位点gaagacaa以及与bamhi经酶切后形成粘性末端配对的碱基gatc,3’末端添加碱基cnnnnnnaagctt以使得3’末端沿5’至3’方向依次形成所选择的第一ii型限制性内切酶bamhi和第二ii型限制性内切酶hindiii的完整识别序列,在第9个序列片段的5’末端沿5’至3’方向依次添加iis型限制性内切酶完整识别位点gaagacaa以及与bamhi经酶切后形成粘性末端配对的碱基gatc、3’末端添加第二ii型限制性内切酶hindiii的完整识别序列aagctt。各序列片段5’和3’末端经添加碱基后形成的限制性内切酶识别位点情况如图3所示。
50.分别合成上述添加碱基后的各序列片段,除序列片段1外,依次将相邻的两个序列片段分为一组(序列片段2和3为一组,序列片段4和5为一组,序列片段6和7为一组,序列片段8和9为一组),在每组中,利用第一ii型限制性内切酶bamhi和第二ii型限制性内切酶hindiii双酶切排序靠前的序列片段(序列片段2、4、6和8),利用所选择的iis型限制性内切酶bbsi和第二ii型限制性内切酶hindiii双酶切排序靠后的序列片段(序列片段3、5、7和
9),将各组经酶切的两个序列片段连接后,再依次对得到的连接片段进行编号,将相邻的两个连接片段分为一组,在每组中,利用第一ii型限制性内切酶bamhi和第二ii型限制性内切酶hindiii双酶切排序靠前的片段,利用iis型限制性内切酶bbsi和第二ii型限制性内切酶hindiii双酶切排序靠后的片段,将各组经酶切的两个片段连接后,重复上述步骤,直至获得除序列片段a1外的所有序列片段的连接产物。
51.将除序列片段1外的所有序列片段的连接产物利用iis型限制性内切酶bbsi和第二ii型限制性内切酶hindiii双酶切后与经所选择的第一ii型限制性内切酶bamhi和第二ii型限制性内切酶hindiii双酶切的序列片段1连接,得到seq id no.1所示的dna。
52.上述两个序列片段的酶切、连接过程的示意图如图4所示,各序列片段连接过程的示意图如图5所示。
53.以上合成方法在使用酶切进行拼接时,选用bamhi
‑
bsai的组合,而避免使用bamhi
‑
bglii组合,不会被靠近序列3’端的bglii影响,而导致酶切切断整个序列。
54.经载体酶切和测序验证,证明利用上述方法成功合成了seq id no.1所示的dna片段。将合成的seq id no.1所示dna片段构建至puc57(2.7kb)商业化载体后的酶切电泳验证结果如图6所示。该dna片段的3个一代测序反应示意图如图7所示。
55.对于该dna片段,尝试采用传统的pcr法和连接酶法进行合成,但均未成功。
56.虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。