专利名称:工业化的基因合成方法
技术领域:
本发明涉及遗传工程领域,尤其涉及一种适合工业化生产的基因合成方法。
背景技术:
作为分子生物学操作的基础技术之一,分子克隆已经成功运用二十余年,是科学家们进行基因克隆、检测、功能研究和重组表达的必要手段,对生物工程的发展起到了革命性的推动作用。在基因时代高速发展的今天,传统的分子克隆技术已不能满足科研人员所需要的高效准确的基因操作要求,而基因合成技术的出现正填补了这个空缺,成为目标基因获取的重要技术手段。利用基因合成的方式获得目的基因,不但能够获得自然界中不存在或者模板含量极低的基因序列,而且可以通过序列优化提高表达量或者达到基因功能修饰的目的。基因合成技术为人类改造生物开辟了一个全新的方向,任何与基因相联系的领域都需要进行人工基因的合成,并利用质粒或者病毒等载体运送到目的细胞或组织,以达到各种目的。随着蛋白质组学的发展,生物制药等行业的研究的不断深入,全基因合成的需求也在日益增加。在可预计的将来,基因合成将在生命科学以及新能源、新材料、人工生命、核酸疫苗、生物医药等领域中发挥巨大作用。基因合成有两种途径,一是基因合成公司的商业合成,二是本地实验室自己合成基因。实验室自己合成基因一般需要参考学术文章,根据参考文献的方法进行合成,但大多都只是个别基因的合成,并且成本高、成功率低,因此只具备有限的参考价值。而基因合成公司的商业合成则是有专业技术人员操作,并且具有合成周期短,可对基因的酶切位点或基因序列进行修改,可以进行密码子优化,也可根据研究人员自己的意愿设计得到自然界中很难获得甚至不存在的基因等优势,所以决定了基因合成公司的商业合成成为目前基因合成的主要渠道。目前基因合成主要包括三个步骤一是化学法合成寡核苷酸片段,通常合成的寡核苷酸片段在150bp 200bp ;二是用酶法将化学合成的寡核苷酸链进行人工拼接,得到较长的序列;三是以较长的序列为基础,进一步拼接得到更长的DNA序列,直到达到需要的长度。在基因人工合成中,寡核苷酸链的拼接是基因人工合成的主要限速步骤。常用的基因拼接方法主要有以下二种
第一种方法是连接酶法,是先将寡核苷酸激活,带上必要的5 ‘-磷酸基团,然后与相应的互补寡核苷酸片段退火,形成带有粘性末端的双链寡核苷酸片段,再用连接酶(T4 DNAS Ligase, Taq Ligase等)将它们彼此连接成一个完整的基因或基因的一个大片段 (Khorana HG. Science. V203, 614-625. 1979)。由于所有的连接酶都需要5‘-磷酸化的末端和3' _羟基进行连接,所以在反应前,用于连接的中间引物需要进行5'-磷酸化处理,这就使得基因合成的成本大大增加。同时,为了保证合成的效率,单次连接酶反应合成较长序列的长度受到限制,通常不宜超过500bp。第二种方法是PCR法,将两条具有互补3'-末端的长的寡核苷酸片段彼此退火,所产生的单链DNA作为模板在大肠杆菌DNA聚合酶Klenow片段作用下,合成出相应的互补链,所形成的双链DNA片段,可经处理插入适当的载体上。PCR法通常还被用于更长序列的合成,如 Smith 等人(Hamilton 0. Smith, ClydeA. Hutchison III, Cynthia Pfannkoch et al .PNAS. V100, 15440-15445. 2003)用Tag Ligase对引物进行连接后,再对连接产物进行 PCR法合成,得到了全长的5386bp的ΦΧ174 bacteriophage基因组。PCR法不需要对寡核苷酸链进行任何修饰,因此合成成本较连接酶法大大降低,但是由于多条寡核苷酸链并行反应,要合成的序列越长,则发生错误延伸的可能性就越大。等温单向生长的基 因合成方法 (专利号ZL 200610028886. 6)是一种PCR方法的改良,在DNA寡核苷酸链设计时加入了发夹结构和酶切位点,在同一反应体系中加入多种酶包括聚合酶、外切酶和限制性内切酶,使得多个DNA寡核苷酸链在同一条件下等温单向生长,之后在三种酶的作用下互补杂交、再进行下一轮的聚合延伸。该种方法采用多个DNA寡核苷酸链在同一条件下反应简化了操作, 降低了成本,但是却存在诸多缺点,如寡核苷酸链设计复杂,多种酶同时进行多步反应导致拼接效率低,长DNA序列合成的成功率低以及基因合成的产量小,无法直接用于下游操作, 如克隆、连接反应等都要再进行PCR扩增等,因此无法用于较长基因、全基因或基因组的合成,更难在实际生产中推广。
发明内容
鉴于上述现有技术存在的缺陷,本发明的目的是提出一种具有高成功率、高通量、 高速度和低成本的工业化基因合成的方法。本发明的目的将通过以下技术方案得以实现 一种工业化的基因合成方法,其特征在于包括以下步骤
步骤一将待合成的DNA序列进行分析和优化,得到与设计相一致的目标DNA序列; 步骤二 根据步骤一中所述目标DNA序列,设计用于延伸的寡核苷酸链; 步骤三合成并纯化步骤二中设计的所述寡核苷酸链; 步骤四将步骤三中得到的所述寡核苷酸链进行拼接,形成DNA片段; 步骤五将步骤四中得到的所述DNA片段克隆至载体得到所述目标DNA序列与载体的重组体质粒;
步骤六对所述重组体质粒进行测序分析; 步骤七对测序正确的所述重组体质粒进行质量验证。进一步的,上述的工业化的基因合成方法,其中所述步骤二中设计用于延伸的寡核苷酸链的步骤为
一、将所述目标DNA序列记为正链,正链的互补链记为负链,分段成首尾相连的DNA片
段;
二、将每段DNA片段又分成多个寡核苷酸链,每个寡核苷酸链与其左右相邻的寡核苷酸链具有首尾重叠互补序列,从所述DNA片段的5'-端开始将寡核苷酸链按顺序编号,其中奇数的寡核苷酸链为正链,偶数的寡核苷酸链为负链,所述DNA片段中的寡核苷酸链的数量都为偶数;
三、所述目标DNA序列的5‘-端第一个DNA片段的最后一个编号的寡核苷酸链的 5'-端和与其相邻的第二个DNA片段的第一个编号的寡核苷酸链的5'-端具有重叠互补序列,依次类推,每两个相邻DNA片段之间都有重叠互补序列;
四、在位于目标DNA序列最5'-端的寡核苷酸链的5'-端添加一段与载体上目标 DNA序列插入位点的上游序列重叠的序列;
五、在位于目标DNA序列最3'-端的寡核苷酸链的5'-端添加一段与载体上目标 DNA序列插入位点的下游序列重叠互补的序列。
进一步的,上述的工业化的基因合成方法,其中每段DNA片段的长度在20个 20000个碱基对之间;每个寡核苷酸链的长度在20个 500个碱基之间;每个寡核苷酸链与其相邻的寡核苷酸链之间的重叠互补序列的长度在10个 50个碱基之间。进一步的,上述的工业化的基因合成方法,其中添加的所述重叠序列和所述重叠互补序列分别为长度在ο 100个碱基之间的DNA序列。进一步的,上述的工业化的基因合成方法,其中所述寡核苷酸链的退火温度在 30°C 70°C之间。进一步的,上述的工业化的基因合成方法,其中所述步骤三中合成寡核苷酸链的方法为磷酸二酯法、磷酸三酯法、亚磷酸三酯法、固相合成法、自动化法和基因芯片法中的任意一种。进一步的,上述的工业化的基因合成方法,其中所述固相亚磷酰胺三酯法是将所要合成的寡核苷酸链的3'-末端先以3' -OH与一个固相载体连接,然后依次从3' -5' 的方向将保护了活性官能团的核苷酸单体加上去,最后形成以3' ,5'-磷酸二酯键连接起来的寡核苷酸片段。进一步的,上述的工业化的基因合成方法,其中所述步骤三中纯化寡核苷酸链的方法为C18柱、OPC柱、PAGE和HPLC中的任意一种。进一步的,上述的工业化的基因合成方法,其中所述寡核苷酸链的拼接方法为连接酶法和PCR法中的任意一种。进一步的,上述的工业化的基因合成方法,其中所述连接酶法包括以下步骤
(1)设计用于延伸的寡核苷酸链,使每条寡核苷酸链与左右相邻的寡核苷酸链重叠互补,从DNA片段的5' _端开始对寡核苷酸链进行编号,其中奇数的寡核苷酸链为正链,偶数的寡核苷酸链为负链,每条DNA片段的寡核苷酸链的数量都为偶数;
(2)将合成的每一条寡核苷酸链的5'-端进行磷酸化,使寡核苷酸链带上5'-磷酸基团;
(3)合成好的寡核苷酸链按照编号顺序,所述按照编号顺序是指混合在同一体系的寡核苷酸链中编号顺序的第一个即最小编号的是奇数即为正链寡核苷酸链,编号顺序中的最后一个即最大编号的是偶数为负链寡核苷酸,将所述正链寡核苷酸与负链寡核苷酸混合在反应体系中,加入耐高温的连接酶进行拼接反应,反应条件如下
94 "C 96 °C变性2min 5min,缓慢退火30min到30 V 60°C,40 V 60 V孵育 30min 60min ;
(4)取步骤(3)中的回收产物作为模板,加入DNA片段中首尾两端的寡核苷酸链作为引物,加入DNA聚合酶进行PCR扩增,最终得到大量的DNA片段;所述PCR扩增的反应条件如下
94°C 96°C预变性2min 5min,进行1个循环;之后,95°C变性15s 30s,在寡核苷酸链的退火温度Tm下退火15s 30s,72°C延伸,延伸时间为lmin/3kb lmin/4kb,共进行 18个 25个循环;最后,72°C延伸Imin 7min。所述Tm—般满足以下公式Tm=2X (A+T) + 4X (G+C);所述延伸时间是指根据目标DNA序列的大小来决定的,一般为lmin/3kb lmin/4kb。进一步的,上述的工业化的基因合成方法,其中所述耐高温的连接酶为Taq DNA 连接酶或者T4 DNA连接酶。进一步的,上述的工业化的基因合成方法,其中所述PCR法包括以下步骤
(1)将合成好的所述具有重叠互补序列的寡核苷酸链按照编号顺序,所述按照编号顺序是指混合在同一体系的寡核苷酸链中编号顺序的第一个即最小编号的是奇数为正链寡核苷酸,编号顺序中的最后一个即最大编号的是偶数为负链寡核苷酸,所述正链寡核苷酸与负链寡核苷酸混合在反应体系中,加入DNA聚合酶进行扩增;
(2)PCR方法扩增的反应条件如下
94°C 96°C预变性0 lOmin,进行1个循环;之后,95 °C变性Is 60s,在所述寡核苷酸链的退火温度Tm下退火5s 90s,70°C 75 °C延伸,延伸时间为lmin/3kb lmin/4kb,共进行10个 40个循环,其中每个循环的退火温度比前一循环降低0°C 2V; 最后,72°C延伸Imin IOmin ;即可得到所述目标DNA序列。所述Tm—般满足以下公式 Tm=2X (A+T) + 4X (G+C);所述延伸时间是指根据目标DNA序列的大小来决定的,一般为 lmin/3kb lmin/4kb。进一步的,上述的工业化的基因合成方法,其中还包括以下步骤(3):以所述步骤 (2)得到的第一次PCR扩增的产物回收作为模板,加入作为引物的DNA片段中首尾两端的寡核苷酸链,并加入DNA聚合酶进行第二次PCR扩增,最终得到DNA片段;所述第二次PCR扩增的反应条件如下
94°C 96°C预变性0 lOmin,进行1个循环;之后,95°C变性Is 60s,在寡核苷酸链的退火温度Tm下退火5s 90s,70°C 75°C延伸,延伸时间为lmin/3kb lmin/4kb,共进行10个 40个循环,其中每个循环的退火温度比前一循环降低0°C 2°C;最后,72°C延伸Imin lOmin。所述Tm—般满足以下公式Tm=2X (A+T) + 4X (G+C);所述延伸时间是指根据目标DNA序列的大小来决定的,一般为lmin/3kb lmin/4kb。进一步的,上述的工业化的基因合成方法,其中所述DNA聚合酶为高保真的耐高温DNA聚合酶。进一步的,上述的工业化的基因合成方法,其中所述DNA片段克隆至载体得到重组体质粒的方法为连接法、PCR法和同源重组法中的任意一种。进一步的,上述的工业化的基因合成方法,其中所述同源重组法为单一片段与载体的重组拼接法和多片段与载体的重组拼接法中的任意一种。本发明的突出效果为本发明具有高成功率、高通量、高速度、低成本的特点,其设计简单、适用面广、操作标准化、可以进行工业化规模推广,有利于降低成本、缩短合成周期和提高合成质量。此外,本发明不但适用于基因的合成,还可用于基因组的合成,对于新能源、新材料、人工生命、核酸疫苗、生物医药等领域的快速发展将起到重要的推动作用。 以下便结合实施例附图,对本发明的具体实施方式
作进一步的详述,以使本发明技术方案更易于理解、掌握。附图说 明
图1是本发明的基因合成过程流程示意图2是本发明的基因合成的寡核苷酸链设计示意图3是本发明的多片段拼插与载体聚合酶环延伸过程示意图4A是本发明实施例1的寡核苷酸链PCR拼接电泳图4B是本发明实施例1的重组质粒FucT2-pUC57酶切电泳图5A是本发明实施例2的PllO-alpha-A的两组寡核苷酸链的PCR拼接电泳图5B是本发明实施例2的PllO-alpha-A的两组寡核苷酸链拼接成全长的电泳图5C是本发明实施例2的PllO-alpha-B的三组拼接成全长的电泳图5D是本发明实施例2的PllO-alpha全长凝胶电泳图5E是本发明实施例2的重组质粒BamHI和NotI双酶切验证图6A是本发明实施例3的NaV15_6AhHl-A的四组寡核苷酸链的PCR拼接电泳图6B是本发明实施例3的NaV15_6AhHl-A全长的电泳图6C是本发明实施例3的重组质粒human NaV15_6AhHl- pcDNA3. 1 (+)的鉴定图7是本发明实施例1的FucT2-pUC57的测序结果;
图8是本发明实施例2的PllO-alpha-pLVX-Tight-puro的测序结果;
图9是本发明实施例3的humanNaV15_6AhHl-pcDNA3. 1 (+)的测序结果;
图IOA是本发明实施例4的A34RoptIHD-J全长的电泳图IOB是本发明实施例4的重组质粒A34RoptIHD-J-pUC57的鉴定图11是本发明实施例4的A34RoptIHD-J-pUC57的测序结果。
具体实施例方式本发明利用生物信息学分析,通过基因优化算法和寡核苷酸序列设计算法,得到一系列用于延伸的寡核苷酸链,这些寡核苷酸链经过拼接形成DNA片段。所述DNA片段进一步通过多种方法,包括多片段拼接与载体聚合酶环延伸的方法克隆到目的载体上,最终形成环形的目标DNA序列与载体的重组体质粒。具体包括以下步骤
1.根据生物信息学分析,对待合成的DNA序列进行分析和优化,得到与设计相一致的目标DNA序列;
2.根据目标DNA序列,设计用于延伸的寡核苷酸链;
3.合成并纯化所述寡核苷酸链;
4.将步骤3中合成的所述寡核苷酸链进行拼接,形成DNA片段;
5.将所述DNA片段克隆至载体得到目标DNA序列与载体的重组体质粒;
6.对所述重组体质粒进行测序分析;
7.对测序正确的所述重组体质粒进行质量验证。所述生物信息学分析的方法是使用gene work等基因设计软件,收集大量并且高频率更新的生物信息学数据,其中囊括了从基因转录、翻译到翻译后修饰等几乎所有已知的可能影响蛋白表达水平的序列因素,对待合成的DNA序列进行全方位的分析和优化,包括调整序列中构成二级结构、重复序列及高GC含量的碱基;优化密码子,使待合成的基因与宿主密码子偏好频率相匹配以及优化蛋白翻译的起始位点等。上述方法改善了以往基因合成中由于GC含量高、二级结构复杂等难以测序或合成的基因转化到宿主细胞中不能表达或表达量低等问题,最终大大提高了蛋白的表达水平。所述用于延伸的寡核苷酸链的设计方法如下 一、将目标DNA序列称为正链,正链的互补链称为负链,分段成首尾相连的DNA片段;
二、将每段DNA片段又分成多个寡核苷酸链,这些寡核苷酸链与其左右相邻的寡核苷酸链具有首尾重叠互补序列,从DNA片段的5' _端开始将寡核苷酸链按顺序编号,其中奇数的寡核苷酸链为正链,偶数的寡核苷酸链为负链,每个DNA片段中的寡核苷酸链的数量都为偶数;
三、目标DNA序列的5'-端第一个DNA片段的最后一个编号的寡核苷酸链的5'-端和与其相邻的第二个DNA片段的第一个编号的寡核苷酸链的5'-端具有重叠互补序列,依次类推,每两个相邻DNA片段之间都有重叠互补序列;
四、根据要求在位于目标DNA序列最5'-端的寡核苷酸链的5'-端添加一段序列, 这段序列与载体上目标DNA序列插入位点的上游序列重叠;
五、在位于目标DNA序列最3'-端的寡核苷酸链的5'-端也添加一段序列,这段序列与载体上目标DNA序列插入位点的下游序列重叠互补。所述分段得到的DNA片段其长度在20个 20000个碱基对之间。所述具有重叠互补序列的寡核苷酸链其长度在20个 500个碱基之间。所述每个寡核苷酸链与其相邻的寡核苷酸链之间的重叠互补序列的长度在10 个 50个碱基之间。所述位于目标DNA序列最5 ‘-端的寡核苷酸链的5 ‘-端是指目标DNA序列 5'-端第一个DNA片段的第一个编号的寡核苷酸链的5'-端,也就是目标DNA序列的 5'-端。所述位于目标DNA序列最3 ‘-端的寡核苷酸链的5 ‘-端是指目标DNA序列 5'-端最后一个DNA片段的最后一个编号的寡核苷酸链的5'-端,也就是目标DNA序列的3'-端。所述添加的与载体具有同源性的序列是长度在0 100碱基之间的DNA序列。所述具有重叠互补序列的寡核苷酸链的退火温度(Tm)在30°C 70°C之间。上述寡核苷酸链的设计方法是保证高成功率、高通量、高速度、低成本基因合成方法的核心内容之一,使用通用的gene work等DNA序列设计软件,使所设计的序列在一定的长度范围内具有相对统一的Tm值、简单的二级结构并可有效避免错配或错误杂交。这样设计出的寡核苷酸链在PCR扩增时使用相同的退火温度,简化了实验操作步骤,大大提高了基因合成速度。另外所有的寡核苷酸链都与相邻寡核苷酸链之间有相应的重叠互补序列, 在PCR扩增的过程中通过同源区域互补配对,可以由寡核苷酸链形成长的DNA片段模板,减小了扩增长片段DNA的错配几率,提高了合成基因的成功率。所述寡核苷酸链设计好后,可利用普通的寡核苷酸自动合成仪合成。现已有的寡核苷酸链的化学合成方法包括磷酸二酯法,磷酸三酯法,亚磷酸三酯法,固相合成法,自动化法和最新的基因芯片法等,所述的基因芯片法是基因合成的最新方法,目前采用的是基因芯片的原位合成法,是指将多个寡核苷酸片段用单核苷酸底物直接合到载体的特定位置上制备的芯片,包括光化学基因芯片合成法、物理方法、机械方法、微流体法等。但是该方法目前多还处在研发和试验阶段,合成出的基因片段也相对较短。目前一般都采用固相亚磷酰胺三酯法合成DNA片段。所述固相亚磷酰胺三酯法是指将所要合成的寡核苷酸链的3'-末端先以3' -OH 与一个固相载体,如多孔玻璃珠(CPG)等连接,然后依次从3' -5'的方向将核苷酸单体加上去,所使用的核苷 酸单体的活性官能团都是经过保护的,最后形成以3' ,5'-磷酸二酯键连接起来的寡核苷酸片段。所述纯化是指根据所合成寡核苷酸的组成和应用来选定纯化的方法,常用的纯化方法有C18柱、OPC柱、PAGE和HPLC。(I)ClS柱纯化,亦称为简易反相柱纯化,这是一种活性炭柱子,它对DNA有特异性的吸附,可以被有机溶液洗脱,但不会被水洗脱,所以能有效地去除盐分。它不能有效去除比目的片段短的小片段。(2) OPC柱纯化,OPC纯化是根据DNA保护基(DMT基)和Cartridge柱中树脂间的亲合力作用的原理进行纯化目标DNA片段。OPC法纯化的DNA纯度大于95%。适用于40mer 以下引物的纯化。(3)HPLC纯化,是使用高效液相色谱的原理,对DNA片段进行纯化。是依据不同大小的片段带有的净电荷多少来分离产物的,纯度可以大于99%。主要用于短链和修饰引物的纯化。该法的弱点是成本较高,批量生产效率不高。(4) PAGE纯化,是使用变性聚丙烯酰胺凝胶电泳,对DNA片段进行分离,然后从凝胶中回收目标DNA的方法。纯化后的DNA纯度大于95%,对长链Oligo DNA (大于50mer) 的纯化特别有效。所述寡核苷酸链的拼接包括连接酶法和PCR法。所述连接酶法是先将寡核苷酸激活,带上必要的5' _磷酸基团,然后与相应的互补寡核苷酸片段退火,形成带有粘性末端的双链寡核苷酸片段,再用连接酶将它们彼此连接成一个完整的基因或基因的一个大片段。具体包括以下步骤
1.设计用于延伸的寡核苷酸链,使每条寡核苷酸链与左右相邻的寡核苷酸链重叠互补,从DNA片段的5' _端开始对寡核苷酸链进行编号,其中奇数的寡核苷酸链为正链,偶数的寡核苷酸链为负链,每条DNA片段的寡核苷酸链的数量都为偶数。2.在合成寡核苷酸链时,对每一条寡核苷酸链的5'-端进行磷酸化,使之带上 5'-磷酸基团。3.合成好的具有重叠互补序列的寡核苷酸链按照编号顺序,所述按照编号顺序是指混合在同一体系的寡核苷酸链中编号顺序的第一个即最小编号的是奇数为正链寡核苷酸链,编号顺序中的最后一个即最大编号的是偶数为负链寡核苷酸,将正链寡核苷酸与负链寡核苷酸混合在反应体系中,加入耐高温的连接酶进行拼接反应。反应条件如下
94 "C 96 °C变性2min 5min,缓慢退火30min到30 V 60°C,40 V 60 V孵育 30min 60mino4.取步骤3中的回收产物作为模板,加入DNA片段中首尾两端的寡核苷酸链作为引物,加入DNA聚合酶进行PCR扩增,最终得到大量的DNA片段。PCR扩增条件如下94°C 96°C预变性2min 5min,进行1个循环;之后,95°C变性15s 30s,Tm度退火15s 30s,72°C延伸X min,共进行18个 25个循环;最后,72°C延伸Imin 7min。所述耐高温的连接酶是指耐高温的Taq DNA连接酶,T4 DNA连接酶等;
所述Tm度是指根据寡核苷酸链Tm值的大小确定退火温度,Tm=2X (A+T) + 4X (G+C); 所述X是指根据DNA序列的大小来决定延伸时间,X =lmin/3kb lmin/4kb ; 所述DNA聚合酶是指形成高保真耐高温的DNA聚合酶;
所述反应体系是指可以有效发挥高保真耐高温的DNA聚合酶活性的体系,通过调节添加的阳离子的种类和浓度、添加剂的种类和浓度以及体系的PH等得到的。所述PCR法是指将具有互补3' _末端的长的寡核苷酸片段彼此退火,所产生的单链DNA作为模板在DNA聚合酶作用下,合成出相应的互补链的过程,具体包括以下步骤
1.将合成好的具有重叠互补序列的寡核苷酸链按照编号顺序,正链寡核苷酸与负链寡核苷酸混合在反应体系中,加入DNA聚合酶进行扩增;
2.采用降落PCR(Touch Down PCR)方法扩增,反应条件如下
94°C 96°C预变性0 lOmin,进行1个循环;之后,95°C变性Is 60s,在寡核苷酸链的退火温度Tm下退火5s 90s,70°C 75°C延伸X min,共进行10个 40个循环,其中每个循环的退火温度比前一循环降低0°C 2V ;最后,72°C延伸Imin IOmin ;
3.以步骤2得到的PCR产物回收作为模板,加入DNA片段中首尾两端的寡核苷酸链作为引物,加入DNA聚合酶进行第二次PCR扩增,最终得到DNA片段。如基因序列较短,如 IOOObp左右,经第一次PCR就可直接得到目的基因不需要进行第二次PCR。所述按照编号顺序是指混合在同一体系的寡核苷酸链中编号顺序的第一个即最小编号的是奇数为正链寡核苷酸链,编号顺序中的最后一个即最大编号的是偶数为负链寡核苷酸。所述DNA聚合酶是指形成高保真耐高温的DNA聚合酶。所述反应体系是指可以有效发挥高保真耐高温的DNA聚合酶活性的体系,通过调节添加的阳离子的种类和浓度、添加剂的种类和浓度以及体系的PH等得到的。所述第二次PCR扩增,反应条件如下
94°C 96°C预变性0 lOmin,进行1个循环;之后,95°C变性Is 60s,在寡核苷酸链的退火温度Tm下退火5s 90s,70°C 75°C延伸X min,共进行10个 40个循环,其中每个循环的退火温度比前一循环降低0°C 2°C ;最后,72°C延伸Imin IOmin。所述Tm度是指根据寡核苷酸链Tm值的大小确定退火温度,Tm=2X (A+T) + 4 X (G+C);
所述X是指根据DNA序列的大小来决定延伸时间,X=lmin/3kb lmin/4kb ; 所述DNA片段克隆至载体得到重组体质粒的方法通常包括连接法、PCR法和同源重组法。所述连接法包括以下三种方法
第一种方法是粘性末端的连接用同一种限制性内切酶或者用能够产生相同粘性末端的两种限制性内切酶分别消化DNA片段和载体,形成彼此互补的粘性末端,用DNA连接酶将具有互补粘性末端的DNA片段和载体连接起来形成重组体。第二种方法是用连接酶直接将平末端的DNA片段与经平末端化处理的载体连接起来,或是在带平头末端的DNA片段的3'-末端加上多聚核苷酸的尾巴,在载体上加上互补的尾巴,再用DNA连接酶将它们连接起来。第三种方法是先在DNA片段末端加上化学合成的衔接物或接头,使之形成粘性末端之后,再用DNA连接酶将它们连接起来。所述PCR法是指使用具有重叠序列的引物的方法,使合成的DNA片段两端与目的载体的插入位点上、下游重叠互补,之后将DNA片段与载体混合,进行PCR反应,经过变性、 退火和延伸的循环后DNA片段与载体形成环形的重组体。所述同源重组法有单一片段与载体的重组拼接和多片段与载体的重组拼接。所述多片段与载体的拼接是指多片段拼插与载体聚合酶环延伸法,包括以下步骤
(1)将目的载体进行特殊处理,使其待插入位点线性化;
(2)将待拼接的DNA片段与线性化的载体混合,加入重组酶,经过变性与退火后所有同源区域互补拼接,进行环状延伸;
(3)变性、退火和延伸可以进行多次循环往复,最终得到大量的目标DNA序列与载体的重组质粒。所述载体的待插入位点线性化处理是指使用限制性内切酶酶切或PCR的方法得到线性化的目的载体;
所述特殊的重组酶是指没有5' -3'外切酶功能的高保真的DNA聚合酶; 所述变性、退火和延伸可以进行多次循环与PCR不同,由于没有引入大量的引物,不存在反复扩增过程,不引入突变。上述方法为聚合酶环延伸拼接法,所述方法将多片段拼接和插入载体质粒过程在同一个反应中完成,大大提高了合成速率,并使克隆成功率成倍增加。所述测序分析是指使用通用的测序仪对合成的目标DNA序列与载体的重组体进行测序验证。如果测序过程中发现有序列的突变或错配等问题,可返回PCR拼接步骤对突变所在的区域针对性的进行修复,而不需要全序列从头合成,但本发明成功率非常高只有偶尔极少数的合成需要进行突变修复。所述质量验证是指对测序正确的重组质粒进行实验数据检验、测序结果检验、质粒纯化、酶切验证等,以确保所合成的基因正确,重组体构建正确。下面通过具体实施例对本发明的方法进行说明,但本发明并不局限于此。如图1 是本发明的基因合成过程流程示意图;图2是本发明的基因合成的寡核苷酸链设计示意图,图2中A C代表DNA片段,广10代表针对DNA片段A设计的具有重叠互补序列的寡核苷酸链,其中1号的5'-端添加了一段与载体上目标DNA序列插入位点的上游序列同源的重叠序列,10号的5'-端添加了一段与相邻的DNA片段B重叠互补的序列;图3是本发明的多片段拼插与载体聚合酶环延伸过程示意图。下述实施例中所述实验方法,如无特殊说明,均为常规方法;所述试剂和材料,如无特殊说明,均可从商业途径获得。实施例1
本实施例的目标合成产物为长度为拟6碱基的FucT2 (幽门螺杆菌墨角藻糖基转移酶B)基因序列,并连接到载体pUC57上。Fuct2基因含有高突变序列(poly (C) and TAA r印eats),通过聚合酶延误机制能够经常移入或转出编码框,表达人癌胚抗原LewisY蛋白。合成FucT2基因可用于抗癌方面的分析和研究。
本实施例的基因合成过程如下
1.目标DNA序列经过生物信息学gene work等基因设计软件进行序列分析和优化后的 DNA序列如下
5' -ACAGGTTGACGCTATGGCTTTTAAAGTGGTGCAAATTTGTGGGGGGCTTGGGAATCAAATGTTTCAATA CGCTTTCGCTAAAAGTTTGCAAAAACACCTTAATACGCCCGTGCTATTAGACACTACTTCTTTTGATTGGAGCAATA GGAAAATGCAATTAGAGCTTTTCCCTATTGATTTGCCCTATGCGAATGCAAAAGAAATCGCTATAGCTAAAATGCAA CATCTCCCCAAGTTAGTAAGAGATGCACTCAAATACATAGGATTTGATAGGGTGAGTCAAGAAATCGTTTTTGAATA CGAGCCTAAATTGTTAAAGCCAAGCCGTTTGACTTATTTTTTTGGCTATTTCCAAGATCCACGATATTTTGATGCTA TATCCTCTTTAATCAAGCAAACCTTCACTCTACCCCCCCCCCCCGAAAATAATAAAAATAATAATAAAAAAGAGGAA GAATACCAGCGCAAGCTTTCTTTGATTTTAGCCGCTAAAAACAGCGTATTTGTGCATATAAGAAGAGGGGATTATGT GGGGATTGGCTGTCAGCTTGGTATTGATTATCAAAAAAAGGCGCTTGAGTATATGGCAAAGCGCGTGCCAAACATGG AGCTTTTTGTGTTTTGCGAAGACTTAAAATTCACGCAAAATCTTGATCTTGGCTACCCTTTCACGGACATGACCACT AGGGATAAAGAAGAAGAGGCGTATTGGGATATGCTGCTCATGCAATCTTGCAAGCATGGCATTATCGCTAATAGCAC TTATAGCTGGTGGGCGGCTTATTTGATGGAAAATCCAGAAAAAATCATTATTGGCCCCAAACACTGGCTTTTTGGGC ATGAAAATATTCTTTGTAAGGAATGGGTGAAAATAGAATCCCATTTTGAGGTAAAATCCCAAAAATATAACGCTTAA GCGGCCGCGA-3‘
其中四种碱基的量分别是A :296, T 265, C :171和G 194,GC含量:GC% = 39. 42%。2.寡核苷酸链的设计与合成
根据目标DNA序列设计并合成用于延伸的寡核苷酸链,在目标DNA序列的两端添加保护碱基GGAAC/GTTCC,以防止在合成时首个碱基的缺失。由于只要求连接到克隆载体pUC57 上,因此可以直接采用平末端拼接法。目标DNA序列较短,只有拟6碱基,不需要进行片段的划分可直接分成具有重叠互补序列的寡核苷酸链,共有32条,其中每个寡核苷酸链的长度在40bp飞Obp之间(寡核苷酸链又称为引物),如下
编号序列(5' -3')1GGAACACAGGTTGACGCTATGGCTTTTAAAGTGGTGCAMTTTGTGG2AAGCGTATTGAAACATTTGATTCCCAAGCCCCCCACAAATTTGCACCACT3AATCMATGTTTCMTACGCTTTCGCTAAAAGTTTGCAMAACACCTTAA4AAGAAGTAGTGTCTAATAGCACGGGCGTATTAAGGTGTTTTTGCAAACTT5GTGCTATTAGACACTACTTCTTTTGATTGGAGCAATAGGAAAATGCMTT6CATAGGGCAAATCMTAGGGAMAGCTCTAATTGCATTTTCCTATTGCTC7CCCTATTGATTTGCCCTATGCGAATGCAAAAGAAATCGCTATAGCTMAA8CTCTTACTAACTTGGGGAGATGTTGCATTTTAGCTATAGCGATTTCTTTT9ATCTCCCCAAGTTAGTAAGAGATGCACTCMATACATAGGATTTGATAGG10TATTCAAAAACGATTTCTTGACTCACCCTATCAAATCCTATGTATTTGAG11AGTCMGAAATCGTTTTTGAATACGAGCCTAAATTGTTMAGCCAAGCCG12ATCTTGGAAATAGCCAAAAAAATAAGTCAMCGGCTTGGCTTTAACMTT13ATTTTTTTGGCTATTTCCAAGATCCACGATATTTTGATGCTATATCCTCT14GGTAGAGTGAAGGTTTGCTTGATTAAAGAGGATATAGCATCAAAATATCG15AGCAMCCTTCACTCTACCCCCCCCCCCCGAAAATAATMAAAT16GCGCTGGTATTCTTCCTCTTTTTTATTATTATTTTTATTATTTTCG17GAGGMGAATACCAGCGCAAGCTTTCTTTGATTTTAGCCGCTAAAAACAG18AATCCCCTCTTCTTATATGCACAAATACGCTGTTTTTAGCGGCTAAMTC19TGCATATAAGAAGAGGGGATTATGTGGGGATTGGCTGTCAGCTTGGTATT20GCCATATACTCAAGCGCCTTTTTTTGATAATCAATACCMGCTGACAGCC21GGCGCTTGAGTATATGGCAAAGCGCGTGCCAAACATGGAGCTTTTTGTGT
权利要求
1.一种工业化的基因合成方法,其特征在于包括以下步骤步骤一将待合成的DNA序列进行分析和优化,得到与设计相一致的目标DNA序列;步骤二 根据步骤一中所述目标DNA序列,设计用于延伸的寡核苷酸链;步骤三合成并纯化步骤二中设计的所述寡核苷酸链;步骤四将步骤三中得到的所述寡核苷酸链进行拼接,形成DNA片段;步骤五将步骤四中得到的所述DNA片段克隆至载体得到所述目标DNA序列与载体的重组体质粒;步骤六对所述重组体质粒进行测序分析;步骤七对测序正确的所述重组体质粒进行质量验证。
2.根据权利要求1所述的工业化的基因合成方法,其特征在于所述步骤二中设计用于延伸的寡核苷酸链的步骤为一、将所述目标DNA序列记为正链,正链的互补链记为负链,分段成首尾相连的DNA片段;二、将每段DNA片段又分成多个寡核苷酸链,每个寡核苷酸链与其左右相邻的寡核苷酸链具有首尾重叠互补序列,从所述DNA片段的5'-端开始将寡核苷酸链按顺序编号,其中奇数的寡核苷酸链为正链,偶数的寡核苷酸链为负链,所述DNA片段中的寡核苷酸链的数量都为偶数;三、所述目标DNA序列的5‘-端第一个DNA片段的最后一个编号的寡核苷酸链的 5'-端和与其相邻的第二个DNA片段的第一个编号的寡核苷酸链的5'-端具有重叠互补序列,依次类推,每两个相邻DNA片段之间都有重叠互补序列;四、在位于目标DNA序列最5'-端的寡核苷酸链的5'-端添加一段与载体上目标 DNA序列插入位点的上游序列重叠的序列;五、在位于目标DNA序列最3'-端的寡核苷酸链的5'-端添加一段与载体上目标 DNA序列插入位点的下游序列重叠互补的序列。
3.根据权利要求2所述的工业化的基因合成方法,其特征在于每段DNA片段的长度在20个 20000个碱基对之间;每个寡核苷酸链的长度在20个 500个碱基之间;每个寡核苷酸链与其相邻的寡核苷酸链之间的重叠互补序列的长度在10个 50个碱基之间。
4.根据权利要求2所述的工业化的基因合成方法,其特征在于添加的所述重叠序列和所述重叠互补序列分别为长度在0 100个碱基之间的DNA序列。
5.根据权利要求2所述的工业化的基因合成方法,其特征在于所述寡核苷酸链的退火温度在30°C 70°C之间。
6.根据权利要求1所述的工业化的基因合成方法,其特征在于所述步骤三中合成寡核苷酸链的方法为磷酸二酯法、磷酸三酯法、亚磷酸三酯法、固相合成法、自动化法和基因芯片法中的任意一种。
7.根据权利要求6所述的工业化的基因合成方法,其特征在于所述固相亚磷酰胺三酯法是将所要合成的寡核苷酸链的3'-末端先以3' -OH与一个固相载体连接,然后依次从3' -5'的方向将保护了活性官能团的核苷酸单体加上去,最后形成以3' ,5'-磷酸二酯键连接起来的寡核苷酸片段。
8.根据权利要求1所述的工业化的基因合成方法,其特征在于所述步骤三中纯化寡核苷酸链的方法为C18柱、OPC柱、PAGE和HPLC中的任意一种。
9.根据权利要求1所述的工业化的基因合成方法,其特征在于所述寡核苷酸链的拼接方法为连接酶法和PCR法中的任意一种。
10.根据权利要求9所述的工业化的基因合成方法,其特征在于所述连接酶法包括以下步骤(1)设计用于延伸的寡核苷酸链,使每条寡核苷酸链与左右相邻的寡核苷酸链重叠互补,从DNA片段的5' _端开始对寡核苷酸链进行编号,其中奇数的寡核苷酸链为正链,偶数的寡核苷酸链为负链,每条DNA片段的寡核苷酸链的数量都为偶数;(2)将合成的每一条寡核苷酸链的5'-端进行磷酸化,使寡核苷酸链带上5'-磷酸基团;(3)合成好的寡核苷酸链按照编号顺序,所述按照编号顺序是指混合在同一体系的寡核苷酸链中编号顺序的第一个即最小编号的是奇数即为正链寡核苷酸链,编号顺序中的最后一个即最大编号的是偶数为负链寡核苷酸,将所述正链寡核苷酸与负链寡核苷酸混合在反应体系中,加入耐高温的连接酶进行拼接反应,反应条件如下94 "C 96 °C变性2min 5min,缓慢退火30min到30 V 60°C,40 V 60 V孵育 30min 60min ;(4)取步骤(3)中的回收产物作为模板,加入DNA片段中首尾两端的寡核苷酸链作为引物,加入DNA聚合酶进行PCR扩增,最终得到大量的DNA片段;所述PCR扩增的反应条件如下94°C 96°C预变性2min 5min,进行1个循环;之后,95°C变性15s 30s,在寡核苷酸链的退火温度Tm下退火15s 30s,72°C延伸,延伸时间为lmin/3kb lmin/4kb,共进行18个 25个循环;最后,72°C延伸Imin 7min。
11.根据权利要求10所述的工业化的基因合成方法,其特征在于所述耐高温的连接酶为Taq DNA连接酶或者T4 DNA连接酶。
12.根据权利要求9所述的工业化的基因合成方法,其特征在于所述PCR法包括以下步骤(1)将合成好的所述具有重叠互补序列的寡核苷酸链按照编号顺序,所述按照编号顺序是指混合在同一体系的寡核苷酸链中编号顺序的第一个即最小编号的是奇数为正链寡核苷酸,编号顺序中的最后一个即最大编号的是偶数为负链寡核苷酸,所述正链寡核苷酸与负链寡核苷酸混合在反应体系中,加入DNA聚合酶进行扩增;(2)PCR方法扩增的反应条件如下94°C 96°C预变性0 lOmin,进行1个循环;之后,95°C变性Is 60s,在寡核苷酸链的退火温度Tm下退火5s 90s,70°C 75°C延伸,延伸时间为lmin/3kb lmin/4kb,共进行10 40个循环,其中每个循环的退火温度比前一循环降低0°C 2°C;最后,72°C延伸 Imin IOmin ;即可得到目标DNA序列。
13.根据权利要求12所述的工业化的基因合成方法,其特征在于还包括以下步骤 (3)以所述步骤(2)得到的第一次PCR扩增的产物回收作为模板,加入作为引物的DNA片段中首尾两端的寡核苷酸链,并加入DNA聚合酶进行第二次PCR扩增,最终得到DNA片段; 所述第二次PCR扩增的反应条件如下94°C 96°C预变性O lOmin,进行1个循环;之后,95°C变性Is 60s,在寡核苷酸链的退火温度Tm下退火5s 90s,70°C 75°C延伸,延伸时间为lmin/3kb lmin/4kb,共进行10个 40个循环,其中每个循环的退火温度比前一循环降低0°C 2°C;最后,72°C延伸 Imin IOmin0
14.根据权利要求12所述的工业化的基因合成方法,其特征在于所述DNA聚合酶为高保真的耐高温DNA聚合酶。
15.根据权利要求1所述的工业化的基因合成方法,其特征在于所述DNA片段克隆至载体得到重组体质粒的方法为连接法、PCR法和同源重组法中的任意一种。
16.根据权利要求15所述的工业化的基因合成方法,其特征在于所述同源重组法为单一片段与载体的重组拼接法和多片段与载体的重组拼接法中的任意一种。
全文摘要
本发明揭示了一种工业化的基因合成方法,包括以下步骤(1)将待合成的DNA序列进行分析和优化,得到目标DNA序列;(2)根据目标DNA序列,设计用于延伸的寡核苷酸链;(3)合成并纯化寡核苷酸链;(4)拼接寡核苷酸链,形成DNA片段;(5)将DNA片段克隆至载体得到重组体质粒;(6)对重组体质粒进行测序分析;(7)对测序正确的重组体质粒进行质量验证。本发明具有高成功率、高通量、高速度、低成本的特点,并且设计简单、适用面广、操作标准化、可以进行工业化规模推广,有利于降低成本、缩短合成周期和提高合成质量。
文档编号C12N15/10GK102321612SQ201110249829
公开日2012年1月18日 申请日期2011年8月29日 优先权日2011年8月29日
发明者刁文一, 孙中平, 廖国娟, 张万方, 杨平, 柳伟强 申请人:苏州金唯智生物科技有限公司