专利名称:一种改进的线粒体基因组全序列测定方法
技术领域:
本发明涉及一种改进的线粒体基因组全序列测定方法及其在测定线粒体基因组 全序列中的应用。
背景技术:
线粒体是存在于绝大多数真核细胞内的一种基本的、重要的细胞器.它是细胞进 行氧化磷酸化的场所.人们把线粒体本身的遗传物质线粒体基因组(mtDNA)这一遗传信息 系统归于真核细胞的第二遗传信息系统,或核外基因及其表达系统.对大量不同动物线粒 体基因组全序列测定表明,动物线粒体基因由大致为15 20kb的双链环状DNA分子组成。 线粒体基因编码着大约22个tRNAs,大小2个rRNAs和13个疏水性蛋白质多肽,这些多肽 包括了与线粒体内膜相结合的酶复合体的亚单位细胞色素b(Cytb)、2个ATP酶的亚单位、 3个细胞色素c(Cytc)氧化酶的亚单位(CO I,II和III)、7个NADH还原酶复合体的亚单位 (ND21,22,23,24,24L,25 和 26) (Lee and Kocher, Genetics. , 1995,139 873-887 ;Gares, Genetics.,1998,118 :649_663)。线粒体DNA的研究是近20年来分子生物学研究的重要课 题之一,它引起人们的极大兴趣在于1、线粒体基因组不仅是研究DNA结构与DNA复制、转录的良好模型,也是研究真核 细胞核酸与蛋白质合成的一般问题的非常合适的模型系统(廖顺尧等,生物化学与生物物 理进展,2000,27 508-512)。2、线粒体基因组与核基因组在遗传信息表达上的相互关系是一个很重要的问题。 线粒体基因组具有独立复制的能力,但是实现线粒体基因组复制与表达所需的许多酶(如 DNA聚合酶、RNA聚合酶)却是由核基因组编码的(Anderson, et al.,Nature.,1981,290 457-465)。事实上,编码线粒体基因组的核基因数量大大超过了存在于mtDNA本身的基因 数量,而mtDNA的遗传信息容量并不大,它的编码可能性只是核DNA编码容量的几万到几 十万分之一,建立这种独立的线粒体遗传系统的机制本身使线粒体遗传显得极有意义。此 外,线粒体基因向核基因的转座插入和复制,已作为分析转座机理、病毒转染的一个模型。 线粒体基因组和核基因组的同源基因结构对比也被广泛地应用于核基因和核外基因进化 研究中(Delarbre, et al.,Genetics.,1998,150 :331_344)。3、由于动物线粒体DNA (mtDNA)具有结构简单、严格的母系遗传、几乎不发生重 组、进化速度快且不同区域进化速度存在差异等特点,使其在种类鉴别和分类地位的研究 方面及不同等级阶元系统发育的研究方面应用十分广泛。目前,线粒体基因组全序列测定的研究方法主要有三种。1、基于物理分离策略的方法在PCR技术引入线粒体DNA(简称mtDNA)分离以前,对于线粒体基因组全序列 的测定,主要包括(1)高纯度mtDNA的获得;(2)mtDNA片段化成适于克隆测序的短DNA片 段2部分内容。高纯度mtDNA的获得,主要有氯化铯密度梯度离心法(Lansman,et al.,J Mol Evol.,1981,17 214-226)和差速离心法(闫华超等,生物技术通讯,2007,18 :95_97 ;
3Tamura and Aotsuka, Biochem Genet.,1988,26 :815_819)。此夕卜,还有在此基石出上进对亍 局部优化的方法,如DNase法、碱变性法和改良的碱变性法等(闫华超等,生物技术通讯, 2007,18 95-97 ;夏玉玲等,蚕学通讯,2002,22 :24_29) ;mtDNA片段化通常用限制性内切酶 消化或超声波随机打断2种方法将mtDNA片段化为适合克隆测序的短DNA片段。但是,需 要昂贵的设备,实验时间较长,尤其是对实验材料消耗较大。2、基于LA-PCR技术的方法LA-PCR通常扩增5kb以上的DNA片段,对模板、引物和聚合酶都有相对较为严格 的要求(叶维萍等,动物学杂志,2003,38:105-109)。将线粒体基因组扩增为2个或几个 相互重叠的DNA大片段为广大研究人员所采用,成为一种理想的线粒体基因组分离策略。 LA-PCR的扩增产物经分离纯化后,既可以作为常规PCR 二次扩增的模板,利用通用引物进 行扩增成短DNA片段后进行测序(Zhou, et al.,Genome.,2007,50 :855_866),也可以作为 引物步移法测序的模板进行测序,甚至可以进一步进行限制性内切酶切割后,进行克隆测 序(吴孝兵等,科学通报,2003,48 =1954-1958) 但是,LA-PCR技术对标本保存要求较高, 而且不同物种间扩增条件差异显著。3、基于常规PCR技术的方法参考公布的线粒体基因组研究通用引物(Simon,et al.,Ann Entomol Soc Am., 1994,87:651-701),或通过近源物种的线粒体基因组全序列,设计出能覆盖全基因组的引 物,采用常规PCR技术直接由总DNA中对线粒体基因组进行扩增,形成一系列长度短于5kb 的DNA片段,并将其克隆进质粒载体进行测序。多数常规PCR扩增产物长度可直接克隆至 质粒载体进行测序,亦可通过相同的引物进行PCR法直接测序。但是这种方法容易受到线 粒体假基因的干扰
发明内容
本发明是在常规PCR技术的基础上提供一种改进的线粒体基因组全序列测定及 引物设计方法。本发明内容包括模板的筛选、引物设计、PCR扩增、序列测定结果的拼接4个部分1、模板的筛选登录NCBI (http://www. ncbi. nlm. nih. rov/),搜索和待测物种属 于同一个科甚至同一个目的物种线粒体基因组全序列,同源性在75%以上即可,如果有多 个序列可供利用,通过blast软件比较,优先选择和待测物种亲缘关系最近的物种的序列为宜。2、引物的设计思路以通过筛选得到的序列为模板,用PCR引物设计软件Primer Premier5. 0设计用于PCR扩增的引物,见附图I。具体思路如下1)考虑到目前DNA序列测定技术水平,一个反应能够测定800-1000bp左右,但测 序结果的前40-60bp测不到或不可信,必须排除在外,相邻2段扩增片段之间要有一段重 叠,以便于拼接以及研究成本方面的考虑,每对引物之间的PCR产物长度以1300-1500bp为
且;2)由于PCR引物设计模板是待测物种的近缘种,以模板线粒体序列的长度 /1300-1500bp,得到大致所需要设计的引物的对数。3)引物设计分2批进行,第一批引物对数为总引物对数的一半,相邻两对引物扩增片段之间的间隔距离为1000-1200bp,见附图1.4)将第一批引物的PCR产物测序结果与引物设计所用模板经blast软件比较后取 代模板序列中相应部位的原有序列,即将新得到的序列片段镶嵌到模板序列中,这样得到 的序列大约一半是新的即待测线粒体的序列。5)以4)中得到的镶嵌有新序列的序列为模板进行第二批引物设计,而且,第二批 引物中,每一对引物都必须落在新序列中,而且保证第二批引物的每段PCR产物与模板中
的新序列都一段重叠。6)如果有某对或几对引物的扩增效果不好,可以在这对引物外侧设计一对镶嵌 PCR引物进行镶嵌PCR扩增(见附图2),先进行外侧PCR扩增,再以外侧PCR产物为模板进 行内测PCR扩增以确保PCR扩增成功。必须保证能与相邻的PCR产物片段有重叠,以保证 最终的序列拼接。3、总DNA的提取和PCR扩增1)总DNA的提取各种不同的物种总DNA的提取方法不一样,可根据不同的情况 选取相应的总DNA提取方法。2)PCR扩增以总DNA为模板,反应体系总体积为25 yl,其中,双蒸水16. 2iU, lOXExTaqbuffer 2. 5u 1, dNTP 2. 5 u 1,正向引物 1. 3u 1,反向引物 1. 3u 1,总 DNA 模板 lU 1, ExTaq DNA聚合酶0. 2 yl。PCR反应程序根据引物的实际确定。扩增产物经电泳检测后用UNIQ-10柱式PCR产物回收试剂盒纯化,送生物技术公 司完成测序。4、序列测定结果的拼接1)利用Primer Premier 5. 0软件和NCBI网站的blast在线软件将得到20-30个 PCR片段测序结果进行拼接成一个完整的mtDNA。2)利用DNAStar软件包对序列进行开放阅读框的查找,序列互补链的获得;利用 NCBI网站的ORFfinder软件完成蛋白编码序列的翻译和氨基酸编码情况的调查;用blast 在线软件与模板序列进行比对确定各个线粒体基因及其它非编码序列在序列中的具体位置。本发明的优点和积极效果表现在(1)与基于物理分离策略的方法比较,PCR扩增模板只需要总DNA,而不需要纯的 线粒体基因组DNA,降低了实验的成本和技术难度。(2)与常规PCR技术比较,本发明确定了一些相关的技术参数而形成了一种系统 而完整的新的扩增线粒体DNA全序列的新方法,如用作引物设计模板的近缘物种可以是 分类学上同一科内任何物种的线粒体DNA全序列,而且与待测线粒体的DNA序列同源性在 75%以上即可;每一对PCR引物扩增产物的大致长度1300-1500bp ;相邻2对PCR引物扩 增产物必须重叠50-200bp ;整个PCR扩增所需要用的引物对数为模板线粒体序列的长度 /1300-1500bpo(3)与现有的线粒体全序列测定技术相比,本发明的最主要的特点在于PCR引物 设计,考虑到某些引物所在部位的保守性不强,本发明在这些引物内侧引入了镶嵌PCR引 物并进行镶嵌PCR扩增来确保PCR扩增成功。(4)本发明的一个创新点就是将整个序列扩增所用引物分2批进行设计,第一批引物的设计以近缘物种的线粒体DNA序列为模板,而第二批PCR引物则完全以自身线粒体 DNA序列为模板进行设计。由于线粒体DNA的信息结构、地位、作用及其与核基因的相互关系;细胞进化中独 立自主遗传的必要性等是当前线粒体分子生物学研究热点;线粒体的起源和分化,以及部 分基因序列在分子系统发生和分子进化研究中的重要作用。本发明提供了一种成本低,实 验技术简单而且快速的线粒体基因组全序列测定新方法。
图1为第一批PCR扩增引物设计2为第二批PCR扩增引物设计图,其中斜线阴影部分为第一批PCR产物测序后 将序列镶嵌到模板序列后的结果。图3为镶嵌PCR引物设计图,其中粗箭头为PCR扩增效果不好的引物外侧的镶嵌 PCR引物。图4为波纹唇鱼线粒体基因组全序列第一批PCR引物扩增产物的琼脂糖凝胶电泳 5为波纹唇鱼线粒体基因组全序列第二批PCR引物扩增产物的琼脂糖凝胶电泳 6为第一批PCR引物扩增效果不好,但添加第二对镶嵌引物并经PCR扩增后的 琼脂糖凝胶电泳7为波纹唇鱼线粒体基因组全序列,序列全长为17173个碱基
具体实施例方式实施例1 波纹唇鱼线粒体基因组全序列的测定1、从NCBI网站查询筛选,得到隆头鱼科海猪鱼的线粒体基因组全序列,以该序列 为模板,进行波纹唇鱼线粒体基因组全序列测定的PCR引物设计2、利用软件Primer Premier 5. 0进行PCR引物设计,结果如下表1和2所示表1波纹唇鱼线粒体基因组全序列测定的第一批PCR引物及因扩增效果不好而添
加的第二对镶嵌引物
6 表2波纹唇鱼线粒体基因组全序列测定的第二批PCR引物 所设计引物全部由上海生工生物技术有限公司合成。3、总DNA的提取及PCR扩增1)总DNA提取按《分子克隆实验指南》(第三版,2002)的方法略做改动。取无水 乙醇保存的尾鳍或肌肉(或新鲜血液),TE液浸泡1-2天,中间更换2次,开始之前倒TE。 若为鲜活材料则用生理盐水洗净。剪碎,加入DNA提取裂解液,震勻加SDS和蛋白酶K,55°C 消化完全。然后用饱和酚、酚/氯仿/异戊醇(25 24 1)、氯仿/异戊醇(24 1)抽 提,离心取上清,加少量NaCl和大于2倍体积的无水乙醇沉淀,然后用70%乙醇漂洗,倒去 乙醇,自然干燥后加适量TE溶解,4°C保存,长期保存则分装后-20°C保存备用。取部分DNA 模板于核酸蛋白定量仪上测定A260和A280计算浓度和纯度。2)PCR扩增以总DNA为模板,反应体系总体积为25 yl,其中,双蒸水16. 2iU, lOXExTaqbuffer 2. 5u 1, dNTP 2. 5 u 1,正向引物 1. 3u 1,反向引物 1. 3u 1,总 DNA 模板 lU l,ExTaq DNA聚合酶0. 2yl。PCR反应程序根据引物的实际确定。PCR产物经琼脂 糖凝胶电泳检测后用UNIQ-10柱式PCR产物回收试剂盒(上海生工)纯化,送上海生工完 成测序。3)对经检测PCR扩增产物不理想的引物(第3、7、9对引物),分别在其外侧再设 计一对引物,按上述相同的方法进行PCR扩增并测序。4)用Primer Premier 5. 0软件和NCBI网站的blast在线软件对第一批PCR产物 测序结果进行分析比对,并将其镶嵌在原模板中和该序列片对应的同源片段部位,这样得 到一个长的混合序列,其中一部分为波纹唇鱼的线粒体序列,另一部分为海猪鱼的线粒体 序列。以此混合序列为模板再进行第二批PCR引物设计,但第二批PCR引物位置必须落在 波纹唇鱼的线粒体序列内部;然后按照上述2)和3)的方法进行扩增和测序。第一批和第 二批PCR产物的琼脂糖凝胶电泳图如图4和图5所示。4、所得序列结果的拼接
用Primer Premier 5. 0软件和NCBI网站的blast在线软件将得到21个PCR片 段测序结果进行拼接成一个完整的mtDNA ;再利用DNAStar软件包对序列进行开放阅读框 的查找,序列互补链的获得;并利用NCBI网站的ORFfinder软件完成蛋白编码序列的翻译 和氨基酸编码情况的调查;用blast在线软件与模板序列进行比对确定各个 线粒体基因及 其它非编码序列在序列中的具体位置。得到波纹唇鱼的线粒体全序列如图7所示。
权利要求
建立在常规PCR技术基础上的一种改进的线粒体基因组全序列测定方法,包括如下步骤1)模板的筛选;2)引物的设计;3)总DNA提取、PCR扩增及测序;4)测序结果的序列拼接。
2.根据权利要求1所述的方法,其特征在于筛选分类学上属于同一个科的物种线粒 体基因组全序列作为模板,其与待测序列同源性75%以上即可。
3.根据权利要求1和2所述的方法,其特征在于利用PrimerPremier 5. 0软件进行 引物设计,软件 Primer Premier 5. http //www, premierbiosoft. com/T"lfe,弓I 物设计分2批进行,第一批引物数目为总引物数目的一半,相邻两对引物扩增片段之间的 间隔距离为1000-1200bp。
4.根据权利要求1和2所述的方法,其特征在于第一批引物的PCR产物测序结果与 引物设计所用模板经blast软件比较后取代模板序列中相应部位的原有序列。
5.根据权利要求4所述的方法,其特征在于以得到的镶嵌有新序列的序列为模板进 行第二批引物设计,而且,第二批引物中,每一对引物都必须落在新序列中,而且保证第二 批引物的每段PCR产物与模板中的新序列都有一段50-100bp重叠。
6.根据权利要求1和3所述的方法,其特征在于对于PCR扩增效果不好引物,在其外 侧再引入一对PCR引物,进行镶嵌PCR扩增。
全文摘要
本发明公开了一种在常规PCR技术基础上改进了的线粒体基因组全序列测定方法,目的是提供一种成本低,实验技术简单而且快速的线粒体基因组全序列测定新方法。本发明的特征在于模板的筛选和PCR引物的设计,确定了能作为模板的近缘物种线粒体全序列的最低同源性;将引物的设计分2批进行,并将镶嵌PCR方法引入序列扩增过程中;给出了PCR引物设计的一般规则。本发明主要用于线粒体基因组全序列测定,为遗传学、分子生物学等基础科学研究服务。
文档编号C12Q1/68GK101875966SQ20091013817
公开日2010年11月3日 申请日期2009年4月30日 优先权日2009年4月30日
发明者尹绍武, 张本, 陈国华, 霍蕊, 骆剑, 齐兴柱 申请人:海南大学