专利名称:一种对dna片段进行测序的方法
技术领域:
本发明涉及一种对DNA片段进行测序的方法。
背景技术:
小麦是世界上的主要粮食作物,是我国的第三大类粮食作物,在人类生存和国 家粮食安全中起着十分重要的作用。小麦籽粒含有丰富的营养成分,其中蛋白质约 占籽粒营养成分的8% 10%,包括水溶性的白蛋白、盐溶性的球蛋白、醇溶性的醇溶 蛋白及溶于酸或碱的谷蛋白类。通常将小麦中的白蛋白、球蛋白和酶蛋白等统称为 代谢蛋白,大约占籽粒蛋白的15%左右;将麦醇溶蛋白和麦谷蛋白称为小麦的贮藏 蛋白,约占籽粒蛋白的85%。麦醇溶蛋白的组成和含量决定面团的粘着性和延伸性, 而麦谷蛋白亚基组成及含量决定面团的弹性。小麦的麦谷蛋白按其分子量大小又分 为高分子量麦谷蛋白亚基(high molecular weight glutenin subunits,简称HMW-GS) 禾口低分子量麦谷蛋白亚基(low molecular weight glutenin subunits,简称 LMW-GS),其中HMW-GS是面筋的主要成份,与小麦的加工品质密切相关,赋予面团 弹性,决定面包的烘烤品质。
小麦高分子量麦谷蛋白亚基(HMW-GS)基因定位于第一组染色体(IA, IB,和 ID)长臂的Wy-7位点。HMW-GS每个位点由两个紧密连锁的基因组成,分别编码两 个不同类型的亚基 一个分子量较高的X型亚基和一个分子量较低的Y型亚基。X 与Y型亚基基因之间的距离在10kb以内。7位点为复等位基因,Payne和 Lawrence (1983)报道了在位点中67w-W有3个等位基因、Ww-M有11个 等位基因、W『/"有6个等位基因。此后更多的等位基因被鉴定出来。
对高分子量麦谷蛋白亚基基因的分离和克隆,早期是通过探针杂交筛选文库的 方法获得的。随着PCR技术的发展,其作为一种快速可靠的方法,在小麦及其近缘 物种的HMW-GS基因研究中得到广泛应用。D' 0vidio等(1995)通过PCR方法对六倍 体小麦中的6个HMW-GS基因的完整编码区进行了特异扩增。这就使得人们可以对 HMW-GS的遗传多态性、新的等位基因变异的分离、分子大小的估计及半胱氨酸残基 数量进行研究。此后发现在Glu-l位点编码的H丽-GS长度上的不同主要是由于中部 重复区长度上的变异造成的。 一些研究者指出产生麦谷蛋白亚基大小上的差异最可
3能的机制是一个不平衡的交换事件造成的。不平衡的交换事件也可能由于一些重复 基序的插入造成一个很长的基因出现,也有可能由于一些重复基序的缺失造成一个 很短的基因,如在r.^/"力h'中的12. 4亚基。
HMW-GS基因的长度一般在1.5kb 3.0kb之间,由于其中部重复序列多、GC含 量高,中间设计引物非常困难,无法通过一般的测序方法(primer walking)测通, 目前对这类基因的序列测定都是用嵌套缺失的方法(nested deletion)产生一系 列的亚克隆重叠群,然后将这些重叠片段利用计算机软件拼成全序列。但这种方法 对质粒要求高,需要90%以上的超螺旋质粒,并要控制好酶切时间。
发明内容
本发明的目的是提供一种对DNA片段进行测序的方法。 本发明所提供的对DNA片段进行测序的方法,包括如下步骤
1) 以待测DNA片段为起始片段;
2) 对所述起始片段进行一端测序或两端测序,得到所述起始片段的一端序列
或两端序列;
3) 用所述起始片段的一端序列或两端序列上存在的至少一个限制性内切酶位 点对应的至少一种限制性内切酶酶切所述起始片段,回收含有所述起始片段中未测
序片段的片段;
4) 对含有所述起始片段中未测序片段的片段进行测序,得到所述含有所述起 始片段中未测序片段的片段的序列;
5) 将所测得的所有序列进行拼接得到所述待测DNA片段的序列。
其中,用于酶切的限制性内切酶可以是l种、2种或3种以上,具体可以根据 所要测的DNA片段的序列特征进行选取。
所述方法中,在所述步骤3)和步骤4)之间,还可包括下述操作以所述步 骤3)中所述含有所述起始片段中未测序片段的片段为起始片段,重复所述步骤2) 和3)。
所述方法中还可包括至少2次以下重复的操作在所述步骤3)和步骤4)之 间,重复所述步骤2)和3)的操作,其中,进行一端测序或两端测序的起始片段
为前一次重复中得到的含有所述起始片段中未测序片段的片段。
所述丽A片段具体可以为中部含有多个重复、GC含量高的序列片段,所述重复 的单元可以是2个碱基或3个以上碱基,所述重复的单元的数目可以任意、较佳的
4是大于等于3小于等于70。
所述DNA片段可为不同麦类作物中的麦谷蛋白亚基基因,如高分子量麦谷蛋白
亚基基因或低分子量麦谷蛋白亚基基因,具体可如小麦高分子量麦谷蛋白亚基基
因,进一步具体地说可以是小麦高分子量麦谷蛋白亚基中Bx型亚基基因。其中,所述麦类作物可如小麦、大麦、黑麦作物等。
本发明方法避免了传统方法中多次PCR的步骤,从而大大减小了由PCR扩增引起的序列突变的可能性,保证了所测序列的真实性,克服了传统的嵌套缺失法测序的繁复性,极大的提高了测序的效率和准确性。对于中部重复序列多、GC含量高的DNA片段,传统的方法一般很难测通,主要因为重复序列长且根据其设计引物比较困难,而本发明方法巧妙的回避了引物设计的步骤,通过酶切使重复序列的长度由长变短,逐步测通序列,实验证明,测得的序列准确性高、可靠;对于较长的DNA片段,有时用primer walking方法测序也比较困难,用本发明方法则可以快速、准确的获得序列。
本发明方法还具体的提供了一种高效快速的测得小麦高分子量麦谷蛋白亚基基因序列的技术方案,解决了小麦高分子量麦谷蛋白亚基基因的克隆测序技术问题,为同类型新的亚基基因的测序提供了一种快速有效的方法。
本发明方法对开发相应基因的分子标记,以将相应基因用于培育新的优质种质或品种等方面具有重要的作用,因此,本发明方法适合于推广应用。
图l为济麦20的lBxl3亚基基因的酶切示意图。图2为济麦20的lBxl3亚基基因的酶切结果。图3为特异引物对的位置示意图。图4为用特异引物对扩增lBxl3亚基基因的结果。
具体实施例方式
下述实施例中所使用的实验方法如无特殊说明,均采用《分子克隆实验指南》第三版中公开的常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径购买得到。济麦20购自山东省农科院作物所,产品目录号955159;
高分子量麦谷蛋白亚基基因的定义麦谷蛋白是指禾谷作物的种子中溶于稀酸或稀碱,但不溶于水、盐及醇溶液的蛋白质组分,是由多个亚基通过分子间二硫键相互连接成的大分子物质,麦谷蛋白在稀酸或稀碱溶液中的溶解性随肽链上二硫键数目的增加而减小。麦谷蛋白按其分子量高低可分为高分子量麦谷蛋白亚基(分子
量为60kD以上)和低分子量麦谷蛋白亚基(分子量一般为30-45kD)。编码高分子量麦谷蛋白亚基的基因即称为高分子量麦谷蛋白亚基基因。
实施例l、济麦20的lBxl3亚基基因的亚克隆测序济麦20的lBxl3亚基基因的基因库序列号为FM955452。一、用本发明方法进行测序
1、 济麦20中lBxl3亚基基因的获得
以济麦20的基因组DNA为模板,用如下引物进行扩增,得到济麦20中lBxl3亚基基因;
引物序列正向引物ATGGCTAAGCGCCTGGTCCTCTTTG (序列表中序列2),反向引物CTATCACTGCCTGGTCGACAATGCG (序列表中序列3);
2、 济麦20中lBxl3亚基基因的两端测序
将济麦20的lBxl3亚基基因的PCR产物克隆到pGEM T easy载体上(Promega公司产品),得到重组载体pGEM/lBx13,经两端测序后获得lBxl3亚基基因的5,端和3,端的部分序列,测得的序列为5'端序列为序列表中序列1自5'末端第卜647位核苷酸、3'端序列为序列表中序列1自5'末端第1562-2391位核苷酸。
3、 在两端序列上寻找酶切位点及对基因进行酶切
(1) 寻找酶切位点用生物软件DNAstar/MapDraw分析两端序列上的酶切位点;结果在测得的5,端序列上存在l个HindlII识别位点;在测得的3,端序列上存在
2个Spel识别位点和2个Mfel识别位点(图l);
分析选择合适的酶切位点组合,选择的标准如下1)能获得中间未测序的序列片段、并能使中间未测序的序列片段能够从酶切产物中分离、2)酶是常用的核酸限制性内切酶;
经分析,可以用下面两组酶进行酶切HindlII/Spel, HindlII/Mfel (HindIII识别位点AAGCTT, Spel识别位点:ACTAGT, Mfel识别位点:CAATTG)。
(2) 对基因进行酶切分别用限制性内切酶组合HindlII/Mfe I和HindlII/Spe I (NEB公司产品)对上述重组载体pGEM/lBxl3进行双酶切,酶切体系如下
HindlII/Spe IHindlII/Mfe I
质粒DNA 5ul 5ul
ddH20 18.9ul 20ul
Buffer 2 3ul 3ul
BSA(20x) 1.5ul —
HindIII 0.8ul 0.8ul
Spe I 0.8ul —
Mfe I — 1.2ul
total 30ul 30ul
按双酶切体系37X:过夜酶切,接着65t: 20分钟将酶灭活。将酶切产物进行琼脂糖凝胶电泳检测,结果如图2所示,按预测的酶切位点,HindlII/Spel酶切组合得到4个酶切片段,HindlII/Mfel得到3个酶切片段。4、对酶切位点间的片段进行测序
用T4 DNA聚合酶(NEB公司产品)将酶切产物的粘性末端补平反应体系如下
HindlII/Spe IHindl薩fe I
酶切液(步骤3)28ul28ul
dNTP(2mM)2ul2ul
Buffer 21.2ulL2ul
BSA(20x)0.6ul2ul
T4 DNA聚合酶lullul
ddH207.2ul5.8ul
total40ul40ul
反应条件12°C 15分钟,接着75t: 20分钟终止反应。
用1%的琼脂糖胶电泳分离相应的目的片段。图2中表明,1.2kb左右的片段是序列未知的片段,回收此片段用于序列测定。用Taq酶(Promega公司产品)进行末端加A反应:反应体系如下
DNA回收液28ul
dATP(2mM)2ul
10xTaq Buffer4ul
Taq酶0.5ul
ddH205.5ul
total40ul
反应条件72°C 20分钟,尽量避免中间环节的损失。
最后用乙醇沉淀末端加A反应的产物反应体系如下
DNA片段(己加A) 40ulddH20 60ulNaAC(pH5.2) 10ul冰无水乙醇 300ul反应条件-20° C沉淀过夜;然后4° C, 12,000rpm,离心20分钟,取沉淀;再用lml 70%乙醇洗涤沉淀,4° C, 12,000rpffl,离心5分钟;弃上清,干燥沉淀IO分钟;加10ul ddH20溶解;
连接转化将上述力HA后的产物连接到pGEM T easy载体上,得到的重组载体再转化至大肠杆菌中,筛选培养,挑取阳性单克隆,测序。
共挑取了10个克隆,进行测序,排除了PCR过程中可能存在的扩增错误。结果表明,测得的HindlII/Spel酶切位点间的序列为序列表中序列l自5'末端第359-1590位核苷酸,测得的Hindin/Mfe:t酶切位点间的序列为序列表中序列l自5'末端第359-1627位核苷酸。6、序列拼接
用DNAstar/SeqMan将上述两端序列、酶切位点间的序列进行拼接,得到完整的基因序列。济麦20中lBxl3基因如序列表中序列l所示,序列长度为2391bp。二、序列验证
为了检验本发明方法的准确性,以防在使用双酶切的过程中可能出现小片段的丢失,本实验从基因组水平做了验证。具体方法如下
8根据己测通的序列l,在基因内部分别设计两对特异的引物(图3):引物名称 序列
P1 5' —ATGGCTAAGCGCCTGGTCCTCTTTG—3,
P2 5' —AGTACGCTTGTTGTCCCTGT—3,
P3 5' —CAACTTCGCAGCAGTCGGAACAAGG—3,
P4 5' —CTATCACTGCCTGGCCGACAATGCG—3,
以济麦20基因组为模板,分别用引物对P1/P2和P3/P4进行PCR扩增,扩增产物的电泳图如图4所示(l为lBxl3亚基基因用引物Pl/P2的扩增结果;2为lBxl3亚基基因用引物P3/P4的扩增结果;M为MarkerIII) ,对扩增产物分别进行克隆测序,测得用Pl/P2扩增到1438bp的产物,P3/P4扩增到1325bp的产物,将两段序列用DNAstar/SeqMan拼接在一起,表明这两个片段重叠372bp,拼接后的序列与本发明两端酶切法得到的序列完全相同,说明本发明方法测序结果是可信的,没有出现小片段的缺失。
9序列表
〈110〉中国科学院遗传与发育生物学研究所
<120〉一种对DNA片段进行测序的方法
<130> CGGNARC92014
〈160〉3
<210>1
〈2U〉2391bp
〈212〉DNA
<213〉小麦属小麦(Triticum aestivum)
<400〉1
atggctaagcgcctggtcctctttgcggcagtagtcgtcgccctcgtggctctcaccgcc60
gctgaaggtgaggcctctggtgtgagcgcgagctcgaggc£LtgCC£L£LC£Lg120
gtggtggaccagcaacttcgagacgttagccccgggtgccgccccatcaccgtcagcccg180
ggcacg卿cgcaacctgtggtgccgtccaaggccggatccttctacccc240
cgccttcgcagcaactccaacaaatgatattttggggaatacctgcacta300
Ct£L£Lg£L£Lggtattacccaagtgtaacttcttcgcagcaggggtcettactatccaggccaa360
gcttctccgcaacagttagg已c3已ggacagcagccaggac犯gg3C3gC8420
gagC£L£LC£L£Lgatcagcagcc£Lgg3Ca<£Lag£LcaacgLaggat3CtgLCCC3LaLCttctccgcaa480
cagccaggacaagggcaacaactgggacaagggc咖cagggtactacccaacttcacag540
cagccaggacaaa^gc3gcagggCaaCELELtcaggacaaggatcaacaaggg600
t3ctaccc犯cttccccgcaacagtcaggaaaccgggacaagggcaagca660
gggtactacccaacttctccgcagcagtcaggac犯tggcELgcaacc3ggacaagggcaa720
cagccaggac鄉ggcagcagggca^ica已ggtcagcagccaggac已已ggg780
caacgaccsggacaaLggaca已caaigggtax:taccc犯cttctccgcaacagccgggacaa840
gggcaacaatcaggac已鄉gcaaccagggtactacccaacttctttgcggcagccagga900
caatggcagc£L£LCC3Lgg£LCaLCC£Lgg£LC£tagggcaaceLaggtcagcagcca%0
ggacaaggsca已ca3ccagg3caagg3caacaaggatactacccaacttctctgcaacag1020CCagg3C33gggcaacaaccgggaca鄉gcaaccagggt3Ct3CCC83Cttcgcagcag1080
tcggaac犯gggC3gC观CCaggacaaggagac犯ggacaacaagggtac1140
tacccaacttgtcaggacaagggca已caactgggacaagggc^ccaggg1200
tactacccascttctccacacaaggacaacaatcaggaca1260
gggtactacccaacttctccgcaacagtcaggac鄉ggc已3caaccggg已caagggcaa1320
tcggggtacttcccaacttctcggcagcagtcaggacaagggcagcagcc郷ac鄉ga1380
C33C3gtCgggacaagggcaacaaggtcagcaacc3ggacagcgtactac1440
ccaacttcttcgcaacagtc£Lgg£LC£LaaggCa£LC£lggC£lggacaatggcaacgaccggga1500
C33gggcaatcagggtactacccaacctctccacagcagccaggacaagagcaacagtca1560
gg3C鄉CgC犯caatcaggacaatggcaactagtgtactacccaacttctccgcaacag1620
ccaggcc33ttgcaacaaccagcaca鄉gcacaagggcaacaatcagca1680
ca3gagca^cagccaggacaagcgcasca已ggcaactagtgtactaccca1740
acttctccgcasc已gcc3ggacaattgcaacaaccaacaca^gggcaaca1800
ccaacttctccacaacagtcaggacaagggcaacsagggt3Ctaccc33cttctccgcaa1860
cagtcaggacagggtactacccaacttctccgcaacagtcagg已c鄉gg1920
cagcagccaggacaaggacaacagccaagacaagggcaacsagggtactacccaatttct1980
ccgcagc已gtcaggacaagggc^c3acc3gg織agggca3caagg3t已ctacccaact2040
tctccgcagcagtcaggacaccaggacatgagcaacagccaggacaatgg2100
ctgcaaccaggac鄉ggcaacaagggtactatccaacttcttcacagcagtcsggacaa2160
gggcagcaatcaggaca鄉gcaacaagggtsctacccaacttctctgtggcaaccagga2220
c犯gggcaac已gggca已csaggctacgacagcccataccatgttagcgcg2280
cggcccgcct犯aggtggca鄉gcgcagcagctcgcggcacagctgccg2340
gcaatgtgccggctggagggcagcgacgcattgtcggccsggcagtgatag2391
11〈210〉2
〈211〉25<212〉DNA
<220〉〈223〉
<400〉2
atggctaagc gcctggtcct ctttg 25
<210>3
<211〉25
<212>DNA
<220><223〉
<400〉3
ctatcactgc ctggtcgaca atgcg 25
1权利要求
1、一种对DNA片段进行测序的方法,包括如下步骤1)以待测DNA片段为起始片段;2)对所述起始片段进行一端测序或两端测序,得到所述起始片段的一端序列或两端序列;3)用所述起始片段的一端序列或两端序列上存在的至少一个限制性内切酶位点对应的至少一种限制性内切酶酶切所述起始片段,回收含有所述起始片段中未测序片段的片段;4)对含有所述起始片段中未测序片段的片段进行测序,得到所述含有所述起始片段中未测序片段的片段的序列;5)将所测得的所有序列进行拼接得到所述待测DNA片段的序列。
2、 根据权利要求1所述的方法,其特征在于所述方法在所述步骤3)和步骤 4)之间,包括下述操作以所述步骤3)中所述含有所述起始片段中未测序片段的 片段为起始片段,重复所述步骤2)和3)。
3、 根据权利要求1所述的方法,其特征在于所述方法包括至少2次以下重 复的操作在所述步骤3)和步骤4)之间,重复所述步骤2)和3)的操作,其中, 进行一端测序或两端测序的起始片段为前一次重复中得到的含有所述起始片段中 未测序片段的片段。
4、 根据权利要求l、 2或3所述的方法,其特征在于所述DNA片段为麦谷蛋 白亚基基因。
5、 根据权利要求4所述的方法,其特征在于所述麦谷蛋白亚基基因为高分 子量麦谷蛋白亚基基因。
6、 根据权利要求5所述的方法,其特征在于所述高分子量麦谷蛋白亚基基 因为小麦高分子量麦谷蛋白亚基基因。
7、 根据权利要求6所述的方法,其特征在于所述小麦高分子量麦谷蛋白亚基基因为小麦高分子量麦谷蛋白亚基中Bx型亚基基因。
全文摘要
本发明公开了一种对DNA片段进行测序的方法。该方法包括如下步骤1)以待测DNA片段为起始片段;2)对所述起始片段进行一端测序或两端测序,得到所述起始片段的一端序列或两端序列;3)用所述起始片段的一端序列或两端序列上存在的至少一个限制性内切酶位点对应的至少一种限制性内切酶酶切所述起始片段,回收含有所述起始片段中未测序片段的片段;4)对含有所述起始片段中未测序片段的片段进行测序,得到所述含有所述起始片段中未测序片段的片段的序列;5)将所测得的所有序列进行拼接得到所述待测DNA片段的序列。本发明方法保证了所测序列的真实性,克服了传统的嵌套缺失法测序的繁复性,极大的提高了测序的效率和准确性。
文档编号C12Q1/68GK101463391SQ20091007624
公开日2009年6月24日 申请日期2009年1月8日 优先权日2009年1月8日
发明者刘冬成, 卓国银, 孙家柱, 张爱民, 郭小丽, 阳文龙 申请人:中国科学院遗传与发育生物学研究所