与油茶种仁含油率相关的SNP分子标记及其应用的制作方法

文档序号:21847782发布日期:2020-08-14 17:14阅读:282来源:国知局
本发明涉及分子标记
技术领域
,具体涉及与油茶种仁含油率相关的snp分子标记及其应用。
背景技术
:油茶(camelliaoleiferaabel.)隶属山茶科(theaceae)山茶属(camellial.),是木本油料树种。油茶籽油含有丰富的营养物质,是一种优质的食用油,其不饱和脂肪酸含量达90%以上,以油酸和亚油酸为主。油茶籽油具有抗氧化、抗肿瘤、降血脂等功效,具有较高的营养保健价值。目前,以选择和杂交育种为主要手段、以产果量为主要育种目的的油茶育种已取得了重要进展,但以提高种仁含油率、改良油脂品质为目的的育种研究仍较少。油茶的常规育种周期长,新品种选育缓慢,良种选育速度还不能满足产业发展的需求,这已成为限制油茶产业发展的重要因素之一。相比于传统育种技术,分子标记辅助育种可从苗期开始选择,大幅缩短育种周期,对以果实为主要目的的经济林育种优势尤其明显。分子标记辅助育种离不开有效的分子标记,因此,开发与油茶种仁含油率、油脂品质表型相关的分子标记,对于油茶油脂产量和品质的分子标记辅助育种及相关性状的遗传改良具有重要意义。果实产量、鲜果出籽率、种仁含油率等指标直接决定单位面积油茶产(油)量,因此,开展油茶种仁含油率研究,是提高油茶产量的重要途径之一,对油茶产业的提升和健康发展具有十分重要的意义。技术实现要素:本发明的目的之一在于提供与油茶种仁含油率相关的snp分子标记,本发明的另一目的是提供所述snp分子标记在油茶含油率表型鉴定和育种中的应用。本发明提供的与油茶种仁含油率关联位点的开发方法是基于油茶是典型的异交物种,连锁不平衡(ld)通常在较小范围内迅速消减,因此可以开展重要性状的ld作图。油茶的种仁全部转录本作为本发明标记开发的区域。在具备产生了大量明显的遗传变异的油茶自然群体的前提下,可有效开展与油茶种仁含油率变异显著相关的标记开发。本发明中snp分子标记的开发过程基本如下:(1)在油茶全分布区内广泛收集油茶种质资源,建立种仁含油率广泛分离的油茶自然群体。(2)采集自然群体500份油茶种质的完全成熟种子,用索氏抽提法测定种子含油率。(3)采集自然群体500个油茶单株的油脂高速合成期的种仁,采用rnapreppure多糖多酚植物总rna提取试剂盒(离心柱型,tiangen试剂盒codeno.dp441)提取总rna,每样本分别构建cdna文库,利用illuminahiseqtm4000平台进行二代转录组测序。(4)采集油茶“长林4号”的根、嫩叶、成熟叶片、花瓣和未成熟种子,采用rnapreppure多糖多酚植物总rna提取试剂盒(离心柱型,tiangen试剂盒codeno.dp441)分别提取rna,各组织rna等比例混合,构建pacbiosmrtbell文库,在pacbiosequel平台进行三代转录组测序。测序结果过滤掉低质量数据和冗余序列后,对所有转录本进行注释分析。过程中用到软件lordec((http://www.atgc-montpellier.fr/lordec/)、cd-hitv4.6(ful,niub,zhuz,wus,liw,2012.cd-hit:acceleratedforclusteringthenext-generationsequencingdata.bioinformatics28,3150-2.)、codingpotentialcalculator(cpc)(kongl,zhangy,yez-q,etal.,2007.cpc:assesstheprotein-codingpotentialoftranscriptsusingsequencefeaturesandsupportvectormachine.nucleicacidsresearch35,w345.)和coding-non-codingindex(cnci)(https://github.com/www-bioinfo-org/cnci)等是免费公开的。(5)以(4)中获得的全长转录组序列为参考序列,采用多序列比对法,分析(3)中获得的500个样本转录组序列的snp位点。snp数据根据以下原则严格过滤:每个位点只有2个等位基因;基因型缺失率≤20%;最小等位基因频率≥5%;snp质量值≥100;纯合基因型样本数超过10个;杂合基因型率≤70%。过程中用到软件bcftoolsv1.9software(http://www.htslib.org/doc/bcftools.html)是公开免费的。(6)将群体的基因型数据输入gctav1.25.2(jiany,shongl,goddardme,visscherpm,2011.gcta:atoolforgenome-widecomplextraitanalysis.americanjournalofhumangenetics88,76-82.)软件,进行主成分分析(pca)。(7)将群体的基因型数据、前10个主成分(pc)数据、种仁含油率的表型数据以及kinship矩阵数据输入tassel5.0(http://www.maizegenetics.net/tassel)软件中,采用统一混合线性模型方法(mlm)分析snps标记和油茶种仁含油率性状的连锁不平衡性,检测到48个位点与油茶种仁含油率极显著关联(p<10-5,见表1),对表型变异的贡献率为10.23%~32.66%(表1)。利用上述技术措施,本发明最终获得了与油茶种仁含油率极显著关联的48个snp标记,这些标记位于油茶的9个转录本内,具体参见表1。表1snp分子标记信息具体地,本发明提供如下技术方案:第一方面,本发明提供与油茶种仁含油率相关的snp分子标记,所述snp分子标记选自pb.57703.1-685、pb.93518.1-182、pb.93518.1-191、pb.93518.1-224、pb.93518.1-270、pb.93518.1-284、pb.93518.1-288、pb.103793.1-1118、pb.103793.1-1172、pb.103793.1-1175、pb.47687.1-148、pb.47687.1-215、pb.47687.1-258、pb.47687.1-264、pb.47687.1-282、pb.47687.1-297、pb.47687.1-360、pb.47687.1-366、pb.47687.1-367、pb.85097.1-125、pb.85097.1-197、pb.85097.1-293、pb.85097.1-356、pb.85097.1-532、pb.35678.1-1129、pb.70158.1-51、pb.70158.1-187、pb.70158.1-306、pb.70158.1-314、pb.70158.1-408、pb.70158.1-413、pb.70158.1-419、pb.70158.1-473、pb.70158.1-649、pb.70158.1-704、pb.70158.1-707、pb.70158.1-778、pb.70158.1-854、pb.70158.1-930、pb.70158.1-935、pb.70158.1-944、pb.70158.1-1025、pb.76391.3-1354、pb.76391.3-1385、pb.76391.3-1417、pb.63477.1-1109、pb.63477.1-1163和pb.63477.1-1166中的任一个;其中,snp分子标记pb.57703.1-685含有如seqidno.19所示序列第685位的多态性为c/t的核苷酸序列;具体地,snp分子标记pb.93518.1-182含有如seqidno.20所示序列第182位的多态性为t/c的核苷酸序列,snp分子标记pb.93518.1-191含有如seqidno.20所示序列第191位的多态性为t/c的核苷酸序列,snp分子标记pb.93518.1-224含有如seqidno.20所示序列第224位的多态性为g/a的核苷酸序列,snp分子标记pb.93518.1-270含有如seqidno.20所示序列第270位的多态性为g/a的核苷酸序列,snp分子标记pb.93518.1-284含有如seqidno.20所示序列第284位的多态性为g/a的核苷酸序列,snp分子标记pb.93518.1-288含有如seqidno.20所示序列第288位的多态性为c/t的核苷酸序列;snp分子标记pb.103793.1-1118含有如seqidno.21所示序列第1118位的多态性为a/g的核苷酸序列,snp分子标记pb.103793.1-1172含有如seqidno.21所示序列第1172位的多态性为g/a的核苷酸序列,snp分子标记pb.103793.1-1175含有如seqidno.21所示序列第1175位的多态性为a/c的核苷酸序列;snp分子标记pb.47687.1-148含有如seqidno.22所示序列第148位的多态性为a/g的核苷酸序列,snp分子标记pb.47687.1-215含有如seqidno.22所示序列第215位的多态性为g/t的核苷酸序列,snp分子标记pb.47687.1-258含有如seqidno.22所示序列第258位的多态性为c/t的核苷酸序列,snp分子标记pb.47687.1-264含有如seqidno.22所示序列第264位的多态性为c/t的核苷酸序列,snp分子标记pb.47687.1-282含有如seqidno.22所示序列第282位的多态性为t/c的核苷酸序列,snp分子标记pb.47687.1-297含有如seqidno.22所示序列第297位的多态性为c/t的核苷酸序列,snp分子标记pb.47687.1-360含有如seqidno.22所示序列第360位的多态性为a/g的核苷酸序列,snp分子标记pb.47687.1-366含有如seqidno.22所示序列第366位的多态性为t/c的核苷酸序列,pb.47687.1-367含有如seqidno.22所示序列第367位的多态性为g/c的核苷酸序列;snp分子标记pb.85097.1-125含有如seqidno.23所示序列第125位的多态性为c/g的核苷酸序列,snp分子标记pb.85097.1-197含有如seqidno.23所示序列第197位的多态性为g/c的核苷酸序列,snp分子标记pb.85097.1-293含有如seqidno.23所示序列第293位的多态性为a/g的核苷酸序列,snp分子标记pb.85097.1-356含有如seqidno.23所示序列第356位的多态性为t/g的核苷酸序列,snp分子标记pb.85097.1-532含有如seqidno.23所示序列第532位的多态性为a/t的核苷酸序列;snp分子标记pb.35678.1-1129含有如seqidno.24所示序列第1129位的多态性为g/c的核苷酸序列;snp分子标记pb.70158.1-51含有如seqidno.25所示序列第51位的多态性为g/a的核苷酸序列,snp分子标记pb.70158.1-187含有如seqidno.25所示序列第187位的多态性为a/g的核苷酸序列,snp分子标记pb.70158.1-306含有如seqidno.25所示序列第306位的多态性为c/t的核苷酸序列,snp分子标记pb.70158.1-314含有如seqidno.25所示序列第314位的多态性为a/g的核苷酸序列,snp分子标记pb.70158.1-408含有如seqidno.25所示序列第408位的多态性为t/g的核苷酸序列,snp分子标记pb.70158.1-413含有如seqidno.25所示序列第413位的多态性为t/a的核苷酸序列,snp分子标记pb.70158.1-419含有如seqidno.25所示序列第419位的多态性为a/t的核苷酸序列,snp分子标记pb.70158.1-473含有如seqidno.25所示序列第473位的多态性为c/g的核苷酸序列,snp分子标记pb.70158.1-649含有如seqidno.25所示序列第649位的多态性为a/g的核苷酸序列,snp分子标记pb.70158.1-704含有如seqidno.25所示序列第704位的多态性为g/a的核苷酸序列,snp分子标记pb.70158.1-707含有如seqidno.25所示序列第707位的多态性为a/c的核苷酸序列,snp分子标记pb.70158.1-778含有如seqidno.25所示序列第778位的多态性为c/t的核苷酸序列,snp分子标记pb.70158.1-854含有如seqidno.25所示序列第854位的多态性为a/c的核苷酸序列,snp分子标记pb.70158.1-930含有如seqidno.25所示序列第930位的多态性为c/g的核苷酸序列,snp分子标记pb.70158.1-935含有如seqidno.25所示序列第935位的多态性为t/g的核苷酸序列,snp分子标记pb.70158.1-944含有如seqidno.25所示序列第944位的多态性为a/t的核苷酸序列,snp分子标记pb.70158.1-1025含有如seqidno.25所示序列第1025位的多态性为c/t的核苷酸序列;snp分子标记pb.76391.3-1354含有如seqidno.26所示序列第1354位的多态性为a/c的核苷酸序列,snp分子标记pb.76391.3-1385含有如seqidno.26所示序列第1385位的多态性为g/a的核苷酸序列,snp分子标记pb.76391.3-1417含有如seqidno.26所示序列第1417位的多态性为t/c的核苷酸序列;snp分子标记pb.63477.1-1109含有如seqidno.27所示序列第1109位的多态性为a/g的核苷酸序列,snp分子标记pb.63477.1-1163含有如seqidno.27所示序列第1163位的多态性为g/a的核苷酸序列,snp分子标记pb.63477.1-1166含有如seqidno.27所示序列第1166位的多态性为a/c的核苷酸序列。进一步地,本发明的与油茶种仁含油率相关的snp分子标记可以分别由核苷酸序列如seqidno.1-2、seqidno.3-4、seqidno.5-6、seqidno.7-8、seqidno.9-10、seqidno.11-12、seqidno.13-14、seqidno.15-16、seqidno.17-18所示的引物对以油茶cdna为模板经pcr扩增获得。本发明的与油茶种仁含油率相关的snp分子标记pb.57703.1-685通过核苷酸序列如seqidno.1-2所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.57703.1转录本的685bp处的碱基,其多态性为c/t。本发明的与油茶种仁含油率相关的snp分子标记pb.93518.1-182、pb.93518.1-191、pb.93518.1-224、pb.93518.1-270、pb.93518.1-284、pb.93518.1-288通过核苷酸序列如seqidno.3-4所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.93518.1转录本的182bp、191bp、224bp、270bp、284bp、288bp处的碱基,其多态性分别为t/c、t/c、g/a、g/a、g/a、c/t。本发明的与油茶种仁含油率相关的snp分子标记pb.103793.1-1118、pb.103793.1-1172、pb.103793.1-1175通过核苷酸序列如seqidno.5-6所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.103793.1转录本的1118bp、1172bp、1175bp处的碱基,其多态性分别为a/g、g/a、a/c。本发明的与油茶种仁含油率相关的snp分子标记pb.47687.1-148、pb.47687.1-215、pb.47687.1-258、pb.47687.1-264、pb.47687.1-282、pb.47687.1-297、pb.47687.1-360、pb.47687.1-366、pb.47687.1-367通过核苷酸序列如seqidno.7-8所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.47687.1转录本的148bp、215bp、258bp、264bp、282bp、297bp、360bp、366bp、367bp处的碱基,其多态性分别为a/g、g/t、c/t、c/t、t/c、c/t、a/g、t/c、g/c。本发明的与油茶种仁含油率相关的snp分子标记pb.85097.1-125、pb.85097.1-197、pb.85097.1-293、pb.85097.1-356、pb.85097.1-532通过核苷酸序列如seqidno.9-10所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.85097.1转录本的125bp、197bp、293bp、356bp、532bp处的碱基,其多态性分别为c/g、g/c、a/g、t/g、a/t。本发明的与油茶种仁含油率相关的snp分子标记pb.35678.1-1129通过核苷酸序列如seqidno.11-12所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.35678.1转录本的1129bp处的碱基,其多态性为g/c。本发明的与油茶种仁含油率相关的snp分子标记pb.70158.1-51、pb.70158.1-187、pb.70158.1-306、pb.70158.1-314、pb.70158.1-408、pb.70158.1-413、pb.70158.1-419、pb.70158.1-473、pb.70158.1-649、pb.70158.1-704、pb.70158.1-707、pb.70158.1-778、pb.70158.1-854、pb.70158.1-930、pb.70158.1-935、pb.70158.1-944、pb.70158.1-1025通过核苷酸序列如seqidno.13-14所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.70158.1转录本的51bp、187bp、306bp、314bp、408bp、413bp、419bp、473bp、649bp、704bp、707bp、778bp、854bp、930bp、935bp、944bp、1025bp处的碱基,其多态性分别为g/a、a/g、c/t、a/g、t/g、t/a、a/t、c/g、a/g、g/a、a/c、c/t、a/c、c/g、t/g、a/t、c/t。本发明的与油茶种仁含油率相关的snp分子标记pb.76391.3-1354、pb.76391.3-1385、pb.76391.3-1417通过核苷酸序列如seqidno.15-16所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.76391.3转录本的1354bp、1385bp、1417bp处的碱基,其多态性分别为a/c、g/a、t/c。本发明的与油茶种仁含油率相关的snp分子标记pb.63477.1-1109、pb.63477.1-1163、pb.63477.1-1166通过核苷酸序列如seqidno.17-18所示的引物对以油茶cdna为模板经pcr扩增获得,扩增产物含有位于油茶pb.63477.1转录本的1109bp、1163bp、1166bp处的碱基,其多态性分别为a/g、g/a、a/c。本发明提供了上述48个snp分子标记在鉴定油茶种仁含油率表型中的应用,各位点的基因型及其对应的油茶种仁含油率表型如表2所示。表2序号snp分子标记高含油率基因型低含油率基因型1pb.57703.1-685ct/ttcc2pb.93518.1-182tc/ttcc3pb.93518.1-191tc/ttcc4pb.93518.1-224ga/ggaa5pb.93518.1-270ga/ggaa6pb.93518.1-284ga/ggaa7pb.93518.1-288cc/cttt8pb.103793.1-1118aa/aggg9pb.103793.1-1172ga/ggaa10pb.103793.1-1175aa/accc11pb.47687.1-148ag/ggaa12pb.47687.1-215gt/ttgg13pb.47687.1-258ct/ttcc14pb.47687.1-264ct/ttcc15pb.47687.1-282cc/cttt16pb.47687.1-297ctcc/tt17pb.47687.1-360ag/ggaa18pb.47687.1-366tc/cctt19pb.47687.1-367gc/ccgg20pb.85097.1-125gc/ggcc21pb.85097.1-197gc/ggcc22pb.85097.1-293aa/aggg23pb.85097.1-356tg/ttgg24pb.85097.1-532aa/attt25pb.35678.1-1129gc/ggcc26pb.70158.1-51ga/ggaa27pb.70158.1-187aa/aggg28pb.70158.1-306cc/cttt29pb.70158.1-314aa/aggg30pb.70158.1-408tg/ttgg31pb.70158.1-413ta/ttaa32pb.70158.1-419aa/attt33pb.70158.1-473cc/cggg34pb.70158.1-649aa/aggg35pb.70158.1-704ga/ggaa36pb.70158.1-707aa/accc37pb.70158.1-778cc/cttt38pb.70158.1-854aa/accc39pb.70158.1-930cc/cggg40pb.70158.1-935tt/tggg41pb.70158.1-944ttat/aa42pb.70158.1-1025cc/cttt43pb.76391.3-1354aa/accc44pb.76391.3-1385ga/ggaa45pb.76391.3-1417tt/tccc46pb.63477.1-1109aa/aggg47pb.63477.1-1163ga/ggaa48pb.63477.1-1166aa/accc本发明所述的含油率为油茶种仁的含油率。各snp分子标记可分别单独用于或联合用于油茶种仁含油率表型的鉴定,联合使用时鉴定的准确率更高。本发明还提供与油茶种仁含油率相关的snp分子标记组合,其包括pb.57703.1-685、pb.93518.1-182、pb.93518.1-191、pb.93518.1-224、pb.93518.1-270、pb.93518.1-284、pb.93518.1-288、pb.103793.1-1118、pb.103793.1-1172、pb.103793.1-1175、pb.47687.1-148、pb.47687.1-215、pb.47687.1-258、pb.47687.1-264、pb.47687.1-282、pb.47687.1-297、pb.47687.1-360、pb.47687.1-366、pb.47687.1-367、pb.85097.1-125、pb.85097.1-197、pb.85097.1-293、pb.85097.1-356、pb.85097.1-532、pb.35678.1-1129、pb.70158.1-51、pb.70158.1-187、pb.70158.1-306、pb.70158.1-314、pb.70158.1-408、pb.70158.1-413、pb.70158.1-419、pb.70158.1-473、pb.70158.1-649、pb.70158.1-704、pb.70158.1-707、pb.70158.1-778、pb.70158.1-854、pb.70158.1-930、pb.70158.1-935、pb.70158.1-944、pb.70158.1-1025、pb.76391.3-1354、pb.76391.3-1385、pb.76391.3-1417、pb.63477.1-1109、pb.63477.1-1163和pb.63477.1-1166中的至少两个。第二方面,本发明提供用于扩增所述snp分子标记或其组合的引物。作为本发明的一种实施方式,所述引物包括以下引物中的一对或多对:如seqidno.1-2所示的pb.57703.1-685的引物;如seqidno.3-4所示的pb.93518.1-182、pb.93518.1-191、pb.93518.1-224、pb.93518.1-270、pb.93518.1-284、pb.93518.1-288的引物;如seqidno.5-6所示的pb.103793.1-1118、pb.103793.1-1172、pb.103793.1-1175的引物;如seqidno.7-8所示的pb.47687.1-148、pb.47687.1-215、pb.47687.1-258、pb.47687.1-264、pb.47687.1-282、pb.47687.1-297、pb.47687.1-360、pb.47687.1-366、pb.47687.1-367的引物;如seqidno.9-10所示的pb.85097.1-125、pb.85097.1-197、pb.85097.1-293、pb.85097.1-356、pb.85097.1-532的引物;如seqidno.11-12所示的pb.35678.1-1129的引物;如seqidno.13-14所示的pb.70158.1-51、pb.70158.1-187、pb.70158.1-306、pb.70158.1-314、pb.70158.1-408、pb.70158.1-413、pb.70158.1-419、pb.70158.1-473、pb.70158.1-649、pb.70158.1-704、pb.70158.1-707、pb.70158.1-778、pb.70158.1-854、pb.70158.1-930、pb.70158.1-935、pb.70158.1-944、pb.70158.1-1025的引物;如seqidno.15-16所示的pb.76391.3-1354、pb.76391.3-1385、pb.76391.3-1417的引物;如seqidno.17-18所示的pb.63477.1-1109、pb.63477.1-1163、pb.63477.1-1166的引物。本发明还提供含有所述引物的试剂或试剂盒,所述试剂或试剂盒包含如前所述引物中的一对或多对。第三方面,本发明提供所述的snp分子标记或所述的snp分子标记组合或所述的试剂或试剂盒的以下任一应用:(1)在鉴定油茶种仁含油率表型中的应用;(2)在油茶种质资源鉴定、改良或分子标记辅助育种中的应用,所述油茶种质资源鉴定、改良或分子标记辅助育种的性状为油茶种仁含油率;(3)在油茶种仁含油率的早期预测中的应用;(4)在筛选高含油率油茶中的应用。在利用本发明提供的48个snp分子标记进行油茶种仁中含油率表型鉴定或分子标记辅助育种时,本领域技术人员根据需要可以选择其中任意一个分子标记或多个分子标记的组合。多个标记联合使用,鉴定的准确率更高。第四方面,本发明提供鉴定油茶种仁含油率表型的方法,包括:(1)提取待鉴定油茶的总rna,反转录合成cdna;(2)以cdna为模板,利用上述的引物(seqidno.1-2、seqidno.3-4、seqidno.5-6、seqidno.7-8、seqidno.9-10、seqidno.11-12、seqidno.13-14、seqidno.15-16、seqidno.17-18)中的一对或多对进行pcr扩增;(3)分析pcr扩增产物中上述的snp分子标记或snp分子标记组合的基因型,根据所述基因型判断待鉴定油茶的种仁含油率表型。上述方法的步骤(1)中,所述待鉴定油茶可以为任何育种材料,包括自然群体个体和有性群体个体。提取油茶总rna采用rnapreppure多糖多酚植物总rna提取试剂盒(离心柱型,tiangen试剂盒codeno.dp441)。反转录合成单链cdna采用primescriptrtmastermix试剂盒(takara,大连,中国)。步骤(2)中,所述pcr扩增的反应程序为:94~95℃,3~5min;94~95℃,15~30s,65~69℃,40~60s,38~45个循环;67~70℃,3~6min。优选为,95℃,3min,1个循环预变性;95℃,15s变性,68℃,45s延伸,40个循环;68℃,5min,1个循环彻底延伸。步骤(2)中,在所述扩增后,通过琼脂糖凝胶电泳检测并回收所得到的pcr产物。作为一种实施方案,所述琼脂糖凝胶电泳中,琼脂糖凝胶的浓度为1.2%。胶回收使用axyprepdna凝胶回收试剂盒(axygen,codeno.ap-gx-50)。步骤(3)中,分析snp分子标记的基因型可采用本领域常规技术手段,例如测序等,可以seqidno.1-2、seqidno.3-4、seqidno.5-6、seqidno.7-8、seqidno.9-10、seqidno.11-12、seqidno.13-14、seqidno.15-16、seqidno.17-18为测序引物进行测序。步骤(3)中所述判断待鉴定油茶的含油率表型的方法为:根据表2中所示的snp分子标记中多态性位点的基因型及油茶种仁含油率表型的对应关系中的一组或多组进行判断。以pb.57703.1-685为例,若该snp分子标记的基因型为c/t或t/t时,待鉴定油茶为高含油率,若该snp分子标记的基因型为c/c,则待鉴定油茶为低含油率或候选低含油率。其它位点基因型及其在油茶含油率鉴定中的应用参见表2。作为优选方案,当扩增产物中包含48个所述snp分子标记中的多态性位点时,若超过39个位点为高含油率基因型,则待鉴定油茶为高含油率表型;若少于等于30个位点为高含油率基因型,则待鉴定油茶为低含油率表型;更优选若少于等于28个位点为高含油率基因型,则待鉴定油茶为低含油率表型。进一步优选的,所述的39个高含油率基因型位点中包含pb.70158.1-930、pb.70158.1-935、pb.103793.1-1118、pb.103793.1-1172和pb.103793.1-1175中的多态性位点。本领域人员可以参照上述鉴定油茶种仁含油率表型的方法,对种仁为高含油率表型的油茶进行鉴定和筛选。本发明的有益效果在于:本发明开发了48个与油茶种仁含油率高度关联的snp位点,可以解释10.23%~32.66%的含油率表型方差。利用这48个标记对有性油茶群体进行了辅助选择,结果表明,在48个位点中超过39个位点为高含油率基因型的单株中,76.58%的个体其种仁含油率高于群体种仁含油率平均值;在48个位点中高含油率基因型少于等于30个位点的个体中,80%的个体其种仁含油率低于群体平均值;在48个位点中高含油率基因型少于等于28个位点的个体中,87.10%的个体其种仁含油率低于群体平均值。这表明这些标记用于辅助选择是切实有效的。在油茶常规选择育种中,种仁含油率性状的鉴定需要幼苗造林5-6年才能鉴定,费时费力。本发明中的snp位点位置明确,检测方法方便快速,不受环境影响,目的性更强,工作量小,效率更高,成本低。因此,通过检测该批snp位点,可在苗期进行鉴定和辅助筛选,大大节约生产成本和提高选择效率。在油茶育种中,可选择本发明的分子标记及其检测方法鉴定高含油率油茶进行育种,可提高油茶育种的选择效率,加快育种进程。具体实施方式以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。以下实施例中所用的自然群体材料500份单株,均由中国林业科学研究院亚热带林业研究所木本油料育种与培育研究组收集、评价,并保存于浙江金华婺城区东方红林场种质资源圃。实施例1油茶种仁含油率分离群体的构建及性状测定本实施例中使用普通油茶资源收集圃内500份种质资源的自然群体,其起源地涵盖我国油茶主产区的大部分,包括浙江省、湖南省、江西省、广西区、福建省、广东省等。500个体待果实完全成熟后(5%果实开裂),采集种子,采用索氏抽提法测定种仁含油率。其操作步骤如下:(1)制备中速滤纸包,并放入铝盒内,105℃烘至恒质量,记录铝盒和滤纸包质量(w1)。(2)适量油茶种子剥去硬种皮,105℃烘至恒质量,用粉碎机粉碎后,装入滤纸包内包扎好,记下铝盒、滤纸包和试样的总质量(w2)。(3)采用瑞士buchi索氏提取仪b-811lsv,将称好质量的试样滤纸包放入浸提瓶中,加入约100ml石油醚,提取6h,回收石油醚,将滤纸包(内有残渣)放入铝盒内于105℃烘至恒质量,记下铝盒、滤纸包和残渣的质量(w3)。种仁含油率=[(w2-w3)/(w2-w1)]×100%油茶种仁含油率测定结果表明:自然群体种仁含油率呈正态分布,说明该性状具有数量性状特点。实施例2油茶三代转录组测序及注释分析1、三代测序样本rna的提取:采集油茶“长林4号”的根、嫩叶、成熟叶片、花瓣和未成熟种子,采用rnapreppure多糖多酚植物总rna提取试剂盒(离心柱型,tiangen试剂盒codeno.dp441)分别提取rna,具体步骤如下:(1)首先在1.5ml离心管中加入500μl的裂解液sl(使用前检查是否已加入β-巯基乙醇)。取0.1g样本材料加入液氮充分研磨,迅速将研磨好的样本粉末加入到离心管中,立即旋涡剧烈震荡混匀。(2)12000rpm离心2分钟。(3)将上清液转移至过滤柱cs上(过滤柱cs放在收集管中),12000rpm离心2分钟,小心吸取收集管中的上清至新的rnase-free的离心管中,吸头尽量避免接触收集管中的细胞碎片沉淀。(4)缓慢加入0.4倍上清体积的无水乙醇,混匀(此时可能会出现沉淀),将得到的溶液和沉淀一起转入吸附柱cr3中,12000rpm离心15秒,倒掉收集管中的废液,将吸附柱cr3放回收集管中。注意,若果上清液体积有损失,请相应调整乙醇的加量。(5)向吸附柱cr3中加入350μl去蛋白液rw1,12000rpm离心15秒,倒掉收集管中的废液,将吸附柱cr3放回收集管中。(6)dnasei工作液的配制:取10μldnasei储存液放入新的rnase-free的离心管中,加入70μlrdd缓冲液,轻柔混匀。(7)向吸附柱cr3中央加入80μl的dnasei工作液,室温放置15分钟。(8)向吸附柱cr3中加入350μl去蛋白液rw1,12000rpm离心15秒,倒掉收集管中的废液,将吸附柱cr3放回收集管中。(9)向吸附柱cr3中加入500μl漂洗液rw(使用前请先检查是否已加入乙醇),12000rpm离心15秒,倒掉收集管中的废液,将吸附柱cr3放回收集管中。(10)重复步骤9。(11)12000rpm离心2分钟,将吸附柱cr3放入一个新的rnase-free的离心管中,向吸附膜的中间部位悬空滴加30-50μlrnase-freeddh2o,室温放置2分钟,12000rpm离心1分钟,得到rna溶液。2、三代转录组测序与注释分析:通过纯度和浓度检测的五个组织样品总rna,等比例混合,利用clontechpcrcdna合成试剂盒进行反转录合成单链cdna。利用kapahifipcr试剂盒以单链cdna为模板进行第一轮pcr扩增,生成双链cdna。生成的双链cdna利用bluepippin分成0.5-2kb,2-3kb,3-6kb三个长度片段库。然后进行第二轮pcr扩增产生充足的cdna,构建pacbiosmrtbell文库,在pacbiosequel平台进行三代转录组测序。利用smrtlink5.0软件处理测序数据。测序结果过滤掉低质量数据和冗余序列后,生成ccs。根据序列是否含有5’primer,3’primer和polya尾巴,将所有的ccs分为全长和非全长序列两大类。全长的ccs采用ice算法在缺省参数条件下进行聚类分析产生cs。利用arrow和lordec(http://www.atgc-montpellier.fr/lordec/)软件进一步过滤cs,利用cd-hitv4.6(ful,niub,zhuz,wus,liw,2012.cd-hit:acceleratedforclusteringthenext-generationsequencingdata.bioinformatics28,3150-2.)软件去除冗余序列。利用codingpotentialcalculator(cpc)(kongl,zhangy,yez-q,etal.,2007.cpc:assesstheprotein-codingpotentialoftranscriptsusingsequencefeaturesandsupportvectormachine.nucleicacidsresearch35,w345.)和coding-non-codingindex(cnci)(https://github.com/www-bioinfo-org/cnci)软件在参数缺省条件下进行转录本的蛋白编码潜能预测。未通过蛋白编码潜能检测的转录本进一步在swiss-prot数据库中比对,若在swiss-prot数据库中仍无注释,则认为该转录本为长链非编码rna。其它的转录本进一步在nr、swiss-prot、cog、kegg和go等数据库中比对,注释转录本。实施例3油脂高速合成期种仁转录组测序及多态位点识别1、500个油茶无性系油脂高速合成期种仁总rna提取:利用rnapreppure多糖多酚植物总rna提取试剂盒(离心柱型,tiangen试剂盒codeno.dp441)分别提取各无性系未成熟种仁的总rna(见实施例2)。2、二代转录组测序:通过纯度和浓度检测的各样品总rna,去除其中的核糖体rna,以最大限度地保留所有codingrna和ncrna。得到的rna随机打断成短片段,再以片断化后的rna为模板,用六碱基随机引物(randomhexamers)合成cdna第一链;接着加入缓冲液、dntps(dutp代替dttp)、rnaseh和dnapolymerasei合成cdna第二链,经过qiaquickpcr试剂盒纯化并加eb缓冲液洗脱,经末端修复、加碱基a,加测序接头,然后通过ung(uracil-n-glycosylase)酶降解第二条链。用琼脂糖凝胶电泳进行片段大小选择,进行pcr扩增。最后建好的测序文库用illuminahiseqtm4000平台进行二代转录组测序。3、多态位点识别:为了保证数据质量,对下机后经过初步过滤得到的cleanreads进行进一步更严格的过滤,得到高质量的cleanreads,用于后续的信息分析。过滤的步骤如下:(1)去除含有接头的reads;(2)去除全部都是a碱基的reads;(3)去除含n比例大于10%的reads;(4)去除低质量的reads(质量值q≤20的碱基数占整条reads的50%以上)。采用tophatv2.1.1(trapnellc,robertsa,goffl,etal.,2012.differentialgeneandtranscriptexpressionanalysisofrna-seqexperimentswithtophatandcufflinks.natureprotocols7,562-78.)软件将每个样本的高质量的reads比对到参考转录组序列上(见实施例2)。剔除没有比对上的序列,其余序列利用bcftoolsv1.9软件(http://www.htslib.org/doc/bcftools.html)识别snp位点。识别的snp位点经过严格过滤,获得高质量的snps数据。过滤标准如下:(1)位点上只有2个等位基因;(2)基因型缺失率≤20%;(3)最小等位基因频率(maf)≥5%;(4)snp质量值≥100;(5)纯合子基因型的样本数大于10个;(6)杂合基因型样本率≤70%。实施例4与油茶种仁含油率相关的snp位点的筛选1、群体结构分析:利用gctav1.25.2(jiany,shongl,goddardme,visscherpm,2011.gcta:atoolforgenome-widecomplextraitanalysis.americanjournalofhumangenetics88,76-82.)软件对油茶自然群体进行主成分分析(pca),利用前10个主成分(pc)作为固定效应用于后续的关联分析(表3)。表3自然群体部分个体的前10个pc值2、关联分析:将所有样本的snps位点数据、前10个pc值数据、表型数据(见实施例1)及kinship矩阵数据导入tassel5.0软件中,采用mlm法分析snps与种仁含油率性状的连锁不平衡性,筛选与种仁含油率显著关联的分子标记,经多重检验校正,检测到了48个跟含油率存在极显著关联的位点,这些位点位于9个转录本内,18个位于非编码区,30个位于编码区,引起21个非同义突变,9个同义突变,对含油率差异的贡献率为10.23%~32.66%(见表1)。实施例5本发明中的48个分子标记在油茶高油育种中的应用(1)选择一个油茶杂交f1代家系群体为材料(母本为长林53号,父本为长林40号,均为国家审定良种,良种号分别为“国s-sc-co-012-2008”和“国s-sc-co-011-2008”),采集嫩叶提取总rna(见实施例2)。以rna为模板,采用clontechcdna合成试剂盒反转录生成单链cdna,并稀释100倍,作为工作液。(2)利用seqidno.1-18所示的引物对对单链cdna工作液分别进行pcr扩增,反应体系如表4所示:表4pcr扩增程序为:(3)pcr扩增产物进行凝胶检测和纯化回收并测序、基因分型。凝胶检测和纯化回收按照axyprepdna凝胶回收试剂盒(axygen,codeno.ap-gx-50)说明书进行,其流程如下:①配制1.2%的琼脂糖凝胶,将50μl扩增产物全部上样,电泳电压为5v/cm,电泳约20分钟至上样缓冲液中二甲苯青达到距离凝胶前端1cm处时停止电泳。②在紫外灯下切下含有目的dna的琼脂糖凝胶,用纸巾吸尽凝胶表面的液体并切碎。计算凝胶重量,该重量作为一个凝胶体积(例如100mg=100μl体积)。③加入3个凝胶体积的bufferde-a,混合均匀后于75℃加热,每2~3分钟间断混合,直至凝胶块完全熔化。④加入0.5个bufferde-a体积的bufferde-b,混合均匀。⑤将上述溶液转移到dna制备管中,12000rpm离心1分钟,弃滤液。⑥加入500μlbufferw1,12000rpm离心30秒,弃滤液。⑦加入700μlbufferw2,12000rpm离心30秒,弃滤液。以同样的方法再用700μlbufferw2洗涤一次,12000rpm离心1分钟,弃滤液。⑧将制备管放回离心管中,12000rpm离心1分钟。⑨将制备管置于洁净的1.5ml离心管中,在制备膜中央加25~30μl去离子水,室温静置1分钟。12000rpm离心1分钟洗脱dna。⑩凝胶回收dna,以对应的扩增引物为测序引物,采用一代测序测定扩增产物核苷酸序列,用chromas软件判读测序峰图上每个snp位点的基因型。(4)分别鉴定所有个体的48个位点的基因型。对照表2中各位点的基因型与含油率高低的关系,若某油茶单株在48个位点中有超过39个位点为高含油率基因型,则该油茶个体为高含油油茶;若某油茶单株在48个位点中为高含油率基因型的位点不足30个,则该油茶个体为低含油油茶;若高含油率基因型位点数在30~39个,则该油茶个体为需要进一步验证含油率的油茶。(5)采集所有f1代个体完全成熟种子,测定其种仁的含油率(见实施例1)。结果表明,在48个位点中超过39个位点为高含油率基因型的单株中,76.58%的个体其种仁含油率高于群体种仁含油率平均值(37.79%);在48个位点中高含油率基因型少于等于30个位点的个体中,80%的个体其种仁含油率低于群体平均值(37.79%);在48个位点中高含油率基因型少于等于28个位点的个体中,87.10%的个体其种仁含油率低于群体平均值(37.79%)(表5)。这表明该标记用于辅助选择是切实有效的,可用于早期鉴别或辅助鉴别,可大大节约生产成本,提高选择效率,加快油茶高油育种进程。表5f1单株的种仁含油率及基因型数据注:表中“..”表示基因型缺失。虽然,上文中已经用一般性说明、具体实施方式及试验,对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。序列表<110>中国林业科学研究院亚热带林业研究所<120>与油茶种仁含油率相关的snp分子标记及其应用<130>khp201112306.6<160>27<170>siposequencelisting1.0<210>1<211>20<212>dna<213>人工序列(artificialsequence)<400>1ctgcccgagtcggttatctc20<210>2<211>20<212>dna<213>人工序列(artificialsequence)<400>2catgcgttctgcaactccat20<210>3<211>20<212>dna<213>人工序列(artificialsequence)<400>3aacagcaatggattctttct20<210>4<211>21<212>dna<213>人工序列(artificialsequence)<400>4ctgaaatcaatttcactcttc21<210>5<211>20<212>dna<213>人工序列(artificialsequence)<400>5aaacaccacacacacacagc20<210>6<211>20<212>dna<213>人工序列(artificialsequence)<400>6aaagtttttgtaaacataaa20<210>7<211>20<212>dna<213>人工序列(artificialsequence)<400>7aatcaagtttcagctcctct20<210>8<211>21<212>dna<213>人工序列(artificialsequence)<400>8cgaaccgatcttggttttaat21<210>9<211>20<212>dna<213>人工序列(artificialsequence)<400>9gcacaaggacttatacatag20<210>10<211>20<212>dna<213>人工序列(artificialsequence)<400>10ttacttatttcataattgtt20<210>11<211>20<212>dna<213>人工序列(artificialsequence)<400>11acagctctctctatctctaa20<210>12<211>20<212>dna<213>人工序列(artificialsequence)<400>12caaacaaaggtacctcataa20<210>13<211>21<212>dna<213>人工序列(artificialsequence)<400>13acacacacacacagcagagga21<210>14<211>23<212>dna<213>人工序列(artificialsequence)<400>14agcagcaccaaccaagcaatgac23<210>15<211>20<212>dna<213>人工序列(artificialsequence)<400>15gtactctgcgttgataccac20<210>16<211>20<212>dna<213>人工序列(artificialsequence)<400>16acaggcacaagattatacat20<210>17<211>20<212>dna<213>人工序列(artificialsequence)<400>17acacacacacagcagaggaa20<210>18<211>21<212>dna<213>人工序列(artificialsequence)<400>18tccacttagtatggtacagcc21<210>19<211>1748<212>dna<213>人工序列(artificialsequence)<400>19ctgcccgagtcggttatctctctcgaacttcaatcctagattgactgtgccatgtatgta60ccttaggatccacttcactgcctgccagtgatcttttcctggatcatgcatatacctgct120taccatactcacagcatgcgagatgtcaggtcttgtacaaaccatagcatacattaatgc180accaactgcatttgcatatggaacctgtgccatatgcttccgttcttcttctgtgcgtgg240agacatcgaagcactaagcttgaaatgaggggccaatggtgtacttacagctttggtttt300cccattgatgccaaatctgtctaacaccttcttcagatactgggtttgtgtcagacaaac360cgtgcccttcttcctgtctctcttgatctccatgccaagaactttctttgcttctcccaa420atccttcatttcaaactcccttgctaactgtgctttgagtttgtcaatctccaccttgct480cttagatgcaattagcatatcatctacatataagagcaagtagatgaaggaaccatcggg540aagcttacggaaatatacacaatgatcaaattgacttcttgtgtattctttctctatcat600gaaccgatcaaatcgcttgtaccactgtctcggggattgcttcaatccgtacaacgattt660ggtcagcttacaggcccaattctcctttccagcaactttgaagccatctggctgggacat720gtatatctcctcttcgagatctccatgtaagaaggcagttttgacgtcgagttgggcgag780ctcgagatcaaactgtgcaaccaaagctaacaggatgcgaatagacgtgtgcttcacaac840aggtgagaatacctcattgtagtctattccttccttctgagcatagcctttagctaccaa900tctagctttgaatctgatgttgtcgttgcctggaatgccttctttcttggtgtaaaccca960cttacacccaattgctttcttgccttttggaagttgcaccaactcccaagtctggttctt1020gtgaagtgaaccgatctcttcatccatagcctccttccatttgacactttctggatgctg1080cacggcttctttgaaagtgcacggaacattgtcttcaatgattggaagtgcataggctac1140catatcggtcatccaactgggttgcttagtaaccctttttcctttcctgattgcaatagg1200ttctgactgttgcggagcctctggatcttcatctgaactctcttcagagctatcttctga1260gacttcttcaggatggttgattggctgactagtctttgatggagtctcaaactccacctg1320cactgacttcttcaatgcttcaacattctgttgaggatctggttgcttcaacattgcaga1380ctcatcaaaggtaacatctcttctgatgagaactttctttgattcagggcaccacagtct1440gtatcccttaacaccgtcaccgaagcccaagaagatggctttcttggctcttggatccaa1500cttagattctgtaacatgaaaataagccggacatccaaagatacgtaactgatcataatc1560agtaactgggactcctgaccatacctccatgggagtcttcccattcagtgctgcagtagg1620tagtctgttgactagatgacgagcatagttcaatgcctcgccccaaaacgccttgcttaa1680tccagactgtgacagcatacaccggactttctccaccaaagtgcggttcatgcgttctgc1740aactccat1748<210>20<211>1415<212>dna<213>人工序列(artificialsequence)<400>20aacagcaatggattctttctctcctaacttccctcccatggcgtcctcctcatcatcagc60taatgtcttccatctccttcatctttttcaccaaaaagtccaaaaaaccaaccaaccttc120ctccaaccccaccaacccttcccatcatcggcaacctccaccaactcggcaagctccctc180atcactcacttacccaactctcaaagaaacacggccctgtcatgctcttgagacttggcc240aagtcccatgccttgtcgtttcgtcccccgaaacagccaaacaggtcctaaaaactcatg300atctcgaatgttgcagtagacccttctctcacggccccaaaagactgtcttacaatctcc360tagacttggcttttgggccttacagcgattactggagagaaatgcgaaagctctgcgtga420tcgagcttttcacagtgaaaagggttcattcatttcgacacgttagagaagaagagttgg480gtaagatgatcagacaaatcactcaaatctctcctaataatccactcaatttgagcgagt540tggtattctctctcacgaactcaattatttgtaaggttgcgtttgggaagagctatgagg600ggaagcaatttgagagtggtaagtttcaagagagtatggatgaggctatggccatgttga660gtagcttttggggggcggatttctttccgtatgtaggttggtttgttgatgtatttacag720gactccattggaggcttgagaaatgctttcgtgagtttgatttgttcttcgagagggtca780tgttatcctgatagtatgcatcttgtaatttcgcccctaacaggtcaaagtctgagcatg840aagttattattgacatcttgttaggggtgtccaaggataaaagaatactcttttctgctt900accccaaatgcatcattcttattaacccaggccaattctctgacaatatttatcctccta960aactgagtcgaagcagtgcacacccagttcctagttacacatatcgtcaaaaatgaggca1020aattgcatacccgtagaatagcaagaccaagagaatgaaacaaagttacaccagcagaga1080ccagaactaaggtctagttgctattgcgaagaaaacagacaggtcgatgaaaccgcaact1140agacacagctaaatgtacttaaaaatatgctggttggtgaaaggagacttttcaggctcc1200acccaacacgtcacatttcctaattccccgagatgtcgcgattcgctgtacaaatcagct1260agatcggagtgcccctacgagtttatcccaaaaacagaagaataatagtcaaatgaatga1320gagcacattgagaagcgacctagccaaattatggtcacccaactacccagaagagttcta1380ccaagagaggttgagaagagtgaaattgatttcag1415<210>21<211>1859<212>dna<213>人工序列(artificialsequence)<400>21aaacaccacacacacacagcaaggaaaaatgaaaagcattccagagatgttactgtgttg60tagttctgatcataagccaattcctcttggggggtttggaacagctgtttatcctcttgc120atcctctgaaaccatgaaacaatccttcctccatgcaatcaaacttggttacagacactt180cgactctgcagctttataccagtcagagcagcctcttggagaatcaattgttgatgccat240acgcctaggcttcattcaatctcgccaagacctcttcatcacctctaagctttggtgttc300tgatgctcaccctcatcatgtcctccctgctcttcaaagttcactcaagtaattcataac360tgctgctcttttaatgttattatgctccgtaaatctttctctttcttttttatcagcgaa420agtcgcttgttatgctccataaatcattatttatattcttttgttatatactagtttttt480tataaattatttttttaatccctctaatttgatgattttgatatacttatcaatctcttg540gcttctatacgtaaaaaaaataaacgaaaatttaaacataatgatcaaattgaaacggac600gtaaagtgcaaggatttaaggacaaaaaataaaaggaagaattacactgacatgaatatc660aataaaaaaatattatgaatgttaataattaatgttataaactttttttttattaattta720taattttttctctctaacaccactatcaggtagttttcccaaaatataattttgcttagt780tggttttttttttttaattattatttattatagaaatcttggattggaataccttgatct840gtatctcattcactggccagtgagttcaaagccagggaaatttgagtatccagtgaacaa900gcaagagcttcttcccatggatttcaagtctgtttgggaagccatggaggagtgtcagaa960tcttggcctcacaaaattcattggagtcagtaacttctcatgcaagaagctccaactatt1020actagcaaccgcaaagatccctccagctgtcaaccaggtcgagatgaacccactttggca1080acagaagaagctaagagagttttgtgagaaaaaaggtattcatatcacagcttactctcc1140tttgggcgccaaaggaacaatttggggaagtgacaaagtcatggaatgtgaggtgctcaa1200acagattgccaaagctagaggaaaatctgttgcccagtcaccggttaatctagagggaaa1260gaaaaagggaattacccccaattaatgccccatattagcttctctaaaattaatggatgc1320ttcctaaggatcaatcacggatgagcacattgaactattcatgtgattgagagcccacac1380agcccaagcacaacgacgcaattatcacggcgcgctctaccactgaactaataactcatc1440gtgcgagcctcctagtgggggctcactatgccaaaagcaagagaaacccccatccctctc1500tttcctttttttggccctcaaattctatccttggtttgtctcagatgggtttatgagcaa1560ggggtgagtgttttggtgaagagcttcagtgaggagaggatgaaagagaaccttcaaata1620gttgattgggagctaggcgcacaagactccgagatgataaatcaaatttcacaatataaa1680ggatgtgctggacttgatttcatatcagatgaaggcccttacaaatctctccaggattta1740tgggatggtgaaattgtttgatcctgtaaacgtgtagccaaaaaccacttggataccgtt1800tgataacattttatgcttacaacacaaatgaatgtgtgttttatgtttacaaaaacttt1859<210>22<211>1668<212>dna<213>人工序列(artificialsequence)<400>22aatcaagtttcagctcctctctctctctctccctccctctccatggattccaaagtagaa60atgttcttcttacaaaatgtaatcgggagaggccacattctttcagctatagacacagca120aggctatttgcagctcagggagccaaaatcaccataataataacacaagcatatgcccag180ctcttccagaaaaccttagagagagaccagtcacgaggccatgacatcaacttccacatc240ttcaaattacccacctccgacttcggcttgcccgacggatgtgagactctcctcgccgcc300tctgccggcattatggctaagctttacatggccttcgagacgctccatgaacccatcgaa360caacttgtccgagaacgccgccctgattgcatcgtcagcgacatgttccatccttggact420gccgaccttggtgctcgactcggcattccgaggttcttatactatgttacaggtttgttc480cctctgtgttgcgaagagagcattcgacggaatgcaccacatgacaaagtaaattctgat540gcagagacatgtgctttgccgggtctcccgatgataacatcataattaccaagagtaaaa600tccaatactggtttaaggagaaaggatctggttatggacaattacgtgacgaggttctaa660agtctgagctgaaaagctatggggttataattaacagcttttacgagtaggaaccagctt720atgctgattatttcaataatgaaatgggcagaaagctatgtctcgtaggaccggagtgcc780tcttcaacaaagccttcgaagaaaaggcggagcggggtgcaaagaactccattgatggaa840atacaattttgaaattgctggactccaaacaacctaagtcagtgctttatgttttcggga900gtcaggctagtatggctcctgaacagtacctcgaggatgctcatgggctcgaggcttctg960gttgcccattcatttgggtggcccgagatatgtcagagtacggccaagaagagaaagaaa1020agaaaggaggaaatgaaagtcgcggcaaaaagctaccagagggatttgaagagaggatga1080ccaagtccggacaagggttgatattaaagaagtgggcaccacagttgttaattttagaac1140atgccaatattggagggttcttgacacacagtggatggaactcgacgattgagggaatag1200gagcgggtgttccgatgatcacatggccgttcatagcggaacaattcttcactgaaagcc1260ttgtcgtggatgtgttgaaggttgggattcgtgtggggaatgaggaatggtcatcttata1320tttgggaacccaagttgactgtgaccagagagaaggtggaggcggcggtgaagtggctga1380tgggtggtggtgggggtgatgaagtggaggagatgagaaggcgagtaaagcagttgagtg1440agaaggctaagaaagctatagaccatggtggctcgtccaatgctgatgtcattgctttga1500tcaatgaacttaaatctcgccggacattttgcgaatatttatggtggaggaaggaggatg1560attctaaaattttattaggtagttttgttataatagcattcttgcatttttatcaaaatt1620ttagagggggaggggcggaagaagggaattaaaaccaagatcggttcg1668<210>23<211>1564<212>dna<213>人工序列(artificialsequence)<400>23gcacaaggacttatacatagtttttaacatacaattagggaaaggcaagagttctaccat60cttatttcatatagatactttatttttatttttaacatgagtagacaacaatgccctcct120ctaactttcaaatccttcccaatcatatttgatagggacaagatcaagagacaacttctt180atgcacagtcaagccagcctcctcttccaagctgatatctttcctttccatcccataagg240catttcccagtcaaaacagtgcaaaagatttgccagagtaaattccacagctatggcacc300cattgtcaaaccggggcaaatcctccgacccgctccaaatggcaacaactcgaaattatt360acccctgaaatcaatttcactcttctcaaacctctctgggtagaactcttctgggttgtt420ccaaatttctgggtctcttccaattgcccaggcattgactaggattcttgttttggggta480aacgtcgtagcctccgatcttgcaatgttgcatcgactcgcggggaattagaaatgtggc540tggtgggtgtagcctgaaagtctctttcaccaccatttttaagtaattgagcttgtcaag600ttgggtttcatcgactgtctgttttcttccaatgcaactccttatttctgcttgaacttt660tttcattactcttgggttcttggctagctcggtcattgcccatacaattgtaagagaact720ggtgtctattccaccgacaaatatgtcctgaaattcaaaatatattttatctaaattgag780aaaattcgtgattgcgaacatatgacaagtccaataggtagcttttggtgtctacaattc840tttccacatgagtttggcatcaacttgaaaagggtcattacctttcatttggttggtttt900caaaatttatttttaaaaattaaaacactgtattttcaaaggttaaaaatattttttcaa960attaaaatatttatttagtaaaaacccagttccaaacaataggaaaatatcaacccatcg1020caaggccctataggaaaattttaacccatcgtaagacccaataagaaaatttcagcccat1080cttcaggccccatgggagaatttcaacccattgcaagcccaatggaaaaatttaacttca1140tcagttctgccacgtggcaagacaccgttgagtcatttttaaattggttttaatggctct1200ctatatccccttcttggacgatgtgagaaaacaaattttatttgccaagcaatattaaaa1260aggaaatgtttggtggtccagatttctgtagtttaaatgatttgaatgtatcaaaatgac1320gttattttacacttaaaatgatattattttagatagttcgagccattcgagtcatgattt1380ttcaggccacctatcattgttgtatataaaatttaaattcttaaatttatttacaatgtg1440ggtgtttgggaattgagttttttttgtaggttttttagttgtaagatattattagaggaa1500tttttttttgtggttaaatgtgatgtttatgagagaaaaaatgaaacaattatgaaataa1560gtaa1564<210>24<211>1347<212>dna<213>人工序列(artificialsequence)<400>24acagctctctctatctctaacactcttttcaacagtctctctccgtgtagtagaagccct60tacaatggctgctgcgaccagtgcttcaatcgttgcttcttcggctcaaactctatttgc120agctcggtctgtttctaccaacaatgctgatccctctgtctcaaattcatatgctcgtag180tttcatgggggctcgcttgtcgggatatctccgaaagaataggaaatccattaagattag240cggaaagataactgctgctgctactgctgttgaaacaactcctgtggttgaggaagtcaa300agagttttcacttcctacttgggctgaatttgaccttggaagagctcctgtctattggaa360aaccatgaatggtcttcctccaacttccgtaagtttgacactgccaatgcagctcagttt420tagaactaaagcatttttaaaaaaaaaatatttcttcattaatctttggattgatcatgc480attaacaaactttgacagggggagaggctgaggattttctacaaccccactgcaaccaaa540cttattccaaatgaagagtttggaattgcttttaatggagggtttaatcagcccatcatg600tgtggtggtgagccaagggcaatgctcaggaaaggtcgaggcaaagctgatctcccaata660tattaaatccagatatgtatacctaagcacgccataaatttgatcttctcattcacaaac720ggagtcgagtgggatggtccctacaggctgctgtttcaagttccaaagccttggcaaaac780aaaccaattgactttttcaataagggtcttgcagacgagttgagcaaagatggtgcttgt840gacaaagcaatatttcctgatacaaacattgtcgtcacaagatgtgctatgattggtaat900ttgaccgtcgaaggagtaagtgaaacttctcttattctttcatcgaaagagctagtgtca960actagttttaacgactgccaatggtgtcccaatgcagggtgatcgctgcaatcttgacct1020tgtaccgggatgcactgaccctagctcacatttgtatgacccacttgccaacgtagatga1080tggatcatgtccaattgacacagtgtcagaggaataacataatcttttgggggctgggaa1140gtaaaaaaatattatcgatatctcttagtgttgataatcttttgggggctgtcaaagtca1200tgatatattttcaggcacttttttggttcatcattgccttgttttgtaaattgttatatg1260ttgatatgccattagaatgttgataaacctgccttagaattcaatattccattaaagtca1320tgttatattatgaggtacctttgtttg1347<210>25<211>1193<212>dna<213>人工序列(artificialsequence)<400>25acacacacacacagcagaggaaaaatgaaaagcattccagagatgttactgtgttgtagt60tctgatcataagccaattcctcttgtggggtttggaacagctgtttatcctctttcatcc120tctgaaaccatgaaacaatccatcctccatgcaatcaaacttggttacagacacttcgac180tctgcaactttataccagtcagagcagcctcttggagaatcaattgttgatgccatacgc240ctaggcttcattcaatctcgccaagacctcttcatcacctctaagctttggtgttctgat300gctcaccctcatcatgtcctccctgctcttcaaaattcactcaagaatcttggattggaa360taccttgatctgtatctcattcactggccagtgagctcaaagccaggtaaatttgagtat420ccggtgaacaagcaagagcttcttcccatggatttcaagtctgtttgggaagccatggag480gagtgtcagaatcttggcctcacaaaatttattggagtcagtaacttctcatgcaagaag540ctccaattattactagcaaccgcaaagatccctccagctgtcaaccaggtcgagatgaac600ccactttggcaacagaagaagctaagagagttttgtgagaaaaatggtattcatatcaca660gcttactctcctttgggcgccaaaggaacaatttgggggaagtgacaaagtcatggaatg720tgaggtgctcaaacagattgccaaagctagaggaaaatctgttgcccaggtttgtctcag780atagggtttatgagcaaggggtgagtgttctggtgaagagcttcagtgaggagaggatga840aagagaaccttcaaatatttgattgggagctaagcgcacaagactccgagatgataaatc900aaatttcacagtataaaggatgtgctggacttgatttcatatcagatgaaggcccttaca960aatctctccaggatttatgggatggtgaaattgtttgatcctgtaaacgtgtagccaaaa1020accacttagataccgtttgataacattttatgcttacaacacaaattaatgtgtgtttta1080tgtttacaaaaactttggaaactgtttggttttttattttcatttatggtttgatcattg1140atttcacagttacatttcactttattgaatgtcattgcttggttggtgctgct1193<210>26<211>1710<212>dna<213>人工序列(artificialsequence)<400>26gtactctgcgttgataccactgcttaagcagtggtatcaccgcagagtacagggaaacag60caatggatttctctctccaactccctcatggttgctgctcttcatcctctccgctttctt120ccatctccttcctctttttcaccaaaaagtccaaaaaaccaaccaaccttcctccaaccc180caccaacccttcccatcatcggcaacctccaccaactcggcaagctccctcatcactcac240ttacccaactctcaaagaaacacggccctgtcatgctcttgagacttggccaagtcccat300gccttgtcgtttcgtcccccgaaacagccaaacaggtcctaaaaactcatgatctcgaat360gttgcagtagacccttctctcacggccccaaaagactgtcttacaatctcctagacttgg420cttttgggccttacagcgattactggagagaaatgcgaaagctctgcgtgatcgagcttt480tcacagtgaaaagggttcattcatttcgacacgttagagaagaagagttgggtaagatga540tcagacacatcactcaaatctctcctaataatccactcaatttgagcgagttggtattct600ctctcacgaactcaattatttgtaaggttgcgtttgggaagagctatgaggggaagcaat660ttgagagtggtaagtttcaagagagtatggatgaggctatggccatgttgagtagctttt720ggggggcggatttctttccgtatgtaggttggtttgttgatgtatttacaggactccatt780ggaggcttgagaaatgctttcgtgagtttgatgtgttcttcgagagggtgattgaagagc840atcttgatcctaacaggacaaagtctgagcatgaagatattactgacatcttgttagggt900tgtccaaggatgaaactgtttcttttcatcttaccagaaatcatataaaggcaattctca960tgaacatatttatcggtggagtcgacaccagttctcttacaattgtatgggcaatgaccg1020agctagccaagaacccaagagtaatgaaaaaagttcaagcagaaataaggagttgcattg1080gaagaaaacagacagtcgatgaaacccaacttgacaagctcaattacttaaaaatggtgg1140tgaaagagactttcaggctacacccaccagccacatttctaattccccgcgagtcgatgc1200aacattgcaagatcggaggctacgacgtttaccccaaaacaagaatcctagtcaatgcct1260gggcaattggaagagacccagaaatttggaacaacccagaagagttctacccagagaggt1320ttgagaagagtgaaattgatttcaggggtaataatttcgagttgttgccatttggagcgg1380gtcggaggatttgccccggtttgacaatgggtgccatagctgtggaatttactctggcaa1440atcttttgcactgttttgactgggaaatgccttatgggatggaaaggaaagatatcagct1500tggaagaggaggctggcttgactgtgcataagaagttgtctcttgatcttgtccctatca1560aatatgattgggaaggatttgaaacttagaggagggcattgttgtctactcatgttaaaa1620ataaaaataaagtatctatatgaaataagatggtagaactcttgcctttccctaattgta1680tgttaaaaacatgtataatcttgtgcctgt1710<210>27<211>1302<212>dna<213>人工序列(artificialsequence)<400>27acacacacacagcagaggaaaaatgaaaagcattccagagatgttactgtgttgtagttc60tgatcataagccaattcctcttgtggggtttggaacagctgtttatcctcttgcatcctc120tgaaaccatgaaacaatccctcctccatgcaatcaaacttggttacagacacttcgactc180tgcagctttataccagtcagagcagcctcttggagaatcaattgttgatgccatacgcct240aggcttcattcaatctcgccaagacctcttcatcacctctaagctttggtgttctgatgc300tcaccctcatcatgtcctccctgctcttcaaagttcactcaagtaattcataactgctgc360tcttttaatgttattatgctccgtaaatctttctcttcttttttatcagcgaaagtcgct420tgttatgctccataaatcattatatttatattcttttgttatatactagttttttataat480attttttttaatccctctaatttgatgattttgatatacttatcaatctcttggcttcta540tacgtaaaaaaaataaacgaaaatttaaacataatgatcaaattgaaacggacgtaaagt600gcaaggatttaaggacaaaaataaaaggaagaattacactgacatgatatcaataaaaaa660atattatgaatgttaataattaatgttataaacttttttttattaatttataattttttt720ctctctaacaccactatcaggtagttttcccaaaatataattttgcttagttggtttttt780tttttaattattatttatttatagaaatcttggattggaataccttgatctgtatctcat840tcactggccagtgagttcaaagccagggaaatttgagtatccagtgaacaagcaagagct900tcttcccatggatttcaagtctgtttgggaagccatggaggagtgtcagaatcttggcct960cacaaaattcattggagtcagtaacttctcatgcaagaagctccaactattactagcaac1020cgcaaagatccctccagctgtcaaccaggtcgagatgaacccactttggcaacagaagaa1080gctaagagagttttgtgagaaaaaaggtattcatatcacagcttactctcctttgggcgc1140caaaggaacaatttggggaagtgacaaagtcatggaatgtgaggtgctcaaacagattgc1200caaagctagaggaaaatctgttgcccaggtaaggaggtttcatcaaatttactcatctat1260ctagactgtatatagagtacaggctgtaccatactaagtgga1302当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1