新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用的制作方法

文档序号:447800阅读:613来源:国知局
专利名称:新的hmga等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用的制作方法
背景技术
遗传多态性存在于动物个体之间,也存在于通过育种技术得到的具有所需特征的品种之间。例如,中国品种已知性成熟早、产崽数高,而美国品种已知生长迅速、瘦肉率高。然而,所需性状的遗传度往往较低,而且依据表型变异选择动物的传统育种方法并没有充分地考虑存在的遗传变异和复杂的基因相互作用。
已经有几个研究小组用限制性片段长度多态性(RFLP)分析研究了猪的DNA。在此并入参考的Jung等Theor.Appl.Genet.,77271-274(1989)报道了他们使用RFLP技术显示两个猪品种间的遗传变异。这些品种中证明了猪白细胞抗原(SLA)I类基因的多态性。在此并入参考的Hoganson等在Abstract for Annual Meeting ofMidwestern Section of the American Society of Animal Science,March26-28,1990中也报道了RFLP分析所证明的中国猪猪主要组织相容性复合体(MHC)基因的多态性。在此并入参考的Jung等在Theor.Appl.Genet.,77271-274(1989)中还报道了对某些公猪中SLA I类基因的RFLP分析。作者提出结果提示猪SLA/MHC I类基因和猪的生殖及行为性状之间可能相关。他们进一步提出应用SLA I类限制性片段作为遗传标记,将来很可能会有助于我们改良猪的生长行为。
要追踪特定有利遗传等位基因包括新的及冗长的鉴别主要效应基因的DNA分子标记的方法。。标记可能与具有主效的单个基因连锁,也可能与具有附加效果的多个基因连锁。DNA标记有一些优点易于分离测量而且明确,并且DNA标记是共显性的,即能明确地区分杂合子和纯合子动物。一旦建立了一个标记系统,那么选择就很容易进行了,因为从动物幼体甚至是胚胎中获得组织或血液样本后,可以随时进行DNA标记的检测。
受体基因遗传差异的应用已经成为了进行选择的一个重要标记系统。例如,Rothschild等人的美国专利5,550,024和5,374,526揭示了与产崽数提高相关的猪雌激素受体基因的多态性,其在此并入参考;美国专利号5,935,784揭示了与产崽数提高和总体繁殖率相关的猪促乳素受体基因的多态性标记。
生猪肉的质量受到多种遗传和非遗传因素的影响。后者包括农场、运输、屠宰和加工条件。肉类科学家针对这些因素已经进行了大量的研究,从而大大提高了猪肉的质量。部分研究针对动物的遗传背景,而且一些研究揭示了遗传因素的重要性。这使工业上意识到动物选择性育种和基因技术在提高猪肉质量方面可以起到重要的作用。
DNA水平的信息可以有助于确定特定的主效基因,但它同时也有助于就我们选定的数量性状进行选择。除了表型数据,分子信息可以提高选择的精确度从而提高选择应答。许多科研工作者已经从理论角度对这样一个标记辅助选择系统(Marker Assisted Selection)(MAS)程序中的额外应答的大小进行了研究。总的来说,MAS对于遗传度低及测量表型昂贵的表型而言更为有益。尽管如生长、脂肪量、肉质及饲料消耗比的性状通常并不用这种方法来考量,但就这些性状而言,使用标记进行选择仍然有非常明显的优点。例如,Meuwissen和goddard分析了MAS对不同类型性状的影响。如肉质的性状在屠宰后测量的性状中受到的影响最大并且结合标记信息信息额外的应答可以达到64%。对生长性状这种在活体动物上测量的性状而言,这个数字相对要小,是8%。但是,一旦证明这种关联的存在,那么在表型测试或是选择动物之前(参见下文),可以使用这个标记信息,这样预计可以取得最高达38%的应答。
确实,从遗传上改良经济性状的最佳途径是在待选的群体中直接寻找相关的DNA标记。在育种机构的核心动物群的一些动物中可以连续进行表型测量。由于这些性状中的绝大多数只能在屠宰后才能得到完整评估,因此数据只能取自被选择的动物而不能得自潜在的育种动物。
收集这些表型数据以便能够检测出相关的DNA标记,并使用实验种群确证鉴别的标记或测试候选基因。明显的标记或基因可以直接运用到选择方法中。这种分子信息的一个优点在于我们能在育种动物还非常年幼时就获得它,意味着可以在完成生长行为测试之前就基于DNA标记预选择动物。这对总体测试和选择系统而言是非常有利的。
从前述的内容我们可以看到,需要鉴别遗传标记,其可以用于在基因水平通过鉴别及选择具有改良性状的动物而改良具有经济价值的有益性状。
本发明的一个目的是提供基于或在编码HMGA的核苷酸序列中的遗传标记,其是如生长、脂肪量、肉质及饲料消耗比等具有经济价值的有利性状的一个表征。
本发明的另一个目的是提供确定这个遗传标记是否存在的检测方法。
另一个目的是提供一种评估动物的方法,该方法提高了针对所需性状的选择及育种方法的精确性。
此外本发明的另一个目的是提供一种PCR扩增的检测方法,其可以快速确定该标记是否存在。
本发明的其他目的和优点一部分将在下文说明书中得到说明,而且也可以部分地由说明书中明显得出,或是通过实施本发明了解到。本发明的目的和优点可以通过所附权利要求中的手段及特别指出的组合实现。
发明概述本发明涉及编码HMGA的核苷酸序列的不同基因形式的发现,其可以用于对追踪动物品系的遗传鉴别及作为与动物的生长、脂肪量、肉质和饲料消耗比性状相关的遗传标记。这些基因在物种和动物之间都是保守的,预计此处揭示的不同等位基因也与其它经济或产肉动物如牛、羊、鸡等的这些基因的多态性相关。
为了达到所述目的并依照本发明的目的,如此处包含及广泛描述的,本发明提供了不同基因型的发现,其提供了遗传分型动物及筛选动物以确定更有可能具备有利的生长、脂肪量、肉质及饲料消耗比性状的动物或选择淘汰具有表明较不利的生长、脂肪量、肉质及饲料消耗比性状的动物的方法。此处所说的“有利的生长、脂肪量、肉质、饲料消耗比性状”是指多个可测量的生长、脂肪量、肉质、饲料消耗比性状中之一相比一个给定群体的平均值,有显著的改良(增高或降低),所以这个信息可以用于育种中以获得一个在生长、脂肪量、类质、饲料消耗比方面优化的均一群体,这可以包括根据所需性状,提高某些性状或降低其它性状。如欲了解一些经济性状的例子,可参考以下文献Sosnicki,A.A.,E.R.Wilson,E.B.Sheiss,A.deVries,1998“Is there a cost effective way to produce high quality pork?”,ReciprocalMeat Conference Proceedings,Vol.51.
因此,本发明提供了筛选动物以鉴别更可能产生有利的生长、脂肪量、肉质及饲料消耗比,或不太可能产生这些有利的生长、脂肪量、肉质及饲料消耗比的动物的的方法,以对最佳生长、脂肪量、肉质及饲料消耗比优化育种及选择技术。
检测这些性状的方法一般包括以下步骤1)从动物中获取生物学样品;及2)分析1)中获得的基因组DNA或蛋白质,确定存在哪种HMGA等位基因。也可以使用单元型数据,其将HMGA基因的一系列多态性运用到选择或鉴别方案中以最大化这些标记的益处。
由于一些多态性可能在于HMGA蛋白氨基酸组成的变化,或是表明存在这种变化,因此检测方法甚至也可以包括对HMGA蛋白氨基酸组成的确定。进行这样的纯化和分析的方法典型地涉及通过包括荧光标记抗体的手段分离蛋白,分离纯化蛋白(即利用反相HPLC系统),及使用自动蛋白质测序仪鉴定存在的氨基酸序列。这些检测使用的方法是本领域中已经标准化并已知的,如Ausubel等(eds.),ShortProtocols in Molecular Biology Fourth ed.John Wiley and Sons 1999所揭示。
一个优选的实施方案中,分析了遗传样品。简而言之,从动物中获取遗传物质样品,并分析该样品以确定是否含有与改良的生长、脂肪量、肉质、饲料消耗比相关的HMGA核苷酸序列多态性。
本领域技术人员熟知,要比较核酸分子之间的序列差异,有多种技术可以应用。这些包括比如限制性片段长度多态性分析、异源双链分析、单链构象多态性分析、变性梯度电泳和温度梯度电泳。
一个优选的实施方案中,多态性是限制性片段长度多态性,其检测包括以下步骤从分离的遗传物质中鉴定动物的HMGA基因;将该基因暴露于限制性酶以产生该基因的长度不同的限制片段;分离限制片段形成限制性图谱,如通过电泳或HPLC分离;及比较从已知含有或不含有所述标记的HMGA核苷酸序列得到的限制性片段图谱。如果一个动物对标记测试呈阳性,可以考虑将这样的动物纳入育种计划。如果动物对标记基因型测试不呈阳性,则可以将它挑出用作他用。单元型数据的应用还可以与筛选与生长、脂肪量、肉质和饲料消耗比的不同方面的复等位基因相组合。
最优选的实施方案中,通过使用引物及DNA聚合酶扩增含有多态性的这些基因的特异区域来分离这些基因。然后用限制性酶消化扩增的区域并分离得到的片段。显示RFLP图谱可以通过对片段进行简单染色进行,或者通过标记扩增过程中使用的引物或核苷三磷酸。
另一个实施方案中,本发明包含了在特定的动物群体中鉴定有关生长、脂肪量、肉质及饲料消耗比的遗传标记的方法。繁殖同一个品种或杂交种或是相似遗传品系的雌性动物和雄性动物,并确定每个动物的生长、脂肪量、肉质和饲料消耗比。鉴别每个动物的一个或全部两个HMGA等位基因的多态性,并将其与生长、脂肪量、肉质及饲料消耗比相关联。优选地,使用RFLP分析确定多态性。
另一个实施方案中,本发明包含了对任意的一种特定经济动物进行生长、脂肪量、肉质及饲料消耗比的遗传标记鉴别的方法。基于这个基因在不同动物中的高度保守性,推测仅用上述常规检测方法可以将该标记应用到不同动物中,以基于此处的教导进行生长、脂肪量、肉质、饲料消耗比的选择。繁殖同一个品种或杂交种或是具有相似遗传品系的雌性和雄性动物,并确定每个动物的生长、脂肪量、肉质和饲料消耗比并相关联。对于可以获取其序列的其它动物,可以使用BLAST对比确定特定等位基因是否与此处揭示的一个等位基因相似。这种相似的多态性存在于其它动物和其他紧密相关的基因中。术语“相似的多态性”应该是由BLAST对比确定的与上述任一相同的多态性。
以下术语用于描述两个或多个核酸或多核苷酸之间的序列关系(a)“参考序列”,(b)“对比窗”,(c)“序列一致性”,(d)“序列一致性比例”和(e)“实质一致性”。
(a)此处所用“参考序列”是一个用于序列对比基础的确定的序列,此处指参考HMGA序列。一个参考序列可以是一个特异序列的一部分或全部,例如全长cDNA或基因序列的一部分,或是全部cDNA或基因序列。
(b)此处所用“对比窗”指一个多核苷酸序列的一个连续且特异的片段,其中该多核苷酸序列可以与一个参考序列相对比,而且其中对比窗中的该部分多核苷酸序列与参考序列(其没有添加或缺失)相比,可以包含添加或缺失(即,缺口),以充分地对比这两个序列。一般而言,对比窗在长度上至少要有20个连续的核苷酸,也任意地可以是30、40、50、100甚至更多。本领域技术人员了解为避免由于多核苷酸序列含有缺口而导致的与参考序列的高相似性,典型地要引入一个缺口惩罚值,并从匹配数中减去。
本领域熟知对比序列的对比方法。最佳的序列对比的对比可以采用局部同源性算法(Local Homology Algorithm),Smith and Waterman,Adv.Appl.Math.2482(1981);同源性对比算法(Homology AlignmentAlgorithm),Needleman and Wunsch,J.Mol.Biol.48443(1970);寻似法(Search for Similarity Method),Pearson and Lipman,Proc.Natl.Acad.Sci.852444(1988);以及这些算法的计算机化应用,包括但非限于Intelligenetics,Mountain View,California开发的PC/Gene程序中的CLUSTAL;Genetics Computer Group(GCG),575 Science Dr.,Madison,Wisconsin,USA开发的Wisconsin Genetics Software Package中的GAP、BESTFIT、BLAST、FASTA和TFASTA;CLUSTAL程序在以下文献中有详细的描述Higgins and Sharp,Gene 73237-244(1988);Higgins and Sharp,CABIOS 5151-153(1989);Corpet,et al.,NucleicAcids Research 1610881-90(1988);Huang,et al.,ComputerApplications in the Biosciences 8155-65(1992);及Pearson,et al.,Methods in Molecular Biology 24307-331(1994)。可用于数据库相似性搜寻的BLAST系列程序包括用于将核苷酸查询序列与核苷酸数据库序列进行对比的BLASTN;用于将核苷酸查询序列与蛋白质数据库序列进行对比的BLASTX;用于将蛋白质查询序列与蛋白质数据库序列进行对比的BLASTP;用于将蛋白质查询序列与核苷酸数据库序列进行对比的TBLASTN;以及用于将核苷酸查询序列与核苷酸数据库序列进行对比的TBLASTX。参见Current Protocols in MolecularBiology,Chapter 19,Ausubel,et al.,Eds.,Greene Publishing andWiley-Interscience,New York(1995)。
除非另有说明,本文提供的序列一致性/相似性数值指的是使用BLAST 2.0版本中的全套程序、在参数设为默认值下获得的数值。参见Altschul et al.,Nucleic Acids Res.253389-3402(1997)。进行BLAST分析的软件可公开获得,例如国家生物技术信息中心(http//www.hcbi.nlm.nih.gov/)。
这个算法首先要确定“高得分序列对”(high scoring sequencepairs)(HSPs),从查询序列中鉴定一个长度为W的短字,与数据库序列中相同长度的一个字对比时,其匹配或满足某个正数阈值分值T。T被称为邻近字分值阈值(neighborhood word score threshold)(Altschul et al.,同上)。这些初始的邻近字采样(neighborhood wordhits)作为起始搜寻发现含有其的更长的HSPs的种子。只要累积对比分值还能增加,字采样就沿每个序列向两个方向延伸。对于核苷酸序列,使用参数M(一对匹配残基的奖励分值,总是>0)和N(对错配残基的惩罚分值,总是<0)计算累积分值。对于氨基酸序列,利用一个得分矩阵(scoring matrix)来计算累积分值。字采样向每个方向延伸在下列情况时停止累积对比分值比其得到的最大值小X;由于一或多个负分值残基对比的累积,累积分值等于或小于0;或者到了一个序列的端点。BLAST算法的参数W、T和X决定了对比的灵敏度和速度。(核苷酸序列)BLASTN程序使用的缺省设置为字长(W)为11,期望值(E)为10,落差值为100,M=5,N=-4,并且对比两条链。对于氨基酸序列,BLASTP程序使用的缺省设置为字长(W)为3,期望值(E)为10,及得分矩阵为BLOSUM62(参见Henikoff& Henikoff(1989)Proc.Natl.Acad.Sci.USA 8910915)。
除计算序列一致性百分比外,BLAST算法也可对两个序列之间的相似性进行统计分析(参见,例如Karlin & Altschul,Proc.Natl.Acad.Sci.USA 905873-5787(1993))。BLAST算法提供的相似性的一种测量方法是最小总可能性(smallest sum probability)(P(N)),其表示两个核苷酸或氨基酸序列随机配对的可能性。
BLAST搜寻假设蛋白质可以被模型化为随机序列。然而,很多真实的蛋白质包含非随机序列区域,其可能是同聚物序列(homopolymeric tracts)、短周期重复序列或是富含一或多种氨基酸的区域。可以在非相关蛋白质之间对比这些低复杂性区域,尽管其它区域可能完全不同。可以使用多个低复杂性过滤程序减少这些低复杂性对比。例如,可以单独或组合使用SEG(Wooten and Federhen,Comput.Chem.,17149-163(1993))和XNU(Claverie and States,Comput.Chem.,17191-201(1993))低复杂性过滤程序。
(c)本文中两个核酸或多肽序列的“序列一致性”或“一致性”是指当就一个特异的对比窗进行最大对应对比时,两序列中相同的残基。当在蛋白质中使用序列一致性百分比时,认为不一致的残基位置通常由保守的氨基酸取代造成不同,其中氨基酸残基被其它有相似化学性质(比如带电情况和疏水性)的氨基酸残基所取代,因此并不改变分子的功能性质。当序列在保守取代上有差异,可以上调序列一致性百分比以校正该取代的保守性质。由于保守取代有差异的序列被称为具有“序列相似性”或“相似性”。本领域技术人员熟知进行这种调整的方法。典型地,这需要将一个保守取代看作部分的而不是完全的错配来得分,因而提高了序列一致性百分比。因此,例如,当一个相同氨基酸给1分,一个非保守取代给0分时,那么一个保守取代给分在0到1之间。保守取代的得分是通过计算得出的,比如可以依照Meyers and Miller,Computer Applic.Biol.Sci.,411-17(1988)例如,如程序PC/GENE(Intelligenetics,Mountain View,California,USA)中提到的算法。
(d)“序列一致性百分比”指通过对一个对比窗对比两条最佳对比的序列确定的数值,其中与参考序列(其不包含添加或缺失)相比,该对比窗的多核苷酸序列部分可以包含添加或缺失(即,缺口),以最佳对比这两个序列。通过如下方法计算该百分比确定两个序列中相同核酸碱基或氨基酸残基所在的位点数以确定匹配位点数,将匹配位点数除以对比窗中所有位点数再乘以100以计算出序列一致性百分比。
(e)术语多核苷酸序列的“实质一致性”是指一个多核苷酸包含这样一段序列,使用上述标准参数设置的对比程序之一确定,其相比于一个参考序列具有至少70%序列一致性、优选至少80%,更优选至少90%及最优选至少95%的序列一致性。本领域技术人员已知可以在考虑密码子兼并性、氨基酸相似性、阅读框的定位等的前提下,可以适当地调整这些值以确定两个核苷酸序列所编码的蛋白质的一致性。为此目的,氨基酸序列的实质一致性一般是指序列的一致性至少为60%,或优选至少为70%、80%、90%,及最优选至少为95%。
这些程序和算法可以在一个靶基因中确定特定多态性与本文所述的多态性之间的相似性。预计这种多态性在其它动物中也存在,而且在其它动物中对这种多态性的利用可以依照本文的提示,通过简单地参数优化就可以实现。
另外,还可能在不同DNA标记的特异等位基因与已知与特定基因(如本文讨论的HMGA基因)相关的DNA标记的等位基因之间建立连锁,其已显示与特定性状相关。因此,在现有情况下,利用一个或全部两个HMGA基因,通过选择不同染色体标记的特异等位基因而选择HMGA相关标记的某些等位基因,至少在短期内可以间接选择可能产生所需的生长、脂肪量、肉质和饲料消耗比的动物,或是淘汰在可能产生非所需的生长、脂肪量、肉质和饲料消耗比的动物。本文所说的“遗传标记”不应该仅仅包括通过检测多态性相关的蛋白质变化、连锁标记、使用微卫星手段揭示的核苷酸多态性,还甚至包括检测标记表明的蛋白变化及使用其影响动物生长、脂肪量、肉质和饲料消耗比的手段揭示的核苷酸多态性。
正如本文所用,通常一个特定多态性是以一个特定限制性酶的名称来命名。这并不意味着识别该位点的唯一途径就是使用这种限制性酶。本领域技术人员可以获得许多数据库和资源鉴定其他可用于鉴定特定多态性的限制性酶例如http//darwin.bio.geneseo.edu,其可以依据待鉴定的序列和多态性的分析,给出限制性酶。实际上,本文也表明有多种不同方法可以鉴定特定多态性或等位基因,其可能甚至都不使用限制性酶,但其检测相同的遗传或蛋白质组的不同形式。
并入的作为本文说明书组成部分的附图阐明了本发明的一个实施方案,并且与说明书一起阐明本发明的原理。


图1a和b示出了HMGA I的BanI(a)和NaeI(b)PCR-RFLP测试结果。
图2示出了HMGA2的HhaI PCR-RFLP测试结果。
图3是猪hmga1的共有序列(SEQ ID NO19)。
下划线及粗体字标示出的是两个BanI识别位点。其中一个在54位含有单核苷酸多态性。NaeI多态性位点(GCYGGC)以下划线表示。
Y=C或T。
图4是猪hmga2的一个共有序列,长度1168。三个HhaI识别位点(GCGC)以下划线表示,其中两个同时加亮,其含有DNA多态性。SEQ ID NO20。
框1是Mix1的近似PCR片段。
框2是Mix2的近似PCR片段。
K=G或T
Y=C或T图5是表中所示的Berkshire和Yorkshire杂交品种猪1号染色体的重组频率图(recomb.Frac.,Kosambi cM)图6是Berkshire和Yorkshire杂交品种猪7号染色体的遗传图谱。性平均值图(recomb.frac.,Kosambi cM)。
图7总结了HMGA1的其它引物位置和区域。
图8是猪HMGA1的DNA序列(重叠群(contig)1)长度2484bp.SEQ ID NOS21-24图9是猪HMGA1的DNA序列(重叠群2)长度1103 bp.NOS25-29发明详述以下参考文献将详细说明本发明的实施方案,与以下的实施例一起解释本发明的原理。
本发明涉及与动物有经济价值的性状有关的遗传标记。该标记代表与生长、脂肪量、肉质及饲料消耗比性状显著相关的等位基因,因此本发明提供了一种育种时筛选动物以确定可能更可能产生所需生长、脂肪量、肉质及饲料消耗比(一个或全部这些性状)的动物的方法,通过鉴别与所需生长、脂肪量、肉质及饲料消耗比相关的一或两个HMGA核苷酸序列多态性的存在与否来进行。
因此,本发明涉及鉴别特定品种(breed)、种系(strain)、种群(population)或群体(group)动物的遗传标记以及鉴定这些标记的方法,由此可以筛选出具备所需的生长、脂肪量、肉质及饲料消耗比的动物。
本发明鉴定了与动物改良性状相关的HMGA核苷酸序列的新等位基因。本发明的一个实施方案中,已经示出通过BanI或NaeI限制性位点识别的新的猪HMGA1等位基因与较低的脂肪含量和其它如脂肪、生长、肉质和/或饲料消耗比性状相关。另一个实施方案中,已经鉴定了与脂肪和生长性状相关的HMGA2基因的一个新的HhaI识等位基因。在另一个实施方案中,已经示出所述标记一起具有加性效应(additive effect)。
可以使用任何可以鉴定这个标记存在与否的方法,包括例如单链构象多态性(SSCP)分析、碱基切除序列扫描(BESS)、RFLP分析、异源双链分析、变性梯度凝胶电泳及温度梯度电泳、等位基因PCR、连接酶链式反应直接测序、微测序、核酸杂交、微阵列检测HMGA基因或其它HMGA基因连锁序列。而且本发明的范围还包括了在这个多态性存在的情况下对蛋白质构象或序列变化的检测。多态性可能不是导致突变出现的原因,但它指示这个变化的存在,而且可以同时检测表型差异的遗传或蛋白质基础。
以下内容是可以用于检测本发明的多态性的技术的一般性回顾。
本发明中,从动物中取得遗传物质样品。样品可以来自血液、组织、精液等。一般常使用外周血细胞作为来源,并且遗传物质是DNA。获得足够量的细胞以提供供分析用的足量的DNA。本领域技术人员已知或容易确定这个量。通过本领域技术人员已知的技术从血细胞中分离DNA。
核酸的分离和扩增基因组DNA样品可以分离自任何方便地来源,所述来源包括唾液、口腔细胞、毛根、血液、脐带血(cord blood)、羊水、组织液、腹膜液、绒毛膜绒毛,以及有完整分裂间期(interphase)细胞核的其它合适的细胞或组织样品或分裂中期细胞。这些细胞可以取自实体组织,如新鲜或保存的器官或组织样品或活检组织。所述样品可以含有在自然状态下不与生物物质如防腐剂、抗凝剂、缓冲液、固定剂、营养物质、抗生素等混合的化合物。
从多种这些来源中分离基因组DNA的方法在例如Kirby,DNAFingerprinting,An Introduction,W.H.Freeman & Co.New York(1992)中描述。基因组DNA还可以分离自来自任一上述组织样品的培养的原代或二级细胞培养物或转化细胞系。
还可以使用动物的RNA样品。RNA可以依照Sambrook et al.,如上描述的从表达HMGA基因的组织中分离。RNA可以是总细胞RNA、mRNA、poly A+RNA或其任意组合。为获得最好的效果,纯化该RNA,但也可以用未经纯化的胞浆RNA。可以将RNA逆转录出DNA,所得DNA用作扩增模板,以便PCR间接扩增特定RNA转录产物。见,例如Sambrook,同上,Kawasaki et al.,Chapter 8 in PCRTechnology,(1992)同上,和Berg et al.,Hum.Genet.85655-658(1990)。
PCR扩增最常用的扩增手段是聚合酶链式反应(PCR),如美国专利Nos.4,683,195、4,683,202、4,965,188,全部在此并入参考。如果要用PCR来扩增血细胞中的靶区域,应该将加有肝素的全血抽入密封的真空管中,比与其他样品隔离开来保存,处理时也应戴上干净的手套。为获得最佳效果,最好在采血后立即对血液进行处理;如果做不到这一点的话,那么血液应该一直被保存在4℃的密封容器中至使用。也可以检测其他生理体液中的细胞。当使用这些体液时,体液中的细胞应该通过离心与其他体液成分分离开来。
组织应该先用一把已消毒的一次性解剖刀和一根消毒的解剖针(或者用两把解剖刀)在5mm的培养皿中初步剪碎。从组织块中去除石蜡的方法在本领域技术人员所熟知的多种专业手册中都有描述。
为通过PCR扩增样品中的靶核酸序列,该序列必须要能接触到扩增系统中的成分。一种分离靶DNA的方法是用于较大样品的粗提取方法。简而言之,血样样品中的单核细胞、羊水细胞中的羊膜细胞(amniocyte)、培养的绒毛膜绒毛细胞等通过标准方法在无菌的Ficoll-Hypaque梯度上分层(layering)分离。再收集间期细胞,并在提取DNA之前在无菌磷酸盐缓冲盐溶液中洗涤3次。如果测试外周血淋巴细胞的DNA,建议再进行渗压震扰(将在蒸馏水中处理沉淀10秒),然后如果还可见残留有红细胞,在第一次洗涤后再洗涤两次。这样可以避免血红蛋白中的血红素基团对PCR反应的抑制作用。如果PCR测试不在采样后立即进行,则将细胞均分为106个细胞一份,沉淀在Eppendorf管中并在-20℃冷冻干燥,保存至使用。
将细胞重悬在补充了100μg/ml蛋白酶K的50mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.5%Tween 20,0.5%NP40的缓冲液中(每100μl有106个有核细胞)。在56℃孵育两小时后,将细胞在95℃加热10分钟以灭活蛋白酶K,然后迅速移至于冰上降温(骤冻)。如果存在较大的聚集物,则还需在同样的缓冲液中再进行另一次消化循环。取出10μl提取物用作扩增。
从组织例如绒毛膜绒毛细胞或铺满培养的细胞中提取DNA时,那么根据组织样品的大小不同,上述含有蛋白酶K的缓冲液量也可有所差别。提取物在50-60℃孵育4-10个小时,之后在95℃处理10分钟灭活蛋白酶。在更长时间的孵育过程中,以原始浓度孵育4小时后,需要再补加新鲜的蛋白酶K。
样品含有细胞含量少时,提取可以参照下述的方法完成,Higuchi,“Simple and Rapid Preparation of Samples for PCR”,PCR Technology,Ehrlich,H.A.(ed.),Stockton Press,New York,其并入参考。可以应用PCR扩增来自骨髓和外周血细胞培养物的单个集落的很少量细胞(1000-5000个)中的靶区域。将样品中的细胞悬浮在20μl PCR裂解缓冲液(10mM Tris-HCl(Ph8.3),50mM KCl,2.5mM MgCl2,0.1mg/ml明胶,0.45%NP40,0.45%Tween 20)中并冻存直至使用。当要进行PCR时,向在PCR裂解缓冲液中的细胞加入0.6μl蛋白酶K(2mg/ml)。然后将样品加热至大约60℃并孵育1小时。然后将样品加热至95℃10分钟灭活蛋白酶K而终止消化,再在冰上冷却。
下面还有一种相对比较简便的提取用于PCR的DNA的方法,是根据Miller et al.,Nucleic Acids Res.161215(1988)的方法改进的盐析法,所述文献并入参考。在Ficoll-Hypaque梯度上分离单核细胞。将细胞重悬在3ml裂解缓冲液(10mM Tris-HCl,400mM Nacl,2mMNa2EDTA,pH8.2)中。然后向细胞中加入50μl 20mg/ml的蛋白酶K和150μl 20%的SDS的溶液,然后在37℃孵育过夜。孵育过程中摇动试管促进样品的消化。如果孵育过夜后蛋白酶K的消化仍不完全(即还有可见的片段),可以在体系中再加入50μl 20mg/ml的蛋白酶K溶液,再在37℃轻轻摇动或在摇床上孵育过夜。在充分消化后,向样品中加入1ml 6M的NaCl溶液并剧烈混匀。所得溶液在3000rpm离心15分钟。沉淀含有沉淀的细胞蛋白质,而上清液中含有DNA。将上清液转移到装有4ml异丙醇的15ml试管中。轻轻混匀试管中的内容物至水相与醇相混合并形成白色的DNA沉淀。将DNA沉淀移出并滴入至70%乙醇中,轻轻混合。再将DNA沉淀从乙醇中取出并在空气中干燥。向沉淀中加入蒸馏水将其溶解。
用于PCR的提取高分子量DNA的试剂盒包括Genomic IsolationKit A.S.A.P(Boehringer Mannheim,Indianapolis,Ind.)、Genomic DNAIsolation System(GIBCO BRL,Gaithersburg Md.)、Elu-Quik DNAPurification Kit(Schleicher & Schuell,Keene,N.H.)、DNA extraction Kit(Stratagene,LaJolla,Calif.)、TurboGen Isolation Kit(Invitrogen,SanDiego,Calif.)等等。一般而言可以在实践本发明的方法前,按照厂商说明使用这些试剂盒来纯化DNA。
提取出的DNA的浓度和纯度可以通过对稀释等份样品在260nm和280nm的光吸收分光光度分析来确定。提取出DNA后,可以进行PCR扩增。PCR每一次循环的第一步需要将引物延伸获得的核酸双链分开。一旦双链分开,PCR的下一步是使分开的链与在靶序列侧翼的引物杂交。引物接下来可以延伸以形成靶链的互补拷贝。为成功进行PCR扩增,设计引物以便要使一个引物与母链杂交后,延伸产生的子链在与母链变性分开后,可以与另一个引物杂交并作为该引物延伸的模板。变性、杂交及延伸的循环重复所需的次数以获得所需量的扩增核酸。
PCR扩增的一个特别有用的实施方案中,通过将反应体系加热到足够高的温度并进行足够长的时间以引起双链变性但不引起聚合酶发生不可逆变性而分开链(见U.S.Pat.No.4,965,188,并入参考)。典型地热变性涉及的温度在80℃到105℃之间,时间长短数秒至数分钟。然而链的分开则可以任何合适的方法包括物理、化学或酶学手段实现。例如,可以用解旋酶或有解旋酶活性的酶诱导链分开。例如,在有ATP存在的情况下酶RecA具有解旋酶活性。通过解旋酶的链分开的适宜反应条件是本领域已知的(见Kuhn Hoffman-Berling,1978,CSH-Quantitative Biology,4363-67;和Radding,1982,Ann.Rev.Genetics 16405-436,全部并入参考)。
PCR中模板依赖的引物延伸由聚合剂(polymerizing agent)在存在足量的4种去氧核苷三磷酸(一般是dATP、dGTP、dCTP和dTTP)的情况下在包含有适当的盐、金属阳离子以及pH缓冲系统的反应介质中催化进行。适当的聚合剂是已知催化模板依赖的DNA合成的酶。某些情况下,靶区域可能编码细胞表达的蛋白的至少一部分。这样,mRNA也可用于扩增靶区域。或者,PCR还可用于从RNA构建一个cDNA文库以进行进一步的扩增,引物延伸的最初模板是RNA。适于从RNA模板合成互补拷贝DNA(cDNA)序列的聚合剂是逆转录酶(RT),如禽成髓细胞瘤病毒RT、Moloney鼠白血病病毒RT、嗜热栖热菌(Thermus Thermophilus)(Tth)DNA聚合酶,一种由PerkinElmer Cetus,Inc.开发的具有逆转录酶活性和热稳定DNA聚合酶。典型地,最初逆转录步骤后的第一次变性步骤过程中,基因组RNA模板被热降解,只留下DNA模板。适用于以DNA作模板的聚合酶包括,例如,大肠杆菌(E.coli)DNA聚合酶I或者其Klenow片段、T4 DNA聚合酶、Tth聚合酶和Taq聚合酶,分离自水生栖热菌(Thermus aquaticus)的一种热稳定DNA聚合酶,从Perkin ElmerCetus,Inc.可以买到。后一种酶广泛用于核酸的扩增和测序。本领域已知使用Taq聚合酶的反应条件并在Gelfand,1989,PCR Technology,同上中也有描述。
等位基因特异PCR等位基因特异的PCR可以区分存在缺少变异或多态性的靶区域。选择只结合靶序列的某种等位基因的PCR扩增引物。Gibbs,NucleicAcid Res.1712427-2448(1989)中描述了这一方法。
等位基因特异寡核苷酸筛选方法进一步诊断筛选方法使用了等位基因特异寡核苷酸(ASO)筛选方法(allele-specific oligonucleotide screening method),如Saiki等在Nature 324163-166(1986)中所描述。对任意特定等位基因产生一或多个碱基对错配的寡核苷酸。ASO筛选方法检测变体靶基因组或PCR扩增DNA和非突变寡核苷酸之间的错配,示出相较于突变寡核苷酸,减少的寡核苷酸结合。寡核苷酸探针可以设计来在低严格条件下与等位基因的两种多态性形式都能结合,而在高严格条件下,结合其所对应的等位基因。另外,可以控制严格条件,获得基本的二元应答,即对应于一个靶基因变体形式的ASO将与那个等位基因杂交,而不与野生型等位基因杂交。
连接酶介导的等位基因检测方法通过连接酶介导的等位基因检测,可以对比测试对象DNA靶区域和未影响和影响的家族成员中的靶区域。见Landegren et al.,Science 241107-1080(1988)。连接酶也可用于在Wu et al.,Genomics4560-569(1989)中描述的连接扩增反应中检测点突变。连接扩增反应(LAR)通过连续多轮模板依赖的连接,实现了特定DNA序列的扩增,如Wu,同上和Barany,Proc.Nat.Acad.Sci.88189-193(1990)中所述。
变性梯度凝胶电泳使用聚合酶链式反应得到的扩增产物可以用变性梯度凝胶电泳分析。不同的等位基因可以通过基于序列依赖解链性质和在溶液中DNA电泳迁移的不同得以鉴别。在温度升高或变性强度增大时,DNA分子区段解链,这些区段称为解链结构域(melting domain)。每个解链结构域在不同的、碱基特异的解链温度(TM)下协同解链。解链结构域长度至少为20个碱基对,也可以高达数百个碱基对。
可以用聚丙烯酰胺凝胶电泳评估基于序列特异解链结构域不同的等位基因的分化,如Chapter 7,Erlich,ed.,PCR Technology,Principles and Applications for DNA Amplification,W.H.Freeman andCo.,New York(1992)所述,其内容并入参考。
一般而言,通过变性梯度凝胶电泳分析的靶区域使用靶区域侧翼的PCR引物扩增。扩增的PCR产物用线性变性梯度的聚丙烯酰胺凝胶分析,如Myers et al.,Meth.Enzymol.155501-527(1986)和Myers etal.,Genomic Analysis,A Practical Approach,K.Davies Ed.IRL PressLimited,Oxford,pp.95-139(1988)所述,其内容并入参考。电泳系统维持在稍稍低于靶序列解链结构域的Tm的温度。
另一种变性梯度凝胶电泳的方法中,将靶序列可以先附于一段称为GC夹(GC clamp)的GC核苷酸,如Chapter 7,Erlich,同上所述。优选地,GC夹中至少有80%的核苷酸是鸟嘌呤或胞嘧啶。优选地,GC夹至少长达30个碱基。这种方法特别适用于高Tm的靶序列。
通常,通过上述聚合酶链式反应扩增靶区域。一个寡核苷酸PCR引物在5’端带有至少30个碱基的富含GC序列的GC夹,其在扩增过程中掺入到靶区域的5’端。所得扩增的靶区域在上述变性梯度条件下进行电泳。只相差一个碱基变化的DNA片段在凝胶上迁移的位置不同,通过溴化乙锭染色可见。
温度梯度凝胶电泳温度梯度凝胶电泳(TGGE)与变性梯度凝胶电泳基于相同的原理,只是变性梯度是由温度差异产生,而不是化学变性剂的浓度不同而产生的。标准的TGGE使用的是随电泳路径具有温度梯度的电泳仪。当样品在化学变性剂浓度一致的凝胶里迁移时,其面对升高的温度。另一种TGGE的方法是时间温度梯度凝胶电泳(TTGE或tTGGE),即逐步地升高整块电泳凝胶的温度以达到同样的结果。随着样品在凝胶中迁移,整块凝胶的温度升高,因此随样品通过凝胶迁移,它们遇到越来越高的温度。样品准备,包括掺入GC夹的PCR扩增,以及产物的显示都与变性梯度凝胶电泳相同。
单链构象多态性分析HMGA基因座的靶序列或等位基因可以使用单链构象多态性分析区分,其根据单链PCR产物电泳迁移的改变来区分碱基的差别,如Orita et al.,Proc.Nat.Acad.Sci.852766-2770(1989)所述。扩增的PCR产物可以按上述方法产生,然后加热或其它方法变性,从而形成单链扩增产物。单链核酸可能会部分地根据碱基序列重新折叠或形成二级结构。因此,单链扩增产物的电泳迁移率可以检测等位基因或靶序列之间碱基顺序的差别。
错配碱基的化学或酶学方法切割靶序列间的差异还可以通过错配碱基对的差异化学切割区分,如Grompe et al.,Am.J.Hum.Genet.48212-222(1991)所述。另一种方法中,可以通过错配碱基对的酶切割检测靶序列之间的差异,如Nelsonet al.,Nature Genetics 411-18(1993)所述。简而言之,来自一个动物或一个受影响家族成员的遗传物质可以用于产生错配游离异源杂交DNA双链。本文所指的“异源杂交”指DNA双链的包含来自一个动物的一条链,及来自另外一个动物的第二条链,而且通常是在感兴趣的性状的表型上有差别的动物。没有错配的异源双链的正选择可以确定可能与HMGA多态性相关的小的插入、缺失或其它多态性。
非凝胶系统其它可能的技术包括非凝胶系统,如TaqManTM(Perkin Elmer)。这一系统中,设计要研究的突变侧翼的寡核苷酸PCR引物,并通过PCR扩增该区域。另外还要设计第三个寡核苷酸探针以与在基因的不同等位基因中含有碱基对象变化的区域杂交。这一探针的5’和3’端都用荧光染料标记。选择这些染料以便当其互相临近时,其中之一的荧光被另一种染料的荧光淬灭而不能被检测到。相对于探针,PCR引物在Taq DNA聚合酶的作用下从模板的5’端开始延伸,导致附于退火探针的染料通过Taq DNA聚合酶的5’核酸酶活性而切割。这样除去了淬灭效应使得可以检测到探针3’端染料的荧光。如果探针与模板分子的杂交不完全,即存在某种形式的错配,那么染料就不会被切割,这样就可以区分不同的DNA序列。因此只有当寡核苷酸探针的核苷酸序列与它结合的模板分子完全互补,才会除去淬灭。一个反应混合物中,可能含有两种不同探针的序列,每个针对可能存在的不同等位基因设计,从而可以在一次反应中检测两个等位基因。
还有一种技术称为Invader Assay,其包括依赖于荧光催化释放的等温扩增。见Third Wave Technology,www.twt.com.
不依赖PCR的DNA诊断可以基于多态性包括一个动物和家族成员的限制性片段长度多态性在内的多态性而不用扩增步骤鉴定与HMGA序列连锁的DNA序列。杂交探针一般是通过互补碱基配对结合全长或部分靶核酸的寡核苷酸。探针典型地依赖于杂交条件的严格程度与缺少与探针序列完全互补的靶序列结合。探针优选直接或间接标记,因此可以通过检测探针的存在与否来检测靶序列的存在与否。直接标记方法包括放射性同位素标记,如用32P或35S。间接标记方法包括荧光标签、能结合抗生物素蛋白或链霉抗生物素蛋白的生物素复合体,或肽或蛋白质标签等。可见检测办法包括光致发光剂(photoluminescent)、德克萨斯红、罗丹明及其衍生物、red leuco dye、3,3’,5,5’-四甲联苯胺(TMB)、荧光素及其衍生物、丹磺酰、伞形酮及其类似化合物或辣根过氧化物酶、碱性磷酸酶等。
杂交探针包括任意能与一个HMGA编码序列所在的猪染色体杂交核苷酸序列,因此确定与HMGA基因之一连锁的遗传标记,包括限制性片段长度多态性、高度可变区、重复元件,或是可变数目的串联重复。杂交探针可以是任何基因或适合的类似物。其它合适的杂交探针包括已知定位在染色体相关区域的cDNA或基因的外显子片段或部分。
优选地用于本发明的串联重复杂交探针是在高严格的杂交条件下,识别特异基因座的少量片段或是降低严格条件时识别该基因座的较大量片段的探针。
可以使用一或多个限制性酶和/或探针和/或引物。其它的酶、构建的探针以及引物可以通过本领域技术人员的常规实验确定,其也包含在本发明的范围内。
尽管本文所述方法可以使用单一的限制性酶和单一的一组引物,但是这些方法不限于此。如果需要,可以使用一或多种其它的限制性酶和/或探针和/或引物。确实在有些情况下,可能优选使用给出特异单元型的标记组合。结合本文提供和引用的的教导,通过常规实验可以确定其它的酶、构建的探针和引物。
按照本发明,在一个或全部两个HMGA核苷酸序列中,鉴定了与生长、脂肪量、肉质和饲料消耗比相关的多态性。这些标记的存在与否,在一个实施方案中可以通过使用限制性内切核酸酶的PCRRFLP分析来检测,并且由于多态性周围区域的高度同源性,可以使用类似的人、猪或其它HMGA序列设计扩增引物,或者可以使用GenBank中的已知HMGA序列(例如人的)设计或者甚至可以根据从邻近密切的基因的连锁数据得出的序列设计,如本文的教导和参考文献。多态性周围的序列可以有助于设计另外的PCR测试,其中从紧挨多态性的序列中挑出大约4-30个连续碱基的引物用于聚合酶链式反应以在用所需的限制性酶处理前大大扩增该区域。引物不必精确互补,满基本等同序列就可以。本领域技术人员已知PCR扩增引物的设计,详细讨论见Ausubel(ed.),“Short Protocols in MolecularBiology,Fourth Edition”John Wiley and Sons 1999中有详细介绍。下文是对引物设计的简要说明。
引物设计策略聚合酶链式反应(PCR)方法的广泛应用促使开发很多程序辅助设计或选择用作PCR引物的寡核苷酸。下面是可以通过因特网免费获得的4个这样的程序Whitehead Institute的Mark Daly和SteveLincoln开发的PRIMER(UNIX、VMS、DOS和Macintosh)、WashingtonUniversity in St.Louis的Phil Green和LaDeana Hiller开发的Oligonucleotide Selection Program(OSP)(UNIX、VMS、DOS和Macintish)、Yoshi开发的PGEN(只用于DOS)以及University ofWisconsin的Bill Engels开发的Amplify(只用于Macintosh)。通常这些程序通过寻找已知重复序列元件的比特并通过分析推定引物的长度和GC含量来优化Tm来辅助引物设计。还可以获得商业软件,而且引物方法正迅速地被包含在大多数的普通序列分析软件包中。
测序和PCR引物设计用作测序或PCR引物的寡核苷酸需要选择一个特异识别靶的适当序列,然后需测试该序列以排除该寡核苷酸具有稳定二级结构的可能。序列中的反向重复可以使用上述的重复鉴别或RNA折叠程序来鉴别(见Prediction of Nucleic Acid Structure)。如果观察到了可能的茎环结构,那么引物的序列可以向任意方向移动几个核苷酸以最小化可能的二级结构。寡核苷酸的序列也应该与恰当的载体和插入DNA的双链序列进行比较。很明显,测序引物与靶DNA应该只有单一的匹配。还建议不要选用与非所需靶DNA序列只有一个错配的引物。对用于扩增基因组DNA的PCR引物,该引物序列应该与GenBank数据库中的序列进行比较,以确定是否有任何显著的匹配。如果寡核苷酸序列出现在任何已知的DNA序列中,或者更关键的是在任何已知的重复元件中,就应该改变对引物序列。
本发明的方法和材料也可以更广泛应用以评价动物DNA、在基因定型个体动物及检测动物中的遗传差异。特别地,动物基因组DNA的样品可以通过与一或多个对照参比评价,以确定是否存在HMGA序列之一的多态性。优选地,对该动物的HMGA序列进行RFLP分析,并将结果与对照进行比较。对照的结果来自于另一个动物一或全部两条HMGA序列的RFLP分析,其中这个动物的HMGA基因的多态性是已知的。与此类似,一个动物的HMGA基因型可以通过以下方法确定取得其基因组DNA样品,对DNA中HMGA基因进行RFLP分析,再将结果与对照对比。同样,对照结果来源于另一个动物的一条HMGA序列的RFLP分析。这个结果通过确定HMGA基因的多态性,对动物进行基因定型。最后,动物之间的遗传差异可以通过以下方法检测从至少两个动物中获取基因组DNA样品,在一条HMGA核苷酸序列上鉴别多态性的存在与否,并比较结果。
这些检测用于鉴别与生长、脂肪量、肉质和饲料消耗比相关的遗传标记,如上所述,鉴别HMGA基因中可能与其它特征相关的其他多态性,以及动物基因型和表型的一般科学分析。
本文的例子和方法揭示了一些已被鉴别具有多态性的基因,所述多态性与一种有利性状相关,而该性状又会对携带这种多态性的动物的生长、脂肪量、肉质及饲料消耗比产生影响。一基因是否带有多态性通常通过导致在某些等位基因形式中出现一个限制性位点的单个碱基变换进行鉴定。然而,如本文证明和讨论的那样,某个等位基因可能有多个碱基改变,这些改变可以被检测相同多态性(等位基因)的表征。此外,其它遗传标记或基因可能与本文所述的多态性连锁,因此检测也可能涉及鉴定其它的基因或基因片段,但是最终还是需要依赖于动物的遗传分析以寻找相同的多态性。本发明期冀能够涵盖任何基于本文所揭示的等位基因差异分选和鉴别动物的检测方法。
本领域技术人员知道,一旦鉴定了一个多态性并将其与特定的性状建立了联系,那么就有多种方法可以根据这个多态性基因定型(genotype)动物。这些替代测试方案只是本领域技术人员已知的对参数的优化,本发明也期冀能涵盖这些内容。
实施例HMGI(在新命名系统下HMGA的名称;Bustin,2001)基因家族由两个基因组成,其编码三种与染色质结构和转录控制相关的蛋白质(HMG-I、-Y和C)。HMGI/Y蛋白是同一个基因RNA选择性剪接的产物,而HMGIC则由不同的基因编码。
人的HMGIY(HMGA1)基因定位在染色体区域6p21处(Friedmann et al.,1993),并且可能参与细胞生长和分化的基因表达的调节(Reeves and Beckerbauer,2001)。因此,HMGI/Y蛋白的异常或过表达与多种癌症的形成强烈相关(Hess,1998;Tallini and DalCin,1999;Reeves,2000)。由于HMGI/Y蛋白在脂肪细胞特异基因的表达中起着转录作用,HMGI/Y可能在脂肪细胞生长和分化中起着重要的作用(Melillo et al.,2001)。
人HMGIC(HMGA2)基因被物理定位在染色体12q14-12处,而这一区域示出是经常引起脂瘤(lipoma)的染色体重排的位点,所述脂瘤主要由成熟脂肪细胞组成(Asher et al.,1995)。这些发现在表达截短的HMGIC基因结构域的转基因小鼠中得到了证实。这些转基因小鼠都发生肥胖并有异常的脂瘤高发率(Arlotta et al.,2000)。与此相反,HMGIC基因敲除的小鼠示出成年体重降低,主要影响脂肪组织(Zhou et al.1995)。这些结果表明HMGA基因的变异可能与人肥胖的变异和动物脂肪量相关。
HMGA1PCR-RFLP测试引物正向(HMGY1)-5′AGA AGG AGC CCA GCG AAG T3′SEQ ID NO1反向(HMYS2)-5′ACA GTG CTC ACC CAA TGG C3′SEQ ID NO2位置两个都位于外显子中PCR条件Mix110XPCR缓冲液 1.0μlMgCl2(25mM) 0.6μldNTPs(2.5mM) 0.5μlHMGYl(25pmol/μl) 0.1μlHMYS2(25pmol/μl) 0.1μlTaq聚合酶(5U/μl) 0.07μlddH2O 7.63μl基因组DNA 1.0μl在一个PCR反应管中将Mix1和DNA组合。在Mix上覆盖矿物油。按以下PCR程序进行反应94℃3分钟;然后94℃30秒,63.8℃1分钟,及72℃1分30秒,这样的循环进行36次;然后进行最后72℃10分钟的延伸。取出2μl的PCR反应产物在1.6%的琼脂糖凝胶上证实扩增成功和阴性对照的理想结果。
消化可按以下步骤进行BanI消化反应NaeI消化反应
PCR产物4.0μlPCR产物 4.0μlNE缓冲液4 1.0μlNE缓冲液1 1.0μlBSA(10mg/ml) 0.1μlBSA(10mg/ml) 0.1μlBanI(20U/μl) 0.2μlNaeI(10U/μl) 0.4μlddH2O 4.7μlddH2O 4.5μl混合PCR产物、缓冲液、酶和水。在37℃孵育至少4小时或过夜。然后将消化溶液与上样染料(loading dye)混合(2∶5),在3%的NuSieve琼脂糖凝胶上电泳。
HMGA2HhaI PCR-RFLP测试引物HMGIC-55′ACT GAA GAG ACA TCC TCA CA3′SEQ ID NO3HMGIC-T15′CTA AAC CIG GGA CIG TGA AG3′SEQ ID NO4Mix2的引物660bpHMGIC-SF5′GAT AGG ACT AGA TAC AAC TTA C3′SEQ ID NO5HMGIC-T25′GGA TAT ATT GCA TCT CTG GC3′SEQ ID NO6Mix1250bpPCR条件Mix1 Mix210X Promega缓冲液 1.0μl 10X Promega缓冲液 1.0μl25mM MgCl20.6μl 25mM MgCl20.6μldNTPs混合物(每种2.5mM) 0.5μl dNTPs混合物(每种2.5mM) 0.5μl25pmol/μl HMGIC 5 0.1μl 25pmol/μl HMGIC SF 0.1μl25pmol/μl HMGIC T1 0.1μl 25pmol/μl HMGIC T2 0.1μldd无菌H2O 7.4μl dd无菌H2O 7.4μlTaq聚合酶(5U/μl) 0.07μl Taq聚合酶(5U/μl) 0.07μl基因组DNA(12.5ng/μl) 1.0μl 基因组DNA(12.5ng/μl) 1.0μl1、按以下PCR程序进行反应94℃2分钟;然后94℃30秒,56℃(Mix1)和52℃(Mix2)1分钟,再72℃1分30秒,循环35次;然后最后在72℃延伸10分钟。当HMGIC-5和HMGIC-T2引物用于PCR扩增时(退火温度为56℃),PCR片段(1.2kb)含有全部两个HhaI多态性位点。
2、在标准的1%琼脂糖凝胶上检测3μl的PCR反应产物以证实扩增成功和阴性对照的理想结果。
3、HhaI消化反应在每个含有DNA的管里加入5μl扩增产物。在37℃孵育至少4小时或过夜。然后将反应混合物与上样染料混合,将全部体积上样在3%的琼脂糖凝凝胶上。
PCR产物 5.0μl10X NE缓冲液41.0μlBSA(10mg/ml) 0.3μlHhaI酶(20U/μl) 0.3μldd无菌H2O 3.6μl图2中BanI的识别位点用下划线及粗体字表示。其中一个在第54位含有单核苷酸多态性。
图1示出HMGA的序列,其具有下划线表示的NaeI多态性位点(GCYGGC)。
Y=C或T三个HhaI识别位点(GCGC)均用下划线表示,其中用灰色加亮的两个含有DNA多态性。
框1是Mix1的大致PCR片段。
框2是Mix2的大致PCR片段。
K=G或TY=C或T我们测序并分析了用聚合酶链式反应扩增的猪HMGA1和HMGA2片段。猪HMGA2基因片段的序列覆盖了外显子5到3’UTR,在DNA水平示出与相应人序列大约79%的一致性。猪HMGA1基因片段序列覆盖了外显子6和7,在DNA水平示出与相应人外显子序列大约93%的一致性。
我们还在猪HMGA1和HMGA2基因中鉴别出了一些单核苷酸取代(SNPs)。HMGA1基因中鉴别的两个SNPs分别位于BanI和NaeI限制性酶识别位点内,而HMGA2基因中鉴别的另两个SNPs位于HhaI识别位点内。发展了这些SNPs的PCR RFLP测试并测试了来自Berkshire×Yorkshire 3代家系中和PIC商用群体的动物的DNA样品。利用上述DNA样品的PCR RFLP测试的基因型进行了QTL和相关分析。对于Berkshire和Yorkshire杂交参考家系中脂肪相关性状,两个HMGA基因都位于QTL区域内。在几个商用PIC群体的动物中,HMGA1基因的等位基因1 NaeI多态性的存在明显地与较少的背部脂相关。此外,这些商用群体中,HMGA2基因型也与脂肪和生长性状相关。这个参考家系中的两个基因的组合分析清楚地表明两个基因对脂肪性状有加性效应。
这些结果表明,这些多态性与生产猪和肉质的多种具有重要经济价值的性状相关,而且利用这些多态性能够在育种工作中准确选择具有所需性状及表型的动物。
在PIC群体中HMGA基因的相关分析2000年8月1日针对肉质在所有动物中计算了平均值(s.e.)和Sigma P。
所有结果都由mixed model得出,将父系作为随机影响,并固定屠宰日期。
LS平均值显著性水平 α和δ显著性水平水平a-bp<.3 ap<.3c-dp<.1 bp<.1
e-fp<.05 cp<.05g-hp<.01 dp<.01i-jp<.005 ep<.005k-lp<.001 fp<.001m-np<.0005gp<.0005o-pp<.0001hp<.0001估计值是有偏倚(biased)的。
geno p性状=父系+屠宰日期+基因型的模型中基因型的p值。
Expl.%σe2由“基因型”导致的误差方差的减少。
α和δ性状=父系+屠宰日期+ADD+DOM的模型的标记的加合和上位效应。
结果以性状值给出。


US-Landrace中HMGA1 NaeI的肉质和生产性状的分析

US-Large white中HMGA1 NaeI的肉质和生产性状的分析

US-Large white×Duroc中HMGA1 NaeI的肉质和生产性状的分析

所有品系中HMGA1 NaeI的肉质和生产性状的分析

US-Landrace中HMGA2的肉质和生产性状的分析

US-Large white中HMGA2的肉质和生产性状的分析

US-Duroc中HMGA2的肉质和生产性状的分析

US-Large white×Duroc中HMGA2的肉质和生产性状的分析

在参考家系中具有脂肪性状的HMGA基因之间的相互作用分析A.Berkshire和Yorkshire杂交家系F2代动物1)基因频率HMGA1(BanI) 频率百分比频率 百分比11 8817.8588 17.8512 232 47.06320 64.9122 173 35.09493 100.00HMGA2 频率百分比频率 百分比11 6412.7564 12.7512 234 46.61298 59.3622 204 40.64502 100.00HMGA2


B)对最后一根肋骨上脂肪(lrib)性状的影响HMGA1和HMGA2基因型都与最后一根肋骨性状的变化相关。HMGA2等位基因2的存在适度增加了最后一根肋骨脂肪含量(比较12和22号基因型)。HMGA1等位基因1的存在示出与脂肪含量的增加强烈相关。
HMGA2lrib LSMEAN 误差11 3.18575614 0.1160333612 3.12045322 0.0488531822 3.22801544 0.04984788HMGA1lrib LSMEAN 误差11 3.35804436 0.0779811812 3.16165424 0.0477134022 3.07576363 0.04890591

3)对腰部脂肪(lum)性状的影响
HMGA1和HMGA2基因型都示出与腰部脂肪(lumbar fat)相关。HMGA1和HMGA2的组合结果示出对腰部脂肪的明显的加性效应。
HMGA2 lum LSMEAN误差113.470036850.13421404123.537041660.05650774223.554019300.05765829HMGA1 lum LSMEAN误差113.775070260.08990991123.556168110.05501209223.399479340.05638702

C)对总脂质(tlip)性状的影响HMGA2基因型与总脂质(total lipid)的变化相有关HMGA2 tlip LSMEAN误差112.88214497 0.23811466123.06472896 0.10025272223.23158737 0.10229396
HMGA1tlip LSMEAN 误差11 3.33719722 0.1634492512 3.03313238 0.1000077122 3.10162605 0.10250722

5)对第10根肋骨脂肪(trib)性状的影响HMGA1基因型与第10根肋骨脂肪显著相关。
HMGA2 trib LSMEAN误差113.00876115 0.13088375123.08337129 0.05507852223.11863733 0.05619663HMGA1 trib LSMEAN误差113.28558871 0.08686549123.07574337 0.05310117222.98812120 0.05442963

1.Berkshire和Yorkshire杂交家系的猪1号染色体的遗传图谱见图4性平均图谱(recomb.frac.,Kosambi cM)9 SW1515 0.00.17 17.32 S0316 17.30.03 3.411 SWR230020.80.11 10.910 S0008 31.60.16 16.04 SW781 47.70.04 4.38 S0312 51.90.13 13.47 S0331 65.40.03 3.31 MC4R 68.60.04 4.00 HMGA2 72.60.15 15.26 SW974 87.80.17 17.13 SW373 104.90.22 23.05 SW1301 128.0*表示recomb.frac.在这个分析中保持不变log10_like=-1425.68性特异图谱(recomb.frac.,Kosambi cM--雌性,雄性)9 SW1515 0.0 0.00.19 19.70.15 14.92 S0316 19.714.90.03 3.2 0.02 2.311 SWR230022.917.20.08 7.6 0.16 16.110 S0008 30.533.30.16 16.60.14 14.84 SW781 47.148.10.02 2.0 0.07 7.08 S0312 49.155.10.22 23.40.04 4.17 S0331 72.559.20.04 4.5 0.02 2.11 MC4R 77.061.30.06 5.6 0.02 2.20 HMGA2 82.563.50.20 21.30.09 9.56 SW974 103.8 73.00.20 21.60.13 13.33 SW373 125.4 86.30.19 19.40.24 26.45 SW1301 144.8 112.7*表示recomb.frac.在这个分析中保持不变
log10_like=-1396.972.Berkshire和Yorkshire杂交家系的猪7号染色体的遗传图谱见图5性平均图谱(recomb.frac.,Kosambi cM)10 S00250.00.27 29.79 S006429.70.17 18.18TNFB47.80.04 4.40 HMGA152.30.12 12.57 SWR1928 64.70.109.72 SW2040 74.40.099.05 SW25283.50.066.11 SW63289.60.055.54 SW1083 95.10.20 21.63 S0101116.70.21 22.66 SW764139.3*表示recomb.frac.在这个分析中保持不变log10_like=-1441.45性特异图谱(recomb.frac.,Kosambi cM--雌性,雄性)10 S00250.0 0.00.30 35.4 0.23 24.99 S006435.424.9 0.14 14.2 0.21 22.18 TNFB 9.6 47.0 0.06 5.60.04 3.50 HWGA155.250.5 0.17 17.8 0.08 7.97 SWR1928 72.958.4 0.08 7.80.12 11.92 SW2040 80.770.3 0.12 12.1 0.06 5.95 SW25292.976.2 0.09 9.00.04 3.81 SW632101.8 80.0 0.05 5.00.06 6.34 SW1083 106.9 86.3 0.21 21.8 0.20 21.33 S0101128.7 107.6 0.25 27.3 0.17 17.86 SW764156.0 125.5log10_like=-1428.65
HMGA1的另一些引物和新序列引物HMA1-F1(正向)5′AAG CAG CCT CCG GTG AGT C3′SEQ ID NO7HMA1-R1(正向)5′CAC TTC GCT GGG CTC CTT CT3′SEQ ID NO8位于外显子5到内含子5之间(~1800bp,退火温度Ta是65℃)HM766F(正向)5′TCT CTA GTT CCT CAT TCC3′SEQ ID NO9HM766R(正向)5′CCC AAG ACA GAA TAA AAA G3′SEQ ID NO10两者都位于内含子5内(~800bp,Ta是51.7℃)HM867F(正向)5′CCT CTT GTC ATT TTA CTG TC3′SEQ ID NO11HM867R(正向)5′ACC CCA CTT TCC TCA ACT3′SEQ ID NO12位于内含子5到内含子6之间(~390bp,Ta是57.4℃)HM978F(正向)5′CTC TGC CTC CAC TCT CTA3′SEQ ID NO13HM978R(正向)5′TGC CAA AGG TGA CAA GAC3′SEQ ID NO14均位于内含子5内(~1000bp,Ta是59.3℃)HMAI2F(正向)5′CCA GGA AGG AAA CCA AGG G3′SEQ ID NO15HMAI2R(正向)5′TGA CTC AGC AAC CTC CAC G3′SEQ ID NO16位于外显子7到内含子7之间(~1200bp,Ta是60℃)HMAI2F(正向)5′CCA GGA AGG AAA CCA AGG G3′SEQ ID NO17HMAI3R(正向)5′TGA CTC AGC AAC CTC CAC G3′SEQ ID NO18位于外显子7到内含子7之间(~800bp,Ta是56℃)PCR条件Mix110X PCR缓冲液 1.0μlMgCl2(25mM) 0.6μldNTPs(2.5mM) 0.5μlHMGY1(25pmol/μl) 0.1μlHMYS2(25pmol/μl) 0.1μl
Taq聚合酶(5U/μl) 0.07μlddH2O7.63μl基因组DNA 1.0μl在PCR反应管中组合Mix1与DNA。在混合物上方覆盖矿物油。按以下PCR程序进行反应94℃3分钟;36个循环的94℃30秒、Ta1分钟及72℃1分40秒;然后在72℃进行10分钟的最后延伸。在1.6%琼脂糖凝胶上检测2μl的PCR反应产物以证实扩增成功和阴性对照的所需理想结果。(每套引物组在相同的程序中在适当的退火温下进行,如上述)注意另外的SNPs通过序列分析来鉴别。SNP位置以粗体字(boldfont)来表示。
各品种间重叠群(contig)序列对比及HMGA1的共有序列注另外的SNPS通过序列分析来鉴别。对4个不同品种的猪的测序表明HMGA1基因DNA序列中存在一些多态性。SNP位置以符号(*、+)和箭头来表示。下面是对SNPs的描述。
表1通过重叠群1和2的序列分析鉴别的新SNPs的位置和碱基变化的描述

注重叠群2还有其它通过序列分析无法证实的潜在SNPs。
参考文献Arlotta,P.,Tai,A.K.,Manfioletti,G.,Clifford,C.,Jay,G.,Ono,S.J.2000.Transgenic mice expressing a truncated form of the high mobilitygroup I-C protein develop adiposity and an abnormally high prevalenceof lipomas.J.Biol.Chem.275,14394-14400.
Ashar,H.R.,Fejzo,M.S.,Tkachenko,A.,Zhou,X.,Fletcher,J.A.,Weremowicz,S.,Morton,C.C.,Chada,K.1995.Disruption of thearchitectural factor HMGI-CDNA-binding AT hook motifs fused inlipomas to distinct transcriptional regulatory domains.Cell 8257-65.
Bustin,M.,2001.Revised nomenclature for high mobility group(HMG)chromosomal proteins.Trends Biochem.Sci.26,152-153.
Friedmann,M.,Holth,L.T.,Zoghhbi,H.Y.,Reeves,R.1993.Organization,inducible-expression and chromosome localization of thehuman HMGI(Y)nonhistone protein gene.Nucleic Acids Res.21,4259-4267.
Hess,J.L.1998.Chromosomal translocaitons in benign tumors.Am.J.Clin.Path.109,251-261.
Melillo,R.M,,Pierantoni,G.M,,Scala.S.,Battista,S.,Fedele,M.,Stella,A.,De Biasio,M.C.,Chiappetta,G.,Fidanza,V.,Condorelli,G.,Santoro,M.,Croce,C.M.,Viglietto,G.,Fusco,A.2001.Critical role ofthe HMGI(Y)proteins in adipocytic cell growth and differentiation.Mol.Cell.Biol.21,2485-2495.
Tallini,G.,Dal Cin,P.1999.HMGI(Y)and HMGI-C dysregulationa common occurrence in human tumors.Adv.Anat.Pathod.6,237-246.
Reeves,R.2000.Structure and function of the HMGI(Y)family ofarchitectural transcription and chromatin structure.Environ.HealthPerspect.108,803-809.
Reeves,R.,Beckerbauer,L.2001.HMGI/Y proteinsflexibleregulators of transcription and chromatin structure.Biochim.Biophy.Acta 1519,13-29.
Zhou,X.,Benson,K.F.,Ashar,H.R.,Chada,K.1995.Mutationresponsible for the mouse pygmy phenotype in the developmentallyregulated factor HMGI-C.Nature 376,771-774.
序列表<110>衣阿华州立大学研究基金公司<120>新的HMGA等位基因及作为生长、脂肪量、肉质及饲料消耗比性状遗传标记的应用<130>ISURF 2900<150>60/364,959<151>2002-03-15<160>30<170>PatentIn version 3.1<210>1<211>19<212>DNA<213>porcine<400>1agaaggagcc cagcgaagt19<210>2<211>19<212>DNA<213>porcine<400>2acagtgctca cccaatggc19<210>3
<211>20<212>DNA<213>porcine<400>3actgaagaga catcctcaca20<210>4<211>20<212>DNA<213>porcine<400>4ctaaacctgg gactgtgaag20<210>5<211>22<212>DNA<213>porcine<400>5gataggacta gatacaactt ac 22<210>6<211>20<212>DNA<213>porcine<400>6ggatatattg catctctggc20<210>7<211>19
<212>DNA<213>porcine<400>7aagcagcctc cggtgagtc 19<210>8<211>20<212>DNA<213>porcine<400>8cacttcgctg ggctccttct20<210>9<211>18<212>DNA<213>porcine<400>9tctctagttc ctcattcc 18<210>10<211>19<212>DNA<213>porcine<400>10cccaagacag aataaaaag 19<210>11<211>20<212>DNA<213>porcine
<400>11cctcttgtca ttttactgtc20<210>12<211>18<212>DNA<213>porcine<400>12accccacttt cctcaact 18<210>13<211>18<212>DNA<213>porcine<400>13ctctgcctcc actctcta 18<210>14<211>18<212>DNA<213>porcine<400>14tgccaaaggt gacaagac 18<210>15<211>19<212>DNA<213>porcine
<400>15ccaggaagga aaccaaggg 19<210>16<211>19<212>DNA<213>porcine<400>16tgactcagca acctccacg 19<210>17<211>19<212>DNA<213>porcine<400>17ccaggaagga aaccaaggg 19<210>18<211>19<212>DNA<213>porcine<400>18tgactcagca acctccacg 19<210>19<211>703<212>DNA<213>porcine<400>19ccaacaccta aaagacctcg gggccgacca aaggggagca aaaacaaggg cgcygccaag 60
acccgggtga ggcttgaagg ggtggctcct ggtggaggga agtgggaagt aaccccccgc120cccctgcaag cagctgaggg aggtctggga aggggtgggc ttgtcctgat tctctgcatg180ccctttctct ggtacgtggg cccgatgggt cttggctagt tgaggaaagt ggggtgatgg240ccgaggccta acttctaggg ccttgtcttg cccaggacac tggggaagtc aagtcagatg300tcccagagct ttcctggtct ggagggaggc cagttgggca gaatggaggg ctgttccccc360tgggctgaga tgtcacctcc cccccaaccc caggccgcct gggtcctgag ggtgggggag420caggcaaggc cagatctaca gtggcattgg cctttggaga agttgttttg ttttttattt480tattttttct aagacacgac tcatatcctc tgagtcacgg gtgaaggagg gagtgggggc540gtgtgtgtgt atgttggggt ggggggcggt gtggcyggcc agtcatcccc agctggactc600cggtgggcct gctgggctga gagtcccggc tgcccctccc tgctcgccct cgccctccag660ggcactggtc actgcggggc acccgccatt gggtgagcac tgt 703<210>20<211>1168<212>DNA<213>porcine<400>20actgaagaga catcctcaca gaagtctgca gaagaggatt aggaggckcc aacattcaac 60gtccacctca gcagcagttg aatcttttga agggagaact acttactccc tattgccatg120gtttttccac tttcatctgg ggttgcaggg gaagggtggg ggtggggtgg gaggagaagg180gacataacct tgaaaaggac tgtattaatc accttctttg taatcccttc acagtcccag240gtttagtgga aaactgctgt aaacacagga gacacagttt aacaatgcaa cttttaatga300ctgttttcat tttccttaac ctactaatag tttgtggatc tgatgagcag gagtgggtgg360gtgagaaaaa ctctgaatgg gtttagccaa tcactgtact gcatccaaac cagaaacgtg420tcacctgcgt gacagtgggc attcctctag gcaaggtgca gtaggaaatg ctgcccacct480cagacgtcac ccagccccct ctcagtggtg aagcttctgt ttagaacacc aaagatagga540ctagatacta cttactttct catataacct ggtagacact tacttgatga tgtttttatt600tttaccttta tttctaagtg agaggaaatg ctgatgtatc ytttcatcca actaaccaga660aaaggtgatg ttctcttttc aaaaagggaa gtaagcaaac tcagattgcc aactcctata720tttatggatg ctatacattg cttatttaat acacagttaa cagtaatggt gagttttaat780
tctctccgta gcgcctttgg taattcacaa tagtgatgga tctaatggtt ctagcatttt 840aagaaaccta gacaagtaaa attattctct ttatgatttc atgaaaaggt acaacagaat 900aacccatgat gaacttacct ggattatgag acgggagaag caaaatctaa atctattttg 960ctatagttat actacaattt aaagaacaac aacaaagcag gctctcttgt ctctttcttt1020ytctctctgt ctctctctcc attgtgtatg agtttctgtg aaagatctaa ataccatgtt1080cctcaaatga agcttatgtg ttactccagg taatacgttt tgacatagga tggttggctg1140aagtgctttt ctttgacatc agcgycgc 1168<210>21<211>1838<212>DNA<213>porcine<220>
<221>misc_feature<222>(725)..(725)<223>n can be any nucleotide<400>21aaaaagtttc tgggctagca cctgttcatg ggcctccttg agtggccctg ggttgggctc 60tgcctccact ctctaaaagg aaattgaagc ccaagaagtt gacagtgttg aggagttggt120gcagagtgac tcagagccct gattctgtcc cacccctccc cccaaaggtc acgtgaggtt180aaaaggccac cctggcactt tgtgcgcccc agggagcttg gcccgtcagg ctgtggggac240cacctgttat atggtggaga tcttggtgtc tgttacaggg gggcagctgt ccccaagtga300ggggcagcgg ctggtggtga agcccagtta cttccttttc aggggggaga ggaaaggaat360tgaggtcgat ccctggcctt tagatggcag gcagtttgtg tacctgggcc tccggcttcc420ccgtctgtag gtggagagac ctggcggagc caggggtcat gagaagtcca atgggtgctg480gactcgagct gcctcatgga gggccctcag ctcgtgggga acttgtcctc ttcatctggt540cctttggcct ctcccagcck cctgttagcg gcggtcatgg ttgcgggggg atcagaaggg600gtgttgggtt actggaccac gcgcagcctg gggaaaccat agctgacgtg cctttgctgc660
ccagagcctg tgctgcatgt agcagctttt tattctgtct tgggttagta caatttcagt 720ggcantaatg ggcagggatc tggggctcca agatctggac agaatcctct gggggaggca 780gcctggaggt cccttctgtt tggggggatg tcctctccca cctcctgcat cgccctggac 840actggcacgt ccttcattgt acattgttca gtttttttta ctgtcacagg gaagcaaggg 900gagaggcctt gcaaaggatg ttcagactgg gaacctgaat ccccagggct gtgcctgcca 960tgattcctgt ggattctgga gtggggctgt cggggtgggg gtggggtggg gcagagactg1020tctggtgaaa gaggtgggac actggtgtct atgccctgac cgttccatct gtctttgcag1080aaggagccca gcgaagtgcc aacacctaaa agacctcggg gccgaccaaa ggggagcaaa1140aacaagggcg ccgccaagac ccgggtgagg cttgaagggg tggctcctgg tggagggaag1200tgggaagtaa cccccagccc cctgcaagca gctgagggag gtctgggaag gggtgggctt1260gtcctgattc tctgcatgcc ctttctctgg tacgtgggcc cgatgggtct tggctagttg1320aggaaagtgg ggtgatggcc gaggcctaac ttctagggcc ttgtcttgcc caggacactg1380gggaagtcaa gtcagatgtc ccagagcttt cctggtctgg agggaggcca gttgggcaga1440atggagggct gttccccctg ggctgagatg tcacctcccc cccaacccca ggccgcctgg1500gtcctgaggg tgggggagca ggcaaggcca gatctacagt ggcattggcc tttggagaag1560ttgttttgtt ttttatttta ttttttctaa gacacgactc atatcctctg agtcacgggt1620gaaggaggga gtgggggcgt gtgtgtgtat gttggggtgg ggggcggtgt ggcyggccag1680tcatccccag ctggactccg gtgggcctgc tgggctgaga gtcccggctg cccctccctg1740ctygccctcg ccctccaggg cactggtcac tgcggggcac ccgccattgg gtgagcactg1800tcagggacat ttttgacaat ggatcttttc tctgcaca1838<210>22<211>2484<212>DNA<213>porcine<400>22ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc180caagccgaag ggaccctgtg gtcaggcagg ccagtgctca caccggggta aagcacccag240
cctttgtttc cacctcattg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat 300agaaacgcaa aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca 360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc 420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc 480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga 540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc 600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag 660cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac 720aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct 780tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt 840tgtgtacctg ggcctccggc ttccccgtct gtaggtggag agacctggcg gagccagggg 900tcatgagaag tctaatgggt gctggactcg agctgcctca tggagggccc tcagctcgtg 960gggaacttgt cctcttcatc tggtcctttg gcctctccca gcctcctgtt agcggcggtc1020atggttgtgg ggggatcaga aggggtgttg ggttactgga ccacacgcag cctggggaaa1080ccatagctga cgtgcctttg ctgcccagag cctgtgctgc atgtagcagc tttttattct1140gtcttgggct tagtacaatt tcagtgacac taatgggcag ggatctgggg ctccaagatc1200tggacagaat cctctggggg aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc1260tcccacctcc tgcatcgccc tggacactgg cacgtccttc attgtacatt gttcagtttt1320cgtgactcta caaggtaggt cttgtcacct ttggcagatg aggggaactg tagctcaagc1380ataaagcgtc ttgcccaaga tcttagacct aggcaatggc agagctggga tgcgaacaga1440gcagcctaag aaggggtttc tgtccccatg acacccttcc caatgggctt ctagcctctt1500gtcattttac tgtcacaggg aagcaagggg agaggccttg caaaggatgt tcagactggg1560aacctgaatc cccagggctg tgcctgccat gattcctgtg gattctggag tggggctgtc1620ggggtggggg tggggtgggg cagagactgt ctggtgaaag aggtgggaca ctggtgtcta1680tgccctgacc gttccatctg tctttgcaga aggagcccag cgaagtgcca acacctaaaa1740gacctcgggg ccgaccaaag gggagcaaaa acaagggcgc tgccaagacc cgggtgaggc1800ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag1860ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt1920acgtgggccc gatgggtctt ggctagttga ggaaagtggg gtgatggccg aggcctaact1980
tctagggcct tgtcttgccc aggacactgg ggaagtcaag tcagatgtcc cagagctttc2040ctggtctgga gggaggccag ttgggcagaa tggagggctg ttccccctgg gctgagatgt2100cacctccccc ccaaccccag gccgcctggg tcctgagggt gggggagcag gcaaggccag2160atctacagtg gcattggcct ttggagaagt tgttttgttt tttattttat tttttctaag2220acacgactca tatcctctga gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg2280ttggggtggg gggcggtgtg gccggccagt catccccagc tggactccgg tgggcctgct2340gggctgagag tcccggctgc ccctccctgc tygccctcgc cctccagggc actggtcact2400gcggggcacc cgccattggg tgagcactgt cagggacatt tttgacaatg gatcttttct2460ctgaccatct agaaaaccac caca 2484<210>23<211>2484<212>DNA<213>porcine<400>23ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc180caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag240cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat300agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag660cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac720aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct780tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt840tgtgtacctg ggcctccggc ttccccgtct gtaggtggag agacctggcg gagccagggg900
tcatgagaag tctaatgggt gctggactcg agctgcctca tggagggccc tcagctcgtg 960gggaacttgt cctcttcatc tggtcctttg gcctctccca gcctcctgtt agcggcggtc1020atggttgtgg ggggatcaga aggggtgttg ggttactgga ccacgcgcag cctggggaaa1080ccatagctga cgtgcctttg ctgcccagag cctgtgctgc atgtagcagc tttttattct1140gtcttgggct tagtacaatt tcagtggcac taatgggcag ggatctgggg ctccaagatc1200tggacagaat cctctggggg aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc1260tcccacctcc tgcatcgccc tggacactgg cacgtccttc attgtacatt gttcagtttt1320cgtgactctg caaggtaggt cttgtcacct ttggcagatg aggggaactg tagctcaagc1380ataaagcatc ttgcccaaga tcttagacct aggcaatggc agagctggga tgcgaacaga1440gcagcctaag aaggggtttc tgtccccatg acacccttcc caatgggctt ctagcctctt1500gtcattttac tgtcacaggg aagcaagggg agaggccttg caaaggatgt tcagactggg1560aacctgaatc cccagggctg tgcctgccat gattcctgtg gattctggag tggggctgtc1620ggggtggggg tggggtgggg cagagactgt ctggtgaaag aggtgggaca ctggtgtcta1680tgccctgacc gttccatctg tctttgcaga aggagcccag cgaagtgcca acacctaaaa1740gacctcgggg ccgaccaaag gggagcaaaa acaagggcgc cgccaagacc cgggtgaggc1800ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag1860ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt1920acgtgggccc gatgggtctt ggctagttga ggaaagtggg gtgatggccg aggcctaact1980tctagggcct tgtcttgccc aggacactgg ggaagtcaag tcagatgtcc cagagctttc2040ctggtctgga gggaggccag ttgggcagaa tggagggctg ttccccctgg gctgagatgt2100cacctccccc ccaaccccag gccgcctggg tcctgagggt gggggagcag gcaaggccag2160atctacagtg gcattggcct ttggagaagt tgttttgttt tttattttat tttttctaag2220acacgactca tatcctctga gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg2280ttggggtggg gggcggtgtg gctggccagt catccccagc tggactccgg tgggcctgct2340gggctgagag tcccggctgc ccctccctgc tcgccctcgc cctccagggc actggtcact2400gcggggcacc cgccattggg tgagcactgt cagggacatt tttgacaatg gatcttttct2460ctgaccatct agaaaaccac caca 2484<210>24<211>1950
<212>DNA<213>porcine<400>24ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca 120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc 180caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag 240cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat 300agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca 360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc 420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc 480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga 540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc 600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag 660cttggcccgt caggctgtgg actttgtgcg ccccagggag cttggcccgt caggctgtgg 720ggaccacctg ttatatggtg gagatcttgg tgtctgttac aggggggcag ctgtccccaa 780gtgaggggca gcggctggtg gtgaagccca gttacttcct tttcaggggg gagaggaaag 840gaattgaggt cgatccctgg cctttagatg gcaggcagtt tgtgtacctg ggcctccggc 900ttccccgtct gtaggtggag agacctggcg gagccagggg tcatgagaag tctaatgggt 960gctggactcg agctgcctca tggagggccc tcagctcgtg gggaacttgt cctcttcatc1020tggtcctttg gcctctccca gcctcctgtt agcggcggtc atggttgtgg ggggatcaga1080aggggtgttg ggttactgga ccacgcgcag cctggggaaa ccatagctga cgtgcctttg1140ctgcccagag cctgtgctgc atgtagcagc tttttattct gtcttgggct tagtacaatt1200tcagtggcac taatgggcag ggatctgggg ctccaagatc tggacagaat cctctggggg1260aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc tcccacctcc tgcatcgccc1320tggacactgg cacgtccttc attgtacatt gttcagtttt cgtgactctg caaggtaggt1380cttgtcacct ttggcagatg aggggaactg tagctcaagc ataaagcatc ttgcccaaga1440tcttagacct aggcaatggc agagctggga tgcgaacaga gcagcctaag aaggggtttc1500tgtccccatg acacccttcc caatgggctt ctagcctctt gtcattttac tgtcacaggg1560
aagcaagggg agaggccttg caaaggatgt tcagactggg cacctgaatc cccagggctg1620tgcctgccat gattcctgtg gattctggag tggggctgtc ggggtggggg tggggtgggg1680cagagactgt ctggtgaaag aggtgggaca ctggtgtcta tgccctgacc gttccatctg1740tctttgcaga aggagcccag cgaagtgcca acacctaaaa gacctcgggg ccgaccaaag1800ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag1860ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt1920acgtgggccc gatgggtctt ggctagttga 1950<210>25<211>2404<212>DNA<213>porcine<400>25ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc180caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag240cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat300agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag660cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac720aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct780tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt840tgtgtacctg ggcctccggc ttccccgtct gtaggtggag gctggactcg agctgcctca900tggagggccc tcagctcgtg gggaacttgt cctcttcatc tggtcctttg gcctctccca960
gcctcctgtt agcggcggtc atggttgtgg ggggatcaga aggggtgttg ggttactgga1020ccacgcgcag cctggggaaa ccatagctga cgtgcctttg ctgcccagag cctgtgctgc1080atgtagcagc tttttattct gtcttgggct tagtacaatt tcagtggcac taatgggcag1140ggatctgggg ctccaagatc tggacagaat cctctggggg aggcagcctg gaggtccctt1200ctgtttgggg ggatgtcctc tcccacctcc tgcatcgccc tggacactgg cacgtccttc1260attgtacatt gttcagtttt cgtgactctg caaggtaggt cttgtcacct ttggcagatg1320aggggaactg tagctcaagc ataaagcatc ttgcccaaga gcagcctaag aaggggtttc1380tgtccccatg acacccttcc caatgggctt ctagcctctt gtcattttac tgtcacaggg1440aagcaagggg agaggccttg caaaggatgt tcagactggg aacctgaatc cccagggctg1500tgcctgccat gattcctgtg gattctggag tggggctgtc ggggtggggg tggggtgggg1560cagagactgt ctggtgaaag aggtgggaca ctggtgtcta tgccctgacc gttccatctg1620tctttgcaga aggagcccag cgaagtgcca acacctaaaa gacctcgggg ccgaccaaag1680gggagcaaaa acaagggcgc cgccaagacc cgggtgaggc ttgaaggggt ggctcctggt1740ggagggaagt gggaagtaac cccccgcccc ctgcaagcag ctgagggagg tctgggaagg1800ggtgggcttg tcctgattct ctgcatgccc tttctctggt acgtgggccc gatgggtctt1860ggctagttga ggaaagtggg gtgatggccg aggcctaact tctagggcct tgtcttgccc1920aggacactgg ggaagtcaag tcagatgtcc cagagctttc ctggtctgga gggaggccag1980ttgggcagaa tggagggctg ttccccctgg gctgagatgt cacctccccc ccaaccccag2040gccgcctggg tcctgagggt gggggagcag gcaaggccag atctacagtg gcattggcct2100ttggagaagt tgttttgttt tttattttat tttttctaag acacgactca tatcctctga2160gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg ttggggtggg gggcggtgtg2220gcyggccagt catccccagc tggactccgg tgggcctgct gggctgagag tcccggctgc2280ccctccctgc tcgccctcgc cctccagggc actggtcact gcggggcacc cgccattggg2340tgagcactgt cagggacatt tttgacaatg gatcttttct ctgaccatct agaaaaccac2400caca 2404<210>26<211>1103<212>DNA<213>porcine
<400>26tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctga gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg 840ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct 900ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc 960agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg1020gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta1080aattcttcct tttttatgaa tga1103<210>27<211>1103<212>DNA<213>porcine<400>27tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg 840ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct 900ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc 960agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg1020gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta1080aattcttcct tttttatgaa tga1103<210>28<211>1102<212>DNA<213>porcine<220>
<221>misc_feature<222>(949)..(949)<223>n is any nucleotide<220>
<221>misc_feature<222>(957)..(957)
<223>n is any nucleotide<400>28tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120tgmggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtagcc cgcggccagc ctgttgtggc cgctccacag cccagcagct gcccctgcgg 840gccaaggcca cctgggtccc cggcacccac cagtgcagtg agggggctca ttgcaccctc 900caggcaccct gtcccatttc ctcccctgac cacctccctg ctccccccnc cacccancca 960gtcacttcct ccagcctagt gctgccctgg gccctgccag gtccctgcct tgggcctggg1020ggccaagggc ctggctcggt gagagcagcc catgtgtgtg gtttttttcc ctccctttaa1080attcttcctt ttttatgaat ga 1102<210>29<211>1059<212>DNA<213>porcine<400>29tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120
tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgctggc acgggggccc ccatgtggtg 720tcccaacatt ccggcccagt gagtgagccc cacacttccc tttcctcccc gccctggcct 780ggggtcagcc cgcggccagg gccaaggcca cctgggtccc cggcacccac cagtgcagtg 840agggggctca ttgcaccctc caggcaccct gtcccatttc ctcccctgac cacctccctg 900ctccccccac cacccagcca gtcattcctc cagctagtgc tgccctgggc cctgccaggt 960ccctgccttg ggcctggggg ccaagggctg gctcggtgag agcagcccat gtgtgtggtt1020tttttccctc cctttaaatt cttccttttt tatgaatga 1059<210>30<211>1103<212>DNA<213>porcine<400>30tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc120tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca480
aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg 840ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct 900ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc 960agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg1020gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta1080aattcttcct tttttatgaa tga110权利要求
1.一种鉴别具有表征一种表型性状的基因型的动物的方法,所述方法包括从所述动物中获取核酸样品,检测样品中是否存在特征为HMGA1或HMGA2基因多态性的基因型或者是否存在与其连锁的多态性,所述基因型是已表明与一种表型性状显著相关的基因型;及根据所述动物中存在的基因型将所述动物与所述表型性状相关联。
2.权利要求1的方法,其中经BLAST对比确定所述多态性导致HMGA基因或其等价物的氨基酸变化。
3.权利要求1的方法,其中所述多态性位于HMGA1基因中。
4.权利要求3的方法,其中所述基因型是NaeI或BanI多态性。
5.权利要求1的方法,其中所述多态性定位在HMGA2基因中。
6.权利要求5的方法,其中所述基因型是HhaI多态性。
7.权利要求1的方法,其中所述检测步骤选自以下一组中限制性片段长度多态性(RFLP)分析、微测序、MALD-TOF、SINE、异源双链分析、单链构象多态性(SSCP)、变性梯度凝胶电泳(DGGE)和温度梯度凝胶电泳(TGGE)。
8.权利要求1的方法,其中所述动物是猪。
9.权利要求1的方法,所述方法进一步包括扩增HMGA核苷酸序列或其含有所述多态性部分的量的方法。
10.权利要求9的方法,其中所述扩增包括以下步骤选择能够扩增含有一个或多个多态性NaeI、BanI或HhaI位点的HMGA核苷酸序列的一个区域的正向和反向引物。
11.权利要求9的方法,其中所述正向和反向引物选自以下一组SEQ ID No1和2、3和4、5和6、7和8、9和10、11和12、13和14、15和16,或17和18。
12.一种筛选动物以确定更可能示出改良的生长、脂肪量、肉质和饲料消耗比性状的动物的方法,包括从所述动物中获取生物学样品;检测所述动物中是否存在与改良的生长、脂肪量、肉质、饲料消耗比性状相关的基因型,所述基因型的特征为a)在HMGA核苷酸序列中的多态性,所述多态性导致一或多个NaeI、BanI或HhaI位点。
13.权利要求12的方法,所述方法进一步包括扩增HMGA编码核苷酸序列基因或其含有所述多态性部分的量的步骤。
14.一种在表达时编码HMGA蛋白的核苷酸序列或等位基因,所述核苷酸序列包含由NaeI、BanI或HhaI多态性位点所致的变体。
15.权利要求11的HMGA蛋白。
16.一种鉴别具有表征一种显著相关的表型性状的所需基因型的动物的方法,,该方法包括从动物中获取包含HMGA1或HMGA2基因的核酸样品,将该样品用与BanI、NaeI或HhaI识别位点相同的限制性酶消化以获得片段,将消化产生的片段从消化物中分离出来,鉴别HMGA1或HMGA2基因的等位基因上是否存在BanI、NaeI或HhaI位点,其中存在所述等位基因表明动物具有表征一种显著相关的表型性状的基因型。
17.一种选择具有所需性状的动物的方法,包括如下步骤从动物中获取核酸样品,鉴别多态性,所述多态性是特征为BanI、NaeI或HhaI限制位点的HMGA1或HMGA2基因中的核苷酸,然后选择具有与所需性状相关的核苷酸的动物。
18.一种间接选择HMGA基因中多态性的方法,所述方法包括从一个动物中获取核酸样品,并用已知与HMGA基因相关的DNA标记在HMGA1或HMGA2基因中鉴别特征为BanI、NaeI或HhaI限制位点的多态性,所述DNA标记进一步是已知与用于间接鉴别核苷酸取代的有利性状相关的标记,并根据核苷酸取代的存在来选择所述动物。
19.一种鉴别具有表征表型性状的所需基因型的动物的方法,该方法包括通过从感兴趣的品系或品种的动物中获取样品、从各样品中制备每个动物的核酸样品、筛选多态性而确定HMGA基因的基因型来确定HMGA基因型和感兴趣的性状间的关联,其中该多态性的存在表明该动物具有表征有利表型性状的基因型,然后计算该HMGA基因型与所述性状之间的关联。
20.一种选择育种用动物的方法,所述方法包括从所述动物中获取核酸样品;检测样品HMGA1或HMGA2基因是否存在多态性,所述多态性已示出与表型性状显著相关;然后根据标记基因型的效应估计值,将HMGA1或HMGA2基因型用在选择模型中,并从而根据得出的估计值选择用作育种的动物。
21.一种隔离动物以在屠宰时提供均一性的方法,该方法包括从所述动物中获取核酸样品;检测样品中与肉质相关的多态性在HMGA基因中存在与否,然后根据存在于所述动物中的多态性对所述动物进行隔离。
22.一种筛选更可能产生所需的生长、脂肪量、肉质和饲料消耗比的动物的方法,该方法包括从所述动物中获取遗传物质样品;并检测在所述动物中与提高的生长、脂肪量、肉质和饲料消耗比相关的基因型存在,所述基因型具有以下特征a)HMGA基因中的多态性。
23.权利要求22的方法,其中用BLAST对比确定所述多态性导致HMGA基因或其等价物的氨基酸变化。
24.权利要求22的方法,其中所述多态性位于HMGA1或HMGA2基因中。
25.权利要求22的方法,其中所述基因型为NaeI、BanI或HhaI多态性。
26.权利要求22的方法,其中所述检测步骤选自以下一组限制性片段长度多态性(RFLP)分析、微测序、MALD-TOF、SINE、异源双链分析、单链构象多态性(SSCP)、变性梯度凝胶电泳(DGGE)和温度梯度凝胶电泳(TGGE)。
27.权利要求22的方法,其中所述动物是猪。
28.权利要求22的方法,进一步包括扩增含有所述多态性的HMGA核苷酸序列或其部分量的步骤。
29.权利要求28的方法,其中所述扩增包括以下步骤选择能够扩增含有一或多个NaeI、BanI或HhaI位点的HMGA核苷酸序列的一个区域的正向和反向引物。
30.一个在表达时编码HMGA蛋白的核苷酸序列或等位基因,所述核苷酸序列包含SEQ ID NOS19、20、21、22、23、24、25、26、27、28或29。
31.权利要求30的HMGA蛋白。
全文摘要
本发明揭示了可用作动物生长、脂肪量、肉质和饲料消耗比的遗传标记,鉴别这些标记的方法,及筛选动物以确定更可能产生所需生长、脂肪量、肉质及饲料消耗比的方法,并优选选择那些动物进行以后的育种目的。所述遗传标记基于HMGA核苷酸序列中存在或缺少某种多态性。
文档编号C12N15/09GK1643162SQ03806119
公开日2005年7月20日 申请日期2003年3月14日 优先权日2002年3月15日
发明者马克斯·F·罗思柴尔德, 金关石, 月·树·阮 申请人:衣阿华州立大学研究基金公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1