棕榈Mantle表型检测的制作方法

文档序号:12165286阅读:268来源:国知局
棕榈Mantle表型检测的制作方法与工艺

本申请要求申请号为61/988,132,2014年5月2日提交的美国临时专利申请和申请号为62/091,471,2014年12月12日提交的美国临时专利申请的权益,为了各种目的将其全部内容通过引用结合在本文中。

参考作为ASCII文本文件提交的“序列表”、表格或列出附录的计算机程序

序列表编写在2015年4月30日创建的文件SEQ 96380-941211_ST25.txt中,420,872字节,机器格式IBM-PC,MS-Windows操作系统,该序列表通过引用并入本文中。



背景技术:

油棕属于Elaeis属,Elaeis属包含两种物种:E.guineensis和E.oleifera。油棕被认为是世界上产油最高效的含油作物,超越相同类型的所有其它作物,例如大豆、油菜籽和向日葵。平均产量3.74吨/公顷/年的产油能力,所需的土地比大豆所需的土地小10倍(Oil World,2007),生产周期为25-30年,使油棕成为有利可图的农作物。但是,最近的油产量已经达到停滞期。然而,为供给不断增长的世界人口,预计食用油需求将逐步上升。

自从作为油料作物而引入马来西亚,油棕已经经历了至少两波已知的产量提高周期,第一波是杂交tenera(DxP)的引入,杂交tenera代替dura作为商业植物材料。这证实通过仅操纵单个基因,油产量增加高达30%(Kushairi et al.,2006;Singh et al.,2013)。然而,在过去二十年中,马来西亚的平均产油量一直徘徊于3.5至3.9吨/公顷/年之间。由于棕榈油产量下降到第二位,马来西亚和所有其它棕榈油生产国需要提高产量。农用地变得稀少的事实进一步加剧了这种情况。因此,通过更大面积的种植来增加生产不再被视为替代方案。

通过多年的育种和选择,棕榈油工业已经产生了高达13.6吨/公顷/年(接近18.2吨/公顷/年的理论产量(Corley,1998))的棕榈(Sharma and Tan,1999)。最佳实验图产生了平均为9.8吨/公顷/年的棕榈油(Musa and Gurmit,2008),并且选择的后代能够达到12.2吨/公顷/年(Rajanaidu et al.,1990)。克隆这些超级棕榈可以为该行业提供急需的高产量种植材料,使其走出停滞。因此,商用克隆被吹捧为第二波油棕改良作物。

由于其生物结构,油棕没有天然的营养繁殖手段,常规杂交育种方法将需要至少三代,或超过20年,以实现这种优良的产量(Soh et al.,2005)。20世纪70年代首次描述了成功的油棕营养繁殖(Jones,1974;Rabechault and Martin,1976)。Jones(1995)对其发育给出了一个相当全面的个人见解。这些油棕克隆的成功报道促进组织培养实验室的发展,从而提供克隆油棕种植材料。来自早期田间试验的令人鼓舞的结果起领头作用,为更多的实验室所效仿。到80年代中期,马来西亚(Wooi,1990)和其它地方(Le Guen et al.,1991)已有10个克隆油棕实验室。

然而,当Corley等人(1986)首次报道mantling现象(注:果实表面被覆盖的异常现象,可能会导致油棕没有收成)时,由开拓型Bakasawit/Unifield和Tropiclone商业实验室领导的整个克隆行业决定减少生产,并恢复研究和开发。当时,带头研究克隆异常的任务指派给马来西亚棕榈油研究所(PORIM,Palm Oil Research Institute of Malaysia),马来西亚棕榈油研究所是棕榈油行业的保管机构,现在被称为马来西亚棕榈油董事会(MPOB,Malaysian Palm Oil Board)。

通过一致的努力,到20世纪90年代初,获得的结果表明,需要建立更好的组织培养方案,其中包括继代培养过程和使用破坏性较小的生长调节剂类型。还提出了替代方法,例如悬浮和原生质体培养,作为避免继代培养的手段。克隆Dura和pisifera亲本,然后进行常规杂交,以规避克隆teneras潜在发生的体细胞克隆变异,在讨论的不同方法中(Ong-Abdullah,Viva562/2011)。有趣的是,高达10%的异常棕榈自发回复正常,并在一段时间内保持正常(Durand-Gasselin et al.,1990)。由Mantled果实(例如,克隆115E)发育的幼苗是正常的,从而推翻了异常是由于显性基因效应或母本传播因子的可能性。通过由Rao和Donough(1990)进行的常规遗传杂交,这种性状也表现出以非孟德尔方式呈现。

早期尝试采用以下技术,比如流式细胞术,随机扩增多态性DNA(RAPD)或经典扩增片段长度多态性(AFLP)分析,不能在Mantled棕榈和正常棕榈之间产生任何可检测的差异(Rival et al.1997,1998;Matthes et al.2001)。然而,当利用甲基化敏感性或相关技术时,似乎改变了Mantled基因组的甲基化水平(Jaligot et al.2002,Matthes et al.2001,Jaligot et al.2004)。

随后,进一步的研究集中在理解mantling的根本分子学起因和表观遗传调节上。还已知在Mantled油棕中,雌能花的退化雄蕊和雄蕊分别发育为假心皮(Morcillo et al.,2006)。在严重的情况下,花不育,并且不结果,导致产量较低。据推测,由于进行了同源异型修饰,产生花器官特性的ABCDE模型的B功能同源异型MADS盒基因(Murai,2013)很可能参与其中。

根据MADS盒假设,使用针对MADS盒的剖析技术(van der Linden et al.2002)从油棕分离含MADS盒的基因(Alwee et al.,2006;Auyong,2006)。该方法允许正常油棕、异常油棕和回复油棕中的MADS盒附近的限制性位点中的DNA多态性可视化。识别了两种标记,即MM77和MM78(EP专利申请号13162130.2),并且尽管已经发现MM78不属于MADS盒基因类,但其仍广泛用于进一步确认。在确认MM78的过程中和其它不相关标记物的过去经验中,证实这些标记物的功能性用途是具有基因型依赖性的。因此,当在来自其它遗传背景的克隆上测试时,它们很少使用或不使用。这是生物标记物开发在油棕的克隆保真性上的主要争论点。

先前研究已经发现,相对于原株和正常分株,mantled棕榈中DNA甲基化总体上减少(Jaligot et al.2000;Matthes et al.2001;Jaligot et al.2002;Jaligot et al.2004)。这些结果与拟南芥和其它植物细胞培养物的观察结果类似,其中转座因子(TE)低甲基化并表达(Tanurdzic et al.2008;Miguel et al.2011;Castilho et al.2000;Kubis et al.2003)。除了TE,水稻和玉米中的体细胞克隆再生体经历了广泛的基因和启动子低甲基化(Stroud et al.2013;Stelpflug et al.2014),这也可能有助于油棕和其它作物中的体细胞克隆变异。在mantled棕榈中观察到的同源异型转化类似于B功能MADS盒基因缺失,表明一个或多个MADS盒基因内的逆转录因子或MADS盒基因本身是表观遗传修饰的候选者(Adam et al.2005)。然而,几十年来对候选逆转录因子(Castilho et al.2000;Kubis et al.2003;Jaligot et al.2014)和候选同源异型基因(Syed Alwee et al.2006;Adam et al.2007;Jaligot et al.2014)中DNA甲基化变化的研究尚未识别出在体细胞克隆mantled棕榈中一致出现的表观遗传变化。事实上,由组织培养再生的水稻和拟南芥植物的近期研究表明造成体细胞克隆变异的原因是遗传机制而不是表观遗传机制(Jiang et al.2011;Miyao et al.2012)。



技术实现要素:

本文描述了用于预测油棕植物、植物细胞或植物组织中存在或不存在体细胞克隆异常(例如,Mantled)的方法、组合物和试剂盒。在一些实施例中,本发明提供了分离油棕植物的方法,该方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;c)使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常;和d)对预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。

在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,确定步骤包括:确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%,95%或99%一致,或一致。

在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、69和70(或选自SEQ ID NO:63、64、65、66、67、68、69和70)的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、39、40、42、43、44、45、46、48、49、51、52、57、58、59、60、61和73的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、11、12、14、15、16、17、18、20、21、23、24、29、30、31、32、33和71的序列至少90%、95%或99%一致,或一致的生物标记物中的至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常.

在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、68和69(或选自SEQ ID NO:63、64、65、66、67、68、69和70))的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、37、38、41、42、47、50、52、53、54、55、56、57、62和74的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、9、10、13、14、19、22、24、25、26、27、28、29、34和72的序列至少90%、95%或99%一致,或一致的生物标记物中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加或减少时,预测存在体细胞克隆异常。在一些情况下,对照基因座是内源对照基因座。在一些情况下,对照基因座是外源对照基因座。

在一些方面,确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%或90%、95%或99%一致,或一致的DNA序列内。在一些方面,每个DMR处于来自所述植物的样品的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,每个DMR处于来自所述植物的样品的DNA区域内,其中所述DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,所述确定步骤包括确定在每个DMR的生物标记物中至少一个胞嘧啶的甲基化状态,其中每个标记物与独立选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在任何前述实施例、方面或情况中,体细胞克隆异常可包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。

在任何前述实施例、方面或情况中,确定甲基化状态可包括亚硫酸氢盐转化;和/或确定甲基化状态可包括用甲基化依赖性内切核酸酶消化基因组DNA;和/或确定甲基化状态可包括用甲基化敏感性内切核酸酶消化基因组DNA;和/或确定甲基化状态可以包括测量测序期间甲基化碱基并入的速率;和/或确定甲基化状态可以包括当包括测量甲基化碱基的分子通过纳米孔时的电流。在任何前述实施例、方面或情况中,确定甲基化状态可以包括甲基化DNA免疫沉淀、通过亲和纯化的甲基化DNA捕获或简化代表性亚硫酸氢盐测序。在任何前述实施例、方面或情况中,确定甲基化状态可以包括核酸杂交,例如微阵列或珠阵列杂交。

在任何前述实施例、方面或情况中,物理分离可以包括选择被预测为体细胞克隆异常的植物进行破坏;和/或选择预测缺乏体细胞克隆异常的植物进行培养。在一些情况下,选择使用于培养的植物发芽,种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。

在一些实施例中,本发明提供用于确定油棕植物中存在或不存在体细胞克隆异常的计算机程序产品,所述计算机程序产品包括:用程序代码编码的计算机可读介质,所述程序代码包括:用于接收代表来自油棕植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态的甲基化值的程序代码,其中所述DMR处于与SEQ ID NO:1序列至少70%,80%,90%,95%或99%一致,或一致的DNA序列内;以及用于将所述甲基化值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述甲基化值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。

在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,所述至少一个胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些方面,对照值是植物外源的对照基因座的甲基化值。在一些方面,对照值是植物内源的对照基因座的甲基化值。

在一些方面,其中所述程序代码包括用于接收至少两个、三个或四个不同DMR中的至少一个胞嘧啶的甲基化状态的程序代码,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于来自所述植物的样品中的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR处于来自所述植物的样品中的DNA区域内,其中每个DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在任何前述计算机程序产品中,在一些情况下,所述计算机程序产品可以预测植物中存在或不存在体细胞克隆异常。在一些情况下,体细胞克隆异常呈现出Mantled表型。

在一些实施例中,本发明提供用于确定来自油棕植物的生物样品中至少一个DMR的甲基化状态的试剂盒,所述试剂盒包含:(1)多核苷酸(例如,可检测地标记的多核苷酸)或成对的多核苷酸(例如,其中可检测地标记所述对中的一条或两条多核苷酸),其能够特异性扩增至少一部分DMR,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;和甲基化依赖性,甲基化敏感性限制酶和/或亚硫酸氢钠;或(2)亚硫酸氢钠、用于全基因组扩增的引物和接头,以及至少一种多核苷酸以量化来自DMR的至少一个胞嘧啶的转化的甲基化序列和/或转化的未甲基化序列的存在,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(3)甲基化敏感性限制酶,用于全基因组扩增的引物和接头,和至少一种多核苷酸以量化至少一部分DMR的拷贝数,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(4)甲基化感测结合部分和至少一种多核苷酸以量化至少一部分DMR的拷贝数,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内。

在一些方面,DMR处于来自所述植物的样品的DNA元区内,其中DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%,80%,90%,95%或99%一致或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况中,DMR处于生物标记物内,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致或一致。

在一些方面,所述试剂盒包含能够特异性扩增两个、三个或四种不同DMR的至少一部分的至少两种、三种或四种多核苷酸或两对、三对或四对多核苷酸,其中每个DMR是独立地处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于DNA元区内,其中所述DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR处于与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致或一致的DNA序列内。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致或一致。

在一些方面,试剂盒还包含特异性检测扩增的DMR或其一部分的可检测地标记的多核苷酸探针。在一些情况下,多核苷酸探针在实时扩增反应中特异性检测扩增的DMR或其一部分。在一些实施例中,本发明提供了预测油棕植物中存在或不存在体细胞克隆异常的方法,所述方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中的差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;和c)使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常。

在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,所述确定步骤包括确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、69和70(或选自SEQ ID NO:63、64、65、66、67、68、69和70)的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、39、40、42、43、44、45、46、48、49、51、52、57、58、59、60、61和73的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、11、12、14、15、16、17、18、20、21、23、24、29、30、31、32、33和71的序列至少90%、95%或99%一致,或一致的生物标记物中的至少一个胞嘧啶的甲基化状态相对于对照基因座减少时,预测存在体细胞克隆异常.

在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、68和69(或选自SEQ ID NO:63、64、65、66、67、68、69和70))的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、37、38、41、42、47、50、52、53、54、55、56、57、62和74的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、9、10、13、14、19、22、24、25、26、27、28、29、34和72的序列至少90%、95%或99%一致,或一致的生物标记物中至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些方面,所述方法包括当至少一个胞嘧啶的甲基化状态相对于对照基因座增加或减少时,预测存在体细胞克隆异常。在一些情况下,对照基因座是内源对照基因座。在一些情况下,对照基因座是外源对照基因座。

在一些方面,确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内。在一些方面,每个DMR处于来自所述植物的样品的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,每个DMR处于来自所述植物的样品的DNA区域内,其中每个DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,所述确定步骤包括确定在每个DMR的生物标记物中至少一个胞嘧啶的甲基化状态,其中每个标记物与独立选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些方面,体细胞克隆异常包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。

在一些情况下,体细胞克隆异常呈现出Mantled表型。

在一些方面,确定甲基化状态包括亚硫酸氢盐转化;和/或用甲基化依赖性内切核酸酶消化基因组DNA;和/或用甲基化敏感性内切核酸酶消化基因组DNA。

在一些实施例中,本发明提供一种方法,所述方法包括:提供对多棵植物中存在或不存在体细胞克隆异常的预测,其中存在或不存在体细胞克隆异常由差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态确定,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;以及使预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。

在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中DNA区域与选自SEQ ID NO:63、64、65、66、67、68、69和70序列至少70%、80%、90%、95%或99%一致,或一致。在一些方面,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,确定步骤包括:确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%,95%或99%一致,或一致。

在一些方面,本发明提供一种用于检测或预测油棕植物的体细胞克隆异常的方法,该方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;c)使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联。在一些实施例中,所述方法还包括对预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况下,所述物理分离包括选择预测为体细胞克隆异常的植物以进行破坏。

在一些情况下,所述物理分离包括选择被预测缺乏体细胞克隆异常的植物以进行培养。在一些情况下,选择使用于培养的植物发芽、种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理未被选择用于培养的植物以降低体细胞克隆异常的可能性。在一些实施例中,所述至少一个胞嘧啶是CHG序列中的第一胞嘧啶,其中H为C、A或T.

在一些方面,DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些实施例中,DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。

在一些情况下,所述确定步骤包括确定生物标记物中至少一个胞嘧啶的甲基化状态,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。在一些情况下,所述DMR处于来自所述植物的样品的DNA区域内,所述DNA区域与SEQ ID NO:84、87或90至少90%、95%或99%一致,或一致。

在一些情况下,至少一个胞嘧啶处于AlwNI、BbvI、ScrFI或RsaI限制性内切核酸酶识别位点中。在一些情况下,所述方法包括确定第一个胞嘧啶和第二个胞嘧啶的甲基化状态,其中所述第一个胞嘧啶处于来自所述植物的样品中的DNA区域的DMR内,其中所述DNA区域与SEQ ID NO:87至少90%、95%或99%一致或一致,并且其中所述第二个胞嘧啶处于来自所述植物的样品中的DNA区域的DMR内,其中所述DNA区域与SEQ ID NO:90至少90%、95%或99%一致或一致。在一些情况下,所述第一个胞嘧啶处于BbvI限制性内切核酸酶位点中,并且所述第二个胞嘧啶处于RsaI限制性内切核酸酶位点中。

在一些情况下,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态减少时,预测存在体细胞克隆异常。在一些情况下,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态增加时,预测存在体细胞克隆异常。在一些情况下,所述方法包括当所述至少一个胞嘧啶的甲基化状态相对于对照基因座的甲基化状态增加或减少时,预测存在体细胞克隆异常。在一些情况下,对照基因座是内源对照基因座。在一些情况下,对照基因座是外源对照基因座。

在一些情况下,确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)中至少一个胞嘧啶的甲基化状态,其中每个DMR独立地处于与SEQ ID NO:1至少90%、95%或99%一致或一致的DNA序列内。

在一些方面,体细胞克隆异常包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。

在一些情况下,体细胞克隆克隆异常被预测为呈现出Mantled表型。

在一些方面,确定甲基化状态包括亚硫酸氢盐转化。在一些情况下,确定甲基化状态包括用甲基化依赖性内切核酸酶消化基因组DNA。在一些情况下,确定甲基化状态包括用甲基化敏感性内切核酸酶消化基因组DNA。在一些情况下,在消化后扩增基因组DNA。

在一些情况下,确定甲基化状态包括亚硫酸氢盐转化;和/或确定甲基化状态包括用甲基化依赖性内切核酸酶消化基因组DNA;和/或确定甲基化状态包括用甲基化敏感性内切核酸酶消化基因组DNA;和/或确定甲基化状态包括测量测序期间甲基化碱基并入的速率;和/或确定甲基化状态包括当包括测量甲基化碱基的分子通过纳米孔时的电流。在一些情况下,确定甲基化状态可以包括甲基化DNA免疫沉淀、通过亲和纯化的甲基化DNA捕获或减少的代表性亚硫酸氢盐测序。在一些情况下,确定甲基化状态可以包括核酸杂交,例如微阵列或珠阵列杂交。

在一些方面,本发明提供用于检测或预测油棕植物的体细胞克隆异常的方法,所述方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中的至少一种小RNA的表达水平,其中所述至少一种小RNA由包含与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码;和c)将所述至少一种小RNA的表达水平与所述植物中存在或不存在体细胞克隆异常相关联。在一些实施例中,所述至少一种小RNA的表达水平相对于正常对照植物中所述至少一种RNA的表达增加或降低至少2倍。

在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ ID NOs:144-161中至少一个序列至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,与来自预测为体细胞克隆异常的植物的样品中的SEQ ID NOs:144-161中任何一个序列至少90%一致的至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%低。在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ ID NO:91至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,来自预测为体细胞克隆异常的植物的样品中与SEQ ID NO:91至少90%一致的所述至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%、40%、30%或10%低。

在一些情况下,生物样品来自植物的茎尖组织。在一些情况下,所述生物样品来源于所述植物的<2cm期花序组织。在一些情况下,所述生物样品来源于所述植物的至少2cm期花序组织。在一些情况下,所述生物样品来源于体外组织培养的植物细胞、种子或幼苗。

在一些实施例中,所述方法还包括将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些实施例中,所述物理分离包括选择被预测为体细胞克隆异常的植物进行破坏。在一些情况下,所述物理分离包括选择将预测为缺乏体细胞克隆异常的植物进行培养。在一些情况下,选择使用于培养的植物发芽、种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理未被选择用于培养的植物以降低体细胞克隆异常的可能性。在一些情况下,体细胞克隆异常被预测呈现出Mantled表型。

在一些方面,本发明提供用于检测或预测油棕植物的体细胞克隆异常的方法,所述方法包括:a)从所述植物获得生物样品;b)确定由SEQ ID NO:5、75、78或80编码的转录物的表达水平;和c)使所述表达水平与所述植物中存在或不存在体细胞克隆异常相关联。在一些实施例中,当SEQ ID NO:5的表达水平相对于野生型对照植物降低时,或当SEQ ID NO:75或78或80的表达水平相对于野生型对照植物增加时,预测植物体细胞克隆异常。在一些实施例中,当SEQ ID NO:75或78或80的表达水平相对于SEQ ID NO:5的表达水平增加时,预测植物体细胞克隆异常。

在一些实施例中,所述方法还包括将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况,所述物理分离包括选择被预测为体细胞克隆异常的植物进行破坏。在一些情况下,所述物理分离包括选择将预测为缺乏体细胞克隆异常的植物进行培养。在一些情况下,选择使用于培养的植物发芽、种植或移植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理未被选择用于培养的植物以降低体细胞克隆异常的可能性。

在一些实施例中,预测体细胞克隆异常呈现Mantled表型。

在一些方面中,本发明提供用于预测油棕植物中存在或不存在体细胞克隆异常的计算机程序产品,所述计算机程序产品包括:用程序代码编码的计算机可读介质,所述程序代码包括:用于接收代表来自油棕植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态的甲基化值的程序代码,其中所述DMR处于与SEQ ID NO:1序列至少70%,80%,90%,95%或99%一致,或一致的DNA序列内;以及用于将所述甲基化值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述甲基化值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。

在一些实施例中,所述DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些情况下,所述DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。在一些情况下,所述至少一个胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些情况下,所述对照值是植物外源的对照基因座的甲基化值。在一些情况下,所述对照值是植物内源的对照基因座的甲基化值。在一些情况下,其中所述程序代码包括用于接收至少两个、三个或四个不同DMR中的至少一个胞嘧啶的甲基化状态的程序代码,其中每个DMR独立地处于与SEQ ID NO:1至少90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于来自所述植物的样品中的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。

在一些情况下,每个DMR处于来自所述植物的样品中的DNA区域内,其中每个DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。在一些情况下,预测体细胞克隆异常呈现出Mantled表型。

在一些方面中,本发明提供用于确定油棕植物中存在或不存在体细胞克隆异常的计算机程序产品,所述计算机程序产品包括:用程序代码编码的计算机可读介质,所述程序代码包括:用于接收值的程序代码,所述值代表:i)小RNA的表达水平(例如,来自植物的样品的小RNA的表达水平),其中所述小RNA由包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码;2)与SEQ ID NO:5、75、78或80至少90%、95%或99%一致,或一致的转录物的表达水平;以及用于将所述表达水平值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述表达水平值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。

在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ ID NOs:144-161中至少一个序列至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,与来自预测为体细胞克隆异常的植物的样品中的SEQ ID NOs:144-161中任何一个序列至少90%、95%或99%一致的所述至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%低。在一些情况下,来自所述植物的样品中的所述至少一种小RNA由包含与SEQ ID NO:91至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。在一些情况下,来自预测为体细胞克隆异常的植物的样品中的与SEQ ID NO:91至少90%、95%或99%一致的所述至少一种小RNA的表达水平比正常对照植物中所述至少一种小RNA的表达水平的50%、40%、30%或10%低。

在一些情况下,所述计算机程序产品可以预测所述植物中存在或不存在体细胞克隆异常。在一些情况下,体细胞克隆异常呈现Mantled表型。在一些情况下,通过应用计算机程序产品将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些实施例中,本发明提供用于测定来自油棕植物的生物样品中至少一个DMR的甲基化状态的试剂盒,其中所述DMR处于与SEQ ID NO:1至少90%、95%或99%一致,或一致的DNA序列内;所述试剂盒包括:(1)亚硫酸氢钠、寡核苷酸扩增引物和至少一种多核苷酸以量化来自DMR的至少一个胞嘧啶的未转化的甲基化和/或转化的未甲基化序列的存在;(2)甲基化敏感性限制酶和甲基化依赖性限制酶、寡核苷酸扩增引物和至少一种多核苷酸以量化至少一部分DMR的拷贝数;(3)甲基化感测结合部分和至少一种多核苷酸以量化至少一部分DMR的拷贝数,其中至少一个胞嘧啶的甲基化状态预示着油棕植物的体细胞克隆异常。

在一些实施例中,所述甲基化敏感性或依赖性限制酶对油棕植物是异源的。在一些实施例中,所述甲基化敏感性或依赖性限制酶选自AlwNI、BbvI、RsaI和ScrFI。在一些实施例中,所述试剂盒包括BbvI和RsaI。在一些实施例中,用于量化来自DMR的至少一个胞嘧啶的未转化的甲基化或转化的未甲基化序列的存在的至少一种多核苷酸包括与来自含有亚硫酸氢盐转化的胞嘧啶的DMR的序列特异性杂交的序列。在一些实施例中,用于量化至少一部分DMR的拷贝数的至少一种多核苷酸包括与来自含有亚硫酸氢盐转化的胞嘧啶的DMR的序列特异性杂交的序列。

在一些实施例中,甲基化敏感性结合部分为抗体。在一些实施例中,所述DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。在一些实施例中,所述DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致,或一致。在一些情况下,所述DMR处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些实施例中,所述试剂盒包括能够特异性扩增两个、三个或四个不同DMR中的至少一部分的至少两种、三种或四种多核苷酸或至少两对、三对或四对多核苷酸,其中每个DMR独立地处于与SEQ ID NO:1至少90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于DNA元区内,其中所述DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少90%、95%或99%一致,或一致。

在一些情况下,每个DMR处于与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少90%、95%或99%一致或一致的DNA序列内。在一些情况下,每个DMR处于生物标记物内,其中每个生物标记物与独立地选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致或一致。在一些情况下,所述试剂盒还包含特异性检测扩增的DMR或其一部分的可检测地标记的多核苷酸探针。在一些情况下,多核苷酸探针在实时扩增反应中特异性检测扩增的DMR或其一部分。

在一些方面中,本发明提供用于检测油棕植物中RNA表达水平的试剂盒,所述试剂盒包括:a)能够与小RNA特异性杂交的寡核苷酸引物,所述小RNA由包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码;或b)能够与转录物特异性杂交的寡核苷酸引物,所述转录物由SEQ ID NO:5、75、78或80编码,其中检测的表达水平预示着油棕植物的体细胞克隆异常。在一些情况下,所述试剂盒还包含可检测地标记的多核苷酸探针;或其中可检测地标记所述寡核苷酸引物。在一些情况下,b)的寡核苷酸引物包括SEQ ID NO:125、126、127、128或129。在一些情况下,a)的寡核苷酸引物能够与小RNA特异性杂交,所述小RNA由包括与SEQ ID NOs:144-161之一至少90%(例如,91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)一致的多核苷酸的序列编码。

在一些方面中,本发明提供减少通过体外组织培养繁殖的油棕植物的体细胞克隆异常的方法,所述方法包括:将SEQ ID NO:5或与SEQ ID NO:5至少90%、95%或99%一致的序列编码的mRNA外源施用于所述植物;或将小RNA外源施用于所述植物,所述小RNA由包含与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的多核苷酸的序列编码。在一些实施例中,外源施用所述mRNA或小RNA包括使所述植物的细胞质或细胞核与mRNA或小RNA接触。在一些实施例中,外源施用所述mRNA或小RNA包括使所述植物与包括异源启动子的表达盒接触,所述异源启动子可操作地连接至与SEQ ID NO:5至少90%、95%或99%一致或一致的多核苷酸。

在一些实施例中,外源施用所述mRNA或小RNA包括使所述植物与包括异源启动子的表达盒接触,所述异源启动子可操作地连接至编码小RNA的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的序列。在一些实施例中,外源施用所述mRNA或小RNA包括使体外组织培养的植物细胞与所述mRNA或小RNA接触。

在一些方面,本发明提供包含异源启动子的表达盒,所述异源启动子可操作地连接至:i)编码小RNA的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%、95%或99%一致或一致的序列;或ii)编码mRNA的多核苷酸,其中,所述多核苷酸包括与SEQ ID NO:5至少90%、95%或99%一致或一致的序列。表达盒可以是异源表达盒。在一些方面,本发明提供了包括前述任一种表达盒的重组植物。

在一些实施例中,本发明提供预测油棕植物存在或不存在体细胞克隆异常的方法,所述方法包括:a)从所述植物获得生物样品;b)确定来自所述植物的样品中差异甲基化区域(DMR)或亚区域的甲基化密度,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的序列内;和c)使所述甲基化密度与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常。

在一些方面,所述DMR处于来自所述植物的样品中的DNA元区内,其中所述DNA元区与选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述DMR处于来自所述植物的样品中的DNA区域内,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述确定步骤包括确定生物标记物中甲基化密度,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些方面,所述方法包括当甲基化密度相对于对照基因座降低时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:63、64、65、66、67、69和70(或选自SEQ ID NO:63、64、65、66、67、68、69和70)的序列至少70%、80%、90%、95%或99%一致,或一致的DNA元区中甲基化密度相对于对照基因座降低时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:35、36、39、40、42、43、44、45、46、48、49、51、52、57、58、59、60、61和73的序列至少70%、80%、90%、95%或99%一致,或一致的DNA区域中甲基化密度相对于对照基因座减少时,预测存在体细胞克隆异常。在一些情况下,当与选自SEQ ID NO:7、8、11、12、14、15、16、17、18、20、21、23、24、29、30、31、32、33和71的序列至少90%、95%或99%一致,或一致的生物标记物中的甲基化密度相对于对照基因座降低时,预测存在体细胞克隆异常.

在一些方面,所述确定步骤包括确定至少两个、三个或四个不同的差异甲基化区域(DMR)的甲基化密度,其中每个DMR独立地处于与SEQ ID NO:1至少70%、80%或90%、95%或99%一致,或一致的DNA序列内。在一些情况下,每个DMR处于来自所述植物的样品的DNA元区内,其中每个DNA元区与独立地选自SEQ ID NO:63、64、65、66、67、68、69和70的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,每个DMR处于来自所述植物的样品的DNA区域内,其中所述DNA区域与独立地选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述确定步骤包括确定在每个DMR的生物标记物中的甲基化密度,其中每个标记物与独立选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些方面,体细胞克隆异常包括相对于对照植物,果实产量、油产量、生长或植物繁殖降低。在一些情况下,对照植物是亲本植物。在一些情况下,对照植物是与预测为体细胞克隆异常的植物的果形表型(dura、tenera或pisifera)相同的野生型植物。

在一些情况下,体细胞克隆异常呈现出Mantled表型。

在一些方面,确定甲基化密度包括亚硫酸氢盐转化;和/或用甲基化依赖性内切核酸酶消化基因组DNA;和/或用甲基化敏感性内切核酸酶消化基因组DNA。在一些情况下,甲基化密度是CHG甲基化密度。

在一些实施例中,本发明提供一种方法,所述方法包括:提供对多棵植物存在或不存在体细胞克隆异常的预测,其中存在或不存在体细胞克隆异常由来自每棵植物的样品中的差异甲基化区域(DMR)内的甲基化密度确定(例如,CHG甲基化密度),其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;以及将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。

定义

本文所用的“植物”是指来自植物界的生物体的任何细胞或细胞群。“油棕植物”是指物种E.guineensis的生物体的任何细胞或细胞群。非限制性实例包括完整植物、营养枝器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟子房),植物组织(例如维管组织、基本组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)和相同的后代。非限制性实例还包括来自体外细胞培养物的植物细胞或植物细胞群。

本文所使用的“原株(ortet)”是指产生克隆的来源棕榈。“克隆”是指通过在无菌条件下克隆繁殖获得的来自标本植物组织或细胞的基因上一致或基本一致的棕榈拷贝。“分株”是指通过体外繁殖衍生的植物。“外植体”是指用于体外繁殖的棕榈的切除组织。“半克隆(Semiclone)”是指来源于克隆亲本和幼苗亲本之间的杂交的后代。“双克隆(Biclone)”是指来源于杂交的子代,其中两个亲本都是克隆。

本文所用的术语“体细胞克隆异常”是指在体外培养中出现的任何表型或基因型(例如表观遗传)修饰。例如,Mantled表型可以作为经历体外培养的油棕植物中出现的体细胞克隆异常而出现。

“甲基化”是指胞嘧啶的C5位置,腺嘌呤的N6位置的胞嘧啶甲基化和/或羟甲基化或其它类型的核酸甲基化。体外扩增的DNA是未甲基化的,因为体外DNA扩增方法不保留扩增模板的甲基化模式。然而,“未甲基化DNA”或“甲基化DNA”也可以分别指其原始模板未甲基化或甲基化的扩增的DNA。

“甲基化图谱”是指代表来自例如植物的基因组,例如来自植物的细胞或组织的DNA分子内的一个或多个基因座的甲基化状态的一组数据。该图谱可以指示植物中每个碱基的甲基化状态,可以包括关于基因组中碱基对的子集(例如,特异性限制性酶识别序列的甲基化状态)的信息,或可以包括关于每个基因座的区域甲基化密度的信息。

“甲基化状态”是指DNA的一部分内的特定核苷酸或核苷酸的甲基化的存在、不存在和/或数量。特定DNA序列(例如,本文所述的DNA生物标记物或DNA区域)的甲基化状态可以指示所述序列中每个碱基的甲基化状态,或者可以指示所述序列内的碱基对子集的甲基化状态(例如,胞嘧啶的甲基化状态或一个或多个特异限制性内切酶识别序列的甲基化状态),或可以指示关于所述序列内的区域甲基化密度的信息,而不提供在序列中甲基化发生在何处的精确信息。甲基化状态可以任选地由“甲基化值”表示或指示。甲基化值可以例如通过量化用甲基化依赖性限制酶限制性消化后存在的完整DNA的量而产生。在该实施例中,如果使用定量PCR量化DNA中的特定序列,则模板DNA的量大致等于模拟处理的对照表明该序列不是高度甲基化的,而模板的量显着小于模拟处理的样品中产生的量表明该序列存在甲基化的DNA。因此,例如来自上述实施例的值,即甲基化值,代表甲基化状态,因此可用作甲基化状态的定量指标。当期望将样品中的序列的甲基化状态与阈值进行比较时,这是特别有用的。

“甲基化依赖性限制酶”是指在甲基化识别序列处或附近剪切或消化DNA,但是当识别序列未甲基化时不在相同序列处或附近剪切DNA的限制酶。甲基化依赖性限制酶包括在甲基化识别序列处切割的酶(例如,DpnI)和在接近识别序列但不在识别序列处切割的酶(例如McrBC)。例如,McrBC的识别序列是5'RmC(N40-3000)RmC 3',其中“R”是嘌呤,“mC”是甲基化胞嘧啶,“N40-3000”表示观察到限制事件的两个RmC半位点之间的距离。McrBC通常接近一个半位点或另一个位点切割,但是剪切位置通常分布在几个碱基对上,从甲基化碱基起约30个碱基对。McrBC有时切割两个半位点的3',有时切割两个半位点的5',有时在两个位点之间切割。典型的甲基化依赖性限制酶包括例如McrBC(参见,例如,美国专利号5,405,760)、McrA、MrrA、DpnI、MspJI、LpnPI、AspBHI、RlaI和SgrTI。本领域技术人员会理解,任何甲基化依赖性限制酶,包括本文所述的限制酶的同源物和直系同源物,也适用于本发明。

“甲基化敏感性限制酶”是指在未甲基化识别序列处或附近剪切DNA但在识别序列甲基化时不在相同序列处或附近剪切的限制酶。例如,McClelland et al.,Nucleic Acids Res.22(17):3640-59(1994)和http://rebase.neb.com描述了典型的甲基化敏感性限制酶。当识别序列内的胞嘧啶在位置C5处甲基化时,在识别序列处或附近不剪切DNA的合适的甲基化敏感性限制酶包括,例如Aat II、Aci I、Acl I、Age I、Alu I、Asc I、Ase I、AsiS I、Bbe I、BsaA I、BsaH I、BsiE I、BsiW I、BsrF I、BssH II、BssK I、BstB I、BstN I、BstU I、Cla I、Eae I、Eag I、Fau I、Fse I、Hha I、HinP1I、HinC II、Hpa II、Hpy99I、HpyCH4IV、Kas I、Mbo I、Mlu I、MapA1I、Msp I、Nae I、Nar I、Not I、Pml I、Pst I、Pvu I、Rsr II、Sac II、Sap I、Sau3A I、Sfl I、Sfo I、SgrA I、Sma I、SnaB I、Tsc I、Xma I和Zra I。当识别序列内的腺苷在N6位置甲基化时不在其识别序列处或附近剪切DNA的合适的甲基化敏感性限制酶包括例如MboI。本领域技术人员会认识到任何甲基化敏感性限制酶,包括本文所述的限制酶的同源物和直系同源物也适用于本发明。本领域技术人员会进一步认识到,在其识别序列处或附近存在胞嘧啶甲基化的情况下不能进行切割的甲基化敏感性限制酶可能对其识别序列处或附近的腺苷甲基化的存在并不敏感。同样,在其识别序列处或附近存在腺苷甲基化的情况下不能进行切割的甲基化敏感性限制酶可能对其识别序列处或附近的胞嘧啶甲基化的存在并不敏感。例如,Sau3AI对于在其识别序列处或附近的甲基化胞嘧啶的存在是敏感的(即,不能切割),但对在其识别序列处或附近的甲基化腺苷的存在是不敏感的(即,切割)。本领域技术人员还会认识到,一些甲基化敏感性限制酶通过包含其识别序列的DNA的一条或两条链上的碱基的甲基化而阻断,而其它甲基化敏感性限制酶仅通过两条链上的甲基化阻断,但如果识别位点是半甲基化的,则可以切割。

“区分具有和不具有特定体细胞克隆异常的植物的阈值”是指可用于区分来自异常植物的样品和来自非异常植物的样品的特定测量值或值范围。理想地,存在绝对地区分两个组的阈值或值(即,来自异常组的值总是或几乎总是在阈值的一侧(例如,较高),并且来自野生型组的值总是或几乎总是在阈值的另一侧(例如,较低))。然而,在许多情况下,阈值不是绝对地区分异常和野生型样品(例如,当异常和野生型样品产生的值存在一些重叠时)。

术语“生物标记物”是指DNA区域、差异甲基化区域(DMR)或DNA元区的子序列。在一些情况下,生物标记物与DNA区域、DMR或DNA元区的一部分一致。在一些情况下,生物标记物与DNA区域、DMR或DNA元区的一部分基本上一致,或至少90%、95%或99%一致。可以使用任何BLAST进行序列比较,包括具有默认参数的BLAST 2.2算法,分别描述于Altschul et al.,Nuc.Acids Res.25:3389 3402(1997)和Altschul et al.,J.Mol.Biol.215:403410(1990中。因此,例如,本文所述的DNA区域或生物标记物可对应于油棕植物基因组的DNA序列,即使在生物标记物或DNA区域与所讨论的特定的油棕植物基因组之间存在轻微变异。这种差异可能是油棕植物之间轻微遗传变异的结果。因此,本文所述的DMR、DNA区域、DNA元区和生物标记物可以与SEQ ID NO:1的子序列至少约90%、95%、99%、99.9%一致,基本一致或一致。

给定的生物标记物的“灵敏度”是指报告DNA甲基化值与区分野生型样品和异常样品的阈值不同的体细胞克隆异常样品的百分比。例如,在一些情况下,当甲基化相对于阈值增加时,预测存在体细胞克隆克隆异常。在这种情况下,灵敏度计算如下:

该方程式也可以表示如下:

其中真阳性定义为来自经证实为体细胞克隆异常的植物(例如,Mantled植物)的样品报告DNA甲基化值高于阈值(即与表型相关联的范围),假阴性定义为经证实为体细胞克隆异常样品报告DNA甲基化值低于阈值(即与无体细胞克隆异常相关联的范围)。在当甲基化低于阈值时,预测体细胞克隆异常的情况下,本领域技术人员可以轻易地修改上述方程式。类似地,当通过DNA区域中或生物标记物内甲基化的增加或减少来预测体细胞克隆异常时,可以组合上述方程及其修改版本以获得灵敏度值。

因此,灵敏度的值反映了从已知异常样品获得的给定生物标记物的DNA甲基化测量值将在体细胞克隆异常相关测量值的范围内的概率。本文所定义的计算的灵敏度值的相关性表示当应用于具有该条件的植物时,给定的生物标记物将检测到存在体细胞克隆异常的概率的估计。给定的生物标记物的“特异性”是指报告DNA甲基化值与区分体细胞克隆异常样品和野生型样品的阈值不同的野生型样品的百分比。例如,在一些情况下,当甲基化相对于阈值降低时,预测不存在体细胞克隆异常。在这种情况下,计算特异性如下:

该方程式也可以表示如下:

其中真阴性定义为来自经证实为体细胞克隆正常的植物的样品报告DNA甲基化值低于阈值(即与无异常相关联的范围),假阳性定义为来自经证实为体细胞克隆正常的植物的样品,其确认为部分正常报告DNA甲基化值高于阈值(即与异常相关联的范围)。因此,特异性的值反映了从已知的非异常样品获得的给定生物标记物的DNA甲基化测量值将在野生型相关测量值的范围内的概率。在当甲基化低于阈值时,预测体细胞克隆异常的情况下,本领域技术人员可以轻易地修改上述方程式。类似地,当通过DNA区域中或生物标记物内甲基化的增加或减少来预测体细胞克隆异常时,可以组合上述方程及其修改版本以获得特异性值。本文所定义的计算的灵敏度值的相关性表示当应用于不具有该条件的植物时,给定的生物标记物将预测缺乏体细胞克隆异常的概率的估计。

公众可通过国家生物技术信息中心(National Center for Biotechnology Information)获得用于执行BLAST分析的软件。该算法涉及首先通过在查询序列中鉴定长度为W的短字来鉴定高分序列对(HSP),当与数据库序列中相同长度的字比对时,高分序列对匹配或满足某些正评估的阈值分T。T被称为邻近字分数阈值(Altschul et al.,同上)。这些最初的邻近字采样充当了开始搜索以发现含有它们的更长的HSP的种子。所述邻近字采样沿着每个序列的两个方向延伸,直到累积的比对分数可提高。对于核苷酸序列,使用参数M(匹配的残基对的奖励分;总是>0)和N(错配残基的罚分;总是<0)来计算累积的分数。对于氨基酸序列,使用计分矩阵来计算累积的分数。当累积的比对分数从其达到的最大值下降了数值X;由于一个或多个负得分残基比对的积累,累积的分数达到零或低于零;或到达任何一个序列的末端时,停止在每个方向上字采样的延伸。BLAST算法的参数W、T和X决定了比对的灵敏性和速度。BLASTN程序(对于核苷酸序列)默认使用的是,字长度(W)11,期望值(E)10,M=5,N=-4,并且比较两条链。对于氨基酸序列,BLASTP程序默认使用的是,字长度(W)3,期望值(E)10,和BLOSUM62计分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)50,期望值(E)10,M=5,N=-4,并且比较两条链。

本文所用的术语“核酸”、“多核苷酸”和“寡核苷酸”是指核酸区域、核酸区段、引物、探针、扩增子和寡聚物片段。该术语不受长度的限制,并且对多脱氧核糖核苷酸(含有2-脱氧-D-核糖),多核糖核苷酸(含有D核糖)和任何其它嘌呤或嘧啶碱基或修饰的嘌呤或嘧啶碱的N-糖苷是通用的。这些术语包括双链和单链DNA,以及双链和单链RNA。

核酸、多核苷酸或寡核苷酸可以包括例如磷酸二酯键或修饰的键,包括但不限于磷酸三酯、氨基磷酸酯、硅氧烷、碳酸酯、羧甲基酯、乙酰胺酯、氨基甲酸酯、硫醚,桥连的氨基磷酸酯、桥连的亚甲基膦酸酯、硫代磷酸酯、甲基膦酸酯、二硫代磷酸酯、桥连的硫代磷酸酯或砜键,以及这些键的组合。

核酸、多核苷酸或寡核苷酸可以包含五种生物学上存在的碱基(腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶)和/或除了五种生物学上存在的碱基之外的碱基。例如,本发明的多核苷酸可以含有一个或多个修饰的,非标准的或衍生的碱基部分或一个或多个修饰的糖部分。

通过在比较窗口上比较两个最佳比对序列来确定“序列一致性百分比”或“一致性”,其中比较窗口中多核苷酸序列的部分相比参照序列(其不包含添加或缺失)可以包含添加或缺失(即,空隙),用于使两个序列进行最佳比对。通过以下步骤计算百分比:确定在两个序列中出现一致的核酸碱基或氨基酸残基的位置的数目,产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数,并将结果乘以100以产生序列一致性的百分比。

术语多肽序列的“基本一致”是指多肽包括具有至少75%序列一致性的序列。可替换地,一致性百分比可以是75%至100%的任何整数。典型实施例包括与使用本文所述程序(优选使用标准参数进行BLAST)的参考序列相比至少:75%、80%、85%、90%、95%或99%,如下文所述。技术人员将认识到,通过考虑密码子简并性、氨基酸相似性、阅读框定位等,可以适当地调整这些值以确定由两个核苷酸序列编码的蛋白质的一致性。除了不一致的残基位置可以因保守氨基酸改变而不同之外,“基本相似”的多肽共享如上所述的序列。保守氨基酸取代是指具有相似侧链的残基的可互换性。例如,具有脂肪族侧链的氨基酸组是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的氨基酸组是丝氨酸和苏氨酸;具有含酰胺侧链的氨基酸组是天冬酰胺和谷氨酰胺;具有芳香族侧链的氨基酸组是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的氨基酸组是赖氨酸、精氨酸和组氨酸;具有含硫侧链的氨基酸组是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,天冬氨酸-谷氨酸和天冬酰胺-谷氨酰胺。核苷酸序列基本一致的另一个指示是,两个分子在严格条件下彼此或与第三核酸是否杂交。严格条件是依赖于序列的,并且在不同情况下将不同。通常,将严格条件选择为比确定的离子强度和pH下的特定序列的热解链温度(Tm)低约5℃。Tm是50%的靶序列与完全匹配的探针杂交的温度(在确定的离子强度和pH下)。通常,严格条件是在pH 7下盐浓度为约0.02摩尔,温度为至少约60℃的条件。

本文所用,术语“特异性杂交”在寡核苷酸的背景下是指在合适条件下与序列杂交但不与其它相关或不相关序列杂交的寡核苷酸。在一些情况下,合适的条件是严格的杂交条件。在一些情况下,合适的条件是核酸扩增条件,例如PCR扩增条件。在一些情况下,与核酸特异性杂交的寡核苷酸可以与亚硫酸氢盐转化的核酸杂交,但不与对亚硫酸氢盐转化有抗性的相同序列的核酸(例如甲基化核酸)或者没有经历亚硫酸氢盐转化的核酸杂交。在一些情况下,与核酸特异性杂交的寡核苷酸可以与核酸序列杂交,但不与已经进行亚硫酸氢盐转化的相同序列的核酸杂交。

在异源启动子的背景下,术语异源是指可操作地连接编码RNA或蛋白质的多核苷酸序列的启动子,其中在野生型生物体中没有发现该启动子可操作地连接该多核苷酸。类似地,在异源表达盒的背景下,术语“异源”指与野生型生物体中发现的任何表达盒不同的表达盒。因此,术语异源表达盒可以含有内源启动子和内源编码序列,只要表达盒作为整体不是天然存在于野生型生物体中即可。

附图说明

图1.正常果形和mantled果形。a-c,(a)正常的果形,(b)可育的mantled果形和(c)单性结实的mantled果实。图像显示为全果(上),纵切果实(中)和横切果实(下)。全果这样展示:正常和单性结实的mantled为侧视图,而可育的mantled为顶视图,以使得多个假心皮可见。黑色箭头表示每个异常果实的几个假心皮之一。白色箭头表示正常果实和可育的mantled果实的木质化的壳和核,单性结实的mantled果实中不存在木质化的壳和核。

图2.mantled DNA甲基化对比正常DNA甲基化的显著变化的总结。“EgDEF”盒指示从外显子1的5'到转录物的3'末端的区域。根据标记,用灰框表示元件1(Rider)、2(Karma)和3(Koala)反转录转座子。显示出阵列特征ID号。基因组坐标表示除了阵列特征ID 107120和108280之外,每个阵列特征的最5'碱基相对于已公布的E.guineensis基因组的Scaffold p5_sc00322(Singh et al.,2013)的坐标。映射到已公布的E.guineensis基因组的Scaffold p5_sc00322(Singh et al.,2013)有两个特征,并且基因组坐标与p5_sc25957有关,如所公开的。这个小支架随后被映射到EgDEF1间隔,如图所示。在最左列指出了克隆谱系,并且指示每个谱系中mantled样品和正常样品的数目。黑框代表mantled样品的低甲基化事件相对于正常样品在统计学上是显著的。灰框表示mantled样品的超甲基化事件相对于正常样品在统计学上是显著的(p<0.05,双尾学生t检验)。白框表示测量报告DNA甲基化无显著差异。在整个基因座上存在统计学显著的差异甲基化区域(DMR),其中一个跨越Karma反转录转座子。

图3.微阵列特征的文氏图,其报道了mantled分株叶和正常叶之间甲基化差异显著(p<0.05,双侧学生t检验,Methods)。每个椭圆表示从一个来源(基因型)获得的克隆谱系:来源A(5棵mantled和9棵正常分株),来源B(14棵mantled和15棵正常分株),来源C(10棵mantled和10棵正常分株),以及来源D(8棵mantled和7棵正常分株)。基因型之间共享相对较少的特征,并且只有一个特征检测到来自所有4个来源的mantled棕榈中的低甲基化。带下划线的数字表示包括映射到Karma LINE元件(图2中展示的元件2)的四个微阵列特征中的一个的子集。

图4.EgDEF1/MANTLED基因在染色体12上的表观遗传图谱。a,微阵列特征数据绘制在EgDEF1/MANTLED基因的示意图上,包括Rider、Karma和Koala反转录转座子。CG和CHG位点如上所示。在y轴上绘制正常克隆分株(n=41)和单性结实的mantled克隆分株(n=37)之间的差异DNA甲基化密度测量结果的Log10p值(双侧学生t检验)。b,原株(O)、正常(N)和单性结实的mantled克隆分株(M)的叶样品的全基因组亚硫酸氢盐测序。在0至100%标度上绘制跨Karma的单个胞嘧啶的DNA甲基化密度(a中的框),并且表示原株(n=5)、正常分株(n=5)或mantled分株(n=5)的平均值。对CG、CHG和CHH甲基化分别绘图,如直方图的左侧所示。通过水平柱突出显示与Karma反转录转座子对应的差异CHG甲基化区域(CHG DMR)的位置。

图5.通过四个独立的MethylScreen试验测量差异CHG甲基化。根据实施例2所述设计试验。每个试验监测差异甲基化区域(CHG DMR)内的特定CHG胞嘧啶的甲基化。组1、2、3和4表示同一组的原株样品,加上来源于原株的树的一个正常样品,和一个mantled样品的独立组。如实施例2所述计算致密甲基化分子的百分比。使用的CHG甲基化敏感性限制酶是AlwNI(a)、BbvI(b)、ScrFI(c)和RsaI(d)。误差条表示重复试验的标准偏差。

图6.来自独立于图2-5代表的那些样品的原株、分株mantled和正常克隆的叶DNA样品中CHG甲基化的线性判别分析(LDA)。如实施例2所述,通过用甲基化敏感性限制酶Bbv I或Rsa I消化,然后进行定量PCR来监测CHG甲基化。对角线表示LDA确定的正常(原株(n=8)和正常分株(n=13))和mantled(单性结实的mantled分株(n=19),可育的mantled分株(n=2)和产生正常果实和可育的mantled果实的混合分株(n=7))CHG甲基化密度预测之间的阈值。显示了两个假阴性单性结实的mantled样品(FN1和FN2)。箭头指示图7b和7c中进一步分析的正常样品和mantled对照样品。

图7.a,来自正常克隆和mantled克隆(分株)的叶样品以及两个假阴性mantled样品的中的Karma元件的亚硫酸氢盐测序分析。计算在Karma剪接受体位点(在b-e中位点6),加上剪接位点上游27bp(位点5)和下游16bp(位点7)的另外两个CHG位置的CHG甲基化密度(未转化的CHG胞嘧啶碱基读数/总胞嘧啶碱基读数),所有这些都被在来自图3的所有4个来源的mantled棕榈中检测到低甲基化的独特的共有微阵列特征所覆盖。如星号所示,mantled对照样品和两个假阴性mantled样品相对于正常对照明显低甲基化(p<0.0001,双尾Fisher精确检验)。b-e,(b)正常对照样品,(c)mantled对照样品和(d)FN1假阴性mantled样品和(e)FN2假阴性mantled样品中Karma元件反义链的各个亚硫酸氢盐测序读数。跨测序扩增子的13个反义CHG位点按比例显示。“S”表示Karma剪接受体位点(CAG/CTG)处的胞嘧啶。“B”表示Bbv I位点。图3中报道的共有微阵列特征由围绕剪接位点的柱表示。甲基化的CHG和未甲基化的CHG位点分别由黑框和白框表示。包括“N”的框表示在并非高质量DNA测序碱基读数的特定读数内的CHG位置,因此这些碱基的DNA甲基化状态未确定。

图8.回复棕榈中的Karma CHG甲基化。a,来自回复分株的小穗产生混合花束,包括正常果实和可育的mantled果实,每个果实只有一个或两个假心皮(箭头)。b-c,来自(a)中代表的花束的全果(左)和纵切(右)正常(b)果实和微mantled(c)果实。d,Bbv I位点处的CHG甲基化密度。图中显示了由两个独立克隆谱系(1和2)的每一个产生100%正常果实的正常分株,以及产生混合花束的回复分株,每束花束具有99%、95%或7%正常果实(n.f.)的。误差条表示叶(n=4),花轴(n=8)或果实(n=2)的生物学重复样的标准偏差。e-f,Karma剪接受体位点处,加上正常果实(白色柱)和微mantled果实(黑色柱)的剪接位点上游27bp和下游16bp的另外两个CHG位点(如图7所示)的甲基化密度,所述正常果实和微mantled果实来自在产生99%(e)或95%(f)正常果实的克隆谱系1中的两个回复分株(双尾Fisher精确检验,n.s.表示不显著)。对于每棵分株,从同一花束收集正常果实和微mantled果实。通过检测不影响CHG位点的亚硫酸氢盐测序扩增子内的杂合SNP来单独分析等位基因。

图9.Mantled组织中小非编码调节RNA的差异表达。a,如实施例5中所述的转录物模型。b,通过正常茎尖(SA),<2cm期花序组织(<2cm)和晚期花序组织(Inf.)的全转录组小RNA测序确定的不同的24mer siRNA计数。)。x轴是与A中显示的转录物模型成比例的基因组位置。y轴是在0至3.0的标度上每百万个片段映射到每千个碱基的片段(FPKM)的标准读数。垂直柱表示来源于跨EgDEF1基因座位置的不同的24mer FPKM标准化读数。数据代表每种组织类型的三个独立样品。c,通过mantled茎尖(SA),<2cm期花序组织(<2cm)和晚期花序组织(Inf.)的全转录组小RNA测序确定的不同的24mer siRNA计数。根据B中所述绘图。垂直箭头表示相对于mantled茎尖,正常茎尖中特异性24mer siRNA(SEQ ID NO:91)表达高11倍。

图10.mantled组织中siRNA的差异表达。a,在正常茎尖样品(空心柱)和mantled(灰色柱)茎尖样品中的平均FPKM标准化24mer siRNA读数。误差条代表三个重复样的标准偏差。X轴标记指示所提供的每种不同siRNA的SEQ ID NO。b,在正常<2cm期花序样品(空心柱)和mantled(灰色柱)<2cm期花序样品中的平均FPKM标准化24mer siRNA读数。误差条代表三个重复样的标准偏差。X轴标记指示所提供的每种不同的siRNA的SEQ ID NO。c,在正常晚期花序样品(空心柱)和mantled(灰色柱)晚期花序样品中的平均FPKM标准化24mer siRNA读数。误差条代表三个重复样的标准偏差。X轴标记指示每种不同siRNA的SEQ ID NO。

图11.mantled花序的抑制的24nt siRNA表达映射到Karma。正常0期顶端分生组织(n=5个生物重复样)和单性结实0期顶端分生组织(n=7个生物重复样)的小RNA测序。将每个24nt siRNA的每百万个片段映射到每千个碱基读数的片段(FPKM)标准化表达值绘制在包括Karma(黑框)的内含子5的区域上。高于和低于零线的柱分别表示有义siRNA和反义siRNA,并且在相同的尺度上绘制。相对于正常0期花序组织,由Karma区域表达的24nt siRNA簇在mantledv中0期花序组织被阻遏。

图12.花序发育期3-5的24nt小RNA分析。将每次测定的24nt siRNA的FPKM标准化表达值按比例绘制,在图的顶部绘制基因组元件。高于和低于零线的柱分别代表有义siRNA和反义siRNA,并且在两个方向上以相同的比例绘制。

图13.选择性剪接的转录物。对来自正常棕榈和单性结实的mantled棕榈的雌性花序(每个表型的茎尖,<2cm花序和晚期花序各3个生物重复样)进行转录组测序组装EgDEF1/MANTLED转录物。黑框代表外显子,在转录模型图上方依比例标记并表示Karma和Koala元件。外显子5选择性剪接到Karma开始的剪接受体位点导致mantled花序而非正常花序转录kDEF1物。在正常花序和mantled花序中都检测到不利用外显子5剪接供体位点的第三转录物(tDEF1)。坐标与参照pisifera油棕基因组构建体相对(Singh et al.2013)。

图14.cDEF1、kDEF1和tDEF1的qRT-PCR试验设计。A.EgDEF1的基因模型,其指示转录物特异性qRT-PCR引物的相对位置,如实施例5所述。黑框代表EgDEF1外显子。灰框('t')表示包含在tDEF1转录物中的内含子5序列。空心框('k')表示Karma ORF2序列。箭头表示qRT-PCR引物。B.选择性剪接的转录物和用于特异性检测每种转录物的qRT-PCR引物的概略。C.使用正常总RNA或mantled总RNA作为模板的每个试验的终点RT-PCR结果。

图15.在整个正常雌性花序发育和单性结实的mantled雌性花序发育中cDEF1、tDEF1和kDEF1表达的定量逆转录酶PCR(qRT-PCR)分析。误差条代表每个表型每期3个生物重复的组织样品的三次重复技术试验之间的标准偏差。显示了相对于内源参考基因的表达。

图16.用于检测本文公开的DMR中的差异DNA甲基化的甲基化特异性PCR试验的实施例。实施例6描述了试验的细节。

图17.用于检测本文公开的DMR中的差异DNA甲基化的甲基化DNA免疫沉淀试验的预示实施例。实施例7描述了试验的细节。

具体实施方式

I.引言

已经进行体外培养的植物中体细胞克隆异常的出现阻碍了始终表现出高油产量的油棕种植材料的开发。表现出体细胞克隆异常(作为体外培养的结果)的油棕植物包括例如表现出Mantled表型的那些油棕植物。发明人已经识别了油棕植物中体细胞克隆异常下的分子机制:与SEQ ID NO:1对应的油棕基因座内的差异甲基化。发明人还识别了SEQ ID NO:1内的DNA区域、元区和生物标记物,其中甲基化状态预示着存在或不存在体细胞克隆异常。因此,可以利用方法、组合物、试剂盒和计算机程序产品(包括本文所述的那些)来确定其中的一个或多个DMR、DNA区域、元区、生物标记物或胞嘧啶核苷酸(例如,CHG基序中的胞嘧啶)的甲基化状态,从而基于预测的每棵植物的体细胞克隆异常的存在或不存在来预测植物和/或分离的植物中存在或不存在体细胞克隆异常。例如,可以测定植物细胞的培养物以预测存在或不存在体细胞克隆异常(例如,Mantled表型)。

II.DNA区域

可以在DNA区域中检测差异甲基化。DNA区域包括具有一个或多个感兴趣的甲基化位点(例如,胞嘧啶,“微阵列特征”,或由选择的引物或引物对扩增的扩增子)和扩增子的3'或5'方向的任一个或两个方向上高达4千碱基(kb)的核酸侧翼序列(即,“翼展”)。该范围大致对应与通过在筛选两个或更多个样品中的DNA之间的差异甲基化(例如,进行如下文实施例1所述的用于初始识别差异甲基化序列的方法)之前将DNA随机片段化而获得的DNA片段的长度。在一些实施例中,一个或多个DNA区域的翼展在相对于微阵列特征表示的序列的3'和5'方向上都为约0.5kb、0.75kb、1.0kb、1.5kb、2.0kb、2.5kb、3.0kb、3.5kb或4.0kb。在一些实施例中,一个或多个DNA区域的翼展在相对于由微阵列特征表示的序列中的最中心的核苷酸的3'和5'方向上都为大约2kb,或2kb。

DNA区中的甲基化位点可以位于非编码转录控制序列(例如,启动子、增强子等)中,或编码序列中,包括内含子,外显子和与SEQ ID NO:1对应的油棕基因组基因座的反转录转座子元件。在一些实施例中,所述方法包括检测一个或多个转座元件内、处或附近(例如,包括在SEQ ID NO:1中的转座元件的3'或5'约1.0kb,1.5kb,2.0kb,2.5kb,3.0kb,3.5kb或4.0kb中或内的核酸序列)的甲基化状态。

本发明的DNA区域还包括天然存在的变体,包括例如存在于不同受试对象群体中的变体和由单核苷酸多态性(SNP)产生的变体。SNP包括不同大小和简单序列重复子的插入和缺失,比如,二核苷酸和三核苷酸重复子。变体包括相对于本文所述的DNA区具有至少90%、95%、98%、99%序列一致性,即具有一个或多个缺失、添加、取代、反向序列等的核酸序列。当所述核酸为具有21或24个核苷酸长度的siRNA时,变体包括相对于本文所述的DNA区域共享至少15、16、17、18、19、20、21、22、23或24个一致的核苷酸,例如具有1、2、3、4、5、6、7、8、9或更多个缺失、添加、取代、反向序列等的核酸序列。

Ⅲ.方法

在一些实施例中,可以通过确定与SEQ ID NO:1对应的油棕植物的基因组区域内的一个或多个胞嘧啶的甲基化状态来预测存在或不存在体细胞克隆异常(例如,Mantled表型)。SEQ ID NO:1含有三个不同的反转录转座子(SEQ ID NO:2,元件1(Rider);SEQ ID NO:3,元件2(Karma);SEQ ID NO:4,元件3(Koala))和EgDEF1基因,EgDEF1基因转录成至少四种不同形式(cDEF1,由SEQ ID NO:5编码;tDEF1,由SEQ ID NO:75编码;kDEF1,由SEQ ID NO:78编码;和gDEF1,由SEQ ID NO:80编码)。

SEQ ID NO:1的一个或多个胞嘧啶(例如,CHG基序中的胞嘧啶)的甲基化状态可以例如确定并与对照或阈值进行比较,由此可以预测存在或不存在体细胞克隆异常。在一些情况下,当一种或多种特定胞嘧啶的甲基化(例如,相对于对照或阈值)增加时,预测体细胞克隆异常。在一些情况下,当一个或多个特定胞嘧啶的甲基化(例如,相对于对照或阈值)减少时,预测体细胞克隆异常。在一些情况下,当一一个或多个特定胞嘧啶的甲基化(例如,相对于对照或阈值)增加或减少时,预测体细胞克隆异常。

在一些实施例中,可以通过确定正常植物、植物细胞或组织对比mantled植物、植物细胞或组织中差异表达的一种或多种转录物的表达水平来预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,当一种或多种转录物的表达(例如,相对于对照或阈值)减少时,预测体细胞克隆异常。在一些情况下,转录物由SEQ ID NO:1内的序列编码。在一些情况下,转录物由SEQ ID NO:77编码。在一些情况下,转录物由SEQ ID NO:130-134、136-139、142-143或144-161中的一个或多个序列内的序列编码。在一些情况下,转录物由SEQ ID NO:144-161中的一个或多个序列内的序列编码。在一些情况下,转录物为siRNA转录物(例如,24mer siRNA)。在一些情况下,当一种或多种转录物的表达(例如,相对于对照或阈值)增加时,预测体细胞克隆异常。在一些情况下,转录物由SEQ ID NO:135、140或141中的一个或多个序列内的序列编码。在一些情况下,转录物为siRNA转录物(例如,24mer siRNA)。

A.用于确定甲基化的方法

检测DNA甲基化的任何方法可以用于本发明的方法中。

在一些实施例中,检测甲基化的方法包括随机剪切基因组DNA或使基因组DNA随机片段化,用甲基化依赖性限制酶或甲基化敏感性限制酶切割DNA,随后选择性识别和/或分析切断或未切断的DNA。选择性识别可以包括例如分离切断和未切断的DNA(例如通过大小)和定量切断的感兴趣的序列,或者选择性地,定量未切割的感兴趣的序列。参见,例如,专利号为7,186,512的美国专利。可替换地,该方法可以包含在限制酶消化后扩增完整的DNA,从而只扩增在扩增区域中未被限制酶剪切的DNA。参见,例如,专利号为7,910,296、8,361,719、7,901,880和8,163,485的美国专利。在一些实施例中,可以使用基因特异性引物或引物对来进行扩增。可替换地,可以将接头加入随机片段化的DNA的末端,可以用甲基化依赖性或甲基化敏感性限制酶消化DNA,可以使用与接头序列杂交的引物扩增完整的DNA。在这种情况下,可以进行第二步骤以确定扩增的DNA池中特定基因的存在、不存在或数量。在一些实施例中,使用实时定量DNA扩增(例如,PCR)扩增DNA。

在一些实施例中,所述方法包括定量基因组DNA群内靶序列中的平均甲基化密度。在一些实施例中,所述方法包括使基因组DNA与甲基化依赖性限制酶或甲基化敏感性限制酶在允许所述基因座中的潜在限制酶剪切位点的至少一些拷贝保持不剪切的条件下接触;定量所述基因座的完整拷贝;以及比较扩增产物的量与表示对照DNA甲基化的量的对照值,从而与对照DNA的甲基化密度相比较,量化所述基因座中的平均甲基化密度。

DNA基因座的甲基化的量可以通过提供包含基因座的基因组DNA样品,用甲基化敏感性或甲基化依赖性限制酶剪切所述DNA,然后量化完整的(例如,未被甲基化敏感性或甲基化依赖性限制性内切酶切断的)DNA或量化感兴趣的DNA基因座处的已切断的DNA的量。完整的或已切断的DNA的量将取决于含有基因座的基因组DNA的初始量,基因座中甲基化的量,和基因组DNA中基因座的甲基化核苷酸的数量(即,分数)。可以通过比较完整的DNA或已切断的DNA的量与对照值(表示类似处理的DNA样品中完整的DNA或已切断的DNA的量)来确定DNA基因座中甲基化的量。对照值可以表示已知或预测的甲基化核苷酸数量。可替换地,对照值可表示来自另一个(例如,正常、野生型)细胞的相同基因座或第二基因座中的完整的或已切断的DNA的量。

在允许基因座中的潜在的限制酶剪切位点的至少一些拷贝保持未剪切的条件下,使用至少一种甲基化敏感性或甲基化依赖性限制酶,随后量化剩余的完整拷贝并将该量与对照进行比较,可以确定基因座的平均甲基化密度。如果甲基化敏感性限制酶与DNA基因座的拷贝在允许基因座中潜在的限制酶剪切位点的至少一些拷贝由于在剪切位点处甲基化的存在而保持未剪切的条件下接触,则剩余的完整的DNA将与甲基化密度成正比,因此可与对照进行比较以确定样品中基因座的相对甲基化密度。类似地,如果甲基化依赖性限制酶与DNA基因座的拷贝在允许基因座中的潜在的限制酶剪切位点的至少一些拷贝由于在剪切位点处缺乏甲基化而保持未剪切的条件下接触,则剩余的完整的DNA将与甲基化密度成反比,并且因此可以与对照进行比较以确定样品中基因座的相对甲基化密度。例如,专利号为7,910,296的美国专利公开了这样的试验。

用于上述方法的试剂盒可以包括例如一种或多种甲基化依赖性限制酶,甲基化敏感性限制酶,扩增(例如PCR)试剂和一种或多种探针和/或引物。在一些情况下,所述一种或多种探针和/或引物对SEQ ID NO:1或其部分具有特异性,例如,与SEQ ID NO:1或其部分特异性杂交。在一些情况下,所述一种或多种探针和/或引物对亚硫酸氢盐转化的SEQ ID NO:1或其部分具有特异性,例如,与亚硫酸氢盐转化的SEQ ID NO:1或其部分特异性杂交。

可以使用定量扩增方法(例如,定量PCR或定量线性扩增)来量化在限制性消化后由一个或多个扩增引物选择的基因座内的完整的DNA的量。例如,专利号为6,180,349;6,033,854和5,972,602的美国专利,以及例如,Gibson et al.,Genome Research 6:995-1001(1996);DeGraves,et al.,Biotechniques 34(1):106-10,112-5(2003);Deiman B,et al.,Mol Biotechnol.20(2):163-79(2002),公开了定量扩增的方法。可以“实时”监测扩增。

用于检测DNA甲基化的另外的方法可以涉及在用亚硫酸氢盐处理DNA之前和之后的基因组测序。参见,例如et al.,Proc.Natl.Acad.Sci.USA 89:1827-1831(1992)。当亚硫酸氢钠与DNA接触时,未甲基化的胞嘧啶转化为尿嘧啶,而不会修改甲基化的胞嘧啶。

在一些实施例中,使用限制酶消化由亚硫酸氢盐转化的DNA扩增的PCR产物来检测DNA甲基化。参见,例如,Sadri&Hornsby,Nucl.Acids Res.24:5058-5059(1996);Xiong&Laird,Nucleic Acids Res.25:2532-2534(1997)。

在一些实施例中,单独使用MethyLight试验或与其它方法组合使用来检测DNA甲基化(参见,Eads et al.,Cancer Res.59:2302-2306(1999))。简而言之,在MethyLight过程中,基因组DNA在亚硫酸氢钠反应中转化(亚硫酸氢盐过程将未甲基化的胞嘧啶残基转化为尿嘧啶)。然后使用例如与CpG二核苷酸杂交的PCR引物对感兴趣的DNA序列进行扩增。通过使用仅与由未甲基化DNA的亚硫酸氢盐转化产生的序列(或可替换地与未转化的甲基化序列)杂交的一个或多个引物,扩增可以指示一个或多个引物杂交的序列的甲基化状态。类似地,可以用特异性结合至由未甲基化(或甲基化)DNA的亚硫酸氢盐处理产生的序列的探针来检测扩增产物。如果需要,引物和探针都可用于检测甲基化状态。因此,与MethyLight一起使用的试剂盒可以包括亚硫酸氢钠以及引物或可检测地标记的探针(包括但不限于Taqman或分子信标探针),所述引物或可检测地标记的探针区分用亚硫酸氢盐处理的甲基化DNA和未甲基化DNA。其它试剂盒组分可包括例如DNA扩增所需的试剂,包括但不限于PCR缓冲液,脱氧核苷酸;和热稳定聚合酶。

在一些实施例中,单独使用或与其它方法组合使用Ms-SNuPE(甲基化敏感性单核苷酸引物延伸)反应以检测DNA甲基化(参见Gonzalgo&Jones,Nucleic Acids Res.25:2529-2531(1997))。Ms-SNuPE技术是基于DNA的亚硫酸氢盐处理,随后进行单核苷酸引物延伸(Gonzalgo&Jones,同上)评估在特定CpG位点处的甲基化差异的定量方法。简而言之,使基因组DNA与亚硫酸氢钠反应以将未甲基化的胞嘧啶转化为尿嘧啶,同时使5-甲基胞嘧啶不变。然后使用亚硫酸氢盐转化的DNA的特异性PCR引物对所需靶序列进行扩增,分离所得产物并将其用作感兴趣的CpG位点的甲基化分析的模板。

用于Ms-SNuPE分析的典型试剂(例如,典型的基于Ms-SNuPE的试剂盒可能供有)可以包括但不限于:用于特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;用于特定基因的Ms-SNuPE引物;反应缓冲液(用于Ms-SNuPE反应);和可检测地标记的核苷酸。另外,亚硫酸氢盐转化试剂可以包括:DNA变性缓冲液、磺化反应缓冲液、DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱)、脱磺化反应缓冲液和DNA回收组分。

在一些实施例中,单独使用或与其它方法组合使用甲基化特异性PCR(“MSP”)反应以检测DNA甲基化。MSP试验需要通过亚硫酸氢钠进行DNA的初始修饰,将所有未甲基化但不甲基化的胞嘧啶转化为尿嘧啶,随后用甲基化DNA特异性引物和未甲基化DNA特异性引物扩增。参见,Herman et al.,Proc.Natl.Acad.Sci.USA 93:9821-9826,(1996);U.S.专利号5,786,146。

另外的甲基化检测方法包括但不限于甲基化的CpG岛扩增(参见,Toyota et al.,Cancer Res.59:2307-12(1999))和例如公开号为2005/0069879的美国专利;Rein,et al.Nucleic Acids Res.26(10):2255-64(1998);Olek,et al.Nat Genet.17(3):275-6(1997)和公开号为WO 00/70090的PCT公布中描述的那些方法。

在一些实施例中,所述方法包括:从所述植物获得生物样品;确定来自所述植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶(例如,CHG基序中的胞嘧啶)的甲基化状态,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;以及使所述至少一个胞嘧啶的甲基化状态与所述植物中存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测所述植物中存在或不存在体细胞克隆异常。

可以通过本领域已知的任何方法获得生物样品。通常,以保留样品的核酸的方式获得生物样品。在一些情况下,获得并处理所述生物样品以保持其中基因组DNA的甲基化状态。在一些情况下,获得和处理所述生物样品以保持RNA完整性。

可替换地,在一些情况下,所述方法包括提供对多棵植物中存在或不存在体细胞克隆异常的预测,其中存在或不存在体细胞克隆异常由来自每棵植物的样品中的差异甲基化区域(DMR)内至少一个胞嘧啶的甲基化状态决定,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;以及使预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。

在一些情况下,所述方法还包括使预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况下,所述植物可以物理分离,例如通过选择预测为体细胞克隆异常的植物并将其破坏或丢弃。在一些情况下,通过选择预测为缺乏体细胞克隆异常的植物进行培养从而对所述植物进行物理分离。在一些情况下,使选择用于培养的植物发芽、移植或种植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理物理分离的植物以减少、减轻、消除或预防体细胞克隆异常。例如,物理分离的植物可以与含有启动子的表达盒接触,所述启动子可操作地连接至编码转录物的多核苷酸,所述转录物在预测为体细胞克隆异常的植物中表达减少。

在一些方面,DMR处于来自所述植物的样品中的DNA元区内。该元区包含两个或更多个呈现差异甲基化的重叠DNA区域。典型的DNA元区包括与SEQ ID NOS:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72对应(例如,至少90%、95%或99%一致,或一致)的生物标记物中心的重叠的4kb翼展区域(2kb 5’和3’)。在一些情况下,DNA元区处于SEQ ID NO:1中,或处于与油棕基因组中的SEQ ID NO:1对应(例如至少70%、80%、90%、95%或99%一致,或一致)的基因座中。典型的DNA元区包括与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致的那些序列。在一些情况下,DMR处于来自所述植物的样品中的DNA区域内。所述DNA区域可以为,例如4kb,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少约70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些实施例中,当至少一个胞嘧啶的甲基化状态相对于对照基因座降低时,预测存在体细胞克隆异常。在一些实施例中,当至少一个胞嘧啶的甲基化状态相对于对照基因座增加时,预测存在体细胞克隆异常。在一些情况下,至少一个胞嘧啶的甲基化的增加或减少预测着存在体细胞克隆异常。在一些情况下,所述至少一个胞嘧啶处于与选自SEQ ID NO:1-5和7-75、78或80的序列对应(例如,至少70%、80%、90%、95%或99%一致,或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。

可以将至少一个胞嘧啶的甲基化状态与对照基因座进行比较以确定甲基化的相对变化。例如,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较高,则测试基因座的甲基化状态增加。作为另一个实例,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较低,则测试基因座的甲基化状态降低。通常,对照基因座具有已知的、相对恒定的甲基化状态。例如,可以预先确定没有甲基化,具有一些或大量的甲基化,从而提供相对恒定的值以控制与存在或不存在体细胞克隆异常无关的检测方法等中的误差。在一些实施例中,对照基因座是内源的,即,是独立样品的基因组的一部分。可替换地,对照基因座可以是外源基因座,例如以已知量掺入样品中且甲基化状态已知的DNA序列。

在一些实施例中,确定2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个不同的差异甲基化区域(DMR)的至少一个胞嘧啶的甲基化状态,以预测存在或不存在体细胞克隆异常。在一些情况下,所述DMR处于与独立地选自SEQ ID NOS:1-5和7-75的序列对应(例如,至少70%、80%、90%、95%或99%一致或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。

在一些实施例中,预测的体细胞克隆异常是油棕植物降低果实产量、油产量、生长或繁殖的异常。在一些情况下,降低是相对于对照植物降低,该对照植物比如亲本植物或相同果实颜色(nigrescens或virescens)或壳厚度(dura、tenera或pisifera)表型的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。

B.通过基因表达分析预测异常

基因组DNA的甲基化可以影响邻近基因序列的表达(转录和/或翻译)。因此,在一些实施例中,所述方法包括使DNA区域中至少一个胞嘧啶的甲基化状态与邻近编码序列的表达相关联的步骤,所述邻近编码序列比如cDEF1(SEQ ID NO:5)、tDEF1(SEQ ID NO:75)、kDEF1(SEQ ID NO:78),或gDEF1(SEQ ID NO:80)中的一个或多个转录物,和/或靠近EgDEF1基因座的反转录转座子的一个或多个转录物(SEQ ID NO:2、3或4)。例如,可以检测DNA区域中感兴趣的胞嘧啶的3'或5'任一方向上约1.0kb、1.5kb、2.0kb、2.5kb、3.0kb、3.5kb或4.0kb或更多的基因序列的表达。在一些实施例中,所述方法包括检测或定量邻近编码序列的表达的步骤,所述邻近编码序列例如cDEF1(SEQ ID NO:5)、tDEF1(SEQ ID NO:75)、kDEF1(SEQ ID NO:78)或gDEF1(SEQ ID NO:80)中的一个或多个转录物,和/或靠近EgDEF1基因座的反转录转座子的一个或多个转录物(SEQ ID NO:2、3或4),并使所述表达与体细胞克隆异常的存在,或不存在,或预测相关。

在一些情况下,cDEF1表达与正常表型相关。例如,在一些情况下,在正常表型植物中cDEF1表达水平较高,因此当检测到低水平的(例如,相对于阈值或对照)的cDEF1表达时,预测Mantled表型。在一些情况下,tDEF1的表达与Mantled表型相关。例如,在一些情况下,在Mantled表型植物中tDEF1的表达水平较高,因此当检测到高水平的(例如,相对于阈值或对照)的tDEF1表达时,预测Mantled表型。在一些情况下,kDEF1的表达与Mantled表型相关。例如,在一些情况下,在Mantled表型植物中kDEF1的表达水平较高,因此当检测到高水平的(例如,相对于阈值或对照)的kDEF1表达时,预测Mantled表型。在一些情况下,gDEF1的表达与Mantled表型相关。例如,在一些情况下,在Mantled表型植物中gDEF1表达水平较高,因此当检测到高水平的(例如,相对于阈值或对照)的gDEF1表达时,预测Mantled表型。在一些情况下,阈值或对照是来自正常植物的样品或正常植物的表达值。在一些情况下,阈值或对照是来自异常(例如,Mantled)植物的样品或异常(例如,Mantled)植物的表达值。

在一些情况下,SEQ ID NO:1内编码的siRNA的表达与正常表型相关,因此当检测到低水平的(例如,相对于阈值或对照)siRNA表达时,预测Mantled表型。例如,在一些情况下,当检测到由SEQ ID NO:144-161中一个或多个序列编码的一种或多种siRNA的表达水平低(例如,相对于阈值或对照)时,预测Mantled表型。在一些情况下,当由SEQ ID NO:144-161中的一个或多个序列编码的一种或多种siRNA的表达相对于对照或阈值降低至少50%时,预测Mantled表型。作为另一个实施例,在一些情况下,当检测到由SEQ ID NO:91编码的siRNA的表达水平低(例如,相对于阈值或对照)时,预测Mantled表型。在一些情况下,当由SEQ ID NO:91编码的siRNA的表达相对于对照或阈值降低至少50%、60%、70%、80%或90%时,预测Mantled表型。

本领域熟知用于测量特定基因序列的转录和/或翻译的方法。参见例如Ausubel,Current Protocols in Molecular Biology,1987-2006,John Wiley&Sons和Sambrook and Russell,Molecular Cloning:A Laboratory Manual,3rd Edition,2000,Cold Spring Harbor Laboratory Press。在一些实施例中,将SEQ ID NO:1、2、3、4、5、75、78或80中编码的基因的基因表达或蛋白质表达与对照进行比较,所述对照例如来自已知体细胞克隆异常为阴性或已知体细胞克隆异常为阳性的植物的样品的邻近基因序列的表达,或者区分体细胞克隆异常和野生型状态的表达水平。涉及表达检测的此类方法,如本文所述的检测甲基化的方法,可用于预测植物中存在或不存在体细胞克隆异常(例如,可用于预测存在或不存在Mantled表型)。在一些情况下,检测调节RNA的表达。例如,可以检测调节cDEF1(SEQ ID NO:5)、tDEF1(SEQ ID NO:75)的表达的调节RNA。典型的调节RNA包括但不限于微RNA。在一些情况下,检测至少部分在位于与SEQ ID NO:1对应的基因组基因座中的反转录转座子内编码的一种或多种调节RNA的表达。差异DNA甲基化可导致调节RNA表达的变化(例如,微小RNA,小干扰RNA和反义RNA),然后调节RNA表达的变化可导致顺式或反式中的基因表达的变化。同样,调节RNA本身可以通过RNA引导的DNA甲基化(RdDM)体系引导植物中DNA甲基化状态的建立和/或维持。参见Vu,et al.2013 Development 140:2953-60,Regulski,et al.2013 Genome Res 23:1651。因此,在一些情况下,涉及调节RNA的机制在与Mantled表型有关的差异DNA甲基化的建立或在差异DNA甲基化调节涉及Mantled表型的基因功能的机制中也可能涉及。

在一些实施例中,该方法还包括使SEQ ID NO:1、或DNA区域,或DNA元区,或生物标记物中一个或多个胞嘧啶的甲基化状态与SEQ ID NO:1、2、3、4、5、75、78或80中一致的一个或多个基因区域的表达相关联。在一些实施例中,所述方法还包括使所述甲基化状态和/或表达水平与Mantled表型相关联的步骤。

在一些实施例中,检测小RNA的表达。小RNA为小非编码表达RNA分子。小RNA可以参与基因调节和其它生物过程。通过本发明的方法检测或定量的典型的小RNA包括由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码的一个或多个小RNA。通过本发明的方法检测或定量的典型的小RNA包括至少部分由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码的一种或多种小RNA。

在一些情况下,小RNA在正常植物对比异常(例如,Mantled)植物中差异表达。可以在植物样品中检测这种差异表达,并与对应于样品的植物的预测的正常或异常(例如,Mantled)表型相关联。这种差异表达的小RNA包括但不限于由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸编码或至少部分由该多核苷酸编码的那些小RNA。在一些情况下,当由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142或143至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达增加(相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,当由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、116、117、135、140或141至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达增加(相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,阈值或对照是来自正常植物的样品或正常植物的表达值。在一些情况下,阈值或对照是来自异常(例如,Mantled)植物的样品或异常(例如,Mantled)植物的表达值。

在一些情况下,当检测到由与SEQ ID NO:135、140或141至少75%,80%,85%,90%,95%,95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达时,或当检测到表达水平增加(例如,相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,当检测到由与SEQ ID NO:130、131、132、133、134、136、137、138、139、142或143至少75%,80%,85%,90%,95%,95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达时,或当检测到表达水平增加(例如,相对于阈值或对照)时,预测正常表型。在一些情况下,阈值或对照是来自正常植物的样品或正常植物的表达值。在一些情况下,阈值或对照是来自异常(例如,Mantled)植物的样品或异常(例如,Mantled)植物的表达值。

在一些情况下,当由与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达减少(相对于阈值或对照)时,预测异常(例如,Mantled)表型。在一些情况下,当由与97、115、118、119、120、121、122、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致,或一致的多核苷酸序列编码或至少部分由该多核苷酸序列编码的小RNA的表达减少(相对于阈值或对照)时,预测异常(例如,Mantled)表型。

在一些实施例中,所述方法包括:从植物获得生物样品;检测或量化SEQ ID NO:2、3、4、5、75、78、80、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161中的一个或多个序列的表达;并且使所述表达或表达水平与植物存在或不存在体细胞克隆异常相关联,其中所述相关联包括预测植物存在或不存在体细胞克隆异常。

可以通过本领域已知的任何方法获得生物样品。通常,以保留样品的核酸的方式获得所述生物样品。在一些情况下,获得并处理所述生物样品以保持其中的RNA。在一些情况下,获得和处理所述生物样品以保持RNA完整性。

可替换地,在一些情况下,所述方法包括提供对多棵植物中存在或不存在体细胞克隆异常的预测,其中通过基因表达分析来确定存在或不存在体细胞克隆异常;以及将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的植物物理分离。

在一些情况下,所述方法还包括将预测为体细胞克隆异常的植物与预测为缺乏体细胞克隆异常的一棵或多棵植物物理分离。在一些情况下,所述植物可以物理分离,例如通过选择预测为体细胞克隆异常的植物并将其破坏或丢弃。在一些情况下,通过选择预测为缺乏体细胞克隆异常的植物进行培养,将所述植物物理分离。在一些情况下,使选择用于培养的植物发芽、移植或种植。在一些情况下,丢弃或破坏未被选择用于培养的植物。在一些情况下,处理物理分离的植物以减少、减轻,消除或预防体细胞克隆异常。

在一些实施例中,预测的体细胞克隆异常是油棕植物降低果实产量、油产量、生长或繁殖的异常。在一些情况下,降低是相对于对照植物,比如亲本植物或相同果实颜色(nigrescens或virescens)或壳厚度(dura、tenera或pisifera)表型的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。

C.采样和/或分拣

可以由油棕植物的任何合适的细胞或组织获得油棕核酸。例如,油棕核酸可以由叶、茎、根、种子或体外培养物中的或体外培养物获得的植物细胞或植物细胞群获得。在一些情况下,油棕核酸由种子的胚乳组织获得。在一些实施例中,由植物细胞(例如,体外培养物中的植物细胞或从体外培养物获得的植物细胞)、幼苗、未成熟(例如无果实的)植物或成熟植物中提取核酸。在一些情况下,以使得油棕植物的活力不降低或者活力基本上不降低这样的方式获得油棕核酸。例如,在一些情况下,样品提取可以使群体中活植物或种子的数量减少小于约20%、15%、10%、5%、2.5%、1%或更少。在一些情况下,核酸由植物细胞群获得,其中植物细胞群的一个或所有基因组基因座的基因型和/或表观基因型一致或基本一致。例如,可以提取、分析来自体外培养物中的一部分植物细胞的核酸样品,并且结果用于分拣体外培养物。获得合适样品的典型组织类型包括来自体外苗木和苗圃分株的叶。可替换地,也可以使用组织,比如根、花序和合子胚。也可以在组织培养之前筛选来自潜在的原株的组织。也可以测试来自半克隆和双克隆的种子。

可以自动进行采样。例如,可以使用机器在体外培养物中挑选植物细胞集落或细胞团、或其一部分用于分析。类似地,机器可以从植物或种子获取样品,或从多个植物细胞集落、细胞团、植物或种子获取样品。也可以手动进行采样。本文描述了另外的采样方法。

在一些实施例中,控制采样以防止样品污染。例如,可以在样品加工步骤之间采用洗涤步骤。可替换地,可以使用一次性或可移除的样品处理元件,例如,一次性移液尖、一次性容器或容器,或一次性刀片或研磨机。

在一些情况下,在检测油棕植物DMR内的一个或多个胞嘧啶的甲基化状态之前纯化样品。例如,样品可以离心、提取、沉淀(例如,醇沉淀),或使用固体支持物(例如,使用结合核酸的珠子或膜)纯化。本领域技术人员已知用于纯化植物核酸的其它方法。

在一些实施例中,预测存在或不存在体细胞克隆异常(例如,Mantled表型),并且基于预测的表型分拣所述植物。例如,可以基于SEQ ID NO:1中一个或多个胞嘧啶或一个或多个DNA区域、DNA元区或其中的生物标记物的甲基化状态预测体细胞克隆异常(例如,Mantled表型),并且基于预测的表型分拣所述植物。在一些情况下,例如,基于甲基化状态或基因表达可以预测体细胞克隆异常(例如,Mantled表型),并且基于预测的表型分拣所述植物。

例如,可以基于预测的植物表型(例如,基于如本文所述的植物的甲基化或表达)将多棵植物分拣(例如,物理分离)为Mantled或非Mantled(例如,野生型)植物。可以分拣并储存或利用并种植野生型植物或以其它方式与植物繁殖材料分离以克隆生成缺乏一个或多个体细胞克隆异常的植物。在一些情况下,可以丢弃或破坏(例如,高压灭菌)或不在商业油棕生产中培养具有一个或多个体细胞克隆异常的植物,例如,Mantled植物,。

在一些情况下,植物是来自体外培养物的植物细胞、植物细胞团或植物细胞集落,并且当来自培养物的一棵或多棵植物被预测为体细胞克隆异常(例如,预测一棵或多棵植物呈现

Mantled表型)时,丢弃或破坏体外培养物。在一些情况下,植物是幼小分株,并测定来自所述植物的核酸以预测存在或不存在体细胞克隆异常。在一些情况下,在种植田间之前分拣所述幼小分株。例如,可以丢弃预测为体细胞克隆异常(例如,Mantled表型)的幼小分株。预测为缺乏体细胞克隆异常的分株可以在田间进一步培养和/或种植。作为另一个可替换方案,可以测定为最佳棕榈油产量已经种植于田间,但是没有成熟到足以验证不存在体细胞克隆异常(例如,Mantled表型)的油棕植物,并且可以从田间移除预测为体细胞克隆异常的植物。在一些实施例中,预测存在或不存在体细胞克隆异常和植物果实颜色和/或壳厚度表型。预测果实颜色和/或壳厚度表型和/或基于这些预测的表型来分拣的方法公开于,例如,申请号为14/226,508,2014年3月26日提交的美国专利申请和申请号为13/800,652,2013年3月13日提交的美国专利申请。在一些情况下,可以基于VIR基因的基因型来预测和/或分拣果实颜色。在一些情况下,可以基于SHELL基因的基因型来预测和/或分拣壳厚度。

在一些情况下,将果实颜色和/或壳厚度预测与甲基化状态或基因表达信息组合以预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,基于一种、两种或所有三种预测的表型分拣所述植物。例如,可以基于预测的表型将植物分拣为nigrescens或virescen种子或植物和dura、tenera或pisifera种子或植物。然后可以根据预测验证所述植物缺乏体细胞克隆异常(例如,Mantled表型)。在一些情况下,可以预测植物缺乏体细胞克隆异常(例如,Mantled表型),然后可以基于预测或预期的nigrescens、virescens、dura、tenera和/或pisifera表型分拣和/或储备这些植物。

在一些情况下,在田间栽培之前进行幼小植物的一种或多种表型的预测。因此,在一些情况下,所述样品是前期苗圃硬化或苗圃习服期间的幼小分株。在一些实施例中,所述样品从已经发芽并随后培养少于1、2、4、6个月或少于1、2、3、4或5年的半克隆或双克隆植物获得。在一些实施例中,在所述植物已经发芽(例如,从种子中)之前或发芽后不久(例如,在发芽后少于约1、2、3、4或5周)获得所述样品。

在一些实施例中,确定至少一个胞嘧啶的甲基化状态,并且与DNA指纹识别方法组合以帮助登记、选择、维持、组织、识别或追踪克隆材料、树干、株系或培养物。例如,可以利用用于预测存在或不存在体细胞克隆异常的DNA指纹识别和甲基化状态或基因表达确认体外培养物来源于特定来源或谱系。类似地,可以查明存在或不存在受植物品种保护法(例如马来西亚或印度尼西亚的植物品种保护法)保护的株系、树干或品种和预测存在或不存在体细胞克隆异常。在一些实施例中,可以使用DNA指纹识别来识别和/或确认棕榈具有或可能具有一种或多种期望的表型(例如,果实颜色、壳厚度、害虫抗性等)和预测存在或不存在体细胞克隆异常。本领域已知用于DNA指纹识别的方法,并且该方法包括,例如在Lim&Rao,J Oil Palm Research,17:136-144(Dec.2005);Billotte,et al.,Genome,,44(3):413-425(2001);Jack&Mayes,Oleagineux,48(1):1-8(1993);Jack,et al.,Theor Appl Genet,90:543-649(1995);Cheah,et al.,Advances in Oil Palm Research p.332-70(2000);和Corley,J.Oil Palm Research,17:64-69(2005)中描述的那些方法。

机器可以用于实施本文所述的一种或多种方法,制备用于本文所述的一种或多种方法的植物样品或促进油棕植物的高通量分拣。

在一些情况下,机器可以对种子进行分拣和定向,使得种子都以类似的方式定向。例如,种子可以定向为种子胚胎区域向下,并且无胚胎区域向上。在一些情况下,所述种子可以置于有序阵列中或单行中。

在一些实施例中,使所述种子保持预定取向从而便于有效和精确采样。例如,所述机器可以通过种子形状或视觉外观来使种子定向。在一些情况下,种子定向为便于从包含种子的子叶和/或胚乳组织的各个种子的“冠状物(Crown)”采样,从而保持每个种子的萌芽活力。

在一些情况下,机器可以单独储备植物和相应提取的样品。例如,可以从体外培养物获得样品,并且储备培养物。在一些情况下,以可以确定其所来源的样品和植物(例如,培养物)这样的方式组织、标记或登记提取的样品和储备的植物。在一些情况下,追踪所提取的样品和储备的植物,使得在收集数据之后可以访问每棵植物的数据。例如,可以从培养物中提取样品,并且对样品和种子预测存在或不存在体细胞克隆异常(例如,Mantled表型)。然后可以基于该预测来访问植物数据、使植物发芽、种植、储备或破坏植物。

在一些情况下,提取和储备由所述机器自动进行,但是甲基化分析和/或经分析的植物的处理手动进行或通过另一台机器进行。因此,在一些实施例中,提供了由两台或更多台机器组成的系统用于提取样品,分拣和储备以及预测存在或不存在体细胞克隆异常(例如,Mantled表型)。

在一些情况下,所述植物通过机器储备在阵列中,例如,单独地在管或孔阵列中。可以在每个孔中或从每个孔中对所述植物进行采样和/或查询。采样或查询的结果可以与阵列中所述植物的位置相关联。

采样可包括核酸(例如,DNA或RNA)的提取和/或分析。采样还可以包括磁共振成像、光分散、光吸收、ELISA、酶测定等。

例如,专利号为4,910,146、6,307,123、6,646,264、6,673,595、7,367,155、8,312,672、7,685,768、7,673,572、8,443,545、7,998,669、8,114,669、8,362,317、8,076,076、7,402,731、7,600,642、8,237,016、8,401,271、8,281,935、8,241,914、6,880,771、7,909,276、8,221,968和7,454,989的美国专利进一步描述了用于植物培养、采样和/或分拣的系统、机器、方法和组合物。例如,公开号为2012/180386、2009/070891、2013/104454、2012/117865、2008/289061、2008/000815、2011/132721、2011/195866、2011/0079544、2010/0143906和2013/079917的美国专利申请也进一步描述了用于植物培养、采样和/或分拣的系统、机器、方法和组合物。公开号为WO2011/119390和WO2011/119394的国际专利申请进一步描述了用于植物培养、采样和/或分拣的另外的系统、机器、方法和组合物。

本文还提供了使用本文所述的系统、机器、方法和组合物进行植物(例如种子、幼苗、植物、植物细胞、植物细胞集落或植物细胞团)采样或分拣的方法。例如,可以将植物或植物组装载到取样器中,并获得样品。在一些情况下,植物可以例如储备成阵列。在一些情况下,储备由对植物进行采样的机器进行。在其它情况下,所述植物由另一台机器储备,或手动储备。在一些情况下,可以从所述样品中提取DNA。在一些情况下,可以通过相同的机器获得样品并提取DNA。在其它情况下,通过另一台机器或手动提取DNA。可以分析提取的DNA,并预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,通过相同的机器,通过另一台机器或手动分析提取的DNA。在一些情况下,通过机器、不同的机器或手动预测存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,可以基于对体细胞克隆异常(例如,Mantled表型)的存在或不存在的预测来处置(例如,培养、处理或破坏)储备的植物。在一些情况下,可以基于VIR基因型或预测的果实颜色表型,基于其预测的壳厚度表型,和/或基于对体细胞克隆异常(例如,Mantled表型)的存在或不存在的预测,处置储备的植物。例如,可以丢弃或破坏或处理预测为体细胞克隆异常的植物。作为另一个实施例,可以从选择用于田间种植和培养以产油的植物群中移除(例如,分离)预测为pisifera和/或Mantled,或dura和/或Mantled的植物。类似地,例如,预测为tenera并且不存在体细胞克隆异常(例如,缺乏Mantled表型)的植物可以从其它植物中分离和/或选择用于田间培养。在一些情况下,通过机器、不同的机器或手动处置所述植物。

在一些情况下,将所述植物(例如,种子、幼苗、植物、植物细胞、植物细胞集落或植物细胞团)从客户运送到服务提供商,分析并返回。在一些情况下,仅返回具有预测的表型的植物。例如,仅返回预测为缺乏体细胞克隆异常的植物或其组合。在其它情况下,对植物进行采样,并将样品从客户运送到服务提供商进行分析。然后,客户可以利用通过分析提供的信息来处置所述植物。

在一些情况下,提供试剂(例如本文所述的组合物)以对所述植物进行手动或自动采样。例如,可以提供如本文所述的内切核酸酶、寡核苷酸引物或探针或其组合。作为另一个实例,如本文所述,可以提供包含用于分析来自油棕植物的核酸所需的试剂的反应混合物或试剂盒。

C.筛选培养条件

在油棕株系中,体外培养物可以产生体细胞克隆异常。例如,体外培养物可以产生具有Mantled表型的油棕植物。在一些情况下,可以筛选培养条件或方案以识别减少或消除体细胞克隆变体产生的条件或方案。然后可以使用这些条件或方案来开发体细胞克隆异常减少或无体细胞克隆异常的克隆繁殖的油棕植物系。例如,体外培养物可以经受标准培养条件作为对照。然后可以使类似或相同的培养物经受测试条件。可以在对照和测试培养物中确定体细胞克隆异常的存在或不存、比例或可能性。然后可以识别和利用减少或消除体细胞克隆异常的测试条件。在一些情况下,可以反复重复实验以进一步改善培养条件。典型的培养条件包括但不限于采样期间棕榈的生理状态、外植体类型、继代培养物数量、每胚胎系的分株数、生长素激素水平和类型、细胞分裂素激素水平和类型、盐浓度、渗透压、pH、温度、光周期、饲养细胞的存在和/或类型、培养基组成等。

在一些情况下,可以筛选体外植物培养物以识别已经出现体细胞克隆异常的培养物。例如,可以检验体外油棕植物培养物或体外油棕植物培养物组,可以预测存在或不存在体细胞克隆异常,然后分离、丢弃或破坏预测为具有体细胞克隆异常或体细胞克隆异常的百分比或可能性较高的培养物。在一些情况下,可以处理预测为具有体细胞克隆异常的培养物以降低体细胞克隆异常可能性,预防或逆转体细胞克隆异常。

IV.减少体细胞克隆异常

在一些实施例中,处理植物(例如,植物细胞体外组织培养物)以减少、预防、减轻、消除或逆转体细胞克隆异常或预测的体细胞克隆异常。在一些情况下,通过向所述植物外源施用由SEQ ID NO:5或与SEQ ID NO:5至少90%,95%或99%一致或一致的序列编码的mRNA,或向所述植物外源施用由包括与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、116、117、123、124、130、131、132、133、134、136、137、138、139、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少90%,95%或99%一致或一致的多核苷酸的序列编码的小RNA来减少、预防、减轻、消除或逆转体细胞克隆异常。

在一些情况下,外源施用mRNA或小RNA包括使植物的细胞质或细胞核与所述mRNA或小RNA接触。在一些情况下,所述mRNA或小RNA在体外转录反应中产生。在一些情况下,外源施用所述mRNA或小RNA包括使所述植物与包含异源启动子的表达盒接触,所述异源启动子可操作地连接至与SEQ ID NO:5至少75%、80%、85%、90%、95%或99%一致或一致的多核苷酸。在一些情况下,外源施用所述mRNA或小RNA包括使所述植物与包含异源启动子的表达盒接触,所述异源启动子可操作地连接至编码小RNA的多核苷酸,其中所述多核苷酸包含与SEQ ID NO:91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、116、117、123、124、130、131、132、133、134、136、137、138、139、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160或161至少75%、80%、85%、90%、95%或99%一致或一致的序列。

在一些情况下,外源施用所述mRNA或小RNA包括产生转基因植物并且从所述转基因植物产生体外组织培养物,所述转基因植物具有可操作地连接至一个或多个前述多核苷酸的异源启动子。在一些情况下,这样的组织培养体系可以减少或消除体细胞克隆异常的产生。因此,可以在没有产生具有体细胞克隆异常的植物风险或风险较小的情况下,通过体外组织培养繁殖技术无定限地产生具有一种或多种所需特性例如高油产量或所需dura、tenera、pisifera、virescens或nigrescens表型的油棕植物。

V.试剂盒

本发明还提供了使用本文所述的方法检测和/或量化本发明的DMR、DNA区、DNA元区或生物标记物内的甲基化的试剂盒。

本发明的试剂盒可以包括与本发明的至少一个诊断性生物标记物序列杂交的至少一种多核苷酸和至少一种用于检测甲基化的试剂。用于检测甲基化的试剂可以包括,例如,亚硫酸氢钠、多核苷酸和/或甲基化敏感性或甲基化依赖性限制性酶,所述多核苷酸设计为,如果生物标记物序列未甲基化(例如,包含至少一个C→U转化)则与作为本发明的生物标记物的产物(例如,扩增产物)的序列特异性杂交,或如果生物标记物甲基化,则特异性杂交。试剂盒可以提供适于在试验中使用的试验装置形式的固体支持物。所述试剂盒可以进一步包括可检测标记,可检测标记任选地连接到所述试剂盒中的多核苷酸,例如,探针。所述试剂盒中也可以包括用于进行试验的其它材料,包括试管、移液管等。所述试剂盒还可以包括在本文所述的任何试验中使用一种或多种这些试剂的书面说明书。

在一些实施例中,提供了用于确定来自油棕植物的生物样品中至少一个DMR的甲基化状态的试剂盒,所述试剂盒包括:(1)多核苷酸或多核苷酸对,其能够特异性扩增DMR的至少一部分,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;和甲基化依赖性、甲基化敏感性限制酶和/或亚硫酸氢钠;或(2)亚硫酸氢钠,用于全基因组扩增的引物和接头,和至少一种多核苷酸以量化来自DMR的至少一个胞嘧啶的甲基化转化序列和/或未甲基化转化序列的存在,其中DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(3)甲基化敏感性限制酶,用于全基因组扩增的引物和接头,和至少一种用于量化DMR的至少一部分的拷贝数的多核苷酸,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内;或(4)甲基化感测结合部分和至少一种多核苷酸以量化DMR的至少一部分的拷贝数,其中所述DMR处于与SEQ ID NO:1至少70%、80%、90%、95%或99%一致或一致的DNA序列内。

在一些情况下,所述DMR处于来自所述植物的样品中的DNA元区内。该元区包含两个或更多个呈现差异甲基化的重叠DNA区域。典型的DNA元区包括与SEQ ID NOS:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72对应(例如,至少90%、95%或99%一致,或一致)的生物标记物中心的重叠的4kb翼展区域(2kb 5’和3’)。在一些情况下,DNA元区处于SEQ ID NO:1中,或处于与油棕基因组中的SEQ ID NO:1对应(例如至少70%、80%、90%、95%或99%一致,或一致)的基因座中。典型的DNA元区包括与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致的那些序列。在一些情况下,DMR处于来自所述植物的样品中的DNA区域内。所述DNA区域可以为,例如4kb,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少约70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

在一些实施例中,所述试剂盒确定2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个不同的差异甲基化区域(DMR)的至少一个胞嘧啶的甲基化状态,从而预测存在或不存在体细胞克隆异常。在一些情况下,所述DMR处于与独立地选自SEQ ID NOS:1-5和7-75的序列对应(例如,至少70%、80%、90%、95%或99%一致或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。

在一些实施例中,所述试剂盒包含特异性检测扩增的DMR或其一部分的可检测地标记的多核苷酸探针。

VI.计算机程序产品

本文所述方法的计算可涉及基于计算机的计算和工具来预测植物或植物细胞中存在或不存在体细胞克隆异常(例如,预测Mantled表型)。例如,如本文所述,计算机可以将DNA区域、DNA元区、生物标记物,其一部分或其中的一个或多个胞嘧啶的甲基化值与阈值或对照值进行比较。所述工具有利地以可由常规设计的通用计算机系统(在此称为“主计算机”)执行的计算机程序的形式提供。主计算机可以配置有许多不同的硬件组件,并且可以制成许多维度和式样(例如,台式PC、笔记型电脑、平板PC、手持计算机、服务器、工作站、大型机)。可以包括标准组件,例如监视器、键盘、磁盘驱动器、CD和/或DVD驱动器等。在主计算机连接至网络的情况下,可以经由任何合适的传输介质(例如,有线、光学和/或无线介质)和任何合适的通信协议(例如,TCP/IP)来提供连接;主计算机可以包括合适的联网硬件(例如,调制解调器、以太网卡、WiFi卡)。主计算机可以实现多种操作系统中的任一种,包括UNIX、Linux、Microsoft Windows、MacOS或任何其它操作系统。

用于实现本发明的各方面的计算机代码可以以各种语言编写,包括PERL、C、C++、Java、JavaScript、VBScript、AWK或可以在主计算机上执行或可以编译以在主机上执行的任何其他脚本或编程语言。还可以以低级语言编写或分配代码,比如汇编语言或机器语言。

主计算机系统有利地提供了界面,用户通过该界面控制所述工具的操作。在本文所述的实施例中,软件工具以脚本(例如,使用PERL)实现,其执行可以由用户从操作系统(比如Linux或UNIX)的标准命令行界面发起。本领域技术人员将理解,命令可以酌情适应所述操作系统。在其它实施例中,可以提供图形用户界面,图形用户界面允许用户使用指向设备来控制操作。因此,本发明不限于任何特定的用户界面。

结合本发明的各种特征的脚本或程序可以编码在用于存储和/或传输的各种计算机可读介质上。合适的介质的示例包括磁盘或磁带,比如压缩盘(CD)或DVD(数字多用光盘)的光学存储介质、闪存和适于经由符合各种协议的有线、光学和/或无线网络,包括互联网传输的载波信号。

在一些实施例中,所述计算机程序产品包含用程序代码编码的计算机可读介质,所述程序代码包括:

用程序代码编码的计算机可读介质,所述程序代码包括:用于接收代表来自油棕植物的样品中差异甲基化区域(DMR)内的至少一个胞嘧啶的甲基化状态的甲基化值的程序代码,其中所述DMR处于与SEQ ID NO:1序列至少70%、80%、90%、95%或99%一致,或一致的DNA序列内;

以及用于将所述甲基化值与对照值进行比较的程序代码,其中所述对照值区分具有和不具有体细胞克隆异常的植物,其中所述甲基化值与对照值的比较预示着植物中存在或不存在体细胞克隆异常。

在一些情况下,所述DMR处于来自所述植物的样品中的DNA元区内。该元区包含两个或更多个呈现差异甲基化的重叠DNA区域。典型的DNA元区包括与SEQ ID NOS:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72对应(例如,至少90%、95%或99%一致,或一致)的生物标记物中心的重叠的4kb翼展区域(2kb 5’和3’)。在一些情况下,所述DNA元区处于SEQ ID NO:1中,或处于与油棕基因组中的SEQ ID NO:1对应(例如至少70%、80%、90%、95%或99%一致,或一致)的基因座中。典型的DNA元区包括与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少70%、80%、90%、95%或99%一致,或一致的那些序列。在一些情况下,所述DMR处于来自所述植物的样品中的DNA区域内。所述DNA区域可以为,例如4kb,其中所述DNA区域与选自SEQ ID NO:35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、73和74的序列至少约70%、80%、90%、95%或99%一致,或一致。在一些情况下,所述胞嘧啶处于生物标记物中,其中所述生物标记物与选自SEQ ID NO:7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、71和72的序列至少90%、95%或99%一致,或一致。

可以将至少一个胞嘧啶的甲基化状态与对照值进行比较以确定甲基化的相对变化,其中所述对照值时对照基因组的甲基化值。例如,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较高,则测试基因座的甲基化状态增加。作为另一个实例,如果测试基因座处的胞嘧啶的甲基化状态指示与对照基因座处的甲基化状态相比甲基化程度较低,则测试基因座的甲基化状态降低。通常,对照基因座具有已知的、相对恒定的甲基化状态。例如,可以预先确定没有甲基化,具有一些或大量的甲基化,从而提供相对恒定的值以控制与存在或不存在体细胞克隆异常无关的检测方法等中的误差。在一些实施例中,对照基因座是内源的,即,是独立样品的基因组的一部分。可替换地,对照基因座可以是外源基因座,例如以已知量掺入样品中且甲基化状态已知的DNA序列。

在一些实施例中,确定2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27或28个不同的差异甲基化区域(DMR)的至少一个胞嘧啶的甲基化状态,从而预测存在或不存在体细胞克隆异常。在一些情况下,所述DMR处于与独立地选自SEQ ID NOS:1-5和7-75的序列对应(例如,至少70%、80%、90%、95%或99%一致或一致)的基因座、反转录转座子、DNA元区、DNA区域或生物标记物中。

在一些实施例中,预测的体细胞克隆异常是油棕植物降低果实产量、油产量、生长或繁殖的异常。在一些情况下,降低是相对于对照植物,比如,亲本植物或相同果实颜色(nigrescens或virescens)或壳厚度(dura、tenera或pisifera)表型的野生型植物。在一些情况下,体细胞克隆异常呈现出Mantled表型。

在一些情况下,所述计算机程序产品预测植物中存在或不存在体细胞克隆异常(例如,Mantled表型)。在一些情况下,所述计算机程序产品为另一计算机程序产品或本领域技术人员提供数据,以预测所述植物中存在或不存在体细胞克隆异常。在一些情况下,所述计算机程序产品计算统计置信度(例如,p值、t统计量等)以预测植物中存在或不存在体细胞克隆异常。

实施例

提供以下实施例以阐述而不限制要求保护的本发明。

实施例1:全DNA甲基化图谱揭示了Mantled克隆繁殖材料中的差异DNA甲基化。

基于pisifera油棕基因组的基因组构建体设计微阵列特征(Singh et al.2013,Nature 500,340-344)。超过100万个特征被设计成与油棕基因组的独特序列相交的独特的61个碱基序列。虽然重复序列构成约57%的油棕基因组,但是可以将独特序列特征设计成侧接不同重复元件的序列,以及嵌入特定重复元件内的独特序列。使用基于DNA微阵列,利用甲基化依赖性限制酶McrBC的技术平台识别Mantled克隆材料相对于表型正常的克隆材料的差异甲基化的基因座(Ordway et al.2006 Carcinogenesis 27:2409-2423;Ordway et al.2007 PLoS ONE 2:e1314)。参见,例如,专利号为7,186,512的美国专利。其中给定的微阵列特征可以报告DNA甲基化状态的基因组区域取决于为微阵列杂交进行标记的DNA片段的分子大小。在微阵列实验中,通过琼脂糖凝胶提取来纯化1至4kb大小范围的DNA,并用作用于氰染料标记的模板。因此,每个微阵列特征查询的基因组区域是8kb(即,由微阵列特征表示的序列的上游4kb和下游4kp)。

与mantled异常有关的果型如图1所示。从78个克隆繁殖的棕榈(分株)的矛尖形叶(spear leaf)中提取DNA,包括37棵单性结实的mantled分株,41棵正常分株和从中得到克隆分株的10棵原株。这些样品从四个工业来源得到并且如图2所述,代表11个独立的克隆繁殖事件,并且每个克隆繁殖事件产生3至5棵正常树和2至5棵mantled树。由代表两次技术重复样、并且每个重复样进行染色交换反向杂交的四个独立的微阵列杂交产生全基因组DNA甲基化图谱。

数千个基因座在遗传一致的原株,单性结实的mantled分株样品和正常分株样品之间进行了差异性甲基化,其中在mantled样品中大部分(~90%)是低甲基化的,这与先前报道的总5mC水平减少一致(Matthes et al.2001;Jaligot et al.2002;Jaligot et al.2004)。有趣的是,大多数这些低甲基化基因座(~75%)映射到转座子和重复子,而较少频繁的超甲基化基因座映射到基因序列和重复序列。这些结果与拟南芥细胞培养物的类似图谱一致(Vaughn et al.2007),但与水稻中体细胞克隆再生体的表观遗传图谱不同,其中尽管激活了一些TE(Miyao et al.2012;Cui et al.2013),但DNA甲基化的丧失使基因大大受限((Stroud et al.2013)。为了识别来自多个克隆谱系的mantled克隆和正常克隆之间的表观遗传学差异,首先独立地在各来源群内基于微阵列特征杂交识别正常样品和完全mantled样品之间的显著的差异甲基化区域(DMR)。然后在特征对特征的基础上,比较来源群体之间的杂交结果(图3)。虽然在每个群体的mantled克隆和正常克隆之间检测到数万个显著特征,但是99.9%的这些特征排除了4个群体中的任一个(94.4%)或2(5.5%)个,表明在表观遗传学对组织培养的响应中基因型变异显著。只有79个差异甲基化特征是4个群体中的3个共有的(其中67%与重复元件有关),并且所有4个群体中只有单个微阵列特征检测到正常克隆和mantled克隆之间的差异甲基化(图3)。

区分所有4个群体中mantled克隆与正常克隆的单个特征位于EgDEF1的~35kb内含子5(图4a)即,金鱼草(Antirrhinum majus)DEFICIENS基因的油棕直系同源物中,EgDEF1编码类似于拟南芥APETALA3(AP3)的花同源异型MADS盒转录因子(Adam et al.2005)。金鱼草中的def突变体和拟南芥中的ap3突变体导致雄蕊进行心皮(B类)同源异型转换,强烈地使人想起油棕中的mantled表型(Jaligot et al.2011)。EgDEF1在E.guineensis染色体12上跨越约40kb并且包括7个外显子(图4a)。Ty1/copia反转录转座子位于EgDEF1启动子有义方向的上游,并且与番茄(Solanum lycopersicum)的Rider元件具有相似性,而Ty3/gypsy反转录转座子Koala位于反义方向的内含子5的中心附近。与以前的报告(Jaligot et al.2014)一致,在多个群体的mantled克隆中一致地检测到在这些反转录转座子中的任一个内的DNA甲基化差异(图4a)。

之前未报告的第三个重复元件位于内含子5中,在有义方向,并且与水稻Karma家族LINE元件具有同源性。Karma元件,以及Tos17 copia样元件,在水稻胚胎发生组织培养物中激活,但是与Tos17不同,Karma元件仅在再生植物中转座,其中该元件的跨代DNA保持低甲基化(Komatsu et al.2003)。3.2kb油棕Karma元件的侧翼为13bp靶位点复制序列(TTCAAAATGATGA),并编码与水稻Karma ORF2同源的逆转录酶开放阅读框。如在哺乳动物LINE元件中,ORF2之前是紧邻靶位点重复序列的剪接受体序列(GAACAG^ATGC),并且之后是多聚腺苷酸化信号,类似水稻5'截短的Karma元件(Komatsu et al.2003;Cui et al.2013)。独特的60个核苷酸微阵列特征(mantled克隆中一致检测到低甲基化)不仅映射到Karma元件,而且意外包括预测的剪接受体位点。尽管克隆谱系更少,映射到Karma元件内的所有另外三个的微阵列特征也在mantled克隆中检测到显著的低甲基化(图3和4a)。

所识别的基因组差异甲基化区域映射到已公开的E.guineensis基因组构建体的支架13008的坐标58360至61400(Singh et al.2014,Nature 500,340-344的图1)。SEQ ID NO:15、16、17和18提供了报道这些差异DNA甲基化测量的四个特征的序列。SEQ ID NO:43、44、45和46中提供了跨越61mer特征序列的4061bp区域(61mer特征序列的+/-2Kb)的序列。SEQ ID NO:66提供了从显著特征57600上游2kb至显著特征62840下游2kb的合并序列。

为了进一步分析跨EgDEF1基因约95Kb区域中的DNA甲基化,分析代表支架13008的坐标33080至127680的微阵列特征产生的数据,以独立比较来自每个克隆繁殖事件的mantled克隆材料vs.正常克隆材料(图2)。在元素2(Karma)内,相对于来源于所有11个克隆繁殖谱系的样品中的正常样品,mantled样品显示低甲基化。然而,如图2所总结,其它不同区域以更多谱系特异性方式显示了差异DNA甲基化事件。例如,谱系1、2、3和5显示与mantled样品中元件3(Koala)的5'端有关的序列的超甲基化。SEQ ID NO:25、26、27和72提供报告这些差异DNA甲基化测量的四个特征的序列。SEQ ID NO:53、54、55和74提供了跨61mer特征序列的4061bp区域(61mer特征序列的+/-2Kb)的序列。SEQ ID NO:68提供了特征79360上游2kb至83520下游2kb的合并序列。此外,与元件1(Rider)有关的区域显示来源于谱系1、3、5、9和11的mantled样品的差异DNA甲基化。SEQ ID NO:7、8、9、10、11、12、13和71提供了报道这些差异DNA甲基化测量的8个特征的序列。SEQ ID NO:35、36、37、38、39、40、41和73提供了跨61mer特征序列的4,061bp区域(61mer特征序列的+/-2Kb)的序列。SEQ ID NO:63提供了从特征33080上游2kb至35720下游2kb的合并序列。SEQ ID NO:64提供了从特征44480上游2kb至特征45160下游2kb的合并序列。SEQ ID NO:65提供了从特征50360上游2kb至特征51760下游2kb的合并序列。如图2所示,在各种克隆谱系中,EgDEF1内含子5内或EgDEF1基因3'端下游的其它区域的甲基化偶尔有差异(如图2所示)。SEQ ID NO:7至34,71和72提供了报道这些差异DNA甲基化测量的所有30个特征的序列。SEQ ID NO:35-62,73和74提供了跨61mer特征序列的4,061bp区域(61mer特征序列的+/-2Kb)的序列。

实施例2:正常克隆树和异常克隆树的差异DNA甲基化的验证和确认

为了验证mantled克隆中的Karma低甲基化,对来自5个独立克隆谱系(15个样品)的包含遗传相同的原株,单性结实的mantled分株和正常分株的样品三元组进行全基因组亚硫酸氢盐测序。整个EgDEF1基因座(包括Karma元件)的CG甲基化密度在原株样品、正常样品和mantled样品中惊人地相似(图4b),并且内含子和侧翼区域的CG甲基化密度比外显子的CG甲基化密度更高。相比之下,CHG甲基化密度在mantled克隆中显著降低,显示DMR在Karma元件的整个长度上覆盖~170个CHG位点(图4b)。CHH甲基化密度比CG和CHG低得多,并且在mantled克隆中仅略微降低(图4b)。

为了进一步确认元件2中的差异CHG甲基化,设计四个独立的MethylScreen实验(参见例如,专利号为7,910,296、8,361,719、7,901,880和8,163,485的美国专利)以监测甲基化敏感性限制酶靶序列内的CHG位点,甲基化敏感性限制酶靶序列会被CHG甲基化阻断,但对CHH或CG甲基化不敏感。设计第一扩增子以扩增Karma内576bp区域,其含有甲基化敏感酶AlwNI的位点。SEQ ID NO:82和83分别提供正向和反向引物。SEQ ID NO:84提供扩增子序列。限制性位点包括两个CHG位点,并且这些胞嘧啶的甲基化阻断酶的消化。设计第二扩增子以扩增Karma内633bp区域,其含有甲基化敏感酶Bbv1和ScrFI的位点。SEQ ID NO:85和86分别提供正向和反向引物序列。SEQ ID NO:87提供扩增子序列。这些酶位点中的每一个包括CHG位点,并且该位点的甲基化阻断了酶的消化。分别使用相同的扩增子(SEQ ID NO:87)进行两种酶测定中的每一种。最后,设计第三扩增子以扩增Karma内632bp区域,其含有甲基化敏感性限制酶RsaI的位点。SEQ ID NO:88和89分别提供正向和反向引物序列。SEQ ID NO:90提供扩增子序列。该位点包括CHG位点,并且该位点的甲基化阻断酶的消化。如上所述,对已经进行全基因组亚硫酸氢盐测序的原株样品、正常样品和mantled样品的四个独立组的基因组DNA进行四个MethylScreen试验中的每一个。将基因组DNA分成两等份。第一部分进行模拟处理(不包括限制酶)。第二部分在单独的反应中用四种甲基化敏感性限制酶中的每一种消化。对每个部分重复进行一式两份的定量PCR扩增(可替换地,可以通过凝胶电泳,而不使用实时定量PCR分析结果)。对于两个重复测定中的每一个,用酶消化部分Ct减去模拟处理部分Ct,计算ΔCt。致密甲基化%计算为2^-dCt。图5中提供了重复测定之间的平均致密甲基化%和标准偏差。这些结果证明四个MethylScreen试验中的每一个都能够检测到相对于原株DNA和正常克隆DNA,Mantled克隆DNA的低甲基化。

为了确认在不相关的克隆棕榈中的差异CHG甲基化,对来自一组49棵棕榈的成熟叶样品进行Bbv I和Rsa I qPCR测定。这些样品代表来自4个独立工业来源的21个克隆谱系,包括8棵原株和13棵正常克隆,19棵单性结实的mantled克隆,2棵可育的mantled克隆和7棵产生具有mantled果实和正常果实的花束的部分回复克隆。虽然限制性位点测定仅监测DMR中~170个CHG位点中的2个,通过线性判别分析确定的阈值使得检测mantled的灵敏度为93%并且特异性为100%,反映了Karma低甲基化与mantled表型的强关联(图6)。对从所有7个回复棕榈取出的叶按照mantled样品进行打分,与在发育晚期混合棕榈上出现并恢复为正常表型的正常花束的观察一致(Corely,1986)。

虽然在两个限制性位点的CHG甲基化密度有高度预测性,但其并非与mantled表型完全相关。通过对跨Karma剪接受体位点的区域进行亚硫酸氢盐测序(图7),进一步分析了两棵假阴性mantled棕榈(图6中的FN1和FN2)和2棵对照棕榈(图6中的箭头)。如qPCR所预测,该区域在正常对照样品中密集地CHG甲基化,而mantled对照样品已经去CHG甲基化(图7b-c)。假阴性mantled样品(通过限制性位点试验预测为具有正常的甲基化)在周围区域保留了大量的CHG甲基化,然而相对于正常对照样品,剪接受体位点附近的CHG甲基化明显降低了50%(图7a-b和d-e),这表明剪接受体CHG位点处或邻近的低甲基化足以预测mantled表型。因为其强预测性,我们分别命名MANTLED超甲基化和低甲基化的表观等位基因(epialleles)Good Karma和Bad Karma。

实施例3:表观遗传镶嵌体(mosaics)中的表型逆转

mantled棕榈有时会逆转,产生包括正常果实和mantled果实的花束(Rao&Donough,1990)。我们假设DNA甲基化有时可以恢复成回复棕榈和镶嵌体棕榈,类似于玉米中同样由转座子调控的表观等位基因((McClintock,1965;Martienssen et al.,1990;Martienssen&Baron,1994)。虽然罕见,我们鉴定出产生具有正常果实和(可育)mantled果子的花束的棕榈的两个克隆谱系。克隆谱系1包括两个回复体克隆,每束分别具有99%和95%正常果实,其中异常果实仅具有一个或两个小的假心皮(图8a-c)。第二谱系(克隆谱系2)包括仅具有7%正常果实的镶嵌体克隆。相对于正常对照克隆,在来自回复体和镶嵌体克隆的叶中,最接近Karma剪接位点(图8d)的Bbv I位点(图5-6)处的CHG甲基化较低。然而,来自两个回复体克隆而非来自mantled镶嵌体克隆的果实恢复了甲基化(图8d-f)。

如同在玉米、Linnaria、拟南芥和番茄中的类似的表观等位基因((Martienssen et al.,1990;Cubas et al.,1999;Manning et al.,2006;Kinoshita et al.,2007),发育期间异常表型的逆转伴随DNA甲基化的恢复,表明Karma元件的甲基化是mantled表型的起因。没有观察到单个mantled果实和正常果实之间的差异甲基化,可能反映弱mantled表型的非细胞自主性(图8d)。DEF和AP3基因的非细胞自主性导致金鱼草和拟南芥的镶嵌嵌合体中的类似逆转((Furner et al.,2008;Perbal et al.,1996;Jenik&Irish,2001)。有趣的是,来自镶嵌体克隆的正常果实和mantled果实中跨Karma剪接受体位点的区域的亚硫酸氢盐测序显示,剪接受体位点处的CHG甲基化根据表型而显著不同,这表明回复体果实确实是超甲基化细胞和低甲基化细胞的镶嵌体(图8e-f)。

实施例4:Mantled表型与非编码调节RNA表达的变化相关

在植物中,小非编码调节RNA可以影响DNA甲基化和基因表达。为了确定Mantled表型和小非编码调节RNA的表达之间的相关性,在来源于3棵正常克隆树和3棵Mantled克隆树的茎尖组织、来源于3棵正常克隆树和3棵Mantled克隆树的<2cm期花序组织以及来源于3棵正常克隆树和3棵Mantled克隆树的晚期花序组织上进行全转录组小RNA测序。通过标准Illumina技术产生小RNA测序文库,并且每个文库样品独特地条码化,从而可以单独分析每个样品的转录组。在每条HiSeq 2500道四个文库的池中对文库进行测序。24个核苷酸测序读数(代表小RNA的24mer类)被映射回参考油棕基因组(Singh et al.2013)。识别精确匹配EgDEF1基因区间内的序列的读取,并将其映射到EgDEF1参考序列的对应序列。针对每个样品,计算每种不同的24mer序列的映射读数的数目,并且通过计算在每个样品内对读取计数进行FPKM标准化:(#映射到EgDEF1基因座的不同的24的精确映射的24mer读数)/(#映射到参考油棕基因组的总24mer读数)*1,000,000。图9显示24mer siRNA读数相对于EgDEF1基因组基因座的图(图9A)。示出了来自正常克隆树(图8B)和来自Mantled克隆树(图8C)的茎尖(SA)、<2cm花序(<2cm)和晚期花序(Inf.)的标准化计数的单独的印迹。通过比较正常表型和Mantled表型之间的SA和<2cm组织的印迹可以看出,在正常样品中检测到许多24mer siRNA,而在Mantled样品中较少或未检测到24mer siRNA。不管表型如何,在晚期花序中检测到明显较少的不同的24mer siRNA,这与小非编码调节RNA在早期花发育中的重要作用一致。正常SA和<2cm中的一个强峰(与SEQ ID NO:99中提供的24mer siRNA对应,Mantled SA和<2cm中显著降低)映射到EgDEF1外显子5的剪接位点下游152bp的基因组区域,Karma元件中以产生kDEF1转录物(参见实施例5)。

To further address differential 24mer siRNA expression,24mer siRNAs that displayed at least a 2-fold difference in expression in one phenotype relative to the other were identified for each tissue type:shoot apex,<2cm stage inflorescences and later stage inflorescences.As predicted by the analysis shown in Figure 9,shoot apex tissue has the largest number of distinct 24mer siRNAs differentially expressed in Normal relative to Mantled tissues(Table 1).

为了进一步解决差异24mer siRNA表达,对于以下每种组织类型,识别在一种表型中相对于在其它表型中显示表达相差至少2倍的24mer siRNA:茎尖、<2cm期花序和晚期花序。如图9所示的分析所预测,在正常组织中相对于Mantled组织差异性表达中,茎尖组织具有最大数目的不同的24mer siRNA(表1)。

将EgDEF1内含子5的剪接位点下游152bp映射至Karma元件的24mer siRNA(SEQ ID NO:91)表达差异最大,并且正常茎尖组织的表达水平相对于Mantled茎尖组织的表达水平高11倍。另外23条siRNAs(SEQ ID NO:92-115)在正常茎尖中的表达水平也比在Mantled茎尖中的表达水平高,倍数差异为2至5.9倍。在Mantled茎尖组织中检测到单个24mer siRNA的表达比正常茎尖组织单个24mer siRNA的表达高2.5倍(SEQ ID NO:115)。在正常茎尖组织相对于Mantled茎尖组织中差异表达的25个siRNA中,两个siRNA(SEQ ID NO:91和SEQ ID NO:97)映射到差异甲基化区域内。这些siRNA可影响EgDEF1基因的DNA甲基化和/或差异剪接。此外,其它23个siRNA可能在EgDEF1基因表达的方面发挥作用。

与图9所示的分析一致,较晚发育期(<2cm期花序和晚期花序)显示正常和Normal之间24个siRNA的表达差异逐渐减少。在<2cm期花序中,10个不同的siRNA存在至少2倍的差异表达(表2)。

这些siRNA包括SEQ ID NO:97、104和115表示的siRNA,其在茎尖中也是差异表达的。由SEQ ID NO:104表示的siRNA在正常茎尖(2.7倍)和<2cm期花序(2.8倍)中相对于在Mantled茎尖和<2cm期花序中过表达。由SEQ ID NO:115表示的siRNA在Mantled茎尖(2.5倍)和<2cm期花序(2.5倍)中相对于在正常茎尖和<2cm期花序中过表达。由SEQ ID NO:97表示的siRNA在正常茎尖中相对于在Mantled茎尖中过表达(3.2倍),但在Mantled<2cm期花序中相对于在正常<2cm期花序中过表达(2倍)。如表2所示,检测到在<2cm期花序中差异表达的另外7个siRNA(SEQ ID NO:116-122)。最后,检测到两个siRNA在正常晚期花序中相对于在Mantled晚期花序中过表达(表3,SEQ ID NO:123和SEQ ID NO:124)。

图10中展示了这些siRNA在正常组织和Mantled组织中的标准化siRNA表达水平(FPKM方法),以及每个表型每个组织状态的三个重复样的标准偏差。除了相对于Mantled组织在正常组织中以不同数量水平表达的24mer siRNA,识别在一种表型的组织类型中表达但不在另一种表型的组织类型中表达的24mer siRNA。表4列出了对于一种表型的组织类型,24mer siRNA平均检测至少3次读数,而在另一种表型的相同组织中未检测到读数。

在正常茎尖中检测到5个不同的siRNA(SEQ ID NO:130-134),但是在Mantled茎尖中没有检测到。在Mantled<2cm期花序中检测到一个siRNA(SEQ ID NO:135),但在正常<2cm期花序中没有检测到。在正常<2cm期花序中检测到四个siRNA(SEQ ID NO:136-139),但在Mantled<2cm期花序中没有检测到。在Mantled晚期花序中检测到两个siRNA(SEQ ID NO:140和141),但在正常晚期花序中没有检测到。最后,在正常晚期花序中检测到2个siRNA(SEQ ID NO:142和143),但是在Mantled晚期花序中没有检测到。因此,早在田间种植和Mantled异常果实表型发育之前,一个或多个这些siRNA(SEQ ID NO:82-124)的表达的定量检测可用于预测体细胞克隆材料中的Mantled表型。此外,在体细胞克隆繁殖的细胞培养阶段中,一个或多个siRNA(例如SEQ ID NO:91和SEQ ID NO:97)的异位表达可用于维持或重置Karma元件内差异甲基化区域的DNA甲基化状态和/或来源于EgDEF1基因座的mRNA的适当剪接,从而抑制克隆来源的棕榈中异常Mantled果实表型的发育。

因为在拟南芥和玉米中,24nt小干扰(si)RNA引导CHH和CHG甲基化,并且DNA甲基化反过来通常是RNA聚合酶IV生物合成24nt siRNA所必需的(Regulski et al.,2013;Zhong et al.,2012;Hollick 2012),我们进一步分析了在正常雌花和mantled雌花中花序发育时程中的siRNA表达。在0、2、3、4和5期对雌花序组织进行小RNA测序(在0期的7个mantled和5个正常生物重复样、在2期和3期各6个mantled和8个正常生物重复样、在4期的7个mantled和5个正常生物重复样和在5期的5个mantled和4个正常生物重复样)。如之前所定义,时期在组织学上分为0期(顶端分生组织)、2期(花被器官萌生)、3期(花被器官器官发育和繁殖器官萌发)、4期(繁殖器官发育)、5期(繁殖器官完全成形)(Adam et al.,2007)。识别映射到基因组支架(包括EgDEF1)的siRNA读数且将每1000映射读数的片段(FPKM)归一化到整个油棕参考基因组(Singh et al.2013)。通过学生t检验,双尾假设等方差比较在正常样品的生物学重复样的每个24mer的FPKM值和mantled样品的生物学重复样的每个24mer的FPKM值。该分析识别了0期正常花序中的24nt Karma siRNA簇,其在mantled花序中减少或不存在,而与EgDEF1内含子匹配但在Karma外部的其它siRNA的表达差异并不显著(图11)。总之,相对于正常0期花序组织,在mantled 0期花序组织中,来源于Karma的几个24nt siRNA(SEQ ID NO:144-147、150-158和160-161)被阻遏或沉默(表5)。相对于正常2期花序,在mantled 2期花序中,这些24nt siRNA中的几个(SEQ ID NO:145、151、154和157)也被阻遏或沉默,并且两个24nt siRNA(SEQ ID NO:148、149和159)在2期花序中明显被阻遏(表5)。最后,在3期,在2期受阻遏的一个24nt siRNA(SEQ ID NO:149)在mantled花序中相对于在正常花序中保持阻遏。在花序发育晚期的差异表达的siRNA的数量减少是发育晚期siRNA表达整体降低的结果,即使在正常组织中也是如此(图12)。来源于Karma剪接受体位点附近的siRNA大部分处于反义方向(表5),提高了24nt siRNA(与选择性剪接外显子互补)与表观遗传机制中异常DNA甲基化协作从而引起mantled表型的有趣的可能性。因此,早在田间种植和mantled异常果实表型发育之前,一个或多个这些siRNA(SEQ ID NO:82-124和144-161)的表达的定量检测可用于预测体细胞克隆材料中的mantled表型。此外,在体细胞克隆繁殖的细胞培养期中,一个或多个siRNA(例如SEQ ID NO:144-161)的异位表达可用于维持或重置Karma元件内差异甲基化区域的DNA甲基化状态和/或来源于EgDEF1基因座的mRNA的适当剪接,从而抑制克隆来源的棕榈中异常mantled果实表型的发育。

实施例5:Mantled表型与选择性剪接的转录物表达的变化相关

通过来自正常棕榈和单性结实的mantled棕榈的雌性花序(每个表型的茎尖、<2cm花序和晚期花序各3个生物重复样)的全转录组下一代测序来分析整个花序发育期的正常组织和mantled组织中的基因表达。检测来源于EgDEF1基因座的四个不同剪接的mRNA转录物(图9和13)。首先,在正常组织和mantled组织中检测cDEF1转录物(SEQ ID NO:5)。这些全长转录物包括所有EgDEF1内含子的剪接,使得成熟mRNA包括EgDEF1基因的完整外显子1至7并编码全长EgDEF1MADS盒转录因子(SEQ ID NO:6)。第二,在正常组织和mantled组织中检测较短的转录物tDEF1(SEQ ID NO:75)。此转录物包括EgDEF1外显子1-5,然而外显子5不剪接至外显子6。相反,tDEF1 mRNA从外显子5延伸至内含子5并在此后不远终止。由于预测的MADS框蛋白K结构域内的移码和早期翻译终止,tDEF1 mRNA编码截短的蛋白(SEQ ID NO:76)。接下来,仅在mantled组织中检测到选择性剪接转录物。该转录物kDEF1(SEQ ID NO:78)从EgDEF1外显子5剪接到内含子5内的Karma元件的剪接受体位点。该选择性剪接位点的位置落入差异甲基化区域内(图4-8)。选择性剪接事件导致外显子5编码序列后的移码,和预测的MADS盒蛋白K结构域的翻译过早终止(SEQ ID NO:79)。最后,在少量mantled组织样品中检测到非常低水平的另外的选择性剪接的转录物gDEF1(SEQ ID NO:80)。该转录物从EgDEF1外显子5剪接到Karma和差异甲基化区域上游的内含子5的区域中。这种剪接事件还导致外显子5编码序列后的移码和MADS盒转录因子的K结构域内的翻译过早终止(SEQ ID NO:81)。应注意,截短的MADS盒转录因子蛋白(kDEF1,tDEF1和/或gDEF1)的这种表达包括蛋白质异源二聚化和DNA结合所需的MADS盒结构域,但缺乏转录激活所需的蛋白质的C端结构域,该表达可以对全长MADS盒蛋白的功能主要起消极影响,并且因此导致同源异型转换表型,比如,在Mantled果实异常的克隆棕榈中显示的同源异型转换表型。

为了定量测量cDEF1、tDEF1和kDEF1的表达,设计并优化每种转录物的特异性qRT-PCR试验(图14)。为了特异性测量cDEF1表达,设计正向PCR引物以跨越EgDEF1外显子1和2(图14a,SEQ ID NO:125中的a)的剪接点,并且在EgDEF1外显子7(14a,SEQ ID NO:126的e)内设计反向引物。为了特异性测量kDEF1表达,设计正向PCR引物以跨越EgDEF1外显子4和5(图14a,SEQ ID NO:127中的b)的剪接点,并且在Karma元件(图14a,SEQ ID NO:128中的d)内设计反向引物。为了特异性测量tDEF1表达,设计正向PCR引物以跨越EgDEF1外显子1和2(图14a,SEQ ID NO:125中的a)的剪接点,并设计反向引物以跨越包含在tDEF1转录物中的外显子5的3'序列和内含子5的5'序列(图14a中的c,SEQ ID NO:129)。设计并合并多个基因座特异性反向引物用作RT引物,从而可以使用4期正常总RNA样品和5期mantled总RNA样品作为模板由常见逆转录酶反应扩增所有可能的转录物作为cDNA产物。图14b中提供了分析的每种转录物的外显子剪接的总结和所用的qRT-PCR引物。单独使用这些RT产物作为模板和每对引物的终点PCR反应如图14c所示。cDEF1引物扩增来自正常RNA模板和mantled RNA模板的预测大小的条带,尽管相对于mantled样品,从正常样品中定性地扩增的产物更多。kDEF1引物从mantled RNA但不从正常RNA扩增预测大小的条带。tDEF1引物从正常RNA和mantled RNA扩增预测大小的条带,但相对于正常样品,从mantled样品中定性扩增的产物更多。使用SYBR绿色定量方法通过在实时PCR试验中扩增一系列稀释的cDNA模板,确定针对油棕的PCR引物,以及内源看家基因参照qRT-PCR试验的引物PD00380的定量效率(Chan et al.(2014)PLoS ONE 9:e99774)。

使用qRT-PCR试验定量测量整个雌花序时程中的cDEF1、tDEF1和kDEF表达(图15)。在0、2、3、4和5花序发育期中对基因表达进行量化。使用EgDEF1外显子6和7以及Karma的3’区域特异性反向引物的混合物从1μg总RNA进行所有第一链cDNA逆转录反应。针对每个时期,对于每个表型每个时期的三个生物重复样进行三次技术重复。在Roche LC480仪器上的1X Roche SYBR Master Mix中使用1μL第一链cDNA进行qRT-PCR反应。计算中不包括高于33个循环的循环阈值,并且仅对于在3个技术重复中的至少2个中检测到表达的样品计算可检测的表达。通过将每个试验的标准曲线外推定量表达水平,并计算相对于油棕基因表达参照基因(Chan et al.2014)的表达水平。在正常组织和mantled组织中,从0期花序到晚期花序cDEF1表达水平略微上升(图15),而tDEF1以恒定的较低水平表达。然而,在这些结果中,kDEF1表达局限于3至5期花序,仅在mantled组织中。因此,与tDEF1表达不同,在一些情况下,kDEF1在雌性花序中的表达仅在mantled发现,并且预测编码严重截短形式的EgDEF1 MADS盒转录因子。

总之,作为体细胞克隆繁殖的结果出现的油棕的mantled果实异常表型与EgDEF1基因座处的多个分子异常相关联。来自mantled油棕的组织具有显著CHG低甲基化的差异甲基化区域,其涵盖嵌入EgDEF1基因的内含子5内的Karma家族LINE反转录转座子元件。该区域的低甲基化敏感地且特异性地诊断Mantled表型,并且在该区域内的多个CHG位点中的任何一个定量测量甲基化含量的试验具有预测异常的强诊断能力。已经检测到来源于EgDEF1基因的四个选择性剪接转录物,其中之一(cDEF1)编码全长MIKC家族MADS盒转录因子,其中三个(kDEF1、tDEF1和gDEF1)编码截短的蛋白,该截短的蛋白包括MADS盒、I和部分K结构域,但缺乏C端转录激活结构域。在正常组织中,主要表达的转录物编码全长cDEF1蛋白。然而,在Mantled组织中,表达主要来源于选择性剪接的kDEF1转录物,并且在较小程度上来源于选择性剪接的tDEF1转录物。这些发现支持这样一种机制:EgDEF1基因座的表观遗传的反常导致截短的负显性蛋白的表达,该负显性蛋白干扰正常的同源异型花器官特定通路,从而导致mantled果实表型。此外,来自EgDEF1基因座的小非编码调节RNA的表达在来自mantled棕榈的组织中相对于在来自正常棕榈的组织中,尤其是在较早发育期中显著改变。

实施例6:通过甲基化特异性PCR检测差异DNA甲基化

可以通过甲基化特异性PCR(MSP)方法定量DNA甲基化。使用该方法,用亚硫酸氢盐处理DNA样品以将未甲基化的胞嘧啶(但不将甲基化的胞嘧啶)转化为尿嘧啶。设计引物以覆盖潜在的甲基化胞嘧啶位点,并且针对甲基化构型和未甲基化构型设计不同的引物。图16展示了使用MSP分析在本文识别的mantled样品和正常样品中的DMR的实例。应注意,可在种植于田间之前,即,不知道最终的mantled表型的时间,对克隆材料进行这种试验。为了简单起见,所有潜在的DNA甲基化位点在正常DNA中表示为甲基化的(实心圆),在mantled DNA中表示为未甲基化的(空心圆)(图16a)。然而,应注意,给定的DNA分子可包括甲基化胞嘧啶和非甲基化胞嘧啶的混合物。设计用于扩增在引物序列内的位点处甲基化的分子的引物,使得引物在一条链的引物中的潜在甲基化位点处具有胞嘧啶,在另一条链的引物中的潜在的甲基化位点处具有鸟嘌呤。设计用于扩增在引物序列内的位点处未甲基化的分子的引物,使得引物在一条链的引物中的潜在甲基化位点处具有胸腺嘧啶,在另一条链的引物中的潜在甲基化位点处具有腺嘌呤。与并非潜在的甲基化位点的胞嘧啶对应的引物内的碱基设计为与转化的序列碱基配对,因为所有未甲基化的胞嘧啶转化为尿嘧啶。用亚硫酸氢盐处理正常DNA样品和mantled DNA样品以将未甲基化的胞嘧啶转化为尿嘧啶,并且将转化的DNA分别用作模板分别用各引物(非甲基化引物对为UM,甲基化引物对为M)进行PCR扩增。其中胞嘧啶被预测为甲基化的正常样品用M引物对能扩增而用UM引物对不能扩增。其中胞嘧啶被预测为未甲基化的mantled样品用UM引物对能扩增,而用M引物对不能扩增(图16b)。条带的强度差异(而非条带存在或不存在)也可以诊断表型,。

可以应用修饰的方法,其中两条PCR引物之一仅包括一个、两个或三个潜在的甲基化位点。在亚硫酸氢盐转化后,位点的表现与未转化的DNA中的单核苷酸多态性相似。例如,在亚硫酸氢盐转化后,甲基化的胞嘧啶仍然是胞嘧啶并且将与鸟嘌呤碱基配对。然而,未甲基化的胞嘧啶被转化成尿嘧啶并且将与腺嘌呤碱基配对。因此,适于检测单核苷酸多态性的方法也适于监测mantledDMR内的胞嘧啶的甲基化状态。这些方法可以提供定量或定性测量。

实施例7:通过甲基化依赖性免疫沉淀检测差异DNA甲基化

DNA甲基化可以通过甲基化依赖性免疫沉淀(MeDIP)方法定量。在该方法中,使用甲基胞嘧啶特异性抗体对胞嘧啶甲基化的DNA分子进行免疫沉淀,随后扩增特异性DNA序列。图17中展示了使用MeDIP分析本文识别的Mantled和正常样品中的DMR的实例。应注意,可在种植于田间之前,即,不知道最终的mantled表型的时间,对克隆材料进行这种试验。为了简单起见,所有潜在的DNA甲基化位点在正常DNA中表示为甲基化的(实心圆),在Mantled DNA中表示为未甲基化的(空心圆)(图17b)。然而,应注意,给定的DNA分子可包括甲基化胞嘧啶和非甲基化胞嘧啶的混合物。来自正常样品和Mantled样品的DNA通过限制酶或通过超声处理或通过机械剪切而片段化(图17a)。加入甲基胞嘧啶特异性抗体,使用标准方法对抗体和甲基化DNA分子的复合物进行免疫沉淀(图17a)。然后用设计为侧接DMR的引物对免疫沉淀的部分进行PCR扩增(图17b)。可以通过琼脂糖凝胶电泳分析PCR扩增反应(图17c)。作为阳性对照,扩增投入的DNA(无免疫沉淀)。作为阴性对照,扩增无抗体的模拟免疫沉淀部分。5-甲基胞嘧啶特异性抗体免疫沉淀的部分显示正常样品中的DMR区域的扩增,但是未显示Mantled样品中的DMR区域的扩增。条带的强度差异(而非条带存在或不存在)也可以诊断表型。

尽管为了清楚理解的目的,通过说明和示例相当详细地描述了前述发明,但是本领域技术人员会理解,可以在所附权利要求的范围内实施某些改变和修改。此外,本文提供的每篇参考文献通过引用整体并入本文,其程度如同每篇参考文献通过引用单独并入。当在本申请和本文提供的参考文献之间存在冲突时,本申请将占优势。

序列表

<110> 梅丽娜·恩格·阿布杜拉

黄·秀·英格

莱斯利·露·英格·狄

拉金德·辛格

拉加耐度·诺凯亚

拉维葛德伟·撒班森姆尔什

江楠

史蒂芬·W·史密斯

纳森·D·莱基

罗布·马尔提恩森

贾里德·奥德韦

迈克尔·霍根

马来西亚棕榈油协会

<120> 棕榈Mantle表型检测

<130> 96380-941211

<150> US 61/988,132

<151> 2014-05-02

<150> US 62/091,471

<151> 2014-12-12

<160> 161

<170> PatentIn version 3.5

<210> 1

<211> 78321

<212> DNA

<213> Elaeis guineensis

<220>

<221> misc_feature

<222> (14421)..(15355)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (55950)..(57363)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (64044)..(65002)

<223> n is a, c, g, or t

<400> 1

aatctattag tatctgacaa aagttaaatt agagtcgaaa cactaaatga caattaggga 60

tcaacttgat caagtagata gagaatatta gaaaagagag aaattaacaa gatagaacat 120

gattaattag gtgacatagc ccgacaatcc aattggtcta agcaagttga tttaatcaaa 180

tcacggttga actaatatat agatagctca ataaaaatca tacataattg aatctaatga 240

tatttggatc tgaccaagat ggaatttgac atgctgtccg atgatcgtga atcaagactc 300

tctttgctaa ttaagatcaa attagaatca ttgaaagaga atcttttact ggatcaagag 360

agagaaatat ataaagagag tgaaatagtc tatagaaaaa aaatttagag agagaaatta 420

agaagaaaaa ataaattttt ttagagaaag aaagtgggta tacaagctca gagaagggag 480

agaggaaaga gagagaaatg ctctcttatt ttcttttttt tcttttttct tcttttcttt 540

tttttttcca ttcttctttc ccttttctgc ttaatggaat aggggacctc ccattcccct 600

tctatttcta gagttggggg ctcaaaattg atgatagcta tcattgggga tgtaggctat 660

ggtgatgcag tagaggatca ccgaccgatg atcgatggtg atgttgcaat caaaaaatca 720

agaaagatag atggaaaata aaggaaaata aggagaaata gatctcaact tgtttggatg 780

ctaacccact cactgacgac tccacttcaa ctatggccgg agcttgctat ggaaaagaag 840

ccaaggcctt caaggatgaa caccaatggt gaggaagatg gtcgaaaata gaagaatggc 900

tggcttttct aatcgacaaa atagggtatc gcccttctta gcaaatattc ggcaataaat 960

atctagaatc caggatccta ggactatgga agagggagag gagggcaagt caaaggatgc 1020

cagattctta tctagcttcc gacaatgatg gggccctatt ttcgataaac acaatcgagg 1080

atgttcggaa aagggttttt tcgatgatga ttctagtgac caactatgag atttcaaagg 1140

gggtgagggg ggtttaaata agatgggagg gaagtttgaa tcctccttaa atctgaacct 1200

ttttcgacaa agccaagagc gtgaaggaga ctccttcgtg aagtcaaaga tggaatagac 1260

tcccttcggg agtttggttc atcacccaac ttccctagca tgtgcggagt atgtgctagc 1320

cttttctctc tttttttttt catttttttt catcctttaa gatccatgca gtttctaggt 1380

tgagggattg gggtatcaca ttctctctcc taaaaaaaaa ttattttcaa aattttttta 1440

cctatatttt caaaagttgg gattcatggt ccaaatctca tccttgaatt tttttgatat 1500

tctaattctc gaaaaaattt catcgttaaa tcatttcata agagaaaagt caatacctca 1560

agagttgatc tgaatcaaaa ttattatctc tagtaatcga aatcaatatc ttaatttcaa 1620

ataagaatat ccagtttatt gtcaaaatta ttaactactc ttgacttaat tgatctatta 1680

cataatcgta aataaattct aacatactct tgaagtgtag aatataagat tgataaacaa 1740

tcctatatcc gttctaatag atataaaagc ataaacttta aatattttaa atccaagatt 1800

aagaatcaat gatccactta tcctagactc aagatattag aaattttttt ttgtacaata 1860

gatagaggat gtactggtga aaatcatgta gcgatatcca aaataatttt taattaaaaa 1920

tattatcctt ttcattatca atgaatttta tctataagaa agatcaaatc atatgatcca 1980

tcttaaattt ttaactcaaa aaattaatat tgcaaactag ctcaaaataa ttttgatcac 2040

tacatttctg ctgtgcattc taatttaaac cgttcacatt ttttagattc atgaaataat 2100

tttgaccaaa gtattactcc atactatagt caaaaaagat taaaatatta gattctaatt 2160

aaagccaaag ataaactttt gattctcatc cttaattttg cctaaagtat aattattttg 2220

attaaccctt aagcgcaata acacattcaa aaccaacaga taggtttact ataatccaaa 2280

tgaattaaat cttaattctt ttatcaattc atttagacaa tttcaaatca aaattctata 2340

agtaatatca ataaaaaaaa attttgatgc tccaataagt tagaacttaa atcaaaatat 2400

ataagtaaaa ttgatttaat catctcttct aaagtttctt ctattaagat ctttaatatc 2460

tatcaaatac attccacaat aatcatgcaa accttttaaa aattaaattc tcaatgcctt 2520

tactacattt taacaccaag ctcgataata gtgataaaga aacatctaga tcagctttat 2580

aatcaaaaat tttgacttac aattttacgt gtgtctcaaa atcttgaata aatataaata 2640

agatctttta tcttgatcca aaaatagtaa tcaaggattt cattagtaac ttcaacaaca 2700

atggtaaaaa aattttctat ccattgataa acccaaattt tgaattgaag tttcatgcat 2760

accatatagc ctttaataag atctattatt tggatctaaa gatagtaatt aaaattgtta 2820

atgattccac taagatgaat actttacaat ctcataatta atttcttcaa taaaaataga 2880

cttcttgata atgtctccaa ttgtatattt ttttttattt ctacaagaaa acttcataca 2940

ttttttacgt tccaatataa atcttaaaaa gttattccaa tcaaatatca taaaagatct 3000

tcttagtcca accttaaata acttttatga atgaatcttt atcttgccac taaataatga 3060

attttaaaat caagagcaac atcacagcat tctgtcatgt caaatttgtg ttagatgtat 3120

gtcctagaaa tcaattagat tgacaatgta aattttttaa ggatataatt tatatatttt 3180

gatttattaa taaaataaaa tttaaattaa tttttattca tattttttta tctatgaatc 3240

atctaaagaa ttaataagat gatgatacat attcttaaga gttcaaaatt tgaaatatat 3300

gtcattgatg attaatttct gaatactttt gaattcttaa gagtttagaa gatcttgacc 3360

caagtagtgt gaatagtgaa aaaaagtttt cacatacttc acatcaaaaa tttaagttga 3420

ataaattgta catatgacag gtattatagt ttgacgagta atctataacc tctatcttat 3480

caaaattctg atagaaagat tgtattgtat gataactgta cttagaggtt caccttttat 3540

tttactggat taccactaca tgttgctaga tgtcactggt ggattgtgag atctacgaag 3600

attatcttga tgatcgataa ttctcattga aaagattgaa actattttaa tgatgttgtg 3660

atagagatca taatatatct tattatcaga cagaatagaa ttctatggga tcatacacaa 3720

taggagatta agactgatca aatagttgaa tgatgattaa gaatcattac ggagttcaga 3780

ttatcaatat aattgataat tagactaact tataattgtt acaagtagca aggacttaac 3840

tgctaaaggt taataggttc aaaaagaact tatgtataaa tgttgtgcat cttaatttga 3900

ttggatcaaa ttagttatgg ctgaattcaa gatgaatcaa ataggaattt ggttcaattg 3960

aatttgggtc aagctttagg cttaggtcac atatacccaa aatcatttgg atgcatcagg 4020

tgtgtgacac ctgaatcagg cctttctaaa ctattttgag taagtttgat caagtcaaaa 4080

ggatccacac cctaaggttt cttgaataaa accttaggca ccacattgag gacctatagg 4140

aaactttgac cctctctcat atggggtggc acactgaggt tttataaaaa ccttaggcac 4200

ccattttagc cataaaaaaa aagctccaag ggatggggca gtagccatga agaatccttg 4260

gctgtcagga ctctattcaa aagagttctc aaggttttgg actcttatgg agccctagga 4320

tttgtttgcc tataaataga tggccacccc aaggctttag ataatgttag agacttgtga 4380

agctctcccc tttctcttgg ttgccggccc accctctctc ctctctcttc catgccccaa 4440

gacttctttc ttgtctccat catcttgctg aaatttagat ttcagcaaga aaagtcaagt 4500

agaagtcaaa gttctaatgt agctcacaag atgttgagaa cttcctccat ctggcaaagg 4560

ttctgcaaga gagctagcat cctgagaaac aaaaagattg ctgatcagcc ctcatctcca 4620

tatggatatt tgtagagatc agatgcatgc atagctagaa gagaatctta tcacgatcat 4680

cactcgtgaa gatcatctac ctgtgcaaag gtatgagata agaaaaatat tttttttatc 4740

ataattcatg aatcctttgc ttatattata ctgagattct tggaatggat tttttctcta 4800

gtaaaactct agagatcaga tctcgaagtc ttcttcatat aaaggttttg aaagttcttt 4860

atattttcgc tgctttgatt caaaataaat tagatctatt ttgcctttca acctttctca 4920

tatttattga catataaagc tttaattaat gagattaatg aaaagcatgt gcgaaatact 4980

gagaaaatcc taacagtgat atcagagcta cttttgtaca taagaaaagg attcaagtta 5040

aataaaatct gtttgattta agtaaatgaa tcaatcaaaa tttatcctaa cataagtttg 5100

tcctggtata atggtcaaga ccattatgtt gaaaggttat cctaggacaa aaagtctaag 5160

taaaatctat tttatttaag taaatgaatc aattaaagtt tattctaata taagattgcc 5220

ttagcataat ggtgaagacc cttatgttga aaggttgtcc taggatggaa agtgattgat 5280

gagacaaata tatcatgaaa gtatttttca cagatggaat aaaatatata tattttgttt 5340

gtgaaaatga gatttcatga atgtgtttgt cattcaatat gtgtggtgat catcttgaat 5400

tgccacaaat cctttttgga ttagggttgt atcatgactc acaaatcctg atggtttgca 5460

aaattttgca ttctgtagtg atagaaacca aaagttaatc cagttttgga ataagattga 5520

tcaattggta tctaaggcaa gtattttata atggtggtta cttaattagt tataaaagta 5580

cgaagagtct cctaccaatc ttacacttat ctagccaatt tggttgattg aattctgaat 5640

ttgggttgct taagtgttaa gttcactaca aatatattgc aaccatgatt ccgacttagt 5700

caaccaagcc tagatctctt gaatagattc atgttaatta tggatttaca taggatataa 5760

ataaataatt aaaacttgaa gagatctaaa tgaaaccttc tcgtacatat taaatcgaat 5820

gatcttccat cattgtagat atacggatac tctactgatg ttgatgattt tcgactagat 5880

atagtacttt ggttgcatcg aaaaagtaca accactttat aacatgagat gttgcagggt 5940

agagatgggg ttgggcccaa taattgttag gtgaggatcc aaatgatggc tgcacttgcg 6000

tgtgaatggc gagtctgact taattaagaa atagagctaa taactattag atgaggcttc 6060

aggacttaga gacttatgac cactacaact tacttgagaa gcaatggata aagagtcgtc 6120

tatttatcaa ctgacgcatc accaataact atcagatgga gtgatgtata attagtggga 6180

ctatagtatc cacttgaaat cttaatcgta aaaatttttg tttctccacc tgaagagcat 6240

gggagattcg aaaaaatagt gggggtagtt tatttttaaa ataaagctcc taaaataaac 6300

taaaataagt taaatacaaa gtctaactag aatcttcttc tctctgtaga aaatatctgc 6360

ttccaacctc tatttcatat ccttaagact aattgtttga ctagacccag ttataaagat 6420

tgactctaaa acttaaagat agtcttgagt tttgaaaaga tgagctatgt cctggatcaa 6480

gatatcctct ctctaccagc ttgtcccacc cctaatcaag gggcatccta tgaaaagtgg 6540

ttaaacgatg ataacaaggc ttggtgctgt gtgctgacat ctatgtccat tgaactccaa 6600

tgccagcata agggtacaaa ctgtccaagg tatattgact catctacaag agttatatag 6660

tgagtagagc catgtatctc actaggaagt atttaagaga ctcttcaaga tgaagaagta 6720

tgatggatag tctgttaatg atcattgtct gataatgatc aagaacttga aagaacttga 6780

gaagctcgat atgtctatca ataagaaatt gcagattgat ttgatcctac aattccttac 6840

tgattcatat gtgtagttta ttataaacta ccatatgaat aaaatacagt gcaccaaggt 6900

tgagttgtta aatatactga taactactga agggacctcg aagagttcaa gaggcactgt 6960

tcttattatg gagcagacct catctttcaa gaaaaagtct actgaaaaga agaaaaagtt 7020

tgtgaagaag cagaagttag agaataggcc aaagaaagaa gttttcaaga agaaggccac 7080

aaaaaaggaa aagtattttc actgcaactc tgatgaccat tggaagagaa actattctga 7140

ttatgtggca agcttgaaga acaaaaaaga tagcatacct tctgaagata tgtctgatct 7200

tctcgttatt gaaactaatc ttacaatttc ttttactttc agttaggtta tagactctag 7260

ctctagtgct catctatgca cttctataca ggatctggag gaaagtagaa ggctgaggaa 7320

agaagaaata atccaacaag ttgaaaatga tgcaagagtt gttactatgg ctgtggagat 7380

ctatcctcta cgactaccat ctgatcttag tttaattctt agagactgtt attttatacc 7440

tactgctagc aaaaaattga tctctatttc atctctagca taggataatt atgtattaaa 7500

ttttaataaa gattattata ccatttattt gaaaaataaa atggttggac gtaatttttt 7560

aattgacagt ctctatcatt tacatgttga tgtatctatg aatgtaacca agcagaaagt 7620

gaatgccata ggatctaaaa gatctaaaga tgaaataaat tatatgtggc acattaggct 7680

agatcatata agagaagaaa ggattaacag attggagaaa gatgggctct tgggcttatt 7740

gactactgag ttatatccga tctgtgaatt ctgccttcaa gaaaaaatga tcaagctgcc 7800

ctttatgaaa caaggagaaa agaccattaa gatatttgcc ctggtacata ttgatatatg 7860

tggcccatta attcgatgcg ctggtcaaag aaggttgtct ctatttcatc atctttatcg 7920

ataattattc acagtatgga tatgtgtatc ttatgagata caaatatgaa gtctttgaaa 7980

aatttaaaaa atttagaaat gaagtaaaaa aataaactaa aattttttta aagatttttc 8040

aatcagattg aaaagttgaa taccttaatg gagaatttct aaattatctc aaaaaaaata 8100

gcatagtctt ataatggact ccatttggaa tgtcttaact caatagagtt tcgaaataga 8160

gaaatcaaac tttattagat atggttcggt ccatgattag tttcattgac cttctcttat 8220

ttctttggag atatagttta cttaccacta attatctatt gaatagggtt tcctctaaaa 8280

tcatttctac cacattgtat gagatatggt attgtagaaa atcaagtctt gatcatatca 8340

agatttaagg atatccgacc catatcaaaa tatttcagac ggacaagtta gaggtcagat 8400

ctatgaaagc tcggttcaaa agtatcttaa ggagtcttta ggatattatt tctacttttc 8460

agaggatcac aatatgatta taagccaaca tgctctcttc cttaaaaaat agttcatgca 8520

agatggaagt agtaggaggc agattgagct tgaagagagt ctctgaagag caatgagtct 8580

cagaacttac gtaaaaccta tttaagttga gccaatacac acacctcttc ctccatctcg 8640

tagatccagt aaaatttttc attctcctga gagatactta ggtatcatca tagagaatgt 8700

agagaaaata tttctcgtga aaaatgagac atatgaaaat gaccccaaaa cctatagcga 8760

ggcaatatca aatatcgact ataagaaatg gttagaggct atgaagttag aaattaactc 8820

aatacactta aaccaagtct gaacctttat ggatccgtca gaaggtatgg tacctattat 8880

gtataaatag atctacaaaa gaaagattgg ttttgatgga aaggtagaga cctttaaggt 8940

aaagcctgtg actaaaggtt atagctgaca cgaaagcatt gactatcaat atattttttc 9000

actagtagtt atgctaagtc catttgaaca ttacttgcga ttgcagcata ttatgattat 9060

aagatatgac agatagatgt gaaaactatt tttctaaatg aatatcttta ggaagttatc 9120

tatatagagt agactttgtg tttcacttcc agtgatggcg atcacaaagt ttacaaattg 9180

taaagatcta tttatgcact caaacaagca tcttggagct ggaatactta tttcaatgat 9240

gtaatcaaat catttagttt catcaaaaat gagaaagaat cgtgtgtgtt taagaaaatc 9300

agtgggagta ctgttacttt tcttgtattg tacgtggatg acatcctcct gatcgaaaat 9360

gatattttta tgttaatttt agtcaaaata tagttgtcta agaaattctc catgaaggat 9420

cttggggaag catcctatat tttggagata aatgtctata gtgataaatc tatgaggatg 9480

ccaggccttt cacagaagat gtacattaag gaagtgctga agaagttcag catgaaaaac 9540

tccaagtgga gacttctatc cttcaggtat gggattcatc tctccaagaa ggtgtgcctc 9600

aacacatctt aagagataca gtacatgagc aaaatccctt atactgcggc tataggaagt 9660

ctcatgtatg tcatgttatg tacatgacct gatatagctt atgttgtgag tgtcacaagt 9720

agatatcagt tgaatgcagg tgaaaaacac tggacatcta tgaaatgtat ccttaagtac 9780

ttgagaagga ttaaggatat gttcttgatc tttagaggag gagaattaag ggtgcaagaa 9840

tataccgact taaattttat gtttgatatt gatgatcgaa aattgacatc agattatatt 9900

tttttatgca acggtggtac tgtgagttag aaaagtttca agttgcctat catagcagac 9960

tccattatag aagatgagtt tataatcaca ttggaagcta ccaaagaggc attctggttt 10020

aaaaaattta ttacagagct ggatataatg ccatcagatg tcataccact ctactgcgac 10080

aacaatagtg ccataactct agctaaggag ctgaggtctc accaaaagtc taagcacata 10140

gagcaatgat ttaatctcat tcgcaattat ctcgaaaaaa atatatcaag gtatagaaag 10200

tagatactat ggataatatg acagacccac taactaagta gctgagtcaa taaaaaatcg 10260

aagtccatct tgagaagatg ggacttagat ttgtggccaa ttgattttag tgcaaatagg 10320

agattgttag atgtatactc taaaagtcaa ttagactgac aaatataaat tttctaagga 10380

cataatttat atattttgac ttattaataa aataaaattt ggattaattt tttattcata 10440

ttttagtatc catgaattat ccaagagatt aatatgataa tgatatatat tctcaagagt 10500

tgaaaatttg aaacatacgt cattgatgat taatttttga atgctttcga ttaatggatg 10560

atcataagga tagtaattaa tccgatcaat gtacaaatca cttctttttt gatagacgag 10620

tctcgagtct atactatgga gacactggag caagagtgca ggtatttgtt agagaacaaa 10680

ggtatcgagc gtgactaata cgagaagtca attggatggc tatccactcg ttaatgactt 10740

atttgatact acagtagtat gtctagtcct tagatctgca atgcctcagg tgttcataat 10800

gagactgtta gagtttgact gtacataaac ttgatttcta gccatatgga tctttatagt 10860

gcatgttggc tacagtaggt tcgttgtagg aataggatgt gcacatagat agaatctatc 10920

atccttgata gacaaaaaaa atgatcctat ataatttatg agactgagtt caaaaaatct 10980

tgactaagac agtgtgaata atgaaaagaa gtttccacat atatacttca catcagcaat 11040

tccagttaaa taaatcctac atataatagg tattgtagtt tgatgaataa tctataacct 11100

ccatcttatt gaaactctga tagaaggact gtatcatatg gtaactgtat caagagattc 11160

atctactatt ttgctgaatt gtcactacaa actgctagat gtcactgata gattgtggga 11220

cctatgaaga ttatcttgat gatcgatgat tctcatggag aagattgaaa ctatttcaat 11280

gatgttgtgg tagaaatcac aatatatctt actactagat agaatagaac ctatgaggtc 11340

acacataata aaaatttgag attgatcaga ttgttgaatg atgattaaga attgttacag 11400

gattcagatt atcaatataa ttgataattg gactaacttg taattattat aagtagcaaa 11460

gatttaattg ctaaaggtta gcagattcaa ggaggactta tgtgtaaata atgtacatct 11520

taatttgatt ggatcaactt agttatggct aaatttaaga tgaatcaaac agggatttag 11580

tttaatcgaa tttgggtcaa gctttgggct taggtcacat gcactcaaaa gggtttggat 11640

gcatcaagtg tgtgacaccc aaaccaagcc tccctaaact attttgagtt ggttttgacc 11700

aagtcaaaag ggtccacacc ctagggtttc ttgaataaaa ccctaggtgc cacattgagg 11760

accaattagg aaactttgac attctttcac acggagcagc acactagggt ttcatgaaaa 11820

ccctaggcac ccattttagc cataaaagga aagctccaag ggatgggatg gtgccatgaa 11880

gaatccctgg ccattgggac tccattcaaa agttctctag gttttgggct cttatagagc 11940

cctagggttt gtttgcctat aaataggtcg ctaccccaag gctttagata atgctagagg 12000

cttgtgaagc tctctccttt ctcttgtttg ccatcccacc ttctctcctc tctcctccat 12060

gcctcaagac ttctttcttc tctccatcat cttgttgaaa tttagatttc aatgagaagg 12120

atcaagtaga gtcagagttc tactgcagtt ctcaaggtgt tgagaacttt cttcatcagg 12180

caaagattct gcaaaggagt tagcacctca aagaaccaag aaagttgcta atctgccctc 12240

atctccatgt ggatacttat agaggccaag catgacgaga agagccttat cacgatcatc 12300

actcgtggag atcatctacc cgcgcaaagg tatgagataa gaaaaaaata tttttcttat 12360

catgattcat gaatcctttg cttatgttac attgagactc ttggattaga ttttttctct 12420

aataaaattt caaagattag atctcgaagt cttcttcacc taaaggtatt gaaagttctt 12480

tatattttcg ctactttgat tcaaaataga ttagatttgt tttgcctttc aatttttctc 12540

atatttattg agatatgaag ctttaattaa tgagattaat aaaaagcata tgtgaaatac 12600

tgagaacatc ctaacaattt gagcttacaa ttcacttaaa caactaatga tcaaattaat 12660

aatcacaatg cacaataaaa attcatgata aatctttttg ttgttacttt agatcaaaat 12720

ccaactaatc ataacatgat ccacggattg cctatcatat atcaaaccct ctgaattatt 12780

aatcttaaac gatcttttca ttcatgatca taagatttag ttaaaaatca tgaagacaac 12840

ttatattgta atcatcatag atctgtatct taacatcctt agtgtttacc tacctatact 12900

catcctatgt ttgattctat atatcataat ttattcacta atactttgat atcatataaa 12960

ttatcgcatc cccaatctaa gatcatattg gtactttaat atttcattag tgggggttat 13020

gcattagtac tttgatacct tatcagttga atggttaaac actggtactt tgatatccta 13080

tcagtggagg ttatacgctg gtactttaat atcctatcag taagatggtt aaatactgat 13140

actttgataa cctcccagtg ggtgttgtat gctagtactt tattatccta ccaatggggc 13200

agttaaatgc tactactttg atacgctacc aatgggatag ttaaacgcta gtaatctaat 13260

cttagcttga cataaagtaa cgtcgactcg agtttagggt cgactcgaga gaatgttagg 13320

gttagcttga tatgaaagag ggtcgctcgt caatattttg gagtcaactc ttgtttatgg 13380

atgatctaga aagtgtcaga gtgagctcga gtactgcata tttctgatac attgtctatg 13440

ctagaatgtg ctagaactga ttatcttctt tatcaaagtt gatttttgag taacttgatg 13500

atcaattttt ctaggctaga cttgctttgt caaaatgagc acttgttagt ttagagaatc 13560

ttcacctaca catgatctca agcattcatt agtaccaaaa atacttaagt attttgatat 13620

catcaaaatc aattcttggg ttaacacaat acttttcaaa taataagcat acagatataa 13680

tcctataaca atttaaattt tgttcatata tcaatttctt taaaaatatt atattcatct 13740

tgatagctat gaactaaatc aaaatacata ctagtataca acttttactg ggagagtatt 13800

agattaccag catttaacca tcccactggc aaggtatcaa attaccaata cacaacccct 13860

atttataaag tatcaaagta ccagtgttca actgcctcac tggcaggata tcatagtact 13920

agtatttaac taccacattg acaggatatg gaattatcag tatttaacca tcattagtag 13980

aattttgatg catagtcagg ctgcgagtca aaatctatct caaatcaaaa tattgatcac 14040

atgtctaatt ctgtatcata attcattccc ttatgctcta atattatatt aattgtcata 14100

cttctagctc gagatcatga gccaaggatt gcagtaacta ccgcatactt atagagaact 14160

ctttctataa gcatacaaga tattctaaat atactatcaa tatatcatag agaaattaat 14220

ttaaataact aaaagttaat attcaattaa taaattcaac tggcaaatgt atttaaaaat 14280

tttacatcaa ataaatcttg attaataaat attaattaat aacaatagat ttaaatcgaa 14340

acaaggttga tattgttaga atttgatgcc tcaagattca gcccacattg agtccacagt 14400

gaggttcgcg acgaaaaatg nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14460

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14520

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14580

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14640

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14700

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14760

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14820

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14880

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 14940

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 15300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnaagat 15360

attactaaat tttgcttcta atctcactct taaatagtac ttacctttga aactaggcat 15420

ttgaatctga aaaagaaaga ggagattatg agcttgatag ttcagtaaat catgaataaa 15480

ttagctaaat aaatctatga ataatagtat attaaaaata aatatgtaag atacaataat 15540

tcaaaaatga attcatatat ataatacttt ccaaataata agtatgtggc tgcaatcctt 15600

tcgtaattca aattttgttc attaattatt tttttcaaaa catcacatgg atagtcatga 15660

actaaatcaa agtaccagtg cataacccct attgataaag aatcaaataa caagtgtttg 15720

actgcctcat tatcaggata tcaaattatt aatgcataac ctccactgct agggtatcaa 15780

agtagcaacc tcaatcacct cactggaagg gcatctagtt tcagtattta actactccac 15840

tggcaaggtg ttaaattatc aatatttaac ctccactgat aggattttga tatatagtca 15900

gactgcgagc caaaattcat ttcaaaccaa aatatttttc tcaaagacat attttatgtt 15960

tcacattgaa aaattcacaa aaattatgcg atattgaaat caattggata aaatccacgt 16020

caaatttagt atattcaatc ataaatcatt tactattcta gaaaaggtat attaaaagta 16080

taatgcatca atttcataaa tcataaatat ctcaatataa aaaatatttt attatttatt 16140

aataaatcta ggagaagtga agcattactt atcttgtaag taaaactaac caactgatca 16200

aattaattct gagaatcttt ctcaaaactc atcaccacta tatcaaaaac ttgtgcttct 16260

tgctatgtaa gagcatagac cctttcttcg atctggggtt ccaagtttct attttatttt 16320

gttcaactat caaattagac tgacttttca tttttttgtg gatattcagc tattttatgg 16380

cctttctaac aataaccaaa gtatgtacca atattccaac aataatcatt tattgcatga 16440

ttttcaccgc atcgaaatat ttgatattat caatcaatcc aaacttgtta ttcactgacc 16500

tcttattcaa acccttagta tatttaatat tctacctttg tgattcattc aatcgatttc 16560

ttttttttta ttttctttcc ctttctatat gctcttcatt aacttttctt tcaattatca 16620

atgctttatt caatacatct gtataagtag ttaactcata tagtaccatt tattttctaa 16680

tttctatcct caattccaac tcaaatttat ctactcagtc acattcatct tcaaccaatc 16740

tcgaagcaaa cttgacaagc tccataaatt tagcttcata ttctacaact attatatttc 16800

tttatttcag ataaataaat ttttattctt tctgaatcct catactctaa gaaaaatatt 16860

tttatcataa aatatctttt gaaatcactc ccaagcgagt tgttctccat cttgttcata 16920

tttaggtttc attctctatt atcaattaaa tgtctcatct ttcaacatgt atgatgcata 16980

taagattttt tcatcatcat ggtatctctt aacaataaat gctttctcca tctccataag 17040

ctaattttta gctcctattt catagttttc ttaaaagtca atggagacaa cttcttaaat 17100

tctatgatat tactttattg ctcctattgc tcttatgtcc ttgtggtgac aatatttatt 17160

gttgcacttg ctgtagaggc agttactgtt actgcaattg ctattacgat tccatcaagc 17220

cgactagtgt ctgcattatt tggataatag ttgatttttg ctactttatt tagatgttgg 17280

tggcaaaatc aatgacttct ttttgctgag agatgccacc aacctactaa gtatcatcat 17340

cttattggtt gataccttta gcagcacctc gagtggttct ttttatctga tatggaacca 17400

tcttaatctt gcatgaaaaa caaacttcgc aaaattttct tttaaaatct aatatctaat 17460

attatacttt tattaaaatt taattatgat tattttaaga ataaaaaatt taaattttga 17520

aatcctcaca aggctggcca agagataatg accatcatcc tagtcggttt gacgtaggac 17580

atccaaagat caactataat tcaagcatca tattgagatg ctaggatata atcgatggtg 17640

aaatttaatg atgctcgact gatcaagatg ggggccggcc cgatggcctg ttcaacaatc 17700

attgatcaaa attttttaac caaggtctat caagatcatt aaaaagtctt tctaagatct 17760

ataaattgta ataaagagac acaatctaga gagagacact ttttacataa agaaagtaga 17820

aattttaggg agagaaatta gagagaaagg ggaaagagag aggaagctga gaggaagaaa 17880

gaaaagagaa agactctctc tctttttctt ttctttcttt tctctctttt ctttttcttt 17940

tctttttttt cttccttttc tttctttctt tctttggctc attagaaaaa taggggacct 18000

attgatcccc ttgtttccta aataggggag gaatctcatc ttggtagcta tggccggcga 18060

tgtgagccaa agtggcaaaa tcatgaatct cccaacctgc agccgacatt gacttttggc 18120

actggaaaat caaagaaatt tgacaaaaaa tgggaaaaaa ttgaaaccaa aatagggacc 18180

aaaatccggt aatagctagc aaaaatcctt gatctttgct catggaggat aggaaaaaag 18240

attattcaag agattaaggg aatcttatct catttttttg ctgtgcttag gccatggtgg 18300

ttgcagaaat cgtttgtgaa agctcgacaa actctgcaat ttcttcgggc ttgggcctcg 18360

atctttaata ggagaagaga gaagtcctct ttcttttaaa tagagtcgga gggaaggagt 18420

ttgattccct ccttatggtg gtttcaaact ctgatcggaa gtccattgga aaagaagact 18480

cccattagtt ttaaaatcta ataagattta ttgattagaa aattgataaa aaatgattat 18540

taaaaaagta gcataattat ttaaatcaat gatgcttaga ttgttggagg taaatagtaa 18600

taaaatcaaa aaattaaaat tcatgggacc aaaaaataat gaacaagatt tgaaagaaat 18660

gtctataaat aagaatttat gaaacagggg aacattgatc aaaggtgtgt taaatagtgt 18720

ccttaaagtg ttattgtccc tctcacgtag actttgtgtg ttgggagaga acatagtaat 18780

tctctcaacc tatgcaacct aaatcttttg aaaagaaatt taaaattata gaaaaattgg 18840

caaactagaa ttttggtcat tttctttatt agtaaaaaat atactaagtt atatgtcttt 18900

atttatacta gtgaggtcta tctttgcaca attcagacca aatttatatt ctagttaaaa 18960

gaggtataga ttttttaaaa tagatataac tagtggaaat agtcatagaa aagttaaaaa 19020

tcaatgaaag gtagatttca cttctatatt ggctttattt gtggtcactt tatctaattc 19080

ttttttttga tggagcaata taccctgtta aaatcttctc gatttttttt tcactttaag 19140

caacctattt cgatgcctaa acaatggaat ttagtttaac cacttaatat gctacacttt 19200

taaaaggagc accatattgt agggcttgaa aagttacttg atttaaaaaa agagcatctt 19260

aattggacat catacaagta agttatgacc tccgaaaatt tgatacatga tttatcatct 19320

tgatatggta aatcttgtta agatttcctc atggtgtcta aagtggccgg ttcatactga 19380

gtttggtgat tcttctggtc aatggttaat tgctcgaata tttttaagat ataactaatc 19440

tccaactctg ccgactcctt agtagtatga gcacatggaa agcttgacct aattgatttc 19500

ttaaattgct tgaaatcagt acttagaaaa tatgcaaaat ggatgaaatg tttattgcag 19560

cgagagcttt ctgatctgta cgaccgagag cttactagtt ttttatgagc tatacgtttt 19620

gcacttaagc ctaatttaaa tagtgaaata gttttgcaac aattcaaaac aattaaaatc 19680

aaaagacaag ctgctatgca tgttcaactg actcggcttt caatcgcaat atgtcacata 19740

ggctggccta gaatgcagat gcgtgcgtgg tgagcatcct aaaaacctac atatccaata 19800

aattcccact agttggtgaa gtattaaatg taactcgtat taacttttta atgtaggact 19860

aaagtttatt cgactaatta agaactaaat actttaataa ttgaactttt ccaaccagaa 19920

atcagaaaat atttaagtaa ttaaatatta cataataact agatcaaaat atcatggttc 19980

ctctctcgct cgagatcaat tgggatgttg gtttatcttg gtcatccatc gagatgactc 20040

tatcttagcc tttcaaaacg gcgcggtacc acgggtctca ccgcttcgtt acatcgaatg 20100

ccaccatccc tttttttttt ttttttttat ttatttatgc tttcttgctc ctagattggt 20160

gcggcctcat tacaactcca ctgctacttg atgcttccct ctagcatctc ctttgcagct 20220

ctctcacttc caccactctt cggcctaatg ttgggaaacg acgaaggggc cttacaaaaa 20280

tgtcatccat gatggcagtg gagaagaaaa catcgctggg gctttccttc gatatccttc 20340

gcagccaaag ctcttatagg gttatatggg agaacgctgc attatttggg tgatcttttt 20400

ggatggtgtt gttgactgat gctagttttg cttcatgaat tgaatattta cacaagatga 20460

gaatacaatc tagtacaatt ggtaccaatt acctgggttt gactcctgct cgcatctgat 20520

tgaagcttgg ttaatgtgca tctcaattaa ttcagaaaga tcatcggact tcatgtgaat 20580

tattttgact agcatgaata gggctaaata aggctgaaat atgtgttaaa tttttaaaat 20640

tataacttga tcatatgatg tccaattgag atgttttcaa atcaaaattt ttttcgagat 20700

ttatcactta atgttaaact cttagaaggt cgaaacagac tgaaagtttt cttttcaaga 20760

tgtattttga ccgagtatat aacttgatga tcatatgatg cccaattgag atgttttcaa 20820

atgaaaattt tttttgagat ttatgactta atgttaaact cttaaaaggt cgaaacagac 20880

tgaaagtttt cttttcaaga tgtattttga ccaaatatat ctcataatct ataaagaata 20940

tatttcataa tctatgaata attagataga gcgacagaag ataatgctaa tgtaaaaatc 21000

acgatctatt ttttataaaa tttaatattt ttatataatc acttttacta tagtcatatt 21060

tatttttaaa aatttagtta tatttaaaat atcaaaaaaa tttgacttga attatataag 21120

aaaggatctt cctactatta tagatagaag ctttatatca tagtttacag tgtatggatc 21180

atcaatgaaa gaaagaggga tgtaaacctt acttttgaaa tttttctatt tgtttctaaa 21240

ttttttaaag gatccaagtt gagaattgag agaattcttt ctttctgcaa atcaaatcat 21300

tagtataatc cacatggaga cgttgtaata gaaagtagaa actatatttt atgaataata 21360

gaaagggagt tgatttacgc caagcctttt gtttgcttga ttaattattt atttttatgg 21420

tgttagctgg accccatgaa tagcaaccat cgttgggtca gggtcgtgta tttgttttgg 21480

ggtcttcatt aatatacacg gtggtaaatt gttgggggcg cgtcagatgg aaccaatcct 21540

ggttccttac ggtactgtag tgctctatat gtggacggct gtcattctat ccgtgaaata 21600

agaggtgttg tttttcttta aaaagcagca ctctcctcag caaaaacctc agaatccacc 21660

atgtaatatt actcatcctt ggtcttaaag ctgtagcaat acattacttc caaatgccaa 21720

gcaattaaat aaactacata catcgaacct ctttagtacg tacgtctttt caaaaatatt 21780

tttttcgaag atccgacaaa tgtgaaatgc ttattaactt ctttaatgtc tgtttttgct 21840

tgcatattta cacagacata ccatcaactc catcagttgt tgtttgataa ttcgcttgcc 21900

gagcagagaa gagagagagc aagagagaaa ggaggcatag agagcgtgag atgggaaaag 21960

cgaccgattc ttaaactggc gagacatcac acgttacccg gtacacccaa agctttcacg 22020

aatttggaaa gtgaagccat tatggaagcg ctagcttttt gctctccctt gccggaatgg 22080

aaaggccccc gaccttcttt acccctttct ccacgccacc cacccaccac tcttctatac 22140

acctttatag ctcccttctc ctttggcttt cttttaagca gagctcagag gaaaagagac 22200

cttcctgggt gcttgagaaa tagagaagag agaaaagaga gttggagatg gggaggggga 22260

agatagagat caagaagata gagaatccta caaacaggca ggtgacctac tccaagagga 22320

ggacggggat catgaagaag gctaaggaac tgacggtgct ttgcgatgct gaggtctcgc 22380

ttatcatgtt ctccagcacc ggcaagttct ccgagtattg cagccccctt tccgagtgtg 22440

tacacgatat tatccctcct cgtccccctt tttttttttt ttgataaaaa tgaaactcat 22500

atagtcttct tttatgatta tgtgtttgta atgatggatg attgatggct ggatggcagc 22560

accaagacca tatttgatcg ctaccagcag gtgtcaggga tcaacctgtg gagcgcccaa 22620

tacgaggcag aaactcttct tcttcttctt ctcctctctc tctacaaata tgcttttttt 22680

ctaatttttc ttttcaaaga aaaaagaaaa aaaatgattt ctaatattga tgtattttct 22740

tgtgggagta gaaaatgcaa aacactttga accatctgag ggagatcaac cagaacctcc 22800

gcagagaaat aaggtggagg gccaaaagag aatattgtaa tattagtact ttctggtaaa 22860

aataagcatg tagtttcttt ttgcctttaa attttgttgt gctggttctg atgagcaggc 22920

agcggatggg tgaagatctc gacagtttgg gcatccatga actgcgcggt cttgagcaaa 22980

atttagatga ggctttgaag gttgttcgtc acagaaaagt aagatccccc atttattcac 23040

tgcacctatt ttaattcctt attctccatg ttttgagagc ttttgagata aatgatgaga 23100

agcgcatcga gatcgagttg tctatattct ggaatgatta attttttaat tctcaattaa 23160

tgctgtttca ttgctaaata ttcagccata tattttgtct ctgcatggga tttctatgct 23220

aaaattcctc agatttcagc atacagaatc catgagactt gccttggctt taccacaagt 23280

actccagaat caaaattgtg aaagaaaaat aggataaatc tggttaagct gtaatttatt 23340

tacttacttt ctatctatat taaaattatt cagattattt tgcaaattta tggatatgct 23400

tgaatcacgt atctgatact ttctcttcat ctggatggca gtaccatgtg atcaccacgc 23460

agacggatac ctacaagaaa aaggcaaggc taacatgctt tcttaccatc attctttacg 23520

gtctttgatc cggttttgcg tgtccacttc ttacgtagtc tttttcaaac attcctatct 23580

aagactgaag gtaatgattt gcaaaggaat agctttactg ttttcctcta agtagatgaa 23640

atattactca cgtagaaagg agccatcata attgcagaaa gaataaaact gaatggaata 23700

tgagtagaat tgtcaaaatc ttggtttaag ggttttaata gccagatgag aaagcaacct 23760

acttttcttg aacaacttgt ttgtgactgt cttgttgctc ccatcttgca tctatgatta 23820

gcaaaatata tgataaatag atattcagat ttgatcgaaa agaaggaaga ttttctttaa 23880

tccatttaat ttgaatctca caaaaaaaaa gtagaagatt tggacacgat cgctgggggc 23940

agcacgctct taatagaatg gtgtcacgtt gcagatctcg aaaaattatt caattttttt 24000

taaaaaaaaa agagtcattg aaattagacg ttgtatgacc atgttatgat ctctgaaagt 24060

ttgacttctg actcaacttc ccaatatagc agattttact cctgaaccat gtttaacctc 24120

ctgactcata gtggccaaag tatctacatc gagttcactg gtcttcttgg atcacattca 24180

taagaatact tcccataatt ttgctcaacg ttgtttttct catcaaccaa aggtatatgc 24240

tttttaaaat tgaaatgccc atgaatatta tggcattctt ttatttgaca ttttggttga 24300

tcctatattg tttgtttggc attcaacact tcttcatggg aacctttgaa atgaggtagg 24360

tgctaggatt tttcttttta cctatccata tcatatttcc aatgtcttct tttacattag 24420

gttctttagt gacaataggg gaaacgaccc aatataatac ccttgaaaat ttgggcaata 24480

tctactaaaa ctaacttgaa taaaatatta acataaaaag ggatttagta acataaaagc 24540

ataactcaaa atcactcacc ttgtgtgcca cgttctcatt gcccttatta tttttgcatt 24600

gtgaattgtg tcccccaata aagcaacgtg aatggtggaa gagagttgaa tggctttgtt 24660

gagtaattgt tttgagttac tatagcattg ctctactaaa attgaaatct tgctgtgagg 24720

ctatgtatga gaagcaagtt catgcttttt gactgttggg atggaagtat gagcaatctt 24780

tttaatagaa aatggacgaa tcatgaagtt tttccttttt attgaaaaag atgatcgaaa 24840

aatatgtgca agatagaaaa acactgaaaa gataaaatga gaagtaaaag tggaagtcta 24900

ggagaagaaa atttaagaga aatatcttca atgagaggat gtgtgcacca acaaagccaa 24960

ctttcactaa agaatgtaat gactcacctc tactttcttc gaataagggg ttccagttgt 25020

ggaaagtata tagaatcttc tgaaagactg agtaaatgga gcaattcctt ctaagaaata 25080

ttatggcatt tctctcccac gaaatttcaa agcaaagagc agctagtagt tgatcctcta 25140

atctcttaat tgaagtttgg aatttctctt gcctctattt ggcccaaagg tcatgaagat 25200

ctaccggcca acctcttaag ttgaattaga tcttaataga agtccaaatg cttcttgtag 25260

aagaacatct aataaataaa tgagtgatag attctaatcc agagacaaag agcacacctc 25320

gaattcactt gccatccttt tctagctaga acttctctag catgaaactt gttccttaag 25380

gcaagccaaa taaatactca cattttagga atgactgcct tccaaataat tttataatat 25440

ggacaaatta gaccaccatt attgataaac ttgcaatgaa caattataaa tgagttttca 25500

ggttggcaca ttagcaatat aggatggttt gattattaaa aggatgatat gaagggtttc 25560

aaggtggttt gcctcgttca aatcaaagga ttttgaagat taatattcca agataaggtt 25620

ctccaactcc attaggaaag tgtcttcatg tcatcttaga gaagcagctc gtaccaaact 25680

tgacagatgt tttatttatt tagagtgaca cagataccct ttggcaatac tctccatcct 25740

tgtccgaaca acttctaatc acacctcact tatcttgcat ctaactcaga ggctacaagt 25800

tacacctttc aacaaacctt ttcggtttga aaatttgtga tttcattatt tagagttcga 25860

agagcatatc aagtattggt cggagttggc acccaaagca aacgaaacag ttactgacat 25920

ggtccaaaag ctgagatttc taagatccca acttaagcac tgaataaagc cattatggga 25980

aatatcattt taacgaaaga ggaatttaga gtaagaattg attctcttga taccgaagaa 26040

gaactaatac agctttcatc acttcaaaat gatgaacaga tgcatctcaa gtcagcacta 26100

gaccatcttc taaaatagga agatctatgg aagcaacact cccaaatgca gtggcttcaa 26160

aatggggatt gcaatacgaa gtttatccat gtttgggcaa gtaacaggaa aaaaagaata 26220

ctatcactga actctagcaa ggcgatcaga agattatcga atagcagcaa atccaatcca 26280

cattctacaa ctttttttct accctactag gctcgactga ggaatgactc atccaagctg 26340

attagaagat tctttatcca gaaggacctc tggatcttgc tgacattgag tatccattta 26400

tggagaaaga aatccatgat acagtgtatg acttggcttt ggaaaagtca cccggatgat 26460

attttcccat tctccttcta tatgcacttc tagtgtatca tcaaacatga cctgatgaac 26520

ctactgtaaa atcagctaat gtagaccatc tgaactactt gttcatcacc cttatcccaa 26580

aaaaaaattg gtgtgtattc agttagagac ttcaggccaa taagcctgat taatggagta 26640

ataaaaaata tttcaaaaac tctatcgaaa aggctctcac agaaaatgaa tttgttaatt 26700

ttatccacag agcttgcttt caacaaagga agaaatatct ctgaatattt tgtaatgact 26760

atggaaacta tacacttctg caaagctgaa gtacacaagg atctcaatta taaagtcgac 26820

ttcgagaaag cttttgacaa tgtggattgg agctttctat tgaaattgct atccagcacg 26880

gggctttgat tcgaggtggt gtcaatggat agaatatctg atttatacag ctaaattctc 26940

agtccttatt aatggtgata aaggtaaact ttttaaattg aggaaagatc tcaggcaagg 27000

agatcctcta ttcgcctagc tctttctctt agttgttgat atagaatgat caagggagca 27060

agtaggttca atctttttgt tggaattgga tcatataata tcatgggata acttcaaagc 27120

ttttagttca ctgatgacac acttatattt tgcagatatg atctaaaata catcaaaact 27180

cttaaatttt tactctatag ttatgagcta ctgatgggtc tcaaaattaa ctttgaaaaa 27240

ttccaatttt ttggcttgag aattgcaaag atgtcagtac agcaagttgc atctatccta 27300

gaaagcaagg tggctacatt ttccattact tatttgggtc tcccactcca tcattctaaa 27360

ctgaggaaaa cttattggaa tccactcctt gagaaggttc agaagaaatt gatcgggtag 27420

aaaggtaaac ttcttaacct ctagggtagg cttatactaa ctaatgcagt gcttacaggg 27480

atcccactac tctggaggga tacattcctt ctccctcaat tcattatcaa ataaattgat 27540

aaaatccatc gatcattcat ttggagagga aacgaggagt ataactaagg gcactctaga 27600

atatgttggt cgaatatttg tcgatcaaaa aaatttggag gactgggggt tcctcaatct 27660

aaaaattttc aatacaattc ttctttgtaa atggtggtgg aagctctact ctaatgctgg 27720

tgacccgtgg tgtagtttta ttgccactat ccacccaact tcacactaga gatctaaagg 27780

tatacacaaa tcaacctctt cattttggaa tggtttacag cacacatgaa atatttctac 27840

tcctaatcca ctttcaagtt agcaactagt attattttgg aaagatagtt ggttacataa 27900

tcatccactg aaggatcgat ttcctcacct ttacacaata gcattgaagt gcaacaactc 27960

agtggcaaag gtattaagca atctacttga taatagctct tttagtactc ctcttcctca 28020

aagataccaa gaagattttc agagtctata ggaaagcatt gaacaaatta cattaacgga 28080

acgacctgat actatacaat ggaaatggtt tagtagcaat atttttttgg catgaaggat 28140

ctactatttt ctgcaagatg gaggagtttg gcctctactg agtaatatta tataaaaact 28200

cctaatacca aagaaagcca agttatttgc ttggctaagt gctcacaaca aaatcccaat 28260

gaaagctaat cttcttaata gaggaataat tggaactgat tactgtacac tttgcgatga 28320

cttatcagaa actaatgatc atctaatgct catctatact ttttcaaaag caatttggaa 28380

tcaagtactt tcagacctgc aattgtcgaa acttttatgc atgcttaaca ccctatggga 28440

tacttggaga ctcatcaata tgcaacacga tagaagacct aaactagctg ctctattcgt 28500

aattggtcaa tggtgtcttt ggaaggaaag aaataaaaga ttattcgact tctatacttt 28560

ttatccacga tcgattgctg aaactgtgtc actttttctt tcttgggcat cacacctaac 28620

aacggagcaa ctaaagatgt tagctcctgt tcgagaagtt ctcttatcta agaatgaaaa 28680

cacacaatct ttagtgagaa ttacagatgc taacaggcgc agatgaatgt tttatgagca 28740

tttttatagc tgcagcttat atgtgatcta tggtgcaagg agttaattat aaccatggat 28800

attagttagg ttgactatca gaaatcatct ccaatacatt ctatgtaacc actgatcaat 28860

tccatgttca actagatagg aacctgccta tatacaggta tgtccctgat gtaactatag 28920

tatactatta ttcataaata aataacgaag gttttacctt cttctcataa aaaaaaagta 28980

tcttcatgtc atcctatatg tcatgcatct cctttgctac ttcttttatt tacttcttaa 29040

acttggttct accatatatt atcagcccct tttaaatttg cttttggata ttgcatattc 29100

cactcttcaa tcacctcatg ccaagcaaaa catttattca cacttgaaaa ccaatataag 29160

aataccaaag aatttatcca tgaaattcta gaaactttgg ttttactcct ttctccatca 29220

ttcaaaaagg ttcaaaatga tgataactct atatagctta tttatcaaat ttacgaggtt 29280

ggtgttcaat gtttttgtga aaaaaatatc ttgctatcca catagtttga atccatactt 29340

ttgctatctt gagtttcaaa aattttaatt tgctacaatt tgttgctatt agcatatgac 29400

tacttttaag aagataagcc aatatactat tttcctaaga atttaaaaaa tcaaaaataa 29460

aaatttttat ttaagatttt ttaagggttg ttttccaaat gtgcaatggg gcttaatctt 29520

ggcatcattt tctaacttgt agaattttga cccaagtaac atttgtccaa tcacttagaa 29580

cttctataac ttcgtacaat catttgttaa tgttgttcat ctatttatct atattatcta 29640

tctggaatat agttgctctt aattattttt atatatcgcc tattatccac cctaagcttt 29700

catgttcatc ctcatgttgt tggaggtgca tgtcttattc caaactattt accattgctg 29760

tagattttaa aaaatttgct agtttaggac tttttaatct tttgatatca tgttgatgta 29820

agctaaccct ctaaggctag tcataataca ttttaaggat ttatgttata tgagaccaaa 29880

attttaacaa aatgaagtgt tggaaattgg tagaatggaa gtgtaaagat gcttagagac 29940

atagaactag ccctgggcca tgtaaatctt ccaaaagaag aagaaaataa taaaattaag 30000

atcatattca atctctacag aaaagttggt ctttgttgta taataagcca tcttaacata 30060

tgatggacaa taaaatatat aaacttatga gttttaatac ttagatggaa gaaaagggac 30120

agatatgtca caccccatcc tactagcatg agtaggcaca tgatacacgg ttgcatgccc 30180

tgcagagttt gactcatgag gcatgcaagg tattgaatag tagtctaggt aaaattaaaa 30240

aacttggagc attctaaaaa taaatcaagt tcattttata aaatcaatat ttattatgga 30300

ctccatcaaa tattatgcgc ataacatttt atttgcaaat agaagaagat aagtcctaga 30360

tcctaagtct cctactctta gtctcataat tcatccaagc tatccaccaa atatctaaaa 30420

cgaaaaagaa aaacgatagt atgctaatag ctttgtaagt caccttttat ctctaattag 30480

atcaagcata ttagatataa aacaataatt ttcaaagtat atgatttgca attaggaata 30540

aatatttgat aaatacagaa taaattttca taaagcatat ttactaacat tatttataaa 30600

atatataatg cttatatcaa taaatcaatt tctaaatcaa tatatataaa ctatccattc 30660

tgtcttagcc ttacaactat tgctaccatt ccctgtagca tggttaggaa gagactagct 30720

cttgaatact catgtcattt atcaacatat gcgaatgatc attcgactaa tatagtcaaa 30780

aaaaaattac tctgatttat ataaattaaa aattagtaaa taatatatgc tagtaatcac 30840

cttaccagct aagctctaaa gaaaattagc ttttgaatat acatcatgct attgattatt 30900

atatgtcagt gcttgtctca ttttgtggca tgcaagaaga ctagatccta aacttatatg 30960

catagtcaga ttaaagagca aatgttgcat ctgattatat gaacatctat tatgatgtag 31020

agtttgtatc atgtatattt aatttaaaca caaatataat tatacataaa taatattcat 31080

attttaaatt ttaaatattt agataattat tctagtgcag gtataaaaat aagcaatata 31140

aaattttaaa tcgatttata taacatgcat aataaaaaaa attaaggata gaggtactta 31200

ctgctcaact cataaaacat aagaaatctc tttaactaac tttagtgcaa cctagataga 31260

acatattaat gattaagttt tcatctaaaa taaacataga tatcatttta aaatcttagg 31320

catttaaatg gtctcatgat ttgtgaggct ttcttcagat tctacaattt tgaaattttt 31380

tcaaattata atttttttac cttgattgat aacaaagcca ataatacacc tcaaatccaa 31440

atgtattcct aatagttttc aataaatcta atatcaataa atcataatta agatatcaat 31500

ccattctatg aatttgacca taaatcctac ttgtttctct gaccttcact ataaattaat 31560

catcaaacta aataagtgag gggatcataa ttcttttacg acaatccaag aattcaagtc 31620

tagcatccac attagatggc ttcctgtcca gatatttgcg cctctccaaa attgagatta 31680

tcagattaag aaaaataaaa taagagagag ggttaaagga caatgccttc taggtagtga 31740

tgtccgacat cataattttg atcaaatcta tggggcaacc aataatatta gggaaagagg 31800

attggatttg agcaagaata gcaaagtcat tgtcatcaat ggcctgattc attgagttca 31860

atgaaggatt ggtggttgag tggtggaggt ggcatctagg aaggagagag aaagaaaaag 31920

atagagagaa agagataaga aaaatagaga gaaggtggca gttaagatcc ctttttgtga 31980

ttaatatata gcggtaagat actcaaagat ctcaccttat cgacctcaaa cactaaggga 32040

ggtggaagga gggactacta cccatgaagc tagagaaagg gatgatgatg attggaggaa 32100

ggaagaagga aaaatagtag actcgatgat gataagacta aaagaaaagg gtttgactta 32160

gccacttggt atataatgag gtttggtatg gagtcaatag cttgagtaat agcatggaaa 32220

gagagaagga gctgaagaga gtactaagtc ttattagaat aaagaaagat agaatcttag 32280

cgaaaaatag ggcctcaaat ctttcaggta gaggaaaaag agggatcaac gaatgaaaga 32340

ctaaggaaaa ggtgtggagt aggatatact ctcgattagt ctctcaatca tggattctag 32400

tagggcttcg tcagctgctc aatcatggat tctgatagct caaatggtgg taagtagaaa 32460

gagagagatc taaagagatt gatagtggcc ttaaaaccag cacggtcaag gataggcatg 32520

ccttagagag aggaaaagag agagagatta atggaaataa gcgagaaaaa tatattctta 32580

gagaatagat tggcgataag aagaggaggt ggttggggca tgcttaaaga aataaagaaa 32640

attgagtagg cggaaagtgg tgatgcttgg cgatgagaag atttgagaga gagagcaaaa 32700

aaatgtggat gatggtcata ggatagggaa aggaaagaac aaagaagggg gtgctaagct 32760

aactctttct accttcctca caccctgaag caaaggattt ggccaaggat ggacaaatgg 32820

gcgagggctt tggtggatcc atgcctaccc tttctccctc tcacgatgat tctagtcaag 32880

ctatctatct ttgatagctt gagccaagcc aattgacttg atccaatctc tctaaatcca 32940

tacaaactta agagagtgta ttgattcact tattctcttc taagttgata agaaacataa 33000

ttaagtggag ctcattaagt atttcaggta gttgctaact tggcaaaatg gaagcaataa 33060

taaattttaa aagactatag cttggtataa tctcaaccat ccatgattta gaaagatctt 33120

cagactcaat atagattact ttggctacta caggtaagag ctaaatagga tccaaaagta 33180

agatccatca cattagtaag tcaaattata tgtcaaatct tagtaggtat acttagtcct 33240

acgatgccta attaaaatga tcatcatttg aaccttaaaa tggactagtc aactaaaatt 33300

tttctttttg aagaagattt agaccataaa atatcttcta atctgtgaag aattagatag 33360

agcgaggaat ataaaattga tgtagaaatc aagatctatc atatatacaa ttttaatatt 33420

tttttcataa tttttaaata tttatcttct ttttttatag gtctagtcct atttaaacta 33480

ggaagaggag tccaacttga cttatgcaat aggggatgtc cttctagaag ataagaataa 33540

tttgatcaga attatataag agcaaacctc attattataa ataggggcta tatacatcaa 33600

tttatgagat agagaatcaa tgaaacaaaa gtagacttaa gttttatttt cataattctt 33660

ctatcttcta ctttttttct aggagattca agttgagtgg attgaagaaa atctttcatc 33720

ttctcgatcg gatcatattg gtattagagc gttggtcttc tatatttatg gagagcttta 33780

atgtattgtt taaatacgtg aacaatacaa acaatcaaga gaagtgctat ccatgcttca 33840

aatacatcga aatataaaag caaatatggc tactaattct ttttcaatgg acaatgagat 33900

aaaaggatgt cttacacaac tcaaggagaa gattgtgcaa ctcatgaaga ttgtctccag 33960

attgaagata atttcaatac aagcacaaac accagcaact catgttgtga aactgtttcc 34020

tatgtttgga gatgaagatc ttctatctag tgaggagatt gaattaccta aaagtatgaa 34080

aaatctttct tcaatcattg aaagttaaag cttgaattga gatccccata tataatggaa 34140

ccattgatga aaaaaagcta gataattggc taaactaatt acaaacctat tttattatct 34200

atagatatta tggcatctag aagatagctt ttacttatct caagctttct agccatgctc 34260

ttatctgatg aaattcatat atgagaaata ataatatttt taatatggtg cagagccaat 34320

tcaaaggttt aatcaagaag taattttatc taattggcca taaggaagat cggtggatca 34380

aatgataata cttatgatag aaacataatc aatccactta ggactatacc accaagttcc 34440

acaaacaggc aatctgcctt ggaatcttta tcaacaatta tacaattttt ataaagtatg 34500

ttgaaagtct tcatgagagc atctaaaaaa agatgaaact ctttaaggtt gatgatatca 34560

gtaaagctaa catgaaagtc atagagattg aggagaaaaa tcaaattaga gaagataagg 34620

aaggcaaaaa gcatatcaac ataactcaaa aaaaaaaaat tatgatcatt gaaatctttg 34680

aaaatacatc aaggagaagt attgaaagtt tcatcctgaa ttggagctaa agtagaagaa 34740

gcccaaggat gataatttta agaaaaataa aaagtggtcc tcaattctat agagattgag 34800

gagctatctg aacttgagta agcaaacttc aaattgagct tgatggtgag aaaacctaat 34860

acaacaatta aaacggatct agaggtacat gacaactcac ccacttaaag attcaagtga 34920

agcagagtat cattaaggct attataaatc tttgaagcta gaagaacctc attttccaat 34980

atttggttca gaaatcgagg ttgtagatca agcctcatcc atatccttat cctcttagtt 35040

ggattcagaa ggatgtcaag ttaaaaatta tgagatagtg taccttcaag ttagccatca 35100

ctgagaggtt tatttgtgag gtaacttttg aaatagtttc tttggatatt tgtcaagtta 35160

tccttagaaa tgtgtacctt tagaatcaag atgcaatttt ctatagacga tagagaaagt 35220

atcatcttat aagggatgag aaaaagttca tgatcaacac ctcaagaaca taaggtaact 35280

ttgaccttgc aactgttgcc caagtgaagt gatttgttaa tgtttgtgat gagtgcatga 35340

tgatggtata aagaaccgat atcactcatg agaggtcaag gccttgtcct ttggttccat 35400

caatcgatca atagagattg agattaagga ggagtcacta tagtccttgt cgatgaggaa 35460

ggatgacaac aagcattcct accatgaagt ctagatttga gagcaaatga aagtaatcca 35520

ctgagacctg agagcaaaaa aaggcgagac caaaaatcat cttcaagtaa agtcaaatgg 35580

ttcaaccatg agatggggaa gtaagtattt tcccaccttc aattctaact ttgtagaaac 35640

taaatccctt aaacagggga gccctaattt aagaggatcc tcagattcat tgtggactac 35700

tttggctatt acaataagag ctggatagga atcgaaagca aaattcacca cattaggaag 35760

ccaaattgta tggcaaactt caagagacca taacttgatc acatgaaatc caattaagat 35820

gattttattt ttgaatttga atattttttt gagatctata actttagatc taaatcaagc 35880

taaaatttta ttgcttacgc cttcaaaata ggctagtcaa atcaaaactt ttcttttcaa 35940

aaaagacttt gactgaaaga tatctttcaa tctatgaaga atcaagtaga gtgatgaaag 36000

ataaagttga tataaaaatt gagatctatc tcttataaaa ttttagtaat tttatttttt 36060

ttaatattta tctttattta gagatctatt cctatttaaa ctagaaagaa ttgtccaacc 36120

taacttgttc aatgatcaac atcctcctaa aagataaaaa gaagaatctg actcaaatta 36180

taaaagggcg gacctttttt tttgatgaaa agggaggaaa aaaatccatc aaaatttatt 36240

aagaaaaaaa gagtacaaga aaagaaggat atgaaagagt aagagaagcc ccacaacatc 36300

catcaatatt taaaatttaa atttaaatct cccccatcat tctatcaata tttgatattc 36360

aaatttaaat tcttcgcagc atcccaccaa catttgaaat tcaaatcctt tcatacaaac 36420

aaaataatat ttttcaaatt ctcaactttg agtttcaaaa ttgagaagcc tacatattgt 36480

ctgctcttca ccaaagaggg gagattgttg gcttagcttg gcccaagaga agagaagaag 36540

gccaaggccc aatctgtagc ctagagaagg agggtttggt agctacttaa taatcggatc 36600

taaccgataa agacactatc tctattagaa gaaaaggtag agagaaaaag aggcaattgg 36660

ttaacttcag agggggagga ggtaagctgt tgaggagatt aatctgacgc aaggaaaaaa 36720

gaagagctga caactagcca atgatcgaga agggctggag acaatccaag cccagcacca 36780

agaagcaaga gaaagaattt ggaggtcaaa ggaggagtcc aggaagagag agcgaaacac 36840

aatgttcgga tctagccgac aacgatacca attatactag gaaagaaggt aaaaagggaa 36900

agagcaatcg atcatcttca gcaaagaaaa ataaaagagg cacccgacag tcaagcccat 36960

ggccaaatca gtcagcaaga ggacctcaca agatctagac gatgctaagg ggaagggagg 37020

aagaaaagag atccagtaac tgtccaacac caggaaaagg aggagataag aggaagggag 37080

aagtcatttt tctatcttgg gccgaaggag ggagaaggaa gaaagaggaa agaacatcct 37140

caaagtcgaa ggaaggaagg aaagagaggg gggaaggggt cacagtcaga tataccagaa 37200

gggatagatc cagtgtcaaa gagagaaaag agagaggaga tcagaaaata aaatttgatg 37260

actgactaat tgtcatgaaa ggctaatgac aactcataaa aaaagtatag tagtaaagag 37320

agggggatag gcttggttag ggaagagatt ccgacaacaa agagaaagaa agagagagag 37380

agagagaacc ggctcccagc caaaaatagc ttgacccacc atcgagaagg accgacaaag 37440

agagagaaag atagaatagg gagaatagct tggcttcgaa tcaaaaatga tctaacacac 37500

tgctgaaaag gactaggaag agagagagag ggggtagggg agtatctcgg ctcgcaatca 37560

gaatcaactg gccaatgcca gaaaagagag gaagagagag atagagaaga tatagcaaaa 37620

gagaagagat ggacaaaagg agagaggaag ggagggagag agagaaaaaa taggagagag 37680

aggggcttgg tggctgactg tcagaagaag cctcgatgct cgaagattag atggaagaaa 37740

aaaaaatttc tcaaaacttc tcttttctat aagagcaaac ctcactatta taaatagggt 37800

tatgtatctc agtttatgat gtgaagaatt aatgaaaaat tggactttag ctctattttt 37860

gtaattcttt catcttctat ttttatgaaa ttcaagttga gccgattaaa agaaataatc 37920

tttctttccg attggatcaa tccattaact agatacttca aaaatcaaaa tgacctatct 37980

aaaatcctaa atcaaataca aaaccaaaat aactaaatta agatagaaca aactacaatt 38040

acaaaaaact ggctaaagtg tttaaatgct tttactccta agtttcttct tgctcaccat 38100

taatgcttga tctttagctg ggatcatatc agccttatga ccactataag accaacataa 38160

caactcactt gtattgctcc tttaaaatta tacaaaacta gtgtctaata tgtaccatgc 38220

gaatgtctgt ttctcaccag aaaatggatg ggcttcttgt gcaagcacct tcttcctaca 38280

aataataaaa tatgcatccc ttctctcatc ttactaaata aaataattaa aggctttact 38340

atcaggaaat ctggctttat ccatataatt ttggaagttt tatttgaaca taacattacg 38400

agtactagat tacatcagga ggtggttcct cttatttcta ttaagagaaa aatcaatttt 38460

cttttaagaa agatcatttc attttcatca ggtagcgtac tctactaata tacttccaca 38520

acaatatata gggattagat tataggatgg actttaaggc ttcttttcga gagccctgat 38580

ttctcaatca cattcccttt tctttctcat gtaatggcat ttaagagtgc atccagggcc 38640

caacaattag tcacaagtgt tctttttata catggtacat atttgctatt ttttagctta 38700

ttttaacttg attgtgaaga tatcatgaga aaattagatt taaagcctag caatcttgaa 38760

cccataattt caagttaaca ggtggaagag tccattatta tgtgagacca acttagactg 38820

caaaactatc tgatattgga ctatttacta acaccctttt tcatgtgcaa tgtttgtaaa 38880

gagaagatat atgatgtagc gagataggat agtttggctc taatattgtg ttaatattca 38940

aaccaaaatc ctaagctaat agatggaaga gaaatgactt atatacatgt gcattattgg 39000

atatatcttt atgggagaaa taatcacatg gatgtttata tcacacatct catatgtgca 39060

tgttgttgta aggcttcaaa agacagacga tgagattggt cttggatcaa attggaatgt 39120

ttcttagttg aatttggaga agtctgcaac aaatcctata aaagaagtcc cgaaattggt 39180

ggggcacctt tcgatccaag acccttcgat ggataagtca aataaagcct tgagaacaga 39240

ttgtggaaat ggaagaatag aaggatgaga aaagagattg tgaacaaatg gagagaggac 39300

tcttgtttcc ttcagtggag gagttgaaaa tgattcaaca aagtctccac tctatctatc 39360

ccgacttacc ttatggaggg tatgttaccc tcctttatat agaggggtga ggaggcttgc 39420

tcaagttgtt aggccgttaa tttattataa tagaatggtc agctatataa agatcatggg 39480

atgtttatcc atgtgatgat tagctatagg atagctagaa aatatctaat gcttaattag 39540

atgatagctg tcagataacc gtctgcattc ttatagtaca tcgatatttt atcgacgtga 39600

ctagcttaaa tcagcaactg actgaactga atattatgat tcttttagtt aacaatcata 39660

ttggttagag accgatgtaa ttcatagtag atcgatcaca agctgagatg agtatcatat 39720

tttaagaaca atactagcaa gttagatcga tcaaatgtca gatgaaaaag tagatcagta 39780

aacgttcgat ggaacctgaa agaatattta tgatttagat aataatctat catcacgtat 39840

ccagataatg agatcatata acatgtacca atatatgccc tccatttttc acaccgaagt 39900

gaagttcttc acatcgggtg tggaaagtct cttcagaaga tctcacctga cctgtattgt 39960

catcataaat gctccatacc acgatggttg gaagtattaa ttttttaatc actcaaagtc 40020

atacacaatt tcttgaaaat gatttgttga acttagtaat gatgagcgct tagaaaatcg 40080

ggagctcaca attatttggg tggctagtcc ctaatgtgta tgtgctaggt gtcatactgt 40140

aattggccac ttcagctatc acatggatcc tgcttgcatg gcttaatcaa gaagaggtgc 40200

gtcgcaacaa ctctctgcag aaccatcgga taactgacaa gtggcattga tctaatggca 40260

tatcaaatgg attgagactg ttagtaaatt ttataaatag gtctatactc tgttcaaaaa 40320

ttactttact atttttttca catgacagtc ttgctgaaat tttttcagag cccctaacat 40380

cattggtatc ggagtagaga ccccccaaag tcattggagc cggagaagaa agaagtaaag 40440

aagtctttta aaagcttcct caaattcctc tttacatatt aggcagactc tttcatcttc 40500

aacttctttt ccatgaacat ctgagatttt aggttttaca atctttattt ttttttttgg 40560

atagttattc ccttttctct cttttttttt ctgtttctct tttcccattc acctttactt 40620

tcttctttcc tttcaaaaat atcttttgat aggactaatg agataagtca ggaccaatgg 40680

atatctcggt caacccaacc actgctcaag tttgagatgg aaaatctatc tcggacaaca 40740

gctgaagtta gtacctcagg ttaggatgat ctagaatctc ctataagaga ttttttagat 40800

tatttcggcc caagtactga acaatctgtc ctgaccaatc tcgatcttta ggaacttaag 40860

aaaaaatatt cgattcagct tataactcca agttgggatg gtaggattat tgaacctcca 40920

gaaggttatg tcgtatttta tgatgaggca cttcgatctg gactttaatt tctcttacat 40980

cctttcttca gtaatgtttt agacttctat aaactccatc caatctaggt tactcccaat 41040

gccattagga tgatcatagt tttcattatc tatcgtaaat tttttgctat agaactaaga 41100

atttctctct ttaggatgct ggtcatccta agaaaacatc cttatgaaaa agactgatgg 41160

tatttcttac cttggcctca atataaattc ggtcccactc ttcctttttc aatacataat 41220

tgaaaaaatc attttttctt tatttcttct aatgtttcgt agggttttat ttgtaaatag 41280

tctaagccta aaaccaaatg gaactcaaat aacaaaatat tatctgagga tgaggagact 41340

tttgtagagc ttttagatat gaaagtatcc aagttgagcc tactggtgtc caatcagtcc 41400

ttgtttgaca ccgacatcag tcagatctct ccttaagata agtctgatgt taattctttt 41460

tctttattgc tttatcattt ttcatcattt ttcttttcta acaatctttt tccttatata 41520

gtagcaataa tgaagttcaa cctacaaagg ctggctaact caaagaagag gaagaaggat 41580

ctaaccgatt gctctcaaga agagtaagga gactgctcct ctaagatcga ttggcccccg 41640

atcatcacct gggccaatat taattgacat agatgctaca tcgatctcca ctataccacc 41700

agcaaaatca actcatcaac ctactaaggt ggcttgtcca cctcctaaag agtctgcaca 41760

tccaaagtag gcatcttccc caacacctcc aacatcggcc aagttagttt ggctgagcaa 41820

tcagcatctg aggtcacaga ctcctgatgt caacccacca actttctcat caaaaaaaaa 41880

ttgacttggc gaaggtatca cttttggaga cacccagact aggcaaggac ttgctctgta 41940

caatgatgcc tcaaaaggac ctagatgctg ataggaggga tctttctttg gagcaaataa 42000

taaattatgg attcaacagt atcatgaacg tgagtcttca ttctcttcca ctctcttctt 42060

tctttttctt tttttttttt acattggcta tttgttgatc tgaatatatc tttctttttg 42120

cagtcggttg tgtatttcaa gttgctcaat gagcacttga catggttctt caaaaataaa 42180

aatttttttg aaagagaggc tcaaggccaa gaaagaggcc aaaaaagcag ttgaggaggt 42240

caagaaggca gtaaagaaga aggctgtcaa agaaagcaaa atgatggagg ggctgaagaa 42300

acagctccaa gaaaaaatag attccattaa ggagactgga caaccaatga cagatgaatg 42360

ataaagatga caagttgtaa aaacagcctg aaaaaaatct caaagttgga ggccaagctg 42420

aaggaggtcg agtcaataat tgaaaagcat gatgaagctc ttgtcccata ttagagacaa 42480

cttgataaag acaaagagtg gatgtcaagg attattgaag attataagaa ttccgacact 42540

tttcaagatg acgttactga ggcctcaaaa ggagctttca attatggctt tttgagctac 42600

aggagtttaa ttatcaagct ctttcctaac cttgatctca gcaaggtcat aatagaagca 42660

gctctagaag tagtagccga agtgacttct gcaacaacta ctgagcttgc ttccacttct 42720

atcattggag tttctccgat cgaagtccca aacagtccaa tcgaggcctc catcatcgaa 42780

gctatttcga aggaatcagt cggcaaagac cttacctcaa ctcctccaac aaataactcc 42840

caagctaagg cctgaattat cttcttcttt tttttctaaa catttgtatt agcccgatgt 42900

gggcttctat aaatactttt tacattaatg aatgagtttt tcaatgtcaa tattttttct 42960

ttttaactaa tactaatctt ggatgatccg atctgggttg gatgtctcaa aaaatatcat 43020

tcacgataga tagttatttt ctgacttcgg ttagatgatt atgagtatat gtaattcaac 43080

cttggttagg taagtaatca aatattaact attctcaaac caagtagata acgaagtcaa 43140

tgtgattaac tttaacaagt aagattgtta tggaatgaaa ttgaatcaga tcaactaact 43200

atagataact taatctctca taattcactg taaaggttct aaaagtacct ttatctaagt 43260

tcgaagtgac aagtcgggtt cttttattcg tggatttatg acccatgctg tctttttgtg 43320

atcttcatta ttaatcacct taaatcgata tagcaaaatc cagtttatag atctgagtgc 43380

tttcttgtca gattgagtct atcctattat ctgtgaaacc tgatctagag atcaagtatt 43440

ttaggttttt tatttaaggt ccaattcgaa gattgagtat ccaatgtcat attgttaggt 43500

ccaatttgga gattggatgt ctcactatca tctcgtgagg tccaatccaa agatcgaata 43560

tctcactatc atctcatgag gtccaatcca gagattggat gtctcacatc atcttgtgag 43620

atccaattcg aagattggat gtctcacatc atctcatcct attgtggttg gaatttttgt 43680

agccttagtt tgactttttc tgacctcatt tggacaccta aatcttatta tcatcgtttg 43740

atcgattttt actaatctac tttggatgaa aaagaattct tcaatggaac ttttgattag 43800

aactttatct tcattgggat agaaatcgaa tgctttattg aaagatttta ttgataatac 43860

attctgagat ttttaatatt tcatgttctc gaaatgatcg taccatctaa atttttaatt 43920

cgataagctc ttggatggat cacctcagta atctgataag gtccttccca attcgggatg 43980

agtttttctt actccattgg ttttgagact tcagctcatt ggagaaccaa atctccttat 44040

aaaaaatttt aggctttacc tgagagttgt aatatctggc tactttttgt ttataaacta 44100

ccatatgaat ctgggctttt tctcgagttt tctcaaataa attgagatca gtcctcagtt 44160

gatctgaatt attttcttca tgaaaatttt ctattctggt tgtaggtaaa ctgatctcga 44220

ctagtattat agcctctgtt ccgaaagtaa gtttaaaaga tatttctcta gttggtctct 44280

gaggtgtagt tctgtatacc cataaaatat tataaaatta ttctaccccg agacttttag 44340

cctcaatgag ttttattttt aggccttgaa agatagttct ataaataaat ttagcttctc 44400

catttgattg tagatgtcca atcgaagtaa atatatgatc tatgtagagc tcagaataaa 44460

tttttttaaa attttgatta tcaaattatt gctcattatt agtaattata actcaaggca 44520

aaccaaaatg gtaaataatt atttttcaca taaaatctca tattttttct cagtgattta 44580

tgtcagaggt tcaatttcta tccattgggt aaaataatca atagtcacaa ctaaaaattt 44640

tctttgctcc atggccatta gaaaggatcc cagaatatcc attctccata tagcaaaagg 44700

ccacagcact gtaatagaaa taagttcagt tgtaggctga tgttatatat tggcgtacct 44760

ttgacactga tcgcagtact tattaataaa gtcggttgaa tctttttgaa tagtaggcca 44820

ataataatct tactgaatta tttcataagc taaaatttta ccccccaaat ggttactaga 44880

gattccttta tgaacttctc gaaggatgta atcagcttcc gatggcctta ggcataggag 44940

cagtgggagt gaatataacc tctgatataa ttgattatct tgaacaacat accatggggc 45000

ctgtctttta attcttgttc cttcgactgg atcaaccggt agaggttctt tagtaatata 45060

ctccattaat gggtcaatgg aacttagctc atattaaatt tggacaatta gtaaggcctc 45120

gatactagac tttttaagaa tatcaataag aacaccttga tttagtttga aaaaatctga 45180

tgtggctaaa tgagataggg catcagctca gacattttgt ccttggtatt tgcatgatct 45240

tcagattttc aaagtttttt aataattctt tcatattata taaatattga aacatcataa 45300

aatctttagc ttcaaattaa tctcatacct gactgacgat aaattgagaa tcaataaaaa 45360

ttttaatttt tttaacatta agctccttag ccattttgag tcctacaatt agcgtttcat 45420

attctactcc attgtttgag tgttaaaatt aaatctcaaa gcacgctcac taacaatgcc 45480

ttctagactc gttagaatta aactagttct actttctttc gaatttgagg ctccatcaat 45540

gtacagtatc aaataagaat ctttgatatt tttcaattct tttaagattg gttcttcatt 45600

aggaatagag cattcaataa taaaatcagc taatacttaa actttcaatg aagatcgagg 45660

cccatattga tatcaaattc atttaattca atagcctatt tgaatatcct tcttaaagta 45720

tcaagctact gtaaaattaa ttttaaaggt tgatcgatca gaattataat agaatgagcc 45780

taaaaatacg atcaaagtca tcttgctaat gcaatgaggg tataaattat cttctcaatt 45840

ttagaatatc gagtttcaac atctctaaat aatttatttg tataataaat ggatctttgt 45900

atccctgcat catttcaagc taaaatcgaa ctaacagcat ttgctgaaat agatagatac 45960

atgaataatt tttgaccttt gatcggcttt gatagtaatg gagctgtgcc gagatatttc 46020

ttgagatcat cgaaggctgc ttgacattca tcttatcaat cgaagtcttt gatctgcctt 46080

agaattttaa agaaaggaag atatttatca gctgatctga aaataaatta actaagcaat 46140

gctactcatc cagtaagttg gtgtacttct ttgatggagc tcggatgctt catttcacat 46200

agagcttgaa ttttcttaag attgacttta attcctcttt gagttacaaa aaaatctaaa 46260

aaaatttttg aagttacttc aaaagcatat ttgttgggat tgagcttcat ttgatatttt 46320

cgtagtctct aaaggcttct tccagattgg caatatactg atctgactca gtatttttta 46380

ctaatatatc atcaacataa actttgatat taatttcaat ttgttactta aaaatcttat 46440

taatcaagta ttagtatgta gcacctacat ttttaagatc aaaagacatc attttataac 46500

aatgcaaatc tttttcagtg atgaaggcca tattttcttc atcctcaagt gccattttga 46560

tctgatataa ccagaaaaag tatccataaa gcttagtaat ttgtgtcttg aagtagcatc 46620

aacaagctga tcaatttttg agagagaaaa actatctttt aggcaagctt tattgagatc 46680

ggtataatca acatagatcc ttcatttttc attagccttt ttaaccatga caacatttac 46740

aatccacttt ggatattatg cttctctgat gaatttgtct ttcaagagtt tgtcgacttc 46800

ctcatctatt attttttatc ttttcggggt gaaacttctt ttcttctgtt gcattggttt 46860

atgctttgga tcaacattca gcttatgtac aataagatca gttaaaatct caggcatatt 46920

agagactgac taaacaaaga catcggcatt catccgaaga aaagatatta atttctccct 46980

cagatcaggc ttcaatagag atccaatttg gacagttttt tttggatcat cacacaaaag 47040

aacagtaata agtttctcga ctggttctcc tcgatttttg atgatatcaa ctttactttc 47100

ttgatcaagt attttaattg gtagagcttc cacagacctt ttcattttta cagctatcag 47160

aaaatactac ttagcaagta tctgatttcc tcatatttct ccaactccat acttagtttg 47220

gaattggatt agtaaatgat aagtgaagac tatagcctta agggcgttga gcctaggtcg 47280

gtcaagaata gcattataag ctgatggtat tttgacaata aaaaaagtga gtcttacagt 47340

tgactggcat ggttctatcc ctgcagtgac ggacaaagtg acctctcctt ccacagctac 47400

aggatttcta gaaaatccaa ttacgggggt accaacctat ttagctaatt tatcatattc 47460

attctttgga atgtatcata gaacaatata ttagcagagc tttcattatc aataagtatt 47520

ctttttatat catatttggc tattgccata aagatgacaa cagcatcatt acgaggagtt 47580

tgaactctaa catcatcatc gaaaaatgaa attatgtgat ccatgcactg atgctttgga 47640

aggctttcag taatctcagc cacctcctca gttccgtcga gatctgagat catattgatg 47700

actgcagcag tagacttgtt gtgatcattc tcattgttgg gcttctatca ttggtcagta 47760

gcttgacttg cccgatctcg aacatattta ctaaagtaac attagtggat caatacttca 47820

attttatctt ttaattatcg atgctcctca gtatcatggc catagtctcg atggaaatga 47880

cagtattttc tcttatctct ctttgctgga ggggctttca taggattagg ttggcgaata 47940

tatcctaaat cctcgatttc tatcagtatc tgagctcgag gagtagatag tgaggtatag 48000

atgtcgaatc accgaggtgg gcttttgaac ttcagattct tctgaggtcg ttcagagtta 48060

tcctgttggt ttttatgatc ttcttcctag ggccactttt ttccatctct ttttttcttc 48120

acctaacgaa gtatgcatgc tctctttctt ttcagcttga gcatacttac aaacctagat 48180

caatatttgt tcataattgt ttgggtagtt cttattaaga gagaagatca ggcgattact 48240

cttgagtcct tgcttcaaag ctgccattgc aatggactca ttgaagttct tcactttcag 48300

tatggcggca ttaaagcatg ccacatattc ttgaagagat tcaccttcct actatttgat 48360

agtaaaaaga ttgctagtat ttttcaaatg aatccattta ttatcaaaat acgtgatgaa 48420

tatttgctaa ctgtgtgaaa gatgaaatag atcatgtctg gaggtcagag aactagattc 48480

ttgcagatgt tttgagagtg attggaaaag tgatgcaaaa tagggcatta gatacccctt 48540

gtagtcttat aatggctctg aagccttcaa gatgatttaa gggattgatg gagccatcga 48600

atgtttccac tgtaggtatc ttgaatcgag gaggaactga tttaccaaga attttttgag 48660

aaaaaagaga tcgtaagttg aaatctcttc taccttgaga atggcttcca atctatatct 48720

ccatcatttt cttctcaaga ttttgaatct tttgtccaag accctcctcc atacatggct 48780

tcttatgtgg agcagatttc acttcccaag agtgatcagt atggtcaaga agatgatcat 48840

gatgaagatc ttgaggagtt ggttgctaag tgtgatgtga ttggactact tggggggcta 48900

ctttttgcta ccgttctgtc gtatactaca gcagtaagag cttggacctg ctgaaccaag 48960

agactaaact attgtggatc aataataatt gaaggttagg tattctcctg aacatcttca 49020

ggagaagatg aagtaggtaa aggatgattt ggtgccttct tgttcaccat ttctactaaa 49080

atattttaag tgcccttcct ctaacactaa tctattactg caaggcttca aaagacaggc 49140

aacgagatgg gtcttgaatc gaactagaat gtttcttggt tgaatttggc gaagtctgta 49200

acaaatcttg caaagaaaat ctcgaaacct acgggtacct tctggttcaa gatcctctga 49260

tggataagtt aggtaaagtc ttgagaatag gttgtgaaaa tagaagaata gaaggatgag 49320

aagagagatt gtcggtaaat ggagagatga ctcttatttc tttcaatggg ggagctgaaa 49380

ataattcagc agagtttcca ctctatcaat cctgacttat tttgtggagg gtaccttggc 49440

cccttcatat ataggggatg aagaggcctg gtaaggttgt tagactatta ggagagtttg 49500

ttagatcgtt aatttattat aatagaatga ccagctatat aaaaatcatg gagtatttac 49560

ccacatggtg attgactgta gtataactga aagatagcta atgcttagct ggatgactgc 49620

tgttagataa ctgtctgcat tcttacggta cattgatatt ttaccaatgt gacatagctt 49680

aaatcggcaa ctggctgaac taaatattat gtatcccttt agttaacaat catgtcggtt 49740

agagatcaat gtaattcgca gcagatcgat cataagctga gatgagtatc atattttaag 49800

aacaacgctg ggcgagttag gccgatcaaa tgtcagactg aaaaagcaga tcaataaacc 49860

tctgatgtga tctgaaagaa tatttatgat ttaaataata atctatcacc acgtatccag 49920

ataatgaggt catataacat gtaccaacag tgcatttttc catctagtta agaggttggt 49980

tagtggcatt tgtcttcgat atgtaatgtt cacataacta atgtgcttag tagcattctt 50040

ttgtaaggtt aaatcttcaa tgatcttaag ttcacataat tgcctttgtg ccctattagt 50100

ttatagttga ccttttaatt caagagacag tcaccttagc aatcgatgtc tgcttagatt 50160

gggccaatta ggtactcaca ttaatatatt gaatcatgtt tgaatataaa ggattagatt 50220

gatttataag tttcctttta ttgtttacat actgatactt agattgactt actacattat 50280

ttgatatgtt atgttctaat ttttggatta aaattgttgt ttctgatttc tccttacatc 50340

taatactttg tataatttat tattttttag catgattgag tgtagaggat tagattgatt 50400

tttaagttta ttttgattat ttacatgccg atacttaaat tgacttacta cattattcaa 50460

tatgttatgt ttcaattatt gagttaaaat ttttatttct gatttctact gatgtccagt 50520

gtgtgtgtgt gtacgtatgt gtgtatatat ttatttacat atatatgtat gtatgtatac 50580

agacatacat acatacatac atacatacgt acacacacac acacacacac acacacacac 50640

acacacacac atatatatat atatatatct gtgtgtgtgt gtgtctctct ctctatatat 50700

gtataagtat gtatgtatgt atgtgtatat atatatatat atatatatat atatctatat 50760

gtgtgtatgc atgtatgtat atgtatgtat gtatatacat atatgtatat atatgtatat 50820

atatgtgtat atatgtatat atatgtgtgt gtgtgtatac atatgtatac atacatatct 50880

atacatacat atgtatacat acatacatat atatgtatat atacatatac atgtatacat 50940

acatgtatac acatacatgt atacatatac atgtatacat atatgtatac atatacatat 51000

atacatatat atatatatat gtatatacgt gtgtgtgtgt gtgtaagtaa ttaagtatgt 51060

agtgtgtgtg tgtgtgtgta tatatattta tatctgtgtg tgtgtgtata tatgtatgta 51120

tgtatgtatg tatatatata taaatacata catacatatt tatacacaca tatctataca 51180

caaatatgta tacatataga cacacacaca cgcgtgcgcg cgcgcgcgca cacacacaca 51240

tatatatata tatatataga tagatagata tatgtatgta tgtatatata tatgtatata 51300

tatgtataca tatgtgtata tatgtatata tatatgtgtg tgtgtgtgtg tgtgtgtaca 51360

tatgtataca tacatatcta tacatatata tatatataca tatatatata catatacata 51420

tatatatata tacataaata tatatacata tacatacata catatatata tatatatata 51480

tatatatata tatatatata tacacataca tacatacata tacatatata catacacaca 51540

cacacataca cacatgtata cgtacatgta tgcatataca tgtatacgta catgtataca 51600

tatacatgta tacatacata tatagatata tatatacaca tatatgtata tatatatata 51660

tatatacaca tatataggtt atttggaacc taagaaactt gcaaagttac tagatgcaat 51720

gttcggaaac catggaccgt aacaactgga gtagtatttg ggtcatgaat tcatggctag 51780

atcatgaatt gagtgggagt caaccgaagt agggccagct cagacacttg tatttaggtc 51840

ccatgcttgc gtgcattctc ttccctgata tcctttggct ttgctgcctc aaatcctcga 51900

gctatcttat catcatcgca ttgagctcca taccttgctc tttcctaact gtcactgtcc 51960

ccatcaaacc tccggagatc ctctttcttc tccaatgttg agatttgttg gagtcttccc 52020

accttctcac ttcaatgggt ggcaatttca agtgccagtt cccttatttg tcccagctat 52080

attgacaatg gggcttattc tagggtttct catggacata gtgataataa taatcaaggg 52140

accaagagag aaaaatcttt ctagtctgtg ttctttaagt ttgagagata ggcagcacat 52200

ttttttaata agcctttttc actcatcgga tcctgatttt cagttgttcg acctgaacag 52260

ttcaagcaat tgaactgctt gggtcactat tttggacgat tttcagccat ttttaagtat 52320

tgtttgactg gatccacgct gcgtagtggg cattgcgttg atcaagtaga cctgtaaggg 52380

tcaacaaggt ctgagaacac tgaatggatg ctccataatc ctcttgttat ctgtcaacca 52440

tttggaatct tttaaaacaa catgtggtga taatatatat gataaactgt gatagattca 52500

tgtatagatt atacatatga aaatgtagag tgcttagtaa aagtgatgaa gagcaatgcg 52560

ttagaatgtg ctagcctttg acctaaaaat tggaatgccc aatgatgagt tatgataaaa 52620

ttgtgacgtg atttatgaag tctaatgttt agttggcttg cagtttcaga tgcgataaag 52680

aattttatga tttagctctt tggtttttta acatgcaaac atttaattgt actgaaaaac 52740

atttatttcg aaacatgtag gagactattg gatattgaaa ttaaaattga ctttttggtg 52800

tttcacaata tttcttaata aacactacga ctatgtaaat aggtggtgga tcaaagggaa 52860

agaaatgttt ggtgattatt tttagaaaag acaagaagta tttgataaat ggttattttt 52920

caaccgatta atgagagaat gactatgaac ctatgaggtg cacctcttat gatgttgcat 52980

ggatgaagca tctaatccat gggtacaatt tactaaaata taggcccaat tctgagacag 53040

gaacatttac aactcatgta caaagaagaa acttaaagta tcatggatgc cgggatattt 53100

ccttcttcaa atctttcaaa agctgtagtt ttcattataa ggaaaaatga ttataactaa 53160

catcttctat aggtgatgag tggacactag aaggctttcc tataataaca gtagagagag 53220

tagaaaagcc tgtcagcatg cggtccataa gtatatatac atattttcag cgcttaaagt 53280

aaattttctt gtaccaaaaa aagataaatt ttcaaaataa gaactaaaat caactgaaat 53340

gtttgaaatc tgattcgtag gtacatggag aagagtgtaa gacagcaaat atcataaagg 53400

cagaataaga gctggtaatc ttgtaacctg gcgcaactat gttatgcatg tctatatgtg 53460

tgcatgttta tgtataacaa gtaatatttc ttttcttatt tactcacttc agttaggaag 53520

tcaatccaat ctccctttgc ttgggtgtgt tcagattatc aagggccata acagtagtgc 53580

tggtaagcac ctgtttaatg gataaatggc gacaaattct ctccccttct gctcactcta 53640

ttatcatacc ttccgtctta cccatctgct atatcttata aggaacataa ggatcgacat 53700

agcttcatgc tatcacatta caagctaaga tcggaataat acctaatctt ttcgatctac 53760

tattaggtat tactataggg ttgtaaattg ggtttaggtt ttgaactata ttatattttg 53820

gtgtaagaat atagtgccac actatcttga accagactag ctgttgcact tttttgcagg 53880

catcaatatt ttgttcatcc aaaaaaaaat attgcacatg cacagatgaa gtatgagggc 53940

tgtaatcatg tgagaggaaa cacagatggt tgtgatccta taatgcttga agaatgtgat 54000

ccctctttta gttagtatac ctttcttgtt tttctccctg ataggaaata tgaaatgaag 54060

gtatatcttt atgaaaaaga tggatgcata gaatatacaa atataaattt atacaggata 54120

agagaaaggc ctccagcaat ttgcacaata atagtgaaaa aagattaaat aaattcccaa 54180

caatggcgcc aatatgtgat atgcaactat gagtaggctt tcctgttgca acaatcaata 54240

aatatgtcat gcgaggcttt taaggtagag cactaacatt ctaatctgaa ggcctaggta 54300

caattttgaa tttaggactt gtttggatga ctgagtacaa aatcccataa gaatcattga 54360

tttgggccaa cacaactacc tacatgaggc ttaacctagt ctaattttat aaataccaag 54420

ggaactatta tagtaggcca gcccaaatgc catagggaat aaaagatgaa gtatggaggt 54480

tttttttatt ccttatggga tttggactag tccactgcaa tgattcttta aatatttcta 54540

aataagtcta acctaacctc atttggacag ttgtattagt ccaaatccgt aatttccata 54600

gaattttggc tacagtcatc ccaggccctt aaatttaaaa gatcatattt aaaacatgct 54660

tgaattctag attttaatct gggcccttta acttccatag ttggtcttga aatagacagc 54720

ccagccccaa gctcatggcc ctactgtatc ttcgtttggc tgtgcccttt agtaggatgt 54780

cttaggtgtg tgaaaagcac ctgaatattt cccacacaat gtgttttttt ttcagtacaa 54840

accggctatc acaccattct aatatgagta cagtccagag aatcagaata caaaatatct 54900

cgtaaggccc aagggtagtc atcgccttca caccaagtcc agtctccgat atgcttcgca 54960

acaaaagagg cagcccaatc catggtgcta ttcgcctccc ggaatacatg ttggacaaac 55020

gacatattgg cgtgatgaag ggacttctag atatcataga acagtgaata ggtttttagg 55080

tgtttcacct tgtcctgaat ccaactaatg accatggccg agtcatcctc gataaagatc 55140

ctctccgctc gtagctcata tcttatgcag atgatgtccg cccaaacaac gtggagctct 55200

gccccatgaa cggatgggtc gaagatcttc tagcaaccaa aagcttgaca tctggatctc 55260

aaataatata gcccgcacca cccctaccat ctctgacact actatcaaag ttgaccttga 55320

caaactccaa ggatggagct tctcaagaaa tgaaaagagt cctcggagtc actgcaggca 55380

tagcaaggga gtcccagaaa ctcatggtgt caagggacgt ggtggcagta ctcctcagct 55440

aagcaacaag ctctccacca ctcgctacac aggcacaatc tcgattttaa aaatcaagct 55500

gtttctgtac agccaaatct gataggcggt gtacgccatc ctaatacccc aaggcaaccc 55560

ctcaaccata ttctgatgga ccgcatcccg aaaaggcaaa agccatgggc cactatcaac 55620

cttctagatt tggccccccg ccatcctcca aatcagatat gccctcgagc aatggagtaa 55680

ggcatactct attgactcat cctctagttc atagatcaag caagcagtag gaagctccgt 55740

gcttctgtct ttgagaagtg tctgagtagg tagtcgatcc caggcaacct tctagaggaa 55800

aagtctgatc ctagagtgga ctagccatgt gtatatatat atatatatat atgtatgtat 55860

gtatgtatgt atgtatgtat gtatgtacgt acatacatac atacacacac atacatacat 55920

atacatacat acatatacat acatacatan nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 55980

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56040

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56100

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56160

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56220

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56280

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56340

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56400

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56460

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56520

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56580

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56640

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56700

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56760

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56820

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56880

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 56940

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 57360

nnntatatat atatagtata ctatatagta tatatatagt atatatagta tatatatata 57420

tatatatata tagtatatat atatatatat atatatatat gtgtgtgtgt gtgtgtgcgc 57480

gtgcgcgcac gcacgtgtgt atctcgatct gtgtgtgtgt ggtccatctt cacacttttc 57540

cctcaaaaaa accccccttg agattttgtt cagctgaaag gggttcataa aacttgccct 57600

tgcttggtcc tagggtttaa gatttatatg caatattcat taagacgtct aaatgtcata 57660

atattttgag gttacaaata ttaacaaaca gccttggata caaacctttt tctcaaagaa 57720

tcttgtatct gttcttcctc agatgacatg tgatttatgc tacggcctag ttctaaggac 57780

ttttctctgt cattaacata aaaaaaaaac agaaatatat tccttagtaa ggaaatagtt 57840

gtgcactatg attgctatgt ctctcaaaat tataccaaac tttttatgat atagagtgaa 57900

aatcaaatca gcatgtatgg tctatttgcc aaatagggtt gagcataggt cgggttcggt 57960

cgagttgaga gaaaaatttc atccgatcaa attcaatcgg attgaagaaa attcaatcca 58020

ctgccaatca ttcattatgc ataaactatc taaaactgaa atgaatagtt tgtagcagga 58080

tcaggtgtta tgtcagtttg gacttcaatg ttaacccaat attgatttta aatccaacat 58140

tggtccactt agacttattt atttattttt atcaatttaa tataaaaaag atctaaacct 58200

cataagtcat aaattttgga tttatttttg aacatgtaca aaataaaaca gaaaaaagaa 58260

aaaattactt atctaaaagt aactatatct gaaaactttc actttagaat tgtcttaaat 58320

taatgtactt ccatcaacaa ttcaatgtta atatttttat gaatccaaat ggatgataga 58380

gtatttttta gaatgaagta ttgaagtcta aatgacatcg tcccaaaata aaagtgaatt 58440

tatgaaatac tacatctgtc ggattcggtt tcatacggat taaaagtgta ggaatagaat 58500

ccgattataa ataattattt ttttataaat tctaattcaa ttttattcga tttatatttt 58560

ttaaccggtc aaaattaata tttattaagt aggattggat ggatttattc gtatctcgat 58620

tatttgctca gcccattgcc aaatctaaac tcttttcaga taggttccat gtgaacatga 58680

tacatgagat gcagtgtgat agtacacacc attgctaaga aaactttgga gtttgcgtaa 58740

caatatctgt ttaccattta aaaaatggca gttttgaatt ttaacacgct ctcctccaga 58800

ttcagcttat gaacttttcg aataaaaata cccctggact atttttccaa aaagtaccag 58860

catcttttga acttgaatgg aaattcggcc aataaaatgt tttcatttat tgaagaaata 58920

aacagggtaa cgcagtagct ctatttcctc tgcttttctt ttctatatta ataacatgat 58980

tattcatctc tctcggatca caaaaaaatt aagctattca agctttattt atatttcatt 59040

tttaaatttt ttacttaaat acaaaatctc ccatcccact actacggcag catgttttct 59100

atgtatgatt attttcattc aaatgatatc attttttata atttatattg tatgtaatta 59160

attcatttat agttcttaca ttttcctgtt tctagtagat acaataaagc ggttttggac 59220

tagtagcttg ttctctgtat cgaagtttaa ctaaagcttt gacaataata tatgaatcca 59280

tatcactggg taggagagga atatgttggg tataaaggat ttaaggaatt agatattttc 59340

atacaattgt attgcattgc agacagtaat tagattacta tgcaattatt ctctctctcc 59400

atgtttgttg cagttgaaga actctaatga agctcacaaa aatttactgc atgaacttgt 59460

aagtggaatt agacgactcc gttgtcctcc attttctttt attttcttta aaatcatctg 59520

ccattcaaat agacagaaaa aaaaggattg attagctatt ggatgcctct tgaattcagg 59580

aaatgaagga cgagcaccca gtttatggtt ttgtggatga tgaccctagc aactacgcag 59640

gtgcactggc tcttgccaat ggggcttccc acatgtatgc tttccgtgtt cagccgagcc 59700

agccgaatct ccatcgaatg gggtttggct cccatgacct gcgccttgct tgattttatt 59760

gtagcttaaa gaccttacaa cttccagagt ggtgttatat attagtatct taagctatat 59820

gacagtggta agcctctcta tccgctactt gttatccttt aggtactttg catgtggtgc 59880

aaggttataa ttgccttgtg tttctattgt cttcctcatg gtacttactg gactgatgat 59940

gtcaagtgaa atggagttgt ttgaatcctg actgaaattt ctcttggtcc atcaagtgca 60000

agagtaagtt tagacatcac ttgcaagctt ttgctaggaa ataagtagtt tcattgcact 60060

aatgatttcg aatttttgtt ttcgggttag agaaacctag attaatgctg ttattggatg 60120

ctggcagtca gatgaagatt atgtttgatt gtacctcgtt ggacagatgc tcatgcgtag 60180

atccataact ctatttcatt tcatttccct gtacacaatt gaaacagggc atatatgaat 60240

aggtatagaa cagatgattc ctgcaatatt ggaggtggct agctcagctt agactaaagt 60300

tggtctagct gggatattct gaacacctga gatgttcaaa taatgtggga taacttggcc 60360

caactcaact aaacattggc tcaaagcata gtcaaggtaa agcttgagca agctcttttg 60420

agcttggttc gagtccgagc tgagcccggg ccgcttgttt agctgatgaa ctgaattcaa 60480

atagccggta ctcagcttgg ctccactcga ttcatgagtt cgaatcccct caagttcaac 60540

ctcgaacttg acggtgtagt cccacaacca tggccacctc ataatgtggg acggccatta 60600

tgcattcctc tagtgcctgc tccatatgac ttttgttctc attataccat gcacctaaat 60660

gagtgctcat agtgacaatg tttagcctcc acgtataatg tgtgccagct aactagaagc 60720

ctaaactttg gtgaaatttc tgcaatgttg tggttgtaaa acgctcctac gttgagacat 60780

gatggtatct aagattatag acaaactatc atgctgaatc aacccaaatc caaggtgaat 60840

aaaacttgat acaaagccga gctccattgc aatagtacaa tggattctgc acttgaagaa 60900

cattacaaaa tcattttttc ccaaaaagaa acattgcgaa cagaccaaag cgtaaagaaa 60960

ttacatgatt caactaattc aagctttcca tgatgtaggc actcgctaga tgtagtaggg 61020

tgataacttg ctttgtgagg gtggatcata agcttaacct caatctatcc caatctatcc 61080

tttcccttga cctatccatg ccaatctagg ccatttctgc ataaatataa cttaatccca 61140

gtggatccgg cctagtttca ctcactccaa cacattccta ctcaatggta gccaatcctt 61200

tctttagccc tcaaatataa tcctaatcta gcatagccaa ccatcaatca tgcctaataa 61260

agcccgacta caccaacccg atcattcctg atcgtacaca atcaagactt atcctaattg 61320

atcctagctt tttttaggcc tctcttatag aacctgtgcc aattctggac aagctaatcc 61380

aatcttagca gccaaaaata ttacatgttt aattagccaa atcgaaccta tcataaaccc 61440

aatatataat cggaccatac caagatcatc atcctatatt tccttctctt gttataacta 61500

cacctaaaaa ggaatttctt catacttatg aggggtatat tatgataaaa attccttcat 61560

tttagccctc catccttgtc tatttttggg accactagcc aagtaacacc ttaagagccc 61620

tccatcttaa tattccctct aactagctcg atttcttctt cattctttct ttgcgatgtg 61680

tcccctccaa tttaattctt acatgttggg atttgagtac tgaaaaataa tagataaaga 61740

gaaagtaaaa actatgctaa tgataatacc aaaggcataa agaaatcaca gcagtcgcaa 61800

aaacatcaaa tttttttatg gttcggccta agcctatatc tacataggga cgagagtaag 61860

aagaagcttc cactataata atagtttaga gtacaaaaac ttctctgaca ccatgtaggg 61920

aacatcgctt ctaatacaag aaagaagaaa tccaagatta aacaaacctc tagaaaaatt 61980

cttctcgatg gaataactct aatctgagat tgaacaatct tctccaatcg atgatctcca 62040

atcttctttt cttaaatgaa gcacccttca agcctctctt cttttctctc ttcctatcct 62100

cttttgtggc tcacaacctc ctctcctttt tatgttctat gttcctcaca tcacatccac 62160

agactcattt ttatagataa aaaattagag tctatttcgg actccttttc cacacacaag 62220

atggcttccc acgccattgg ttccgtgcgc atgacttttt tcatgccaca aaggattccg 62280

tgctgcaaaa gttttccata tccatgcagt ttccacacac cacaaaaact ttcgcacact 62340

tctcgaaggc ttttcatgct cgaccctttt tggttttcaa ttaaattgat ggatcccata 62400

tgaggaggga ccacaccaat aaatctcctc cttctaactc atatggtagg ttccatcaag 62460

cctgtagcac ctttgcattt tatcagtttt gttcctgaag ccggcttcat caatatatta 62520

gaactatttt cttcagtgtc aactttttta agcttgaacc acttcatctc tagcatattg 62580

acatgctttt ggaaagtatg tcaaattgct caaaattaat cttacggttc tctttttcgt 62640

tagattctag tgcatattac gcactttaac ataagatcta aggaaggaag aggactgagg 62700

taaggtgaag tgattttttt ttgagttggt aatggtacaa aagttatact agaccgtggg 62760

tacctaatct cggagattac catttagatt tggttcttga tcatttgtat agtgatgcat 62820

ttaaaaaatt atttgagcaa aacagtgaat gccattgggt ctgagagatc caaaatcaaa 62880

taacctaaag tatatagatg gttcctttag ctaggtcatg tatgagaaaa aatgatctgc 62940

cgactggaga aaatagatct ttgagctcat tgactgttaa gtcatatcta gtctgtgaat 63000

catctctttg aggattaatg atcaagctat cctttatggg ttaaaagaat aggatcactg 63060

aaatacttat cctagtatac atataatgtg catggcctat ttgatgagtc agactagaag 63120

gttatcacta cttcatcacc tttactgatg agcaatcatg atatggatat gtatgtgaga 63180

tacaaatcta aaagattttg aatggttcaa agaattcaga tatgaagtag aaaagataaa 63240

tcaaaaaatt tttaaaggta cttgatcgga tctagaatgc aataccaaat aaaaaatttg 63300

ttgattatct aaaaaaagtg atatagtttc atgatggaat tcttcttgta cacctcagct 63360

caacggtata tatatgagga gcaatagcac tatatgagat atggtccggt ccatcatgaa 63420

tatcactaat ttaattatta tttatttaag agcaagattt aatttttaaa atttaaatta 63480

gattttttct aaaattggtt tcaccgcacc atatgagata tgatttggtg gataagttag 63540

aggatagatc tgtgagaact catttatagg gtatcccaaa aggtatttaa aatattactt 63600

tttctttcca gtagttgaca atatgattgt gagcaatcat actgttttct taaaaatagt 63660

ggaaggatga actcaaaaag aaagtctcta aagaacaacg agtcacaaga cctatacaac 63720

ctatttaaga tgagccagta tatgtagtac ttccttcacc tcatcaattt agtaggatct 63780

cctatctttt agaaagatac tcggtattct tacaaaggat ttagagaaag tgtttcttga 63840

gggagattga gaatataggg atgatctcaa aacctacaat gacataatat aaggaatcat 63900

gtagttacat gaaggtcagt gggagggttc catactgaca tcgattatga tgtggttaca 63960

tatagaattt ttttttcaaa gatctagatc aaacattctg aaaataaaag gtctatagag 64020

ataaatccga aaaggatgtt tgannnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64080

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64140

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64200

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64260

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64320

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64380

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64440

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64500

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64560

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64620

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64680

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64740

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64800

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64860

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64920

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 64980

nnnnnnnnnn nnnnnnnnnn nnactatgta tgttggctat gtaggttccg attcgctgtt 65040

tggaatatga tatacctaga tgaaatctat cgatcttgat agaaaaagag aagtcctatg 65100

tgattcgtaa gactgagttc agaaaaatct ctgaccagag taagtgtgaa tattgaaaaa 65160

ttttttttac gaaattcaca aatgaactcg agtcgagcca atgtagcata tgactgatga 65220

tagagtttga cgagttctca atgacctccg tcaaattggg actctcgata gagggattgt 65280

atcacacgat aactgcacct agggattcac ttttctattt tgctagcttg ccactatatg 65340

ttgctagacg tcactggtgg atcgtgagaa ctcactaaaa tcattttcgg atcaacgatc 65400

tttgctgagg taagttggaa tcgtttcagt ccatcgaaaa gagtttcgat gatactgtga 65460

tggagatcac gatatgtctc actatcaaac agaatagaac ctgaggagtc acatacaaaa 65520

agagcttaac ctgatcaatg gcttggatta tatttgaatt atcaattaga ttgatagttt 65580

gaatattaga aactgctaat ttgtaaccgt tacagttttg acaactacta attgttagcg 65640

caaggactta attgcaagta ttataatttt tttgaggctg attaaattat aaattaaatt 65700

ttaattaatt taattcagat ttaatttaat tagacttaat ttaatttaat attaattgga 65760

ttcaattatc caaatcagat ttggatttca agcctgattg gatcaggctt gacagccttt 65820

tcgaatttgg ctcattttag actcgatttg aatccgtttg aggttctatt tggatcagat 65880

aaaccatgac ttagagagct caagtttttt gggactctct ttagaaatca tgtcaaaagg 65940

agaagtagag cnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 66600

nnnnnnnnnn nnnnnnnnnn nnnnnnnccc catcgaaaag agtttcgatg atactgtgat 66660

ggagatcacg atatgtctca ctatcaaaca gaatagaacc tgaggagtca tatacaaaag 66720

gagcttaacc tgatcaatgg cttggattat atttgaatta tcaattagat tgatagtttg 66780

aatattagaa actgctaatt tgtaaccgtt acagttttga caactactaa ttgttagcgc 66840

aaggacttaa ttgcaagtat tgtatttttt ttgaggctga ttaaattata aattaaattt 66900

taattaattt aattcagatt taatttaatt agacttaatt taatttaata ttaattaggt 66960

tcaattatcc aaatcagatt tggatttcaa gcctgattgg atcaggcttg acagtctttt 67020

cgaatttggc tcattttaga ctcgatttga atccgtttga ggttctattt ggatcagatg 67080

aaccatgact tagagagctc aagttttttg ggactctctc tagaaatcat gtcaaaagga 67140

gaagtagagt attatttttt tcatccttct ttcttcacac gcatgaaagg agagggggca 67200

ccaatagttg gtgccctgcc ttatctggat gtctttttca tccaattttt tttttaattg 67260

aatttgattt aaaatagaat agaaatatct tagattaagg tatagaagta ctttttttat 67320

gtgataaaaa aaatagagaa agaggacgtg cgctaattat tggcgtgaga catctttcct 67380

tctttcttcc cttatctcaa cgcacatcta tcctttgatt tgtttttgaa caccttggat 67440

taaaagagat gagatctctt gggcattaag aaggagttgt gcgtgggatt tgagatgtgg 67500

tgcgacaaaa aattaaaaga ggatgcatga agggaggtgg cgtgcgttag atgcgagagg 67560

cttctttctt acatctttct ctcctcccca atgcctcttc cttccttctc cacttcacgt 67620

ccatgcccag attcaataaa gatcagatct aagaaaagaa aagagagaga aaaagagaag 67680

aagaagggtt cttcttttct tcatggtgat ctggtataga tcctgttgga tttgtgcgaa 67740

agagtttgag caacgatctg cttctttaag atctgaaaga aaagatcaag atccatggat 67800

gaagagtgag atctgcaagg tgctagcaca ccagtgatct cggtgctccg atcaaatggc 67860

tccgtgtgga tatcagctga ggtcgaacgc gtgcatggct acgatcagaa tctgcgatat 67920

ctgcaggatc cgagatatgg agattcgatc tccattttat ttttctaaca gtttattttt 67980

ctatttcaga tatcagatcg tgggtacata tttgtatcaa gatctttact atggttttca 68040

gatctgattt gatacgtaaa taaattaaaa ttattttaat ttatttattt tcactgtgta 68100

gatgtctaga aaaaatttta aactacacgt acgaaatcga agcattttct aacaactctg 68160

actatcacca tagacgacgt atatctcttg cttcccacca aacttcttta ataagttctt 68220

tagccatagc atttctttat cgacctttgt tatggtgatg tattcaacct ccatcgacga 68280

taatgtgaca cttttatgac tttgattgcc acaacaccgc tccctctgag aatatcatca 68340

gataatctga cgtggatttc tgtatgtcca catcatcgat catgtccgta tctgtgtaag 68400

cctgtagcat aggatctcca ctatcatggc ataaatatat cctggatatc tatttaagat 68460

atcttatttt ccacttcatt gctttccggt gctcctttcc aaagtttgaa agaaaccgat 68520

tgaccatacc atccacttga gcaatattag acctggtgta caccatagca tacataagac 68580

tccccaccac ttagtccttc tcactctttc tgctttgctc tttaatcaat gtaaagtgtc 68640

ctacaagcag acaccaccgg cttcactcta ctcatgttga atcaatccag caccttctca 68700

acataggcct cctatgacaa ccataggacc tggatctcct atctctagca attcttatcc 68760

ttaatatcat tttgacctat cccaagtctt ccgtcataaa tgttcgatcc aactttacct 68820

tcaaatcatt gattttggta atgtggcatc ccacaatcag catgtcatca acatatagca 68880

aaaatttgat aaaattattg tcaaaatatt ttttcatgaa catgcaatgg tcagaactta 68940

ctttcttata tccattctcc attatgatgg aatcaaactt cttgtactac tatcatggtg 69000

cctgcttcag ttcataaaga tttttcttca agcaacacac tatgttctca ttaacctttc 69060

atttcaaact cttctagtta ctctatatat tctcctcctc caagtcgcca tgaaggaatg 69120

ccatcttcac atcaaattgt tccacctcaa catctaaaca gccagcgaga tcgaggataa 69180

ctcgagtaga cgtgagcttt acaacgattg agaaaatctc ttcaaaatcg atactttttc 69240

tctgaccaaa atctttcaca actaatctca tcttgtacct tggttataaa ctattctcct 69300

atggcttcaa tctgaacatc tatttatttt tgagtgcttg ctttttctta ggtatattca 69360

ccaactcata tgtattattt ttctataaag aattcatctc ctctttcatt gccttcatcc 69420

actcctcact atgctggagc tctatggctt cagagtagga ctcaagctct tccacatctg 69480

ttaatagcac ataatcctat ggtggatatc ttatggatgg cgtccactct cttgtgaatc 69540

tctggacctc ttatgcaggt ggttcaacat gcaactcaat ttgaacacca tccgcactct 69600

cctcagcctc atgactatca tatgtaccgt catctgtagt tgctctcctg ttatcaagac 69660

ttctcgaaga ggtatctggg cataagtcta tagggctgct cggggttgac ttcggcttct 69720

taggcttctt aaaatcatcg atcgtctgat cctccaaaaa aataatgtca tagttgcaca 69780

cgatcttcca ctccatagaa tcccacaatc gatagttgaa ctctccgtcc tcactatagc 69840

tcaggaatat gcactgcttc accttgacat ctagtttgga tctctcatct ttaggaatat 69900

gcacgaatgt cctgcatcca aagattttca aataatcata agaaatatct ttctccaaca 69960

atattctcta tagtgtatca cacttaagag tataagaaaa aaaaagatta atgctatgga 70020

tcacagtcat caatgcctcc ctccagaatg ccttcgatag tttagcataa gagcgcatgc 70080

tcccgatcct ctcgcaaatc atcctgttca ccctctcaac aatctcattt tgttgtggca 70140

tcttaggcac tgtcttctct agtctgatgc catttcattg atagtatttt ttgaaagaac 70200

ccctgtattc acccctgttg tccgtccaaa tatacttcag cttttgccca gtctttcttt 70260

caacagagat gtcaaattac ttgaatatta tcgagcactt gatccttcat ttttaaaata 70320

tatgtccaaa ttttttagaa gtgatcatca ataaaagtca tgaagtaaga acatccataa 70380

aaaattttat cactcagaga acaaacatca ctgtgaataa gatctaatgc accaattttt 70440

cttttagaaa aaaattctaa aaagaaactt ggatttgctt acccatcaag caactttcat 70500

atatcttcaa tccaaaacta tgaataggaa gagcattctt cttagtcaaa attgacattc 70560

ctttttggct tatatgtccc agtcgtcaat gccataattc taaggtagaa gattcttcca 70620

ctacattcac ctccccttta ccgagcttgg cttgtatgaa gtagagaaag ccttgcttga 70680

tacttttggc tactactagc gattttttgg ttagcttcta tttgctgtct ccaaatatat 70740

tgtagtagtc ctcctcatct aataccccta tcgataacaa gttcagatga atatctagta 70800

catgtcgaat atttttcaaa aatagcctgt accccaagct cgtgatcagc ataatatctc 70860

caatatcaag gatttttaat tctccatcat tctccatctt tattgtccca aagttactga 70920

aatgacaaga tgagaataat tttcacctca ctgtaacatg atacgaagtg gccaaatcga 70980

tcacccagat agagtctcaa ccaatagtac ttgcaagatc atcatttgtt gtgccacaag 71040

caacgatcat ctctccatcc gtagctactg ctatcatctt attgttcgag ctggagtcat 71100

cacttgatta ttttttgact tctccttttt tagtaatcgg tagtctttct taaagtgatc 71160

ctttttgccg tagttgtaat atctatcact tcgagacttg gatctcttcc gtaatttagt 71220

ggggccatca ttcaagttag attgggagtc cttgtgcttg tttcttccct ttctttctat 71280

gatgagagcc tcatggtggc tcgagacacc ttgctccttt ctcctagcct cctcattaag 71340

catatagtct ttcaccattg ccaaggctat cgaactatct ggtgaagaat tgcttagaga 71400

caccaccaaa gtctcctaac tatcgagtaa gaaacttaac aatagtaaag cctagagctc 71460

ctcatctaac agcatcttca tcacagtaag ctggttcacc acgttctaaa agttgcttag 71520

atgctccacc atataagctc cctccttata tttcatattt atcagtttgt gaattaggaa 71580

caccttgttc tataccatct ctcttgtata gactttttag tttcaaccaa aggccatgag 71640

cattaacctc cattgaaata tggtggaaga tgctatcatc aatccactgt tggataatcc 71700

caacgatttt atgattcaat ttctcccatt ctttatttga catcttatca aactgaataa 71760

taacatcctc gattggatca tgaaaatctt agcagtaaag gaggtcttcc atgtaaggat 71820

tccagattga gtagttagtt aatgtcagct tgatcgtagt gcccgacgaa gattggttct 71880

ccatctatta gcatcttaat ttctttttga atactttaga ttttgtaaaa tttggctctg 71940

ataccactta ttgggatttg agtactaaaa gataatagaa aaagcaaaag caaaaatcac 72000

gccaacgata ataccaaagg cacaaagaat catagcaatc gcaagagcac tagaattttt 72060

tatggctcga tcaaagtcta tgtctgcaca gggatgaaaa taaaaagaaa cttttactat 72120

aataatagtt tagagtataa aaacttctct gacactacgc cgacaatact acttctaata 72180

caagaaagaa gaaattcaag attaaacaaa cctccagaag aatccttttt gatggaatat 72240

gaaagaataa tattctacaa gtcaatcgca tgagtaatgc aataagatat tgttctatat 72300

tttatcttcc aaattcatat atttgatatt aattattaat aaaattagat attttatttc 72360

attatatgct gcattttaat acttgtttaa aattataatg aactccatag gttaggacaa 72420

taattttaag gtcatgatga gatcatacca gtgagattta aatctttgat aaccttaatc 72480

taaaatattc tcaatagtag gatcattaag tcaaaaatca atgatactga taaaactggt 72540

acatcctata tattctcgac agagagggtg gttgatgtca taatcacttg tgtggagaca 72600

ctaatacgaa gatgtggtgc tcattagaga ataagttcat tgaatttact gatcgagaga 72660

atatatgatg caagtgatcc tttgacctaa gatcaccatg gtgccttgta tatatgaatc 72720

tatgttttgg ttcattcttt agcttcattt tttgagcctt gtgtggggtg ctccggacat 72780

ggtgcagtat gtatggaggt tgtgagtggt caacaaaaaa tcaatcactc cttgtaaaag 72840

gagcgaatat cttatgtgat cttataggtt gatccaaaaa atctttgacc aaagcagaat 72900

gataattaga aagagttttt aatatatcat taactgaatc aatatcttct gatcgagata 72960

catataaata agtatttgaa tttgacatga ttttatatcc ataactaatc tgaaatattg 73020

tatgattgaa gaattgaatt gtacaatttt ttaccattga aaaaaatttt tgatattttt 73080

tttcaaattt aatatctttt tgatagtcat gacatgttgc tagacatcaa tcttgacttg 73140

tgggctcaca aaaattaaaa agattttatt tgaaagttaa ttagaaagta ttctgattaa 73200

ttgatgtatt tggactgacc taatctaatt ggattgattt aggtcatgag cttgagccca 73260

ctgctggcta gatgatcgct gtcgtaggca gtcaagaata aaaatcaact caaactatat 73320

agatagggtg agtagggatc atttctatgg agatctagga tgattatctt tttttttaag 73380

aaaaaataaa aagagaattg attgtagaag aattaaaaga aatagaatag caagaattaa 73440

attaaaagta tgaattaatt tatgaaaaaa aataagtcag agaaataact cagaaatttt 73500

gaatccacca tgcaaattag atttattttc ttcttttttt tatgttgcaa cattaattct 73560

tgtgattaag gtattagtat agcttatctc taagagatac ggactgtatc agtagattac 73620

aactcgtcct gttgaagtat aaactatcta aattcaatta caaaatataa gattcaatct 73680

aacatactac gatctatctc tccaaagcac gtatcgtatc tagggatcac gatacgtcaa 73740

tagagggtat aagccgtgta ggctggatca atacctcaaa aaaaaataaa aagatatgaa 73800

ataaaagtat aattttatta cataaaaatt taatataaaa aaaaaccgtt tacaggcttt 73860

atcatatttc tggattgaag agatttagcc acgcatcaag ctctctagct ccataatctc 73920

tcaataattg atccctaaag ctctttaatt ttttttttta ttattttttt gttttttctt 73980

taattttttt ctcttcttat ttttgctgcc atctgctgcc tctgttttct ctgctcctgc 74040

tgcctccttt tatagagcac agcttcttcg aattataagc atctatggac tttcaattcc 74100

cactatcttt tattttgatt gggattttaa aactttatcc gcatcccagc atcttgtttc 74160

acgcgagatc ctagcgtcca catgtgtttt gaattcctta tgggccacag accatttaaa 74220

ccaccaaaga ccactttact attttgattt gaatcccatg gaagccggct gcctctggtc 74280

tcattcaccc ttccagtgct tcacatgggt cccattaatt tgaattccta tgagccacat 74340

ccaagctttt gaatccaagc cttccttatt ttttaaatca attaaaactt tgctttaaat 74400

gccttgtaga ccctcctatt tgcatgctac gtgagaacat tgttaagctc ctcttggccc 74460

acttaagaac ttctatgggc tacatgcttt tggctagctt taaaatggtt ttgggcctaa 74520

ctttggatca ccattcgaag tccattttga attcaattta tttttatttt tttttttaac 74580

ctacaaatcg agctctttta ttggtgatca tttttcctat aaaacaaaaa caaaaagcat 74640

caagtcttaa gaaataaaag ttaattaata tatattttga tacttttatt gggatattta 74700

atgtacttat cactagatat gaaatccaat gggtcacaca ctttgaaatt tgatcttagt 74760

ctaatctaac taggatttat tataaatctt atgggttaaa tttacatgct agcacatgaa 74820

ttaactcaag ttttcaattg gatttagttc taaggtgttt gagctaaccc tatcctgata 74880

ccttaaacct aattagatta gatttgaacc tatggttttc ttgatgcctt atgcttatta 74940

catgaaagag tttcatgtga cttaaattcc tccatgccac cacatcttca tccatgccaa 75000

attaatatgg aacaccccat ttaattgtgc atttaagaag gaatagtcct tcttaaacac 75060

tcctcttaat ttcccacact ttcctttgtt ctacacacca tcaaatggct tttggaaata 75120

tgcgggcgca gaagtggagg tgtcctatat gaaggctctt ccacattata agttatcaca 75180

tggtgaatta aattattgtg tgagaaaatc atgcgccaag agttggcacc ccttgggagt 75240

tttaggcact ccttcttatc ctataaataa ggggcacccc atatggataa atacaaggga 75300

attcaagttt aggcatgaga ttgagaggag aaaaagacac aaaaatctga aaaaaagata 75360

agaaaaaaaa agagagaaaa atagaaagaa aagacgagag aaaacgaaag gcaagggttg 75420

ctaatcctag ggttcaattt ttcaatagtt ggatttctga atcaatttgg ggtggtgaga 75480

ttttttgaga aaaagtttct gatgtggccc tagtagaaga ttgaaggcat tcagatgatg 75540

gtgcaatccg tttttgaaaa agaaaagtga gtagtatact tgtgaagaaa gctgcaacac 75600

tacatcaaat tggaaaggac cttgatcaaa cccatatgga tcaccgttgc aggatatcta 75660

ctttggtatc ttgtgaaggt tatttttttt atcagatcat catcttcaaa aaggtataat 75720

tttctaccta atatgcatgc ttgatttgtt tgattaaaat ctataaagtg ttcataaggt 75780

ttgtgttctg attgtattgt tttaagtatt aaaacttact ttaaaaatat aaaaaaattt 75840

gaaaactatc ttctactgtg caactaaaat ccaacagaat aaccctaata tgagattgag 75900

cgatctccgt caaccgatgt tctctgatct tcttttcttg aatgaagcct cttcaagcct 75960

ttcttcttct ctctctctcc ctatcttctt ttgtggccca cggcctcctc ttctttttat 76020

gttttgtatt tctcatgtca catccataaa ctccctttta tagataaaaa attagagtcc 76080

attttggact ccttttccat gcttcccacg ccattggttc tgtgcacacg actttttcca 76140

tgctacaaaa gtttttcatg tctcacgtag tttccatgcg ccataaaatt ttgcatactt 76200

ctccaagact ttttatgctc gacccttttt ggttttcatt taaatcagtg ggtcccatat 76260

gacgagggat cacaccaaca tcatatgctc tcctcaccat accaaatggt atccccaact 76320

ataagacaaa acattcatca agttgctaac agggttgaag atcagcattc actatagaaa 76380

ttttgttttt ttgctaacag acgaaaagca tcaccaaagg catcaaaacc attggcatag 76440

accctggggt gttttaccga cagacacaaa aagcatcaaa aaatatccct atcagcaaag 76500

agttttgctg atgctttttt tttcatcacc ctttatcgat acttttttac tcgtcgataa 76560

atcatcgaca taactctcaa aaaattgatg atccctattg aatgtcagca taactctaaa 76620

gcctttagtc atgcctgact aaaccatcag caaaaggctt atttttagtg atacctgagc 76680

agtctattac gaaaaatctg aataatatgc tagcaatttt attgtaaatg cacaggagtt 76740

tcatgcatac atttcaaaaa tttttaataa aaaaatatta gattaaatta tttaatctac 76800

aaatgcatgt ataagatctg accttaaaac tactataaat ggatcgatga catgaattta 76860

tatacataaa aatctgaatc taaaatgaca agcatatgaa ccaaaaacag catttagtaa 76920

tagatctaat ctaccacttc tagaattccg aatccaatac ctaagtgtgg gtagttgaac 76980

tccatgatca aaaatgtaga tctgaaaatc ttctctggtc gctcatagcc gcacaagcat 77040

ccgacctcta cggatggttc acacgaagct cctcggacct atcagctctc tgcgggagtg 77100

ctagcttgtg cagtcagttt ctgatggtag attgacttga tctccttctt cgattatctc 77160

gaaccttttt aatgttgaag atggatcaga ggaagatgtt ggatggtaga gaaaaaatag 77220

atgaagactc tcttctcttt gatttttttc ttacccaaaa atctgaaaca gttctaggtc 77280

tctcacccga gaggagaatg gtctcttctt ttgttcatgc caaggaagaa agaaaaccac 77340

ccaaacctta caccccaaag aaaaattttg gcccctcttt ctctctagta tcacacaatg 77400

aaaagttctc tcttgttggc acacaaaatt atggtcattt tatggttgtc gcacaaacca 77460

ggtaagacag gataagagcc agagtttgtt gcaattcaaa ccattttaaa tttcaattta 77520

tcttcaactt tttctcactc ttatctgact taaagagaga cttataagag aaaattgggt 77580

ataaaaaacc atcagaaaga cttccttttc ttacacacaa taggcccctt caaaaataac 77640

caacgtgtgg aaggatatgg ataaggtttt aggttgaaat tcaaatcatt ttgaattcaa 77700

atcaaaatca atcaattcct atccttaatg gatgataaaa gaagggttat cttctaattt 77760

tatcatacat aaactaattt tgtacggtga gaaaagacgt aagataattt gggtggtgca 77820

agggagagag tcccattcat ttaggactct agggtttaac caattgaatt ttttttcaaa 77880

cccaatccaa ttagatccaa ttaaaatatg atgaacctaa tctaattagg ctcctataat 77940

ctttattaaa tttaatcaat caataaatta attgagccat agacctgatc aaattaggat 78000

catttctctt ttaccgatta ggtcatctca taacctaatc agacttgacc tgattgaatc 78060

caattcaatc aaacttgata cagacttcaa tgctcaatca aattaagcta attagtgatc 78120

tattcactaa ttaatcttct attaatgata gtgatccaga ctcttctcta gagtctccgt 78180

ccagtgggac tctccagcag agtcccaatc tagtgggact cttcaccaga gtctccattc 78240

attgggactc ttcagattag ccatgtgatt ggagagaaac ttttaatgtg aatccatcat 78300

ccacatttta tgtgaatgac a 78321

<210> 2

<211> 15569

<212> DNA

<213> Elaeis guineensis

<220>

<221> misc_feature

<222> (11900)..(12834)

<223> n is a, c, g, or t

<400> 2

actacatttt aacaccaagc tcgataatag tgataaagaa acatctagat cagctttata 60

atcaaaaatt ttgacttaca attttacgtg tgtctcaaaa tcttgaataa atataaataa 120

gatcttttat cttgatccaa aaatagtaat caaggatttc attagtaact tcaacaacaa 180

tggtaaaaaa attttctatc cattgataaa cccaaatttt gaattgaagt ttcatgcata 240

ccatatagcc tttaataaga tctattattt ggatctaaag atagtaatta aaattgttaa 300

tgattccact aagatgaata ctttacaatc tcataattaa tttcttcaat aaaaatagac 360

ttcttgataa tgtctccaat tgtatatttt tttttatttc tacaagaaaa cttcatacat 420

tttttacgtt ccaatataaa tcttaaaaag ttattccaat caaatatcat aaaagatctt 480

cttagtccaa ccttaaataa cttttatgaa tgaatcttta tcttgccact aaataatgaa 540

ttttaaaatc aagagcaaca tcacagcatt ctgtcatgtc aaatttgtgt tagatgtatg 600

tcctagaaat caattagatt gacaatgtaa attttttaag gatataattt atatattttg 660

atttattaat aaaataaaat ttaaattaat ttttattcat atttttttat ctatgaatca 720

tctaaagaat taataagatg atgatacata ttcttaagag ttcaaaattt gaaatatatg 780

tcattgatga ttaatttctg aatacttttg aattcttaag agtttagaag atcttgaccc 840

aagtagtgtg aatagtgaaa aaaagttttc acatacttca catcaaaaat ttaagttgaa 900

taaattgtac atatgacagg tattatagtt tgacgagtaa tctataacct ctatcttatc 960

aaaattctga tagaaagatt gtattgtatg ataactgtac ttagaggttc accttttatt 1020

ttactggatt accactacat gttgctagat gtcactggtg gattgtgaga tctacgaaga 1080

ttatcttgat gatcgataat tctcattgaa aagattgaaa ctattttaat gatgttgtga 1140

tagagatcat aatatatctt attatcagac agaatagaat tctatgggat catacacaat 1200

aggagattaa gactgatcaa atagttgaat gatgattaag aatcattacg gagttcagat 1260

tatcaatata attgataatt agactaactt ataattgtta caagtagcaa ggacttaact 1320

gctaaaggtt aataggttca aaaagaactt atgtataaat gttgtgcatc ttaatttgat 1380

tggatcaaat tagttatggc tgaattcaag atgaatcaaa taggaatttg gttcaattga 1440

atttgggtca agctttaggc ttaggtcaca tatacccaaa atcatttgga tgcatcaggt 1500

gtgtgacacc tgaatcaggc ctttctaaac tattttgagt aagtttgatc aagtcaaaag 1560

gatccacacc ctaaggtttc ttgaataaaa ccttaggcac cacattgagg acctatagga 1620

aactttgacc ctctctcata tggggtggca cactgaggtt ttataaaaac cttaggcacc 1680

cattttagcc ataaaaaaaa agctccaagg gatggggcag tagccatgaa gaatccttgg 1740

ctgtcaggac tctattcaaa agagttctca aggttttgga ctcttatgga gccctaggat 1800

ttgtttgcct ataaatagat ggccacccca aggctttaga taatgttaga gacttgtgaa 1860

gctctcccct ttctcttggt tgccggccca ccctctctcc tctctcttcc atgccccaag 1920

acttctttct tgtctccatc atcttgctga aatttagatt tcagcaagaa aagtcaagta 1980

gaagtcaaag ttctaatgta gctcacaaga tgttgagaac ttcctccatc tggcaaaggt 2040

tctgcaagag agctagcatc ctgagaaaca aaaagattgc tgatcagccc tcatctccat 2100

atggatattt gtagagatca gatgcatgca tagctagaag agaatcttat cacgatcatc 2160

actcgtgaag atcatctacc tgtgcaaagg tatgagataa gaaaaatatt ttttttatca 2220

taattcatga atcctttgct tatattatac tgagattctt ggaatggatt ttttctctag 2280

taaaactcta gagatcagat ctcgaagtct tcttcatata aaggttttga aagttcttta 2340

tattttcgct gctttgattc aaaataaatt agatctattt tgcctttcaa cctttctcat 2400

atttattgac atataaagct ttaattaatg agattaatga aaagcatgtg cgaaatactg 2460

agaaaatcct aacagtgata tcagagctac ttttgtacat aagaaaagga ttcaagttaa 2520

ataaaatctg tttgatttaa gtaaatgaat caatcaaaat ttatcctaac ataagtttgt 2580

cctggtataa tggtcaagac cattatgttg aaaggttatc ctaggacaaa aagtctaagt 2640

aaaatctatt ttatttaagt aaatgaatca attaaagttt attctaatat aagattgcct 2700

tagcataatg gtgaagaccc ttatgttgaa aggttgtcct aggatggaaa gtgattgatg 2760

agacaaatat atcatgaaag tatttttcac agatggaata aaatatatat attttgtttg 2820

tgaaaatgag atttcatgaa tgtgtttgtc attcaatatg tgtggtgatc atcttgaatt 2880

gccacaaatc ctttttggat tagggttgta tcatgactca caaatcctga tggtttgcaa 2940

aattttgcat tctgtagtga tagaaaccaa aagttaatcc agttttggaa taagattgat 3000

caattggtat ctaaggcaag tattttataa tggtggttac ttaattagtt ataaaagtac 3060

gaagagtctc ctaccaatct tacacttatc tagccaattt ggttgattga attctgaatt 3120

tgggttgctt aagtgttaag ttcactacaa atatattgca accatgattc cgacttagtc 3180

aaccaagcct agatctcttg aatagattca tgttaattat ggatttacat aggatataaa 3240

taaataatta aaacttgaag agatctaaat gaaaccttct cgtacatatt aaatcgaatg 3300

atcttccatc attgtagata tacggatact ctactgatgt tgatgatttt cgactagata 3360

tagtactttg gttgcatcga aaaagtacaa ccactttata acatgagatg ttgcagggta 3420

gagatggggt tgggcccaat aattgttagg tgaggatcca aatgatggct gcacttgcgt 3480

gtgaatggcg agtctgactt aattaagaaa tagagctaat aactattaga tgaggcttca 3540

ggacttagag acttatgacc actacaactt acttgagaag caatggataa agagtcgtct 3600

atttatcaac tgacgcatca ccaataacta tcagatggag tgatgtataa ttagtgggac 3660

tatagtatcc acttgaaatc ttaatcgtaa aaatttttgt ttctccacct gaagagcatg 3720

ggagattcga aaaaatagtg ggggtagttt atttttaaaa taaagctcct aaaataaact 3780

aaaataagtt aaatacaaag tctaactaga atcttcttct ctctgtagaa aatatctgct 3840

tccaacctct atttcatatc cttaagacta attgtttgac tagacccagt tataaagatt 3900

gactctaaaa cttaaagata gtcttgagtt ttgaaaagat gagctatgtc ctggatcaag 3960

atatcctctc tctaccagct tgtcccaccc ctaatcaagg ggcatcctat gaaaagtggt 4020

taaacgatga taacaaggct tggtgctgtg tgctgacatc tatgtccatt gaactccaat 4080

gccagcataa gggtacaaac tgtccaaggt atattgactc atctacaaga gttatatagt 4140

gagtagagcc atgtatctca ctaggaagta tttaagagac tcttcaagat gaagaagtat 4200

gatggatagt ctgttaatga tcattgtctg ataatgatca agaacttgaa agaacttgag 4260

aagctcgata tgtctatcaa taagaaattg cagattgatt tgatcctaca attccttact 4320

gattcatatg tgtagtttat tataaactac catatgaata aaatacagtg caccaaggtt 4380

gagttgttaa atatactgat aactactgaa gggacctcga agagttcaag aggcactgtt 4440

cttattatgg agcagacctc atctttcaag aaaaagtcta ctgaaaagaa gaaaaagttt 4500

gtgaagaagc agaagttaga gaataggcca aagaaagaag ttttcaagaa gaaggccaca 4560

aaaaaggaaa agtattttca ctgcaactct gatgaccatt ggaagagaaa ctattctgat 4620

tatgtggcaa gcttgaagaa caaaaaagat agcatacctt ctgaagatat gtctgatctt 4680

ctcgttattg aaactaatct tacaatttct tttactttca gttaggttat agactctagc 4740

tctagtgctc atctatgcac ttctatacag gatctggagg aaagtagaag gctgaggaaa 4800

gaagaaataa tccaacaagt tgaaaatgat gcaagagttg ttactatggc tgtggagatc 4860

tatcctctac gactaccatc tgatcttagt ttaattctta gagactgtta ttttatacct 4920

actgctagca aaaaattgat ctctatttca tctctagcat aggataatta tgtattaaat 4980

tttaataaag attattatac catttatttg aaaaataaaa tggttggacg taatttttta 5040

attgacagtc tctatcattt acatgttgat gtatctatga atgtaaccaa gcagaaagtg 5100

aatgccatag gatctaaaag atctaaagat gaaataaatt atatgtggca cattaggcta 5160

gatcatataa gagaagaaag gattaacaga ttggagaaag atgggctctt gggcttattg 5220

actactgagt tatatccgat ctgtgaattc tgccttcaag aaaaaatgat caagctgccc 5280

tttatgaaac aaggagaaaa gaccattaag atatttgccc tggtacatat tgatatatgt 5340

ggcccattaa ttcgatgcgc tggtcaaaga aggttgtctc tatttcatca tctttatcga 5400

taattattca cagtatggat atgtgtatct tatgagatac aaatatgaag tctttgaaaa 5460

atttaaaaaa tttagaaatg aagtaaaaaa ataaactaaa atttttttaa agatttttca 5520

atcagattga aaagttgaat accttaatgg agaatttcta aattatctca aaaaaaatag 5580

catagtctta taatggactc catttggaat gtcttaactc aatagagttt cgaaatagag 5640

aaatcaaact ttattagata tggttcggtc catgattagt ttcattgacc ttctcttatt 5700

tctttggaga tatagtttac ttaccactaa ttatctattg aatagggttt cctctaaaat 5760

catttctacc acattgtatg agatatggta ttgtagaaaa tcaagtcttg atcatatcaa 5820

gatttaagga tatccgaccc atatcaaaat atttcagacg gacaagttag aggtcagatc 5880

tatgaaagct cggttcaaaa gtatcttaag gagtctttag gatattattt ctacttttca 5940

gaggatcaca atatgattat aagccaacat gctctcttcc ttaaaaaata gttcatgcaa 6000

gatggaagta gtaggaggca gattgagctt gaagagagtc tctgaagagc aatgagtctc 6060

agaacttacg taaaacctat ttaagttgag ccaatacaca cacctcttcc tccatctcgt 6120

agatccagta aaatttttca ttctcctgag agatacttag gtatcatcat agagaatgta 6180

gagaaaatat ttctcgtgaa aaatgagaca tatgaaaatg accccaaaac ctatagcgag 6240

gcaatatcaa atatcgacta taagaaatgg ttagaggcta tgaagttaga aattaactca 6300

atacacttaa accaagtctg aacctttatg gatccgtcag aaggtatggt acctattatg 6360

tataaataga tctacaaaag aaagattggt tttgatggaa aggtagagac ctttaaggta 6420

aagcctgtga ctaaaggtta tagctgacac gaaagcattg actatcaata tattttttca 6480

ctagtagtta tgctaagtcc atttgaacat tacttgcgat tgcagcatat tatgattata 6540

agatatgaca gatagatgtg aaaactattt ttctaaatga atatctttag gaagttatct 6600

atatagagta gactttgtgt ttcacttcca gtgatggcga tcacaaagtt tacaaattgt 6660

aaagatctat ttatgcactc aaacaagcat cttggagctg gaatacttat ttcaatgatg 6720

taatcaaatc atttagtttc atcaaaaatg agaaagaatc gtgtgtgttt aagaaaatca 6780

gtgggagtac tgttactttt cttgtattgt acgtggatga catcctcctg atcgaaaatg 6840

atatttttat gttaatttta gtcaaaatat agttgtctaa gaaattctcc atgaaggatc 6900

ttggggaagc atcctatatt ttggagataa atgtctatag tgataaatct atgaggatgc 6960

caggcctttc acagaagatg tacattaagg aagtgctgaa gaagttcagc atgaaaaact 7020

ccaagtggag acttctatcc ttcaggtatg ggattcatct ctccaagaag gtgtgcctca 7080

acacatctta agagatacag tacatgagca aaatccctta tactgcggct ataggaagtc 7140

tcatgtatgt catgttatgt acatgacctg atatagctta tgttgtgagt gtcacaagta 7200

gatatcagtt gaatgcaggt gaaaaacact ggacatctat gaaatgtatc cttaagtact 7260

tgagaaggat taaggatatg ttcttgatct ttagaggagg agaattaagg gtgcaagaat 7320

ataccgactt aaattttatg tttgatattg atgatcgaaa attgacatca gattatattt 7380

ttttatgcaa cggtggtact gtgagttaga aaagtttcaa gttgcctatc atagcagact 7440

ccattataga agatgagttt ataatcacat tggaagctac caaagaggca ttctggttta 7500

aaaaatttat tacagagctg gatataatgc catcagatgt cataccactc tactgcgaca 7560

acaatagtgc cataactcta gctaaggagc tgaggtctca ccaaaagtct aagcacatag 7620

agcaatgatt taatctcatt cgcaattatc tcgaaaaaaa tatatcaagg tatagaaagt 7680

agatactatg gataatatga cagacccact aactaagtag ctgagtcaat aaaaaatcga 7740

agtccatctt gagaagatgg gacttagatt tgtggccaat tgattttagt gcaaatagga 7800

gattgttaga tgtatactct aaaagtcaat tagactgaca aatataaatt ttctaaggac 7860

ataatttata tattttgact tattaataaa ataaaatttg gattaatttt ttattcatat 7920

tttagtatcc atgaattatc caagagatta atatgataat gatatatatt ctcaagagtt 7980

gaaaatttga aacatacgtc attgatgatt aatttttgaa tgctttcgat taatggatga 8040

tcataaggat agtaattaat ccgatcaatg tacaaatcac ttcttttttg atagacgagt 8100

ctcgagtcta tactatggag acactggagc aagagtgcag gtatttgtta gagaacaaag 8160

gtatcgagcg tgactaatac gagaagtcaa ttggatggct atccactcgt taatgactta 8220

tttgatacta cagtagtatg tctagtcctt agatctgcaa tgcctcaggt gttcataatg 8280

agactgttag agtttgactg tacataaact tgatttctag ccatatggat ctttatagtg 8340

catgttggct acagtaggtt cgttgtagga ataggatgtg cacatagata gaatctatca 8400

tccttgatag acaaaaaaaa tgatcctata taatttatga gactgagttc aaaaaatctt 8460

gactaagaca gtgtgaataa tgaaaagaag tttccacata tatacttcac atcagcaatt 8520

ccagttaaat aaatcctaca tataataggt attgtagttt gatgaataat ctataacctc 8580

catcttattg aaactctgat agaaggactg tatcatatgg taactgtatc aagagattca 8640

tctactattt tgctgaattg tcactacaaa ctgctagatg tcactgatag attgtgggac 8700

ctatgaagat tatcttgatg atcgatgatt ctcatggaga agattgaaac tatttcaatg 8760

atgttgtggt agaaatcaca atatatctta ctactagata gaatagaacc tatgaggtca 8820

cacataataa aaatttgaga ttgatcagat tgttgaatga tgattaagaa ttgttacagg 8880

attcagatta tcaatataat tgataattgg actaacttgt aattattata agtagcaaag 8940

atttaattgc taaaggttag cagattcaag gaggacttat gtgtaaataa tgtacatctt 9000

aatttgattg gatcaactta gttatggcta aatttaagat gaatcaaaca gggatttagt 9060

ttaatcgaat ttgggtcaag ctttgggctt aggtcacatg cactcaaaag ggtttggatg 9120

catcaagtgt gtgacaccca aaccaagcct ccctaaacta ttttgagttg gttttgacca 9180

agtcaaaagg gtccacaccc tagggtttct tgaataaaac cctaggtgcc acattgagga 9240

ccaattagga aactttgaca ttctttcaca cggagcagca cactagggtt tcatgaaaac 9300

cctaggcacc cattttagcc ataaaaggaa agctccaagg gatgggatgg tgccatgaag 9360

aatccctggc cattgggact ccattcaaaa gttctctagg ttttgggctc ttatagagcc 9420

ctagggtttg tttgcctata aataggtcgc taccccaagg ctttagataa tgctagaggc 9480

ttgtgaagct ctctcctttc tcttgtttgc catcccacct tctctcctct ctcctccatg 9540

cctcaagact tctttcttct ctccatcatc ttgttgaaat ttagatttca atgagaagga 9600

tcaagtagag tcagagttct actgcagttc tcaaggtgtt gagaactttc ttcatcaggc 9660

aaagattctg caaaggagtt agcacctcaa agaaccaaga aagttgctaa tctgccctca 9720

tctccatgtg gatacttata gaggccaagc atgacgagaa gagccttatc acgatcatca 9780

ctcgtggaga tcatctaccc gcgcaaaggt atgagataag aaaaaaatat ttttcttatc 9840

atgattcatg aatcctttgc ttatgttaca ttgagactct tggattagat tttttctcta 9900

ataaaatttc aaagattaga tctcgaagtc ttcttcacct aaaggtattg aaagttcttt 9960

atattttcgc tactttgatt caaaatagat tagatttgtt ttgcctttca atttttctca 10020

tatttattga gatatgaagc tttaattaat gagattaata aaaagcatat gtgaaatact 10080

gagaacatcc taacaatttg agcttacaat tcacttaaac aactaatgat caaattaata 10140

atcacaatgc acaataaaaa ttcatgataa atctttttgt tgttacttta gatcaaaatc 10200

caactaatca taacatgatc cacggattgc ctatcatata tcaaaccctc tgaattatta 10260

atcttaaacg atcttttcat tcatgatcat aagatttagt taaaaatcat gaagacaact 10320

tatattgtaa tcatcataga tctgtatctt aacatcctta gtgtttacct acctatactc 10380

atcctatgtt tgattctata tatcataatt tattcactaa tactttgata tcatataaat 10440

tatcgcatcc ccaatctaag atcatattgg tactttaata tttcattagt gggggttatg 10500

cattagtact ttgatacctt atcagttgaa tggttaaaca ctggtacttt gatatcctat 10560

cagtggaggt tatacgctgg tactttaata tcctatcagt aagatggtta aatactgata 10620

ctttgataac ctcccagtgg gtgttgtatg ctagtacttt attatcctac caatggggca 10680

gttaaatgct actactttga tacgctacca atgggatagt taaacgctag taatctaatc 10740

ttagcttgac ataaagtaac gtcgactcga gtttagggtc gactcgagag aatgttaggg 10800

ttagcttgat atgaaagagg gtcgctcgtc aatattttgg agtcaactct tgtttatgga 10860

tgatctagaa agtgtcagag tgagctcgag tactgcatat ttctgataca ttgtctatgc 10920

tagaatgtgc tagaactgat tatcttcttt atcaaagttg atttttgagt aacttgatga 10980

tcaatttttc taggctagac ttgctttgtc aaaatgagca cttgttagtt tagagaatct 11040

tcacctacac atgatctcaa gcattcatta gtaccaaaaa tacttaagta ttttgatatc 11100

atcaaaatca attcttgggt taacacaata cttttcaaat aataagcata cagatataat 11160

cctataacaa tttaaatttt gttcatatat caatttcttt aaaaatatta tattcatctt 11220

gatagctatg aactaaatca aaatacatac tagtatacaa cttttactgg gagagtatta 11280

gattaccagc atttaaccat cccactggca aggtatcaaa ttaccaatac acaaccccta 11340

tttataaagt atcaaagtac cagtgttcaa ctgcctcact ggcaggatat catagtacta 11400

gtatttaact accacattga caggatatgg aattatcagt atttaaccat cattagtaga 11460

attttgatgc atagtcaggc tgcgagtcaa aatctatctc aaatcaaaat attgatcaca 11520

tgtctaattc tgtatcataa ttcattccct tatgctctaa tattatatta attgtcatac 11580

ttctagctcg agatcatgag ccaaggattg cagtaactac cgcatactta tagagaactc 11640

tttctataag catacaagat attctaaata tactatcaat atatcataga gaaattaatt 11700

taaataacta aaagttaata ttcaattaat aaattcaact ggcaaatgta tttaaaaatt 11760

ttacatcaaa taaatcttga ttaataaata ttaattaata acaatagatt taaatcgaaa 11820

caaggttgat attgttagaa tttgatgcct caagattcag cccacattga gtccacagtg 11880

aggttcgcga cgaaaaatgn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 11940

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12600

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12660

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12720

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 12780

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnaagata 12840

ttactaaatt ttgcttctaa tctcactctt aaatagtact tacctttgaa actaggcatt 12900

tgaatctgaa aaagaaagag gagattatga gcttgatagt tcagtaaatc atgaataaat 12960

tagctaaata aatctatgaa taatagtata ttaaaaataa atatgtaaga tacaataatt 13020

caaaaatgaa ttcatatata taatactttc caaataataa gtatgtggct gcaatccttt 13080

cgtaattcaa attttgttca ttaattattt ttttcaaaac atcacatgga tagtcatgaa 13140

ctaaatcaaa gtaccagtgc ataaccccta ttgataaaga atcaaataac aagtgtttga 13200

ctgcctcatt atcaggatat caaattatta atgcataacc tccactgcta gggtatcaaa 13260

gtagcaacct caatcacctc actggaaggg catctagttt cagtatttaa ctactccact 13320

ggcaaggtgt taaattatca atatttaacc tccactgata ggattttgat atatagtcag 13380

actgcgagcc aaaattcatt tcaaaccaaa atatttttct caaagacata ttttatgttt 13440

cacattgaaa aattcacaaa aattatgcga tattgaaatc aattggataa aatccacgtc 13500

aaatttagta tattcaatca taaatcattt actattctag aaaaggtata ttaaaagtat 13560

aatgcatcaa tttcataaat cataaatatc tcaatataaa aaatatttta ttatttatta 13620

ataaatctag gagaagtgaa gcattactta tcttgtaagt aaaactaacc aactgatcaa 13680

attaattctg agaatctttc tcaaaactca tcaccactat atcaaaaact tgtgcttctt 13740

gctatgtaag agcatagacc ctttcttcga tctggggttc caagtttcta ttttattttg 13800

ttcaactatc aaattagact gacttttcat ttttttgtgg atattcagct attttatggc 13860

ctttctaaca ataaccaaag tatgtaccaa tattccaaca ataatcattt attgcatgat 13920

tttcaccgca tcgaaatatt tgatattatc aatcaatcca aacttgttat tcactgacct 13980

cttattcaaa cccttagtat atttaatatt ctacctttgt gattcattca atcgatttct 14040

ttttttttat tttctttccc tttctatatg ctcttcatta acttttcttt caattatcaa 14100

tgctttattc aatacatctg tataagtagt taactcatat agtaccattt attttctaat 14160

ttctatcctc aattccaact caaatttatc tactcagtca cattcatctt caaccaatct 14220

cgaagcaaac ttgacaagct ccataaattt agcttcatat tctacaacta ttatatttct 14280

ttatttcaga taaataaatt tttattcttt ctgaatcctc atactctaag aaaaatattt 14340

ttatcataaa atatcttttg aaatcactcc caagcgagtt gttctccatc ttgttcatat 14400

ttaggtttca ttctctatta tcaattaaat gtctcatctt tcaacatgta tgatgcatat 14460

aagatttttt catcatcatg gtatctctta acaataaatg ctttctccat ctccataagc 14520

taatttttag ctcctatttc atagttttct taaaagtcaa tggagacaac ttcttaaatt 14580

ctatgatatt actttattgc tcctattgct cttatgtcct tgtggtgaca atatttattg 14640

ttgcacttgc tgtagaggca gttactgtta ctgcaattgc tattacgatt ccatcaagcc 14700

gactagtgtc tgcattattt ggataatagt tgatttttgc tactttattt agatgttggt 14760

ggcaaaatca atgacttctt tttgctgaga gatgccacca acctactaag tatcatcatc 14820

ttattggttg atacctttag cagcacctcg agtggttctt tttatctgat atggaaccat 14880

cttaatcttg catgaaaaac aaacttcgca aaattttctt ttaaaatcta atatctaata 14940

ttatactttt attaaaattt aattatgatt attttaagaa taaaaaattt aaattttgaa 15000

atcctcacaa ggctggccaa gagataatga ccatcatcct agtcggtttg acgtaggaca 15060

tccaaagatc aactataatt caagcatcat attgagatgc taggatataa tcgatggtga 15120

aatttaatga tgctcgactg atcaagatgg gggccggccc gatggcctgt tcaacaatca 15180

ttgatcaaaa ttttttaacc aaggtctatc aagatcatta aaaagtcttt ctaagatcta 15240

taaattgtaa taaagagaca caatctagag agagacactt tttacataaa gaaagtagaa 15300

attttaggga gagaaattag agagaaaggg gaaagagaga ggaagctgag aggaagaaag 15360

aaaagagaaa gactctctct ctttttcttt tctttctttt ctctcttttc tttttctttt 15420

cttttttttc ttccttttct ttctttcttt ctttggctca ttagaaaaat aggggaccta 15480

ttgatcccct tgtttcctaa ataggggagg aatctcatct tggtagctat ggccggcgat 15540

gtgagccaaa gtggcaaaat catgaatct 15569

<210> 3

<211> 3181

<212> DNA

<213> Elaeis guineensis

<400> 3

ttcaaaatga tgaacagatg catctcaagt cagcactaga ccatcttcta aaataggaag 60

atctatggaa gcaacactcc caaatgcagt ggcttcaaaa tggggattgc aatacgaagt 120

ttatccatgt ttgggcaagt aacaggaaaa aaagaatact atcactgaac tctagcaagg 180

cgatcagaag attatcgaat agcagcaaat ccaatccaca ttctacaact ttttttctac 240

cctactaggc tcgactgagg aatgactcat ccaagctgat tagaagattc tttatccaga 300

aggacctctg gatcttgctg acattgagta tccatttatg gagaaagaaa tccatgatac 360

agtgtatgac ttggctttgg aaaagtcacc cggatgatat tttcccattc tccttctata 420

tgcacttcta gtgtatcatc aaacatgacc tgatgaacct actgtaaaat cagctaatgt 480

agaccatctg aactacttgt tcatcaccct tatcccaaaa aaaaattggt gtgtattcag 540

ttagagactt caggccaata agcctgatta atggagtaat aaaaaatatt tcaaaaactc 600

tatcgaaaag gctctcacag aaaatgaatt tgttaatttt atccacagag cttgctttca 660

acaaaggaag aaatatctct gaatattttg taatgactat ggaaactata cacttctgca 720

aagctgaagt acacaaggat ctcaattata aagtcgactt cgagaaagct tttgacaatg 780

tggattggag ctttctattg aaattgctat ccagcacggg gctttgattc gaggtggtgt 840

caatggatag aatatctgat ttatacagct aaattctcag tccttattaa tggtgataaa 900

ggtaaacttt ttaaattgag gaaagatctc aggcaaggag atcctctatt cgcctagctc 960

tttctcttag ttgttgatat agaatgatca agggagcaag taggttcaat ctttttgttg 1020

gaattggatc atataatatc atgggataac ttcaaagctt ttagttcact gatgacacac 1080

ttatattttg cagatatgat ctaaaataca tcaaaactct taaattttta ctctatagtt 1140

atgagctact gatgggtctc aaaattaact ttgaaaaatt ccaatttttt ggcttgagaa 1200

ttgcaaagat gtcagtacag caagttgcat ctatcctaga aagcaaggtg gctacatttt 1260

ccattactta tttgggtctc ccactccatc attctaaact gaggaaaact tattggaatc 1320

cactccttga gaaggttcag aagaaattga tcgggtagaa aggtaaactt cttaacctct 1380

agggtaggct tatactaact aatgcagtgc ttacagggat cccactactc tggagggata 1440

cattccttct ccctcaattc attatcaaat aaattgataa aatccatcga tcattcattt 1500

ggagaggaaa cgaggagtat aactaagggc actctagaat atgttggtcg aatatttgtc 1560

gatcaaaaaa atttggagga ctgggggttc ctcaatctaa aaattttcaa tacaattctt 1620

ctttgtaaat ggtggtggaa gctctactct aatgctggtg acccgtggtg tagttttatt 1680

gccactatcc acccaacttc acactagaga tctaaaggta tacacaaatc aacctcttca 1740

ttttggaatg gtttacagca cacatgaaat atttctactc ctaatccact ttcaagttag 1800

caactagtat tattttggaa agatagttgg ttacataatc atccactgaa ggatcgattt 1860

cctcaccttt acacaatagc attgaagtgc aacaactcag tggcaaaggt attaagcaat 1920

ctacttgata atagctcttt tagtactcct cttcctcaaa gataccaaga agattttcag 1980

agtctatagg aaagcattga acaaattaca ttaacggaac gacctgatac tatacaatgg 2040

aaatggttta gtagcaatat ttttttggca tgaaggatct actattttct gcaagatgga 2100

ggagtttggc ctctactgag taatattata taaaaactcc taataccaaa gaaagccaag 2160

ttatttgctt ggctaagtgc tcacaacaaa atcccaatga aagctaatct tcttaataga 2220

ggaataattg gaactgatta ctgtacactt tgcgatgact tatcagaaac taatgatcat 2280

ctaatgctca tctatacttt ttcaaaagca atttggaatc aagtactttc agacctgcaa 2340

ttgtcgaaac ttttatgcat gcttaacacc ctatgggata cttggagact catcaatatg 2400

caacacgata gaagacctaa actagctgct ctattcgtaa ttggtcaatg gtgtctttgg 2460

aaggaaagaa ataaaagatt attcgacttc tatacttttt atccacgatc gattgctgaa 2520

actgtgtcac tttttctttc ttgggcatca cacctaacaa cggagcaact aaagatgtta 2580

gctcctgttc gagaagttct cttatctaag aatgaaaaca cacaatcttt agtgagaatt 2640

acagatgcta acaggcgcag atgaatgttt tatgagcatt tttatagctg cagcttatat 2700

gtgatctatg gtgcaaggag ttaattataa ccatggatat tagttaggtt gactatcaga 2760

aatcatctcc aatacattct atgtaaccac tgatcaattc catgttcaac tagataggaa 2820

cctgcctata tacaggtatg tccctgatgt aactatagta tactattatt cataaataaa 2880

taacgaaggt tttaccttct tctcataaaa aaaaagtatc ttcatgtcat cctatatgtc 2940

atgcatctcc tttgctactt cttttattta cttcttaaac ttggttctac catatattat 3000

cagccccttt taaatttgct tttggatatt gcatattcca ctcttcaatc acctcatgcc 3060

aagcaaaaca tttattcaca cttgaaaacc aatataagaa taccaaagaa tttatccatg 3120

aaattctaga aactttggtt ttactccttt ctccatcatt caaaaaggtt caaaatgatg 3180

a 3181

<210> 4

<211> 14184

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic predicted full EgDEF1 cDNA transcript

<400> 4

aggagagaga ggggcttggt ggctgactgt cagaagaagc ctcgatgctc gaagattaga 60

tggaagaaaa aaaaatttct caaaacttct cttttctata agagcaaacc tcactattat 120

aaatagggtt atgtatctca gtttatgatg tgaagaatta atgaaaaatt ggactttagc 180

tctatttttg taattctttc atcttctatt tttatgaaat tcaagttgag ccgattaaaa 240

gaaataatct ttctttccga ttggatcaat ccattaacta gatacttcaa aaatcaaaat 300

gacctatcta aaatcctaaa tcaaatacaa aaccaaaata actaaattaa gatagaacaa 360

actacaatta caaaaaactg gctaaagtgt ttaaatgctt ttactcctaa gtttcttctt 420

gctcaccatt aatgcttgat ctttagctgg gatcatatca gccttatgac cactataaga 480

ccaacataac aactcacttg tattgctcct ttaaaattat acaaaactag tgtctaatat 540

gtaccatgcg aatgtctgtt tctcaccaga aaatggatgg gcttcttgtg caagcacctt 600

cttcctacaa ataataaaat atgcatccct tctctcatct tactaaataa aataattaaa 660

ggctttacta tcaggaaatc tggctttatc catataattt tggaagtttt atttgaacat 720

aacattacga gtactagatt acatcaggag gtggttcctc ttatttctat taagagaaaa 780

atcaattttc ttttaagaaa gatcatttca ttttcatcag gtagcgtact ctactaatat 840

acttccacaa caatatatag ggattagatt ataggatgga ctttaaggct tcttttcgag 900

agccctgatt tctcaatcac attccctttt ctttctcatg taatggcatt taagagtgca 960

tccagggccc aacaattagt cacaagtgtt ctttttatac atggtacata tttgctattt 1020

tttagcttat tttaacttga ttgtgaagat atcatgagaa aattagattt aaagcctagc 1080

aatcttgaac ccataatttc aagttaacag gtggaagagt ccattattat gtgagaccaa 1140

cttagactgc aaaactatct gatattggac tatttactaa cacccttttt catgtgcaat 1200

gtttgtaaag agaagatata tgatgtagcg agataggata gtttggctct aatattgtgt 1260

taatattcaa accaaaatcc taagctaata gatggaagag aaatgactta tatacatgtg 1320

cattattgga tatatcttta tgggagaaat aatcacatgg atgtttatat cacacatctc 1380

atatgtgcat gttgttgtaa ggcttcaaaa gacagacgat gagattggtc ttggatcaaa 1440

ttggaatgtt tcttagttga atttggagaa gtctgcaaca aatcctataa aagaagtccc 1500

gaaattggtg gggcaccttt cgatccaaga cccttcgatg gataagtcaa ataaagcctt 1560

gagaacagat tgtggaaatg gaagaataga aggatgagaa aagagattgt gaacaaatgg 1620

agagaggact cttgtttcct tcagtggagg agttgaaaat gattcaacaa agtctccact 1680

ctatctatcc cgacttacct tatggagggt atgttaccct cctttatata gaggggtgag 1740

gaggcttgct caagttgtta ggccgttaat ttattataat agaatggtca gctatataaa 1800

gatcatggga tgtttatcca tgtgatgatt agctatagga tagctagaaa atatctaatg 1860

cttaattaga tgatagctgt cagataaccg tctgcattct tatagtacat cgatatttta 1920

tcgacgtgac tagcttaaat cagcaactga ctgaactgaa tattatgatt cttttagtta 1980

acaatcatat tggttagaga ccgatgtaat tcatagtaga tcgatcacaa gctgagatga 2040

gtatcatatt ttaagaacaa tactagcaag ttagatcgat caaatgtcag atgaaaaagt 2100

agatcagtaa acgttcgatg gaacctgaaa gaatatttat gatttagata ataatctatc 2160

atcacgtatc cagataatga gatcatataa catgtaccaa tatatgccct ccatttttca 2220

caccgaagtg aagttcttca catcgggtgt ggaaagtctc ttcagaagat ctcacctgac 2280

ctgtattgtc atcataaatg ctccatacca cgatggttgg aagtattaat tttttaatca 2340

ctcaaagtca tacacaattt cttgaaaatg atttgttgaa cttagtaatg atgagcgctt 2400

agaaaatcgg gagctcacaa ttatttgggt ggctagtccc taatgtgtat gtgctaggtg 2460

tcatactgta attggccact tcagctatca catggatcct gcttgcatgg cttaatcaag 2520

aagaggtgcg tcgcaacaac tctctgcaga accatcggat aactgacaag tggcattgat 2580

ctaatggcat atcaaatgga ttgagactgt tagtaaattt tataaatagg tctatactct 2640

gttcaaaaat tactttacta tttttttcac atgacagtct tgctgaaatt ttttcagagc 2700

ccctaacatc attggtatcg gagtagagac cccccaaagt cattggagcc ggagaagaaa 2760

gaagtaaaga agtcttttaa aagcttcctc aaattcctct ttacatatta ggcagactct 2820

ttcatcttca acttcttttc catgaacatc tgagatttta ggttttacaa tctttatttt 2880

tttttttgga tagttattcc cttttctctc tttttttttc tgtttctctt ttcccattca 2940

cctttacttt cttctttcct ttcaaaaata tcttttgata ggactaatga gataagtcag 3000

gaccaatgga tatctcggtc aacccaacca ctgctcaagt ttgagatgga aaatctatct 3060

cggacaacag ctgaagttag tacctcaggt taggatgatc tagaatctcc tataagagat 3120

tttttagatt atttcggccc aagtactgaa caatctgtcc tgaccaatct cgatctttag 3180

gaacttaaga aaaaatattc gattcagctt ataactccaa gttgggatgg taggattatt 3240

gaacctccag aaggttatgt cgtattttat gatgaggcac ttcgatctgg actttaattt 3300

ctcttacatc ctttcttcag taatgtttta gacttctata aactccatcc aatctaggtt 3360

actcccaatg ccattaggat gatcatagtt ttcattatct atcgtaaatt ttttgctata 3420

gaactaagaa tttctctctt taggatgctg gtcatcctaa gaaaacatcc ttatgaaaaa 3480

gactgatggt atttcttacc ttggcctcaa tataaattcg gtcccactct tcctttttca 3540

atacataatt gaaaaaatca ttttttcttt atttcttcta atgtttcgta gggttttatt 3600

tgtaaatagt ctaagcctaa aaccaaatgg aactcaaata acaaaatatt atctgaggat 3660

gaggagactt ttgtagagct tttagatatg aaagtatcca agttgagcct actggtgtcc 3720

aatcagtcct tgtttgacac cgacatcagt cagatctctc cttaagataa gtctgatgtt 3780

aattcttttt ctttattgct ttatcatttt tcatcatttt tcttttctaa caatcttttt 3840

ccttatatag tagcaataat gaagttcaac ctacaaaggc tggctaactc aaagaagagg 3900

aagaaggatc taaccgattg ctctcaagaa gagtaaggag actgctcctc taagatcgat 3960

tggcccccga tcatcacctg ggccaatatt aattgacata gatgctacat cgatctccac 4020

tataccacca gcaaaatcaa ctcatcaacc tactaaggtg gcttgtccac ctcctaaaga 4080

gtctgcacat ccaaagtagg catcttcccc aacacctcca acatcggcca agttagtttg 4140

gctgagcaat cagcatctga ggtcacagac tcctgatgtc aacccaccaa ctttctcatc 4200

aaaaaaaaat tgacttggcg aaggtatcac ttttggagac acccagacta ggcaaggact 4260

tgctctgtac aatgatgcct caaaaggacc tagatgctga taggagggat ctttctttgg 4320

agcaaataat aaattatgga ttcaacagta tcatgaacgt gagtcttcat tctcttccac 4380

tctcttcttt ctttttcttt ttttttttta cattggctat ttgttgatct gaatatatct 4440

ttctttttgc agtcggttgt gtatttcaag ttgctcaatg agcacttgac atggttcttc 4500

aaaaataaaa atttttttga aagagaggct caaggccaag aaagaggcca aaaaagcagt 4560

tgaggaggtc aagaaggcag taaagaagaa ggctgtcaaa gaaagcaaaa tgatggaggg 4620

gctgaagaaa cagctccaag aaaaaataga ttccattaag gagactggac aaccaatgac 4680

agatgaatga taaagatgac aagttgtaaa aacagcctga aaaaaatctc aaagttggag 4740

gccaagctga aggaggtcga gtcaataatt gaaaagcatg atgaagctct tgtcccatat 4800

tagagacaac ttgataaaga caaagagtgg atgtcaagga ttattgaaga ttataagaat 4860

tccgacactt ttcaagatga cgttactgag gcctcaaaag gagctttcaa ttatggcttt 4920

ttgagctaca ggagtttaat tatcaagctc tttcctaacc ttgatctcag caaggtcata 4980

atagaagcag ctctagaagt agtagccgaa gtgacttctg caacaactac tgagcttgct 5040

tccacttcta tcattggagt ttctccgatc gaagtcccaa acagtccaat cgaggcctcc 5100

atcatcgaag ctatttcgaa ggaatcagtc ggcaaagacc ttacctcaac tcctccaaca 5160

aataactccc aagctaaggc ctgaattatc ttcttctttt ttttctaaac atttgtatta 5220

gcccgatgtg ggcttctata aatacttttt acattaatga atgagttttt caatgtcaat 5280

attttttctt tttaactaat actaatcttg gatgatccga tctgggttgg atgtctcaaa 5340

aaatatcatt cacgatagat agttattttc tgacttcggt tagatgatta tgagtatatg 5400

taattcaacc ttggttaggt aagtaatcaa atattaacta ttctcaaacc aagtagataa 5460

cgaagtcaat gtgattaact ttaacaagta agattgttat ggaatgaaat tgaatcagat 5520

caactaacta tagataactt aatctctcat aattcactgt aaaggttcta aaagtacctt 5580

tatctaagtt cgaagtgaca agtcgggttc ttttattcgt ggatttatga cccatgctgt 5640

ctttttgtga tcttcattat taatcacctt aaatcgatat agcaaaatcc agtttataga 5700

tctgagtgct ttcttgtcag attgagtcta tcctattatc tgtgaaacct gatctagaga 5760

tcaagtattt taggtttttt atttaaggtc caattcgaag attgagtatc caatgtcata 5820

ttgttaggtc caatttggag attggatgtc tcactatcat ctcgtgaggt ccaatccaaa 5880

gatcgaatat ctcactatca tctcatgagg tccaatccag agattggatg tctcacatca 5940

tcttgtgaga tccaattcga agattggatg tctcacatca tctcatccta ttgtggttgg 6000

aatttttgta gccttagttt gactttttct gacctcattt ggacacctaa atcttattat 6060

catcgtttga tcgattttta ctaatctact ttggatgaaa aagaattctt caatggaact 6120

tttgattaga actttatctt cattgggata gaaatcgaat gctttattga aagattttat 6180

tgataataca ttctgagatt tttaatattt catgttctcg aaatgatcgt accatctaaa 6240

tttttaattc gataagctct tggatggatc acctcagtaa tctgataagg tccttcccaa 6300

ttcgggatga gtttttctta ctccattggt tttgagactt cagctcattg gagaaccaaa 6360

tctccttata aaaaatttta ggctttacct gagagttgta atatctggct actttttgtt 6420

tataaactac catatgaatc tgggcttttt ctcgagtttt ctcaaataaa ttgagatcag 6480

tcctcagttg atctgaatta ttttcttcat gaaaattttc tattctggtt gtaggtaaac 6540

tgatctcgac tagtattata gcctctgttc cgaaagtaag tttaaaagat atttctctag 6600

ttggtctctg aggtgtagtt ctgtataccc ataaaatatt ataaaattat tctaccccga 6660

gacttttagc ctcaatgagt tttattttta ggccttgaaa gatagttcta taaataaatt 6720

tagcttctcc atttgattgt agatgtccaa tcgaagtaaa tatatgatct atgtagagct 6780

cagaataaat ttttttaaaa ttttgattat caaattattg ctcattatta gtaattataa 6840

ctcaaggcaa accaaaatgg taaataatta tttttcacat aaaatctcat attttttctc 6900

agtgatttat gtcagaggtt caatttctat ccattgggta aaataatcaa tagtcacaac 6960

taaaaatttt ctttgctcca tggccattag aaaggatccc agaatatcca ttctccatat 7020

agcaaaaggc cacagcactg taatagaaat aagttcagtt gtaggctgat gttatatatt 7080

ggcgtacctt tgacactgat cgcagtactt attaataaag tcggttgaat ctttttgaat 7140

agtaggccaa taataatctt actgaattat ttcataagct aaaattttac cccccaaatg 7200

gttactagag attcctttat gaacttctcg aaggatgtaa tcagcttccg atggccttag 7260

gcataggagc agtgggagtg aatataacct ctgatataat tgattatctt gaacaacata 7320

ccatggggcc tgtcttttaa ttcttgttcc ttcgactgga tcaaccggta gaggttcttt 7380

agtaatatac tccattaatg ggtcaatgga acttagctca tattaaattt ggacaattag 7440

taaggcctcg atactagact ttttaagaat atcaataaga acaccttgat ttagtttgaa 7500

aaaatctgat gtggctaaat gagatagggc atcagctcag acattttgtc cttggtattt 7560

gcatgatctt cagattttca aagtttttta ataattcttt catattatat aaatattgaa 7620

acatcataaa atctttagct tcaaattaat ctcatacctg actgacgata aattgagaat 7680

caataaaaat tttaattttt ttaacattaa gctccttagc cattttgagt cctacaatta 7740

gcgtttcata ttctactcca ttgtttgagt gttaaaatta aatctcaaag cacgctcact 7800

aacaatgcct tctagactcg ttagaattaa actagttcta ctttctttcg aatttgaggc 7860

tccatcaatg tacagtatca aataagaatc tttgatattt ttcaattctt ttaagattgg 7920

ttcttcatta ggaatagagc attcaataat aaaatcagct aatacttaaa ctttcaatga 7980

agatcgaggc ccatattgat atcaaattca tttaattcaa tagcctattt gaatatcctt 8040

cttaaagtat caagctactg taaaattaat tttaaaggtt gatcgatcag aattataata 8100

gaatgagcct aaaaatacga tcaaagtcat cttgctaatg caatgagggt ataaattatc 8160

ttctcaattt tagaatatcg agtttcaaca tctctaaata atttatttgt ataataaatg 8220

gatctttgta tccctgcatc atttcaagct aaaatcgaac taacagcatt tgctgaaata 8280

gatagataca tgaataattt ttgacctttg atcggctttg atagtaatgg agctgtgccg 8340

agatatttct tgagatcatc gaaggctgct tgacattcat cttatcaatc gaagtctttg 8400

atctgcctta gaattttaaa gaaaggaaga tatttatcag ctgatctgaa aataaattaa 8460

ctaagcaatg ctactcatcc agtaagttgg tgtacttctt tgatggagct cggatgcttc 8520

atttcacata gagcttgaat tttcttaaga ttgactttaa ttcctctttg agttacaaaa 8580

aaatctaaaa aaatttttga agttacttca aaagcatatt tgttgggatt gagcttcatt 8640

tgatattttc gtagtctcta aaggcttctt ccagattggc aatatactga tctgactcag 8700

tattttttac taatatatca tcaacataaa ctttgatatt aatttcaatt tgttacttaa 8760

aaatcttatt aatcaagtat tagtatgtag cacctacatt tttaagatca aaagacatca 8820

ttttataaca atgcaaatct ttttcagtga tgaaggccat attttcttca tcctcaagtg 8880

ccattttgat ctgatataac cagaaaaagt atccataaag cttagtaatt tgtgtcttga 8940

agtagcatca acaagctgat caatttttga gagagaaaaa ctatctttta ggcaagcttt 9000

attgagatcg gtataatcaa catagatcct tcatttttca ttagcctttt taaccatgac 9060

aacatttaca atccactttg gatattatgc ttctctgatg aatttgtctt tcaagagttt 9120

gtcgacttcc tcatctatta ttttttatct tttcggggtg aaacttcttt tcttctgttg 9180

cattggttta tgctttggat caacattcag cttatgtaca ataagatcag ttaaaatctc 9240

aggcatatta gagactgact aaacaaagac atcggcattc atccgaagaa aagatattaa 9300

tttctccctc agatcaggct tcaatagaga tccaatttgg acagtttttt ttggatcatc 9360

acacaaaaga acagtaataa gtttctcgac tggttctcct cgatttttga tgatatcaac 9420

tttactttct tgatcaagta ttttaattgg tagagcttcc acagaccttt tcatttttac 9480

agctatcaga aaatactact tagcaagtat ctgatttcct catatttctc caactccata 9540

cttagtttgg aattggatta gtaaatgata agtgaagact atagccttaa gggcgttgag 9600

cctaggtcgg tcaagaatag cattataagc tgatggtatt ttgacaataa aaaaagtgag 9660

tcttacagtt gactggcatg gttctatccc tgcagtgacg gacaaagtga cctctccttc 9720

cacagctaca ggatttctag aaaatccaat tacgggggta ccaacctatt tagctaattt 9780

atcatattca ttctttggaa tgtatcatag aacaatatat tagcagagct ttcattatca 9840

ataagtattc tttttatatc atatttggct attgccataa agatgacaac agcatcatta 9900

cgaggagttt gaactctaac atcatcatcg aaaaatgaaa ttatgtgatc catgcactga 9960

tgctttggaa ggctttcagt aatctcagcc acctcctcag ttccgtcgag atctgagatc 10020

atattgatga ctgcagcagt agacttgttg tgatcattct cattgttggg cttctatcat 10080

tggtcagtag cttgacttgc ccgatctcga acatatttac taaagtaaca ttagtggatc 10140

aatacttcaa ttttatcttt taattatcga tgctcctcag tatcatggcc atagtctcga 10200

tggaaatgac agtattttct cttatctctc tttgctggag gggctttcat aggattaggt 10260

tggcgaatat atcctaaatc ctcgatttct atcagtatct gagctcgagg agtagatagt 10320

gaggtataga tgtcgaatca ccgaggtggg cttttgaact tcagattctt ctgaggtcgt 10380

tcagagttat cctgttggtt tttatgatct tcttcctagg gccacttttt tccatctctt 10440

tttttcttca cctaacgaag tatgcatgct ctctttcttt tcagcttgag catacttaca 10500

aacctagatc aatatttgtt cataattgtt tgggtagttc ttattaagag agaagatcag 10560

gcgattactc ttgagtcctt gcttcaaagc tgccattgca atggactcat tgaagttctt 10620

cactttcagt atggcggcat taaagcatgc cacatattct tgaagagatt caccttccta 10680

ctatttgata gtaaaaagat tgctagtatt tttcaaatga atccatttat tatcaaaata 10740

cgtgatgaat atttgctaac tgtgtgaaag atgaaataga tcatgtctgg aggtcagaga 10800

actagattct tgcagatgtt ttgagagtga ttggaaaagt gatgcaaaat agggcattag 10860

ataccccttg tagtcttata atggctctga agccttcaag atgatttaag ggattgatgg 10920

agccatcgaa tgtttccact gtaggtatct tgaatcgagg aggaactgat ttaccaagaa 10980

ttttttgaga aaaaagagat cgtaagttga aatctcttct accttgagaa tggcttccaa 11040

tctatatctc catcattttc ttctcaagat tttgaatctt ttgtccaaga ccctcctcca 11100

tacatggctt cttatgtgga gcagatttca cttcccaaga gtgatcagta tggtcaagaa 11160

gatgatcatg atgaagatct tgaggagttg gttgctaagt gtgatgtgat tggactactt 11220

ggggggctac tttttgctac cgttctgtcg tatactacag cagtaagagc ttggacctgc 11280

tgaaccaaga gactaaacta ttgtggatca ataataattg aaggttaggt attctcctga 11340

acatcttcag gagaagatga agtaggtaaa ggatgatttg gtgccttctt gttcaccatt 11400

tctactaaaa tattttaagt gcccttcctc taacactaat ctattactgc aaggcttcaa 11460

aagacaggca acgagatggg tcttgaatcg aactagaatg tttcttggtt gaatttggcg 11520

aagtctgtaa caaatcttgc aaagaaaatc tcgaaaccta cgggtacctt ctggttcaag 11580

atcctctgat ggataagtta ggtaaagtct tgagaatagg ttgtgaaaat agaagaatag 11640

aaggatgaga agagagattg tcggtaaatg gagagatgac tcttatttct ttcaatgggg 11700

gagctgaaaa taattcagca gagtttccac tctatcaatc ctgacttatt ttgtggaggg 11760

taccttggcc ccttcatata taggggatga agaggcctgg taaggttgtt agactattag 11820

gagagtttgt tagatcgtta atttattata atagaatgac cagctatata aaaatcatgg 11880

agtatttacc cacatggtga ttgactgtag tataactgaa agatagctaa tgcttagctg 11940

gatgactgct gttagataac tgtctgcatt cttacggtac attgatattt taccaatgtg 12000

acatagctta aatcggcaac tggctgaact aaatattatg tatcccttta gttaacaatc 12060

atgtcggtta gagatcaatg taattcgcag cagatcgatc ataagctgag atgagtatca 12120

tattttaaga acaacgctgg gcgagttagg ccgatcaaat gtcagactga aaaagcagat 12180

caataaacct ctgatgtgat ctgaaagaat atttatgatt taaataataa tctatcacca 12240

cgtatccaga taatgaggtc atataacatg taccaacagt gcatttttcc atctagttaa 12300

gaggttggtt agtggcattt gtcttcgata tgtaatgttc acataactaa tgtgcttagt 12360

agcattcttt tgtaaggtta aatcttcaat gatcttaagt tcacataatt gcctttgtgc 12420

cctattagtt tatagttgac cttttaattc aagagacagt caccttagca atcgatgtct 12480

gcttagattg ggccaattag gtactcacat taatatattg aatcatgttt gaatataaag 12540

gattagattg atttataagt ttccttttat tgtttacata ctgatactta gattgactta 12600

ctacattatt tgatatgtta tgttctaatt tttggattaa aattgttgtt tctgatttct 12660

ccttacatct aatactttgt ataatttatt attttttagc atgattgagt gtagaggatt 12720

agattgattt ttaagtttat tttgattatt tacatgccga tacttaaatt gacttactac 12780

attattcaat atgttatgtt tcaattattg agttaaaatt tttatttctg atttctactg 12840

atgtccagtg tgtgtgtgtg tacgtatgtg tgtatatatt tatttacata tatatgtatg 12900

tatgtataca gacatacata catacataca tacatacgta cacacacaca cacacacaca 12960

cacacacaca cacacacaca tatatatata tatatatctg tgtgtgtgtg tgtctctctc 13020

tctatatatg tataagtatg tatgtatgta tgtgtatata tatatatata tatatatata 13080

tatctatatg tgtgtatgca tgtatgtata tgtatgtatg tatatacata tatgtatata 13140

tatgtatata tatgtgtata tatgtatata tatgtgtgtg tgtgtataca tatgtataca 13200

tacatatcta tacatacata tgtatacata catacatata tatgtatata tacatataca 13260

tgtatacata catgtataca catacatgta tacatataca tgtatacata tatgtataca 13320

tatacatata tacatatata tatatatatg tatatacgtg tgtgtgtgtg tgtaagtaat 13380

taagtatgta gtgtgtgtgt gtgtgtgtat atatatttat atctgtgtgt gtgtgtatat 13440

atgtatgtat gtatgtatgt atatatatat aaatacatac atacatattt atacacacat 13500

atctatacac aaatatgtat acatatagac acacacacac gcgtgcgcgc gcgcgcgcac 13560

acacacacat atatatatat atatatagat agatagatat atgtatgtat gtatatatat 13620

atgtatatat atgtatacat atgtgtatat atgtatatat atatgtgtgt gtgtgtgtgt 13680

gtgtgtacat atgtatacat acatatctat acatatatat atatatacat atatatatac 13740

atatacatat atatatatat acataaatat atatacatat acatacatac atatatatat 13800

atatatatat atatatatat atatatatat acacatacat acatacatat acatatatac 13860

atacacacac acacatacac acatgtatac gtacatgtat gcatatacat gtatacgtac 13920

atgtatacat atacatgtat acatacatat atagatatat atatacacat atatgtatat 13980

atatatatat atatacacat atataggtta tttggaacct aagaaacttg caaagttact 14040

agatgcaatg ttcggaaacc atggaccgta acaactggag tagtatttgg gtcatgaatt 14100

catggctaga tcatgaattg agtgggagtc aaccgaagta gggccagctc agacacttgt 14160

atttaggtcc catgcttgcg tgca 14184

<210> 5

<211> 678

<212> DNA

<213> Elaeis guineensis

<400> 5

atggggaggg ggaagataga gatcaagaag atagagaatc ctacaaacag gcaggtgacc 60

tactccaaga ggaggacggg gatcatgaag aaggctaagg aactgacggt gctttgcgat 120

gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180

ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240

agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300

ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360

ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420

catgtgatca ccacgcagac ggatacctac aagaaaaagt tgaagaactc taatgaagct 480

cacaaaaatt tactgcatga acttgaaatg aaggacgagc acccagttta tggttttgtg 540

gatgatgacc ctagcaacta cgcaggtgca ctggctcttg ccaatggggc ttcccacatg 600

tatgctttcc gtgttcagcc gagccagccg aatctccatc gaatggggtt tggctcccat 660

gacctgcgcc ttgcttga 678

<210> 6

<211> 225

<212> PRT

<213> Artificial Sequence

<220>

<223> synthetic

<400> 6

Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn

1 5 10 15

Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala

20 25 30

Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe

35 40 45

Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr

50 55 60

Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp

65 70 75 80

Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu

85 90 95

Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp

100 105 110

Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu

115 120 125

Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr

130 135 140

Thr Gln Thr Asp Thr Tyr Lys Lys Lys Leu Lys Asn Ser Asn Glu Ala

145 150 155 160

His Lys Asn Leu Leu His Glu Leu Glu Met Lys Asp Glu His Pro Val

165 170 175

Tyr Gly Phe Val Asp Asp Asp Pro Ser Asn Tyr Ala Gly Ala Leu Ala

180 185 190

Leu Ala Asn Gly Ala Ser His Met Tyr Ala Phe Arg Val Gln Pro Ser

195 200 205

Gln Pro Asn Leu His Arg Met Gly Phe Gly Ser His Asp Leu Arg Leu

210 215 220

Ala

225

<210> 7

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 7

aaattaatat tgcaaactag ctcaaaataa ttttgatcac tacatttctg ctgtgcattc 60

t 61

<210> 8

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 8

actacatttt aacaccaagc tcgataatag tgataaagaa acatctagat cagctttata 60

a 61

<210> 9

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 9

tgcatgcata gctagaagag aatcttatca cgatcatcac tcgtgaagat catctacctg 60

t 61

<210> 10

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 10

gctcgagtac tgcatatttc tgatacattg tctatgctag aatgtgctag aactgattat 60

c 61

<210> 11

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 11

tatattaatt gtcatacttc tagctcgaga tcatgagcca aggattgcag taactaccgc 60

a 61

<210> 12

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 12

ggaatctcat cttggtagct atggccggcg atgtgagcca aagtggcaaa atcatgaatc 60

t 61

<210> 13

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 13

tataactaat ctccaactct gccgactcct tagtagtatg agcacatgga aagcttgacc 60

t 61

<210> 14

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 14

ataaatgagt gatagattct aatccagaga caaagagcac acctcgaatt cacttgccat 60

c 61

<210> 15

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 15

aagaagaact aatacagctt tcatcacttc aaaatgatga acagatgcat ctcaagtcag 60

c 61

<210> 16

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 16

ttgatataga atgatcaagg gagcaagtag gttcaatctt tttgttggaa ttggatcata 60

t 61

<210> 17

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 17

ggcgcagatg aatgttttat gagcattttt atagctgcag cttatatgtg atctatggtg 60

c 61

<210> 18

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 18

atttgctttt ggatattgca tattccactc ttcaatcacc tcatgccaag caaaacattt 60

a 61

<210> 19

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 19

cggttgcatg ccctgcagag tttgactcat gaggcatgca aggtattgaa tagtagtcta 60

g 61

<210> 20

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 20

cgtcagctgc tcaatcatgg attctgatag ctcaaatggt ggtaagtaga aagagagaga 60

t 61

<210> 21

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 21

aagattgtgc aactcatgaa gattgtctcc agattgaaga taatttcaat acaagcacaa 60

a 61

<210> 22

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 22

atcggtggat caaatgataa tacttatgat agaaacataa tcaatccact taggactata 60

c 61

<210> 23

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 23

ttgaggagat taatctgacg caaggaaaaa agaagagctg acaactagcc aatgatcgag 60

a 61

<210> 24

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 24

tgatctcagc aaggtcataa tagaagcagc tctagaagta gtagccgaag tgacttctgc 60

a 61

<210> 25

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 25

atattttcgt agtctctaaa ggcttcttcc agattggcaa tatactgatc tgactcagta 60

t 61

<210> 26

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 26

atagctaatg cttagctgga tgactgctgt tagataactg tctgcattct tacggtacat 60

t 61

<210> 27

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 27

aattattgag ttaaaatttt tatttctgat ttctactgat gtccagtgtg tgtgtgtgta 60

c 61

<210> 28

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 28

tcttcctcag atgacatgtg atttatgcta cggcctagtt ctaaggactt ttctctgtca 60

t 61

<210> 29

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 29

cctagattaa tgctgttatt ggatgctggc agtcagatga agattatgtt tgattgtacc 60

t 61

<210> 30

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 30

taaatgagtg ctcatagtga caatgtttag cctccacgta taatgtgtgc cagctaacta 60

g 61

<210> 31

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 31

atcctctttt gtggctcaca acctcctctc ctttttatgt tctatgttcc tcacatcaca 60

t 61

<210> 32

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 32

atcctttcaa tctcataaga agttaaatga catggatgac atgaagcttt gatatgcatc 60

g 61

<210> 33

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 33

accatcaaat ggcttttgga aatatgcggg cgcagaagta gaggtgtcct atatgaaggc 60

t 61

<210> 34

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 34

gacgagggat cacaccaaca tcatatgctc tcctcaccat accaaatggt atccccaact 60

a 61

<210> 35

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 35

aaatctatta gtatctgaca aaagttaaat tagagtcgaa acactaaatg acaattaggg 60

atcaacttga tcaagtagat agagaatatt agaaaagaga gaaattaaca agatagaaca 120

tgattaatta ggtgacatag cccgacaatc caattggtct aagcaagttg atttaatcaa 180

atcacggttg aactaatata tagatagctc aataaaaatc atacataatt gaatctaatg 240

atatttggat ctgaccaaga tggaatttga catgctgtcc gatgatcgtg aatcaagact 300

ctctttgcta attaagatca aattagaatc attgaaagag aatcttttac tggatcaaga 360

gagagaaata tataaagaga gtgaaatagt ctatagaaaa aaattttaga gagagaaatt 420

aagaagaaaa aataaatttt ttagagaaag aaagtgggta tacaagctca gagaagggag 480

agaggaaaga gagagaaatg ctctcttatt ttcttttttt tcttttttct tcttttcttt 540

tttttttcct attcttcttt cccttttctg cttaatggaa taggggacct cccattcccc 600

ttctatttct agagttgggg gctcaaaatt gatgatagct atcattgggg atgtaggcta 660

tggtgatgca gtagaggatc accgaccgat gatcgatggt gatgttgcaa tcaaaaaatc 720

aagaaagata gatggaaaat aaaggaaaat aaggagaaat agatctcaac ttgtttggat 780

gctaacccac tcactgacga ctccacttca actatggccg gagcttgcta tggaaaagaa 840

gccaaggcct tcaaggatga acaccaatgg tgaggaagat ggtcgaaaat agaagaatgg 900

ctggcttttc taatcgacaa aatagggtat cgcccttctt agcaaatatt cggcaataaa 960

tatctagaat ccaggatcct aggactatgg aagagggaga ggagggcaag tcaaaggatg 1020

ccagattctt atctagcttc cgacaatgat ggggccctat tttcgataaa cacaattgag 1080

gatgttcgga aaagggtttt ttcgatgatg attctagtga ccaactatga gatttcaaag 1140

ggggtgaggg gggtttaaat aagatgggag ggaagtttga atcctcctta aatctgaacc 1200

tttttcgaca aagccaagag cgtgaaggag actccttcgt gaagtcaaag atggaataga 1260

ctcccttcgg gagtttggtt catcacccaa cttccctagc atgtgcggag tatgtgctag 1320

ccttttctct cttttttttt catttttttt catcctttaa gatccatgca gtttctaggt 1380

tgagggattg gggtatcaca ttctctctcc taaaaaaaaa ttattttcaa aattttttta 1440

cctatatttt caaaagttgg gattcatggt ccaaatctca tccttgaatt tttttgatat 1500

tctaattctc gaaaaaattt catcgttaaa tcatttcata agagaaaagt caatacctca 1560

agagttgatc tgaatcaaaa ttattatctc tagtaatcga aatcaatatc ttaatttcaa 1620

ataagaatat ccagtttatt gtcaaaatta ttaactactc ttgacttaat tgatctatta 1680

cataatcgta aataaattct aacatactct tgaagtgtag aatataagat tgataaacaa 1740

tcctatatcc gttctaatag atataaaagc ataaacttta aatattttaa atccaagatt 1800

aagaatcaat gatccactta tcctagactc aagatattag aaattttttt ttgtacaata 1860

gatagaggat gtactggtga aaatcatgta gcgatatcca aaataatttt taattaaaaa 1920

tattatcctt ttcattatca atgaatttta tctataagaa agatcaaatc atatgatcca 1980

tcttaaattt ttaactcaaa aaattaatat tgcaaactag ctcaaaataa ttttgatcac 2040

tacatttctg ctgtgcattc taatttaaac cgttcacatt ttttagattc atgaaataat 2100

tttgaccaaa gtattactcc atactatagt caaaaaagat taaaatatta gattctaatt 2160

aaagccaaag ataaactttt gattctcatc cttaattttg cctaaagtat aattattttg 2220

attaaccctt aagcgcaata acacattcaa aaccaacaga taggtttact ataatccaaa 2280

tgaattaaat cttaattctt ttatcaattc atttagacaa tttcaaatca aaattctata 2340

agtaatatca ataaaaaaaa tttttgatgc tccaataagt tagaacttaa atcaaaatat 2400

ataagtaaaa ttgatttaat catctcttct aaagtttctt ctattaagat ctttaatatc 2460

tatcaaatac attccacaat aatcatgcaa accttttaaa aattaaattc tcaatgcctt 2520

tactacattt taacaccaag ctcgataata gtgataaaga aacatctaga tcagctttat 2580

aatcaaaaat tttgacttac aattttacgt gtgtctcaaa atcttgaata aatataaata 2640

agatctttta tcttgatcca aaaatagtaa tcaaggattt cattagtaac ttcaacaaca 2700

atggtaaaaa aattttctat ccattgataa acccaaattt tgaattgaag tttcatgcat 2760

accatatagc ctttaataag atctattatt tggatctaaa gatagtaatt aaaattgtta 2820

atgattccac taagatgaat actttacaat ctcataatta atttcttcaa taaaaataga 2880

cttcttgata atgtctccaa ttgtatattt ttttttattt ctacaagaaa acttcataca 2940

ttttttacgt tccaatataa atcttaaaaa gttattccaa tcaaatatca taaaagatct 3000

tcttagtcca accttaaata acttttatga atgaatcttt atcttgccac taaataatga 3060

attttaaaat caagagcaac atcacagcat tctgtcatgt caaatttgtg ttagatgtat 3120

gtcctagaaa tcaattagat tgacaatgta aattttttaa ggatataatt tatatatttt 3180

gatttattaa taaaataaaa tttaaattaa tttttattca tattttttta tctatgaatc 3240

atctaaagaa ttaataagat gatgatacat attcttaaga gttcaaaatt tgaaatatat 3300

gtcattgatg attaatttct gaatactttt gaattcttaa gagtttagaa gatcttgacc 3360

caagtagtgt gaatagtgaa aaaaagtttt cacatacttc acatcaaaaa tttaagttga 3420

ataaattgta catatgacag gtattatagt ttgacgagta atctataacc tctatcttat 3480

caaaattctg atagaaagat tgtattgtat gataactgta cttagaggtt caccttttat 3540

tttactggat taccactaca tgttgctaga tgtcactggt ggattgtgag atctacgaag 3600

attatcttga tgatcgataa ttctcattga aaagattgaa actattttaa tgatgttgtg 3660

atagagatca taatatatct tattatcaga cagaatagaa ttctatggga tcatacacaa 3720

taggagatta agactgatca aatagttgaa tgatgattaa gaatcattac ggagttcaga 3780

ttatcaatat aattgataat tagactaact tataattgtt acaagtagca aggacttaac 3840

tgctaaaggt taataggttc aaaaagaact tatgtataaa tgttgtgcat cttaatttga 3900

ttggatcaaa ttagttatgg ctgaattcaa gatgaatcaa ataggaattt ggttcaattg 3960

aatttgggtc aagctttagg cttaggtcac atatacccaa aatcatttgg atgcatcagg 4020

tgtgtgacac ctgaatcagg cctttctaaa ctattttgag t 4061

<210> 36

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 36

cttttttctt cttttctttt ttttttccta ttcttctttc ccttttctgc ttaatggaat 60

aggggacctc ccattcccct tctatttcta gagttggggg ctcaaaattg atgatagcta 120

tcattgggga tgtaggctat ggtgatgcag tagaggatca ccgaccgatg atcgatggtg 180

atgttgcaat caaaaaatca agaaagatag atggaaaata aaggaaaata aggagaaata 240

gatctcaact tgtttggatg ctaacccact cactgacgac tccacttcaa ctatggccgg 300

agcttgctat ggaaaagaag ccaaggcctt caaggatgaa caccaatggt gaggaagatg 360

gtcgaaaata gaagaatggc tggcttttct aatcgacaaa atagggtatc gcccttctta 420

gcaaatattc ggcaataaat atctagaatc caggatccta ggactatgga agagggagag 480

gagggcaagt caaaggatgc cagattctta tctagcttcc gacaatgatg gggccctatt 540

ttcgataaac acaattgagg atgttcggaa aagggttttt tcgatgatga ttctagtgac 600

caactatgag atttcaaagg gggtgagggg ggtttaaata agatgggagg gaagtttgaa 660

tcctccttaa atctgaacct ttttcgacaa agccaagagc gtgaaggaga ctccttcgtg 720

aagtcaaaga tggaatagac tcccttcggg agtttggttc atcacccaac ttccctagca 780

tgtgcggagt atgtgctagc cttttctctc tttttttttc attttttttc atcctttaag 840

atccatgcag tttctaggtt gagggattgg ggtatcacat tctctctcct aaaaaaaaat 900

tattttcaaa atttttttac ctatattttc aaaagttggg attcatggtc caaatctcat 960

ccttgaattt ttttgatatt ctaattctcg aaaaaatttc atcgttaaat catttcataa 1020

gagaaaagtc aatacctcaa gagttgatct gaatcaaaat tattatctct agtaatcgaa 1080

atcaatatct taatttcaaa taagaatatc cagtttattg tcaaaattat taactactct 1140

tgacttaatt gatctattac ataatcgtaa ataaattcta acatactctt gaagtgtaga 1200

atataagatt gataaacaat cctatatccg ttctaataga tataaaagca taaactttaa 1260

atattttaaa tccaagatta agaatcaatg atccacttat cctagactca agatattaga 1320

aatttttttt tgtacaatag atagaggatg tactggtgaa aatcatgtag cgatatccaa 1380

aataattttt aattaaaaat attatccttt tcattatcaa tgaattttat ctataagaaa 1440

gatcaaatca tatgatccat cttaaatttt taactcaaaa aattaatatt gcaaactagc 1500

tcaaaataat tttgatcact acatttctgc tgtgcattct aatttaaacc gttcacattt 1560

tttagattca tgaaataatt ttgaccaaag tattactcca tactatagtc aaaaaagatt 1620

aaaatattag attctaatta aagccaaaga taaacttttg attctcatcc ttaattttgc 1680

ctaaagtata attattttga ttaaccctta agcgcaataa cacattcaaa accaacagat 1740

aggtttacta taatccaaat gaattaaatc ttaattcttt tatcaattca tttagacaat 1800

ttcaaatcaa aattctataa gtaatatcaa taaaaaaaat ttttgatgct ccaataagtt 1860

agaacttaaa tcaaaatata taagtaaaat tgatttaatc atctcttcta aagtttcttc 1920

tattaagatc tttaatatct atcaaataca ttccacaata atcatgcaaa ccttttaaaa 1980

attaaattct caatgccttt actacatttt aacaccaagc tcgataatag tgataaagaa 2040

acatctagat cagctttata atcaaaaatt ttgacttaca attttacgtg tgtctcaaaa 2100

tcttgaataa atataaataa gatcttttat cttgatccaa aaatagtaat caaggatttc 2160

attagtaact tcaacaacaa tggtaaaaaa attttctatc cattgataaa cccaaatttt 2220

gaattgaagt ttcatgcata ccatatagcc tttaataaga tctattattt ggatctaaag 2280

atagtaatta aaattgttaa tgattccact aagatgaata ctttacaatc tcataattaa 2340

tttcttcaat aaaaatagac ttcttgataa tgtctccaat tgtatatttt tttttatttc 2400

tacaagaaaa cttcatacat tttttacgtt ccaatataaa tcttaaaaag ttattccaat 2460

caaatatcat aaaagatctt cttagtccaa ccttaaataa cttttatgaa tgaatcttta 2520

tcttgccact aaataatgaa ttttaaaatc aagagcaaca tcacagcatt ctgtcatgtc 2580

aaatttgtgt tagatgtatg tcctagaaat caattagatt gacaatgtaa attttttaag 2640

gatataattt atatattttg atttattaat aaaataaaat ttaaattaat ttttattcat 2700

atttttttat ctatgaatca tctaaagaat taataagatg atgatacata ttcttaagag 2760

ttcaaaattt gaaatatatg tcattgatga ttaatttctg aatacttttg aattcttaag 2820

agtttagaag atcttgaccc aagtagtgtg aatagtgaaa aaaagttttc acatacttca 2880

catcaaaaat ttaagttgaa taaattgtac atatgacagg tattatagtt tgacgagtaa 2940

tctataacct ctatcttatc aaaattctga tagaaagatt gtattgtatg ataactgtac 3000

ttagaggttc accttttatt ttactggatt accactacat gttgctagat gtcactggtg 3060

gattgtgaga tctacgaaga ttatcttgat gatcgataat tctcattgaa aagattgaaa 3120

ctattttaat gatgttgtga tagagatcat aatatatctt attatcagac agaatagaat 3180

tctatgggat catacacaat aggagattaa gactgatcaa atagttgaat gatgattaag 3240

aatcattacg gagttcagat tatcaatata attgataatt agactaactt ataattgtta 3300

caagtagcaa ggacttaact gctaaaggtt aataggttca aaaagaactt atgtataaat 3360

gttgtgcatc ttaatttgat tggatcaaat tagttatggc tgaattcaag atgaatcaaa 3420

taggaatttg gttcaattga atttgggtca agctttaggc ttaggtcaca tatacccaaa 3480

atcatttgga tgcatcaggt gtgtgacacc tgaatcaggc ctttctaaac tattttgagt 3540

aagtttgatc aagtcaaaag gatccacacc ctaaggtttc ttgaataaaa ccttaggcac 3600

cacattgagg acctatagga aactttgacc ctctctcata tggggtggca cactgaggtt 3660

ttataaaaac cttaggcacc cattttagcc ataaaaaaaa agctccaagg gatggggcag 3720

tagccatgaa gaatccttgg ctgtcaggac tctattcaaa agagttctca aggttttgga 3780

ctcttatgga gccctaggat ttgtttgcct ataaatagat ggccacccca aggctttaga 3840

taatgttaga gacttgtgaa gctctcccct ttctcttggt tgccggccca ccctctctcc 3900

tctctcttcc atgccccaag acttctttct tgtctccatc atcttgctga aatttagatt 3960

tcagcaagaa aagtcaagta gaagtcaaag ttctaatgta gctcacaaga tgttgagaac 4020

ttcctccatc tggcaaaggt tctgcaagag agctagcatc c 4061

<210> 37

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 37

tcttttatct tgatccaaaa atagtaatca aggatttcat tagtaacttc aacaacaatg 60

gtaaaaaaat tttctatcca ttgataaacc caaattttga attgaagttt catgcatacc 120

atatagcctt taataagatc tattatttgg atctaaagat agtaattaaa attgttaatg 180

attccactaa gatgaatact ttacaatctc ataattaatt tcttcaataa aaatagactt 240

cttgataatg tctccaattg tatatttttt tttatttcta caagaaaact tcatacattt 300

tttacgttcc aatataaatc ttaaaaagtt attccaatca aatatcataa aagatcttct 360

tagtccaacc ttaaataact tttatgaatg aatctttatc ttgccactaa ataatgaatt 420

ttaaaatcaa gagcaacatc acagcattct gtcatgtcaa atttgtgtta gatgtatgtc 480

ctagaaatca attagattga caatgtaaat tttttaagga tataatttat atattttgat 540

ttattaataa aataaaattt aaattaattt ttattcatat ttttttatct atgaatcatc 600

taaagaatta ataagatgat gatacatatt cttaagagtt caaaatttga aatatatgtc 660

attgatgatt aatttctgaa tacttttgaa ttcttaagag tttagaagat cttgacccaa 720

gtagtgtgaa tagtgaaaaa aagttttcac atacttcaca tcaaaaattt aagttgaata 780

aattgtacat atgacaggta ttatagtttg acgagtaatc tataacctct atcttatcaa 840

aattctgata gaaagattgt attgtatgat aactgtactt agaggttcac cttttatttt 900

actggattac cactacatgt tgctagatgt cactggtgga ttgtgagatc tacgaagatt 960

atcttgatga tcgataattc tcattgaaaa gattgaaact attttaatga tgttgtgata 1020

gagatcataa tatatcttat tatcagacag aatagaattc tatgggatca tacacaatag 1080

gagattaaga ctgatcaaat agttgaatga tgattaagaa tcattacgga gttcagatta 1140

tcaatataat tgataattag actaacttat aattgttaca agtagcaagg acttaactgc 1200

taaaggttaa taggttcaaa aagaacttat gtataaatgt tgtgcatctt aatttgattg 1260

gatcaaatta gttatggctg aattcaagat gaatcaaata ggaatttggt tcaattgaat 1320

ttgggtcaag ctttaggctt aggtcacata tacccaaaat catttggatg catcaggtgt 1380

gtgacacctg aatcaggcct ttctaaacta ttttgagtaa gtttgatcaa gtcaaaagga 1440

tccacaccct aaggtttctt gaataaaacc ttaggcacca cattgaggac ctataggaaa 1500

ctttgaccct ctctcatatg gggtggcaca ctgaggtttt ataaaaacct taggcaccca 1560

ttttagccat aaaaaaaaag ctccaaggga tggggcagta gccatgaaga atccttggct 1620

gtcaggactc tattcaaaag agttctcaag gttttggact cttatggagc cctaggattt 1680

gtttgcctat aaatagatgg ccaccccaag gctttagata atgttagaga cttgtgaagc 1740

tctccccttt ctcttggttg ccggcccacc ctctctcctc tctcttccat gccccaagac 1800

ttctttcttg tctccatcat cttgctgaaa tttagatttc agcaagaaaa gtcaagtaga 1860

agtcaaagtt ctaatgtagc tcacaagatg ttgagaactt cctccatctg gcaaaggttc 1920

tgcaagagag ctagcatcct gagaaacaaa aagattgctg atcagccctc atctccatat 1980

ggatatttgt agagatcaaa tgcatgcata gctagaagag aatcttatca cgatcatcac 2040

tcgtgaagat catctacctg tgcaaaggta tgagataaga aaaatatttt ttttatcata 2100

attcatgaat cctttgctta tattatactg agattcttgg aatggatttt ttctctagta 2160

aaactctaga gatcagatct caaagtcttc ttcacataaa ggttttgaaa gttctttata 2220

tttccgctgc tttgattcaa aataaattag atctattttg cctttcaacc tttctcatat 2280

ttattgacat ataaagcttt aattaatgag attaatgaaa agcatgtgcg aaatactgag 2340

aaaatcctaa cagtgatatc agagctactt ttgtacataa gaaaaggatt caagttaaat 2400

aaaatatgtt tgatttaagt aaatgaatca atcaaaattt atcctaacat aagtttgtcc 2460

tggtataatg gtcaagacca ttatgttgaa aggttatcct aggacaaaaa gtctaagtaa 2520

aatctatttt atttaagtaa atgaatcaat taaagtttat tctaatataa gattgcctta 2580

gcataatggt gaagaccctt atgttgaaag gttgtcctag gatggaaagt gattgatgag 2640

acaaatatat catgaaagta tttttcacag atggaataaa atatatatat tttgtttgtg 2700

aaaatgagat ttcatgaatg tgtttgtcat tcaatatgtg tggtgatcat cttgaattgc 2760

cacaaatcct ttttggatta gggttgtatc atgactcaca aatcctgatg gtttgcaaaa 2820

ttttgcattc tgtagtgata gaaaccaaaa gttaatccaa ttttggaata agattgatca 2880

attggtatct aaggcaagta ttttataatg gtggttactt aattagttat aaaagtacga 2940

agagtctcct accaatctta cacttatcta gccaatttgg ttgattgaat tctgaatttg 3000

ggttgcttaa gtgttaagtt cactacaaat atattgcaac catgattccg acttagtcaa 3060

ccaagcctag atctcttgaa tagattcatg ttaattatgg atttacatag gatataaata 3120

aataattaaa acttgaagag atctaaatga aaccttctcg tacatattaa atcgaatgat 3180

cttccatcat tgtagatata cggatactct actgatgttg atgattttcg actagatata 3240

gtactttggt tgcatcgaaa aagtacaacc actttataac atgagatgtt gcagggtaga 3300

gatggggttg ggcccaataa ttgttaggtg aggatccaaa tgatggctgc acttgcgtgt 3360

gaatggcgag tctgacttaa ttaagaaata gagctaataa ctattagatg aggcttcagg 3420

acttagagac ttatgaccac tacaacttac ttgagaagca atggataaag agtcgtctat 3480

ttatcaactg acgcatcacc aataactatc agatggagtg atgtataatt agtgggacta 3540

tagtatccac ttgaaatctt aatcgtaaaa atttttgttt ctccacctga agagcatggg 3600

agattcgaaa aaatagtggg ggtagtttat ttttaaaata aagctcctaa aataaactaa 3660

aataagttaa atacaaagtc taactagaat cttcttctct ctgtagaaaa tatctgcttc 3720

caacctctat ttcatatcct taagactaat tgtttgacta gacccagtta taaagattga 3780

ctctaaaact taaagatagt cttgagtttt gaaaagatga gctatgtcct ggatcaagat 3840

atcctctctc taccagcttg tcccacccct aatcaagggg catcctatga aaagtggtta 3900

aacgatgata acaaggcttg gtgctgtgtg ctgacatcta tgtccattga actccaatgc 3960

cagcataagg gtacaaactg tccaaggtat attgactcat ctacaagagt tatatagtga 4020

gtagagccat gtatctcact aggaagtatt taagagactc t 4061

<210> 38

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (3017)..(3951)

<223> n is a, c, g, or t

<400> 38

cagattatca atataattga taattggact aacttgtaat tattataagt agcaaagatt 60

taattgctaa aggttagcag attcaaggag gacttatgtg taaataatgt acatcttaat 120

ttgattggat caacttagtt atggctaaat ttaagatgaa tcaaacaggg atttagttta 180

atcgaatttg ggtcaagctt tgggcttagg tcacatgcac tcaaaagggt ttggatacat 240

caagtgtgtg acacccaaac caagcctccc taaactattt tgagttggtt ttgaccaagt 300

caaaagggtc cacaccctag ggtttcttga ataaaaccct aggtgccaca ttgaggacca 360

attaggaaac tttgacattc tttcacacgg agcagcacac tagggtttca tgaaaaccct 420

aggcacccat tttagccata aaaggaaagc tccaagggat gggatggtgc catgaagaat 480

ccctggccat tgggactcca ttcaaaagtt ctctaggttt tgggctctta tagagcccta 540

gggtttgttt gcctataaat aggtcgctac cccaaggctt tagataatgc tagaggcttg 600

tgaagctctc tcctttctct tgtttgccat cccaccttct ctcctctctc ctccatgcct 660

caagacttct ttcttctctc catcatcttg ttgaaattta gatttcaatg agaaggatca 720

agtagagtca gagttctact gcagttctca aggtgttgag aactttcttc atcaggcaaa 780

gattctgcaa aggagttagc acctcaaaga accaagaaag ttgctaatct gccctcatct 840

ccatgtggat acttatagag gccaagcatg acgagaagag ccttatcacg atcatcactc 900

gtggagatca tctacccgcg caaaggtatg agataagaaa aaaatatttt tcttatcatg 960

attcatgaat cctttgctta tgttacattg agactcttgg attagatttt ttctctaata 1020

aaatttcaaa gattagatct cgaagtcttc ttcacctaaa ggtattgaaa gttctttata 1080

ttttcgctac tttgattcaa aatagattag atttgttttg cctttcaatt tttctcatat 1140

ttattgagat atgaagcttt aattaatgag attaataaaa agcatatgtg aaatactgag 1200

aacatcctaa caatttgagc ttacaattca cttaaacaac taatgatcaa attaataatc 1260

acaatgcaca ataaaaattc atgataaatc tttttgttgt tactttagat caaaatccaa 1320

ctaatcataa catgatccac ggattgccta tcatatatca aaccctctga attattaatc 1380

ttaaacgatc ttttcattca tgatcataag atttagttaa aaatcatgaa gacaacttat 1440

attgtaatca tcatagatct gtatcttaac atccttagtg tttacctacc tatactcatc 1500

ctatgtttga ttctatatat cataatttat tcactaatac tttgatatca tataaattat 1560

cgcatcccca atctaagatc atattggtac tttaatattt cattagtggg ggttatgcat 1620

tagtactttg ataccttatc agttgaatgg ttaaacactg gtactttgat atcctatcag 1680

tggaggttat acgctggtac tttaatatcc tatcagtaag atggttaaat actgatactt 1740

tgataacctc ccagtgggtg ttgtatgcta gtactttatt atcctaccaa tggggcagtt 1800

aaatgctact actttgatac gctaccaatg ggatagttaa acgctagtaa tctaatctta 1860

gcttgacata aagtaacgtc gactcgagtt tagggtcgac tcgagagaat gttagggtta 1920

gcttgatatg aaagagggtc gctcgtcaat attttggagt caactcttgt ttatggacga 1980

tctagaaagt gtcagagtga gctcgagtac tgcatatttc tgatacattg tctatgctag 2040

aatgtgctag aactgattat cttctttatc aaagttgatt tttgagtaac ttgatgatca 2100

atttttctag gctagacttg ctttgtcaaa atgagcactt gttagtttag agaatcttca 2160

cctacacatg atctcaagca ttcattagta ccaaaaatac ttaagtattt tgatatcatc 2220

aaaatcaatt cttgggttaa cacaatactt ttcaaataat aagcatacag atataatcct 2280

ataacaattt aaattttgtt catatatcaa tttctttaaa aatattatat tcatcttgat 2340

agctatgaac taaatcaaaa tacatactag tatacaactt ttactgggag agtattagat 2400

taccagcatt taaccatccc actggcaagg tatcaaatta ccaatacaca acccctattt 2460

ataaagtatc aaagtaccag tgttcaactg cctcactggc aggatatcat agtactagta 2520

tttaactacc acattgacag gatatggaat tatcagtatt taaccatcat tagtagaatt 2580

ttgatgcata gtcaggctgc gagtcaaaat ctatctcaaa tcaaaatatt gatcacatgt 2640

ctaattctgt atcataattc attcccttat gctctaatat tatattaatt gtcatacttc 2700

tagctcgaga tcatgagcca aggattgcag taactaccgc atacttatag agaactcttt 2760

ctataagcat acaagatatt ctaaatatac tatcaatata tcatagagaa attaatttaa 2820

ataactaaaa gttaatattc aattaataaa ttcaactggc aaatgtattt aaaaatttta 2880

catcaaataa atcttgatta ataaatatta attaataaca atagatttaa atcgaaacaa 2940

ggttgatatt gttagaattt gatgcctcaa gattcagccc acattgagtc cacagtgagg 3000

ttcgcgacga aaaatgnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagatattac 3960

taaattttgc ttctaatctc actcttaaat agtacttacc tttgaaacta ggcatttgaa 4020

tctgaaaaag aaagaggaga ttatgagctt gatagttcag t 4061

<210> 39

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (2337)..(3271)

<223> n is a, c, g, or t

<400> 39

catcatcttg ttgaaattta gatttcaatg agaaggatca agtagagtca gagttctact 60

gcagttctca aggtgttgag aactttcttc atcaggcaaa gattctgcaa aggagttagc 120

acctcaaaga accaagaaag ttgctaatct gccctcatct ccatgtggat acttatagag 180

gccaagcatg acgagaagag ccttatcacg atcatcactc gtggagatca tctacccgcg 240

caaaggtatg agataagaaa aaaatatttt tcttatcatg attcatgaat cctttgctta 300

tgttacattg agactcttgg attagatttt ttctctaata aaatttcaaa gattagatct 360

cgaagtcttc ttcacctaaa ggtattgaaa gttctttata ttttcgctac tttgattcaa 420

aatagattag atttgttttg cctttcaatt tttctcatat ttattgagat atgaagcttt 480

aattaatgag attaataaaa agcatatgtg aaatactgag aacatcctaa caatttgagc 540

ttacaattca cttaaacaac taatgatcaa attaataatc acaatgcaca ataaaaattc 600

atgataaatc tttttgttgt tactttagat caaaatccaa ctaatcataa catgatccac 660

ggattgccta tcatatatca aaccctctga attattaatc ttaaacgatc ttttcattca 720

tgatcataag atttagttaa aaatcatgaa gacaacttat attgtaatca tcatagatct 780

gtatcttaac atccttagtg tttacctacc tatactcatc ctatgtttga ttctatatat 840

cataatttat tcactaatac tttgatatca tataaattat cgcatcccca atctaagatc 900

atattggtac tttaatattt cattagtggg ggttatgcat tagtactttg ataccttatc 960

agttgaatgg ttaaacactg gtactttgat atcctatcag tggaggttat acgctggtac 1020

tttaatatcc tatcagtaag atggttaaat actgatactt tgataacctc ccagtgggtg 1080

ttgtatgcta gtactttatt atcctaccaa tggggcagtt aaatgctact actttgatac 1140

gctaccaatg ggatagttaa acgctagtaa tctaatctta gcttgacata aagtaacgtc 1200

gactcgagtt tagggtcgac tcgagagaat gttagggtta gcttgatatg aaagagggtc 1260

gctcgtcaat attttggagt caactcttgt ttatggacga tctagaaagt gtcagagtga 1320

gctcgagtac tgcatatttc tgatacattg tctatgctag aatgtgctag aactgattat 1380

cttctttatc aaagttgatt tttgagtaac ttgatgatca atttttctag gctagacttg 1440

ctttgtcaaa atgagcactt gttagtttag agaatcttca cctacacatg atctcaagca 1500

ttcattagta ccaaaaatac ttaagtattt tgatatcatc aaaatcaatt cttgggttaa 1560

cacaatactt ttcaaataat aagcatacag atataatcct ataacaattt aaattttgtt 1620

catatatcaa tttctttaaa aatattatat tcatcttgat agctatgaac taaatcaaaa 1680

tacatactag tatacaactt ttactgggag agtattagat taccagcatt taaccatccc 1740

actggcaagg tatcaaatta ccaatacaca acccctattt ataaagtatc aaagtaccag 1800

tgttcaactg cctcactggc aggatatcat agtactagta tttaactacc acattgacag 1860

gatatggaat tatcagtatt taaccatcat tagtagaatt ttgatgcata gtcaggctgc 1920

gagtcaaaat ctatctcaaa tcaaaatatt gatcacatgt ctaattctgt atcataattc 1980

attcccttat gctctaatat tatattaatt gtcatacttc tagctcgaga tcatgagcca 2040

aggattgcag taactaccgc atacttatag agaactcttt ctataagcat acaagatatt 2100

ctaaatatac tatcaatata tcatagagaa attaatttaa ataactaaaa gttaatattc 2160

aattaataaa ttcaactggc aaatgtattt aaaaatttta catcaaataa atcttgatta 2220

ataaatatta attaataaca atagatttaa atcgaaacaa ggttgatatt gttagaattt 2280

gatgcctcaa gattcagccc acattgagtc cacagtgagg ttcgcgacga aaaatgnnnn 2340

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2880

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2940

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagatattac taaattttgc ttctaatctc 3300

actcttaaat agtacttacc tttgaaacta ggcatttgaa tctgaaaaag aaagaggaga 3360

ttatgagctt gatagttcag taaatcatga ataaattagc taaataaatc tatgaataat 3420

agtatattaa aaataaatat gtaagataca ataattcaaa aatgaattca tatatataat 3480

actttccaaa taataagtat gtggctgcaa tcctttcgta attcaaattt tgttcattaa 3540

ttattttttt caaaacatca catggatagt catgaactaa atcaaagtac cagtgcataa 3600

cccctattga taaagaatca aataacaagt gtttgactgc ctcattatca ggatatcaaa 3660

ttattaatgc ataacctcca ctgctagggt atcaaagtag caacctcaat cacctcactg 3720

gaagggcatc tagtttcagt atttaactac tccactggca aggtgttaaa ttatcaatat 3780

ttaacctcca ctgataggat tttgatatat agtcagactg cgagccaaaa ttcatttcaa 3840

accaaaatat ttttctcaaa gacatatttt atgtttcaca ttgaaaaatt cacaaaaatt 3900

atgcgatatt gaaatcaatt ggataaaatc cacgtcaaat ttagtatatt caatcataaa 3960

tcatttacta ttctagaaaa ggtatattaa aagtataatg catcaatttc ataaatcata 4020

aatatctcaa tataaaaaat attttattat ttattaataa a 4061

<210> 40

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 40

agtatattca atcataaatc atttactatt ctagaaaagg tatattaaaa gtataatgca 60

tcaatttcat aaatcataaa tatctcaata taaaaaatat tttattattt attaataaat 120

ctaggagaag tgaagcatta cttatcttgt aagtaaaact aaccaactga tcaaattaat 180

tctgagaatc tttctcaaaa ctcatcacca ctatatcaaa aacttgtgct tcttgctatg 240

taagagcata gaccctttct tcgatctggg gttccaagtt tctattttat tttgttcaac 300

tatcaaatta gactgacttt tcattttttt gtggatattc agctatttta tggcctttct 360

aacaataacc aaagtatgta ccaatattcc aacaataatc atttattgca tgattttcac 420

cgcatcgaaa tatttgatat tatcaatcaa tccaaacttg ttattcactg acctcttatt 480

caaaccctta gtatatttaa tattctacct ttgtgattca ttcaatcgat ttcttttttt 540

tattttcttt ccctttctat atgctcttca ttaacttttc tttcaattat caatgcttta 600

ttcaatacat ctgtataagt agttaactca tatagtacca tttattttct aatttctatc 660

ctcaattcca actcaaattt atctactcag tcacattcat cttcaaccaa tctcgaagca 720

aacttgacaa gctccataaa tttagcttca tattctacaa ctattatatt tctttatttc 780

agataaataa atttttattc tttctgaatc ctcatactct aagaaaaata tttttatcat 840

aaaatatctt ttgaaatcac tcccaagcga gttgttctcc atcttgttca tatttaggtt 900

tcattctcta ttatcaatta aatgtctcat ctttcaacat gtatgatgca tataagattt 960

tttcatcatc atggtatctc ttaacaataa atgctttctc catctccata agctaatttt 1020

tagctcctat ttcatagttt tcttaaaagt caatggagac aacttcttaa attctatgat 1080

attactttat tgctcctatt gctcttatgt ccttgtggtg acaatattta ttgttgcact 1140

tgctgtagag gcagttactg ttactgcaat tgctattacg attccatcaa gccgactagt 1200

gtctgcatta tttggataat agttgatttt tgctacttta tttagatgtt ggtggcaaaa 1260

tcaatgactt ctttttgctg agagatgcca ccaacctact aagtatcatc atcttattgg 1320

ttgatacctt tagcagcacc tcgagtggtt ctttttatct gatatggaac catcttaatc 1380

ttgcatgaaa aacaaacttc gcaaaatttt cttttaaaat ctaatatcta atattatact 1440

tttattaaaa tttaattatg attattttaa gaataaaaaa tttaaatttt gaaatcctca 1500

caaggctggc caagagataa tgaccatcat cctagtcggt ttgacgtagg acatccaaag 1560

atcaactata attcaagcat catattgaga tgctaggata taatcgatgg tgaaatttaa 1620

tgatgctcga ctgatcaaga tgggggccgg cccgatggcc tgttcaacaa tcattgatca 1680

aaatttttta accaaggtct atcaagatca ttaaaaagtc tttctaagat ctataaattg 1740

taataaagag acacaatcta gagagagaca ctttttacat aaagaaagta gaaattttag 1800

ggagagaaat tagagagaaa ggggaaagag agaggaagct gagaggaaga aagaaaagag 1860

aaagactctc tctctttttc ttttctttct tttctttctt ttctttttct tttctttttt 1920

tcttcctttt ctttctttct ttctttggct cattagaaaa ataggggacc tattgatccc 1980

cttgtttcct aaatagggga ggaatctcat cttggtagct atggccggcg atgtgagcca 2040

aagtggcaaa atcatgaatc tcccaacttg cagccgacat tgacttttgg cactggaaaa 2100

tcaaagaaat ttgacaaaaa atgggaaaaa attgaaacca aaatagggac caaaatccgg 2160

taatagctag ccaaaaatcc ttgatctttg ctcatggagg ataggaaaaa agattattca 2220

agagattaag ggaatcttat ctcatttttt tgctgtgctt cggccatggt ggttgcagaa 2280

atcgtttgtg aaagctcgac aaactctgca atttcctcgg gcttgggcct cgatctttaa 2340

taggagaaga gagaagtcct ctttctttta aatagagtcg gagggaagga gtttgatttc 2400

ctccttatgg tggtttcaaa ctctgatcgg aagtccattg gaaaagaaga ctcccattag 2460

ttttaaaatc taataagatt tattgattag aaaattgata aaaaatgatt attaaaaaag 2520

tagcataatt atttaaatca atgatgctta gattgttgga ggtaaatagt aataaaatca 2580

aaaaattaaa attcatggga ccaaaaaata atgaacaaga tttgaaagaa atgtctataa 2640

ataagaattt atgaaacagg ggaacattga tcaaaggtgt gttaaatagt gtccttaaag 2700

tgttattgtc cctctcacgt agactttgtg tgttgggaga gaacatagta attctctcaa 2760

cctatgcaac ctaaatcttt tgaaaagaaa tttaaaatta tagaaaaatt ggcaaactag 2820

aattttggtc attttcttta ttagtaaaaa atatactaag ttatatgtct ttatttatac 2880

tagtgaggtc tatctttgca caattcagac caaatttata ttctagttaa aagaggtata 2940

gattttttaa aatagatata actagtggaa atagtcatag aaaagttaaa aatcaatgaa 3000

aggtagattt cacttctata ttggctttat ttgtggtcac tttatctaat tctttttttt 3060

gatggagcaa tataccctgt taaaatcttc tcgatttttt tttcacttta agcaacctat 3120

ttcgatgcct aaacaatgga atttagttta accacttaat atgctacact tttaaaagga 3180

gcaccatatt gtagggcttg aaaagttact tgatttaaaa aaagagcatc ttaattggac 3240

atcatacaag taagttatga cctctgaaaa tttgatacat gatttatcat cttgatatgg 3300

taaatcttgt taagatttcc tcatggtgtc taaagtggcc ggttcatact gagtttggtg 3360

attcttctgg tcaatggtta attgctcgaa tatttttaag atataactaa tctccaactc 3420

tgccgactcc ttagtagtat gagcacatgg aaagcttgac ctaattgatt tcttaaattg 3480

cttgaaatca gtacttagaa aatatgcaaa atggatgaaa tgtttattgc agcgagagct 3540

ttctgatctg tacgaccgag agcttactag ttttttatga gctatacgtt ttgcacttaa 3600

gcctaattta aatagtgaaa tagttttgca acaattcaaa acaattaaaa tcaaaagaca 3660

agctgctatg catgttcaac tgactcggct ttcaatcgca atatgtcaca taggctggcc 3720

tagaatgcag atgcgtgcgt ggtgagcatc ctaaaaacct acatatccaa taaattccca 3780

ctagttggtg aagtattaaa tgtaactcgt attaactttt taatgtagga ctaaagttta 3840

ttcgactaat taagaactaa atactttaat aattgaactt ttccaaccag aaatcagaaa 3900

atatttaagt aattaaatat tacataataa ctagatcaaa atatcatggt tcctctctcg 3960

ctcgagatca attgggatgt tggtttatct tggtcatcca tcgagatgac tctatcttag 4020

cctttcaaaa cggcgcggta ccacgggtct caccgcttcg t 4061

<210> 41

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 41

caaaattttc ttttaaaatc taatatctaa tattatactt ttattaaaat ttaattatga 60

ttattttaag aataaaaaat ttaaattttg aaatcctcac aaggctggcc aagagataat 120

gaccatcatc ctagtcggtt tgacgtagga catccaaaga tcaactataa ttcaagcatc 180

atattgagat gctaggatat aatcgatggt gaaatttaat gatgctcgac tgatcaagat 240

gggggccggc ccgatggcct gttcaacaat cattgatcaa aattttttaa ccaaggtcta 300

tcaagatcat taaaaagtct ttctaagatc tataaattgt aataaagaga cacaatctag 360

agagagacac tttttacata aagaaagtag aaattttagg gagagaaatt agagagaaag 420

gggaaagaga gaggaagctg agaggaagaa agaaaagaga aagactctct ctctttttct 480

tttctttctt ttctttcttt tctttttctt ttcttttttt cttccttttc tttctttctt 540

tctttggctc attagaaaaa taggggacct attgatcccc ttgtttccta aataggggag 600

gaatctcatc ttggtagcta tggccggcga tgtgagccaa agtggcaaaa tcatgaatct 660

cccaacttgc agccgacatt gacttttggc actggaaaat caaagaaatt tgacaaaaaa 720

tgggaaaaaa ttgaaaccaa aatagggacc aaaatccggt aatagctagc caaaaatcct 780

tgatctttgc tcatggagga taggaaaaaa gattattcaa gagattaagg gaatcttatc 840

tcattttttt gctgtgcttc ggccatggtg gttgcagaaa tcgtttgtga aagctcgaca 900

aactctgcaa tttcctcggg cttgggcctc gatctttaat aggagaagag agaagtcctc 960

tttcttttaa atagagtcgg agggaaggag tttgatttcc tccttatggt ggtttcaaac 1020

tctgatcgga agtccattgg aaaagaagac tcccattagt tttaaaatct aataagattt 1080

attgattaga aaattgataa aaaatgatta ttaaaaaagt agcataatta tttaaatcaa 1140

tgatgcttag attgttggag gtaaatagta ataaaatcaa aaaattaaaa ttcatgggac 1200

caaaaaataa tgaacaagat ttgaaagaaa tgtctataaa taagaattta tgaaacaggg 1260

gaacattgat caaaggtgtg ttaaatagtg tccttaaagt gttattgtcc ctctcacgta 1320

gactttgtgt gttgggagag aacatagtaa ttctctcaac ctatgcaacc taaatctttt 1380

gaaaagaaat ttaaaattat agaaaaattg gcaaactaga attttggtca ttttctttat 1440

tagtaaaaaa tatactaagt tatatgtctt tatttatact agtgaggtct atctttgcac 1500

aattcagacc aaatttatat tctagttaaa agaggtatag attttttaaa atagatataa 1560

ctagtggaaa tagtcataga aaagttaaaa atcaatgaaa ggtagatttc acttctatat 1620

tggctttatt tgtggtcact ttatctaatt cttttttttg atggagcaat ataccctgtt 1680

aaaatcttct cgattttttt ttcactttaa gcaacctatt tcgatgccta aacaatggaa 1740

tttagtttaa ccacttaata tgctacactt ttaaaaggag caccatattg tagggcttga 1800

aaagttactt gatttaaaaa aagagcatct taattggaca tcatacaagt aagttatgac 1860

ctctgaaaat ttgatacatg atttatcatc ttgatatggt aaatcttgtt aagatttcct 1920

catggtgtct aaagtggccg gttcatactg agtttggtga ttcttctggt caatggttaa 1980

ttgctcgaat atttttaaga tataactaat ctccaactct gccgactcct tagtagtatg 2040

agcacatgga aagcttgacc taattgattt cttaaattgc ttgaaatcag tacttagaaa 2100

atatgcaaaa tggatgaaat gtttattgca gcgagagctt tctgatctgt acgaccgaga 2160

gcttactagt tttttatgag ctatacgttt tgcacttaag cctaatttaa atagtgaaat 2220

agttttgcaa caattcaaaa caattaaaat caaaagacaa gctgctatgc atgttcaact 2280

gactcggctt tcaatcgcaa tatgtcacat aggctggcct agaatgcaga tgcgtgcgtg 2340

gtgagcatcc taaaaaccta catatccaat aaattcccac tagttggtga agtattaaat 2400

gtaactcgta ttaacttttt aatgtaggac taaagtttat tcgactaatt aagaactaaa 2460

tactttaata attgaacttt tccaaccaga aatcagaaaa tatttaagta attaaatatt 2520

acataataac tagatcaaaa tatcatggtt cctctctcgc tcgagatcaa ttgggatgtt 2580

ggtttatctt ggtcatccat cgagatgact ctatcttagc ctttcaaaac ggcgcggtac 2640

cacgggtctc accgcttcgt tacatcgaat gccaccatcc cttttttttt tttttttatt 2700

tatttatgct ttcttgctcc tagattggtg cggcctcatt acaactccac tgctacttga 2760

tgcttccctc tagcatctcc tttgcagctc tctcacttcc accactcttc ggcctaatgt 2820

tgggaaacga cgaaggggcc ttacaaaaat gtcatccatg atggcagtgg agaagaaaac 2880

atcgctgggg ctttccttcg atatccttcg cagccaaagc tcttataggg ttatatggga 2940

gaacgctgca ttatttgggt gatctttttg gatggtgttg ttgactgatg ctagttttgc 3000

ttcatgaatt gaatatttac acaagatgag aatacaatct agtacaattg gtaccaatta 3060

cctgggtttg actcctgctc gcatctgatt gaagcttggt taatgtgcat ctcaattaat 3120

tcagaaagat catcggactt catgtgaatt attttgacta gcatgaatag ggctaaataa 3180

ggctgaaata tgtgttaaat ttttaaaatt ataacttgat catatgatgt ccaattgaga 3240

tgttttcaaa tcaaaaattt ttttcgagat ttatcactta atgttaaact cttagaaggt 3300

cgaaacagac tgaaagtttt cttttcaaga tgtattttga ccgagtatat aacttgatga 3360

tcatatgatg cccaattgag atgttttcaa atgaaaattt tttttgagat ttatgactta 3420

atgttaaact cttaaaaggt cgaaacagac tgaaagtttt cttttcaaga tgtattttga 3480

ccaaatatat ctcataatct ataaagaata tatttcataa tctatgaata attagataga 3540

gcgacagaag ataatgctaa tgtaaaaatc acgatctatt ttttataaaa tttaatattt 3600

ttatataatc acttttacta tagtcatatt tattttaaaa aatttagtta tatttaaaat 3660

atcaaaaaaa tttgacttga attatataag aaaggatctt cctactatta tagatagaag 3720

ctttatatca tagtttacag tgtatggatc atcaatgaaa gaaagaggga tgtaaacctt 3780

acttttgaaa tttttctatt tgtttctaaa ttttttaaag gatccaagtt gagaattgag 3840

agaattcttt ctttctgcaa atcaaatcat tagtataatc cacatggaga cgttgtaata 3900

gaaagtagaa actatatttt atgaataata gaaagggagt tgatttacgc caagcctttt 3960

gtttgcttga ttaattattt atttttatgg tgttagctgg accccatgaa tagcaaccat 4020

cgttgggtca gggtcgtgta tttgttttgg ggtcttcatt a 4061

<210> 42

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 42

caagtactcc agaatcaaaa ttgtgaaaga aaaataggat aaatctggtt aagctgtaat 60

ttatttactt actttctatc tatattaaaa ttattcagat tattttgcaa atttatggat 120

atgcttgaat cacgtatctg atactttctc ttcatctgga tggcagtacc atgtgatcac 180

cacgcagacg gatacctaca agaaaaaggc aaggctaaca tgctttctta ccatcattct 240

ttacggtctt tgatccggtt ttgcgtgtcc acttcttacg tagtcttttt caaacattcc 300

tatctaagac tgaaggtaat gatttgcaaa ggaatagctt tactgttttc ctctaagtag 360

atgaaatatt actcacgtag aaaggagcca tcataattgc agaaagaata aaactgaatg 420

gaatatgagt agaattgtca aaatcttggt ttaagggttt taatagccag atgagaaagc 480

aacctacttt tcttgaacaa cttgtttgtg actgtcttgt tgctcccatc ttgcatctat 540

gattagcaaa atatatgata aatagatatt cagatttgat cgaaaagaag gaagattttc 600

tttaatccat ttaatttgaa tctcacaaaa aaaaagtaga agatttggac acgatcgctg 660

ggggcagcac gctcttaata gaatggtgtc acgttgcaga tctcgaaaaa ttattcaatt 720

ttttttaaaa aaaaagagtc attgaaatta gacgttgtat gaccatgtta tgatctctga 780

aagtttgact tctgactcaa cttcccaatg tagcagattt tactcctgaa ccatgtttaa 840

cctcctgact catagtggcc aaagtatcta catcgagttc actggtcttc ttggatcaca 900

ttcataagaa tacttcccat aattttgctc aacgttgttt ttctcatcaa ccaaaggtat 960

atgcttttta aaattgaaat gcccatgaat attatggcat tcttttattt gacattttgg 1020

ttgatcctat attgtttgtt tggcattcaa cacttcttca tgggaacctt tgaaatgagg 1080

taggtgctag gatttttctt tttacctatc catatcatat ttccaatgtc ttcttttaca 1140

ttaggttctt tagtgacaat aggggaaacg acccaatata atacccttga aaatttgggc 1200

aatatctact aaaactaact tgaataaaat attaacataa aaagggattt agtaacataa 1260

aagcataact caaaatcact caccttgtgt gccacgttct cattgccctt attatttttg 1320

cattgtgaat tgtgtccccc aataaagcaa cgtgaatggt ggaagagagt tgaatggctt 1380

tgttgagtaa ttgttttgag ttactatagc attgctctac taaaattgaa atcttgctgt 1440

gaggctatgt atgagaagca agttcatgct ttttgactgt tgggatggaa gtatgagcaa 1500

tctttttaat agaaaatgga cgaatcatga agtttttcct ttttattgaa aaagatgatc 1560

gaaaaatatg tgcaagatag aaaaacactg aaaagataaa atgagaagta aaagtggaag 1620

tctaggagaa gaaaatttaa gagaaatatc ttcaatgaga ggatgtgtgc accaacaaag 1680

ccaactttca ctaaagaatg taatgactca cctctacttt cttcgaataa ggggttccca 1740

gttgtggaaa gtatatagaa tcttctgaaa gactgagtaa atggagcaat tccttctaag 1800

aaatattatg gcatttctct cccacgaaat ttcaaagcaa agagcagcta gtagttgatc 1860

ctctaatctc ttaattgaag tttggaattt ctcttgcctc tatttggccc aaaggtcatg 1920

aagatctacc ggccaacctc ttaagttgaa ttagatctta atagaagtcc aaatgcttct 1980

tgtagaagaa catctaataa ataaatgagt gatagattct aatccagaga caaagagcac 2040

acctcgaatt cacttgccat ccttttctag ctagaacttc tctagcatga aacttgttcc 2100

ttaaggcaag ccaaataaat actcacattt taggaatgac tgccttccaa ataattttat 2160

aatatggaca aattagacca ccattattga taaacttgca atgaacaatt ataaatgagt 2220

tttcaggttg gcacattagc aatataggat ggtttgatta ttaaaaggat gatatgaagg 2280

gtttcaaggt ggtttgcctc gttcaaatca aaggattttg aagattaata ttccaagata 2340

aggttctcca actccattag gaaagtgtct tcatgtcatc ttagagaagc agctcgtacc 2400

aaacttgaca gatgttttat ttatttagag tgacacagat accctttggc aatactctcc 2460

atccttgtcc gaacaacttc taatcacacc tcacttatct tgcatctaac tcagaggcta 2520

caagttacac ctttcaacaa accttttcgg tttgaaaatt tgtgatttca ttatttagag 2580

ttcgaagagc atatcaagta ttggtcggag ttggcaccca aagcaaacga aacagttact 2640

gacatggtcc aaaagctgag atttctaaga tcccaactta agcactgaat aaagccatta 2700

tgggaaatat cattttaacg aaagaggaat ttagagtaag aattgattct cttgataccg 2760

aagaagaact aatacagctt tcatcacttc aaaatgatga acagatgcat ctcaagtcag 2820

cactagacca tcttctaaaa taggaagatc tatggaagca acactcccaa atgcagtggc 2880

ttcaaaatgg ggattgcaat acgaagttta tccatgtttg ggcaagtaac aggaaaaaaa 2940

gaatactatc actgaactct agcaaggcga tcagaagatt atcgaatagc agcaaatcca 3000

atccacattc tacaactttt tttctaccct actaggctcg actgaggaat gactcatcca 3060

agctgattgg aagattcttt atccagaagg acctctggat cttgctgaca ttgagtatcc 3120

atttatggag aaagaaatcc atgatacagt gtatgacttg gctttggaaa agtcacccgg 3180

atgatatttt cccattctcc ttctataagc acttctagtg tatcatcaaa catgacctga 3240

tgaacctact gtaaaatcag ctaatgtaga ccatctgaac tacttgttca tcacccttat 3300

cccaaaaaaa aattggtgtg tattcagtta gagacttcag gccaataagc ctgattaatg 3360

gagtaataaa aaatatttca aaaactctat cgaaaaggct cccacagaaa atgaatttgt 3420

taattttatc cacagagctt gctttcaaca gaggaagaaa tatctctgaa tattttgtaa 3480

tgactatgga aactatacac ttctgcaaag ctgaagtaca caaggatctc aattataaag 3540

tcgacttcga gaaagctttt gacaatgtgg attggagctt tctattgaaa ttgctatcca 3600

gcacggggct ttgattcgag gtggtgtcaa tggatagaat atctgattta tacagctaaa 3660

ttctcagtcc ttattaatgg tgataaaggt aaacttttta aattgaggaa agatctcagg 3720

caaggagatc ctctattcgc ctagctcttt ctcttagttg ttgatataga atgatcaagg 3780

gagcaagtag gttcaatctt tttgttggaa ttggatcata taatatcatg ggataacttc 3840

aaagctttta gttcactgat gacacactta tattttgcag atatgatcta aaatacatca 3900

aaactcttaa atttttactc tatagttatg agctactgat gggtctcaaa attaactttg 3960

aaaaattcca attttttggc ttgagaattg caaagatgtc agtacagcaa gttgcatcta 4020

tcctagaaag caaggtggct acattttcca ttacttattt g 4061

<210> 43

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 43

gaccatgtta tgatctctga aagtttgact tctgactcaa cttcccaatg tagcagattt 60

tactcctgaa ccatgtttaa cctcctgact catagtggcc aaagtatcta catcgagttc 120

actggtcttc ttggatcaca ttcataagaa tacttcccat aattttgctc aacgttgttt 180

ttctcatcaa ccaaaggtat atgcttttta aaattgaaat gcccatgaat attatggcat 240

tcttttattt gacattttgg ttgatcctat attgtttgtt tggcattcaa cacttcttca 300

tgggaacctt tgaaatgagg taggtgctag gatttttctt tttacctatc catatcatat 360

ttccaatgtc ttcttttaca ttaggttctt tagtgacaat aggggaaacg acccaatata 420

atacccttga aaatttgggc aatatctact aaaactaact tgaataaaat attaacataa 480

aaagggattt agtaacataa aagcataact caaaatcact caccttgtgt gccacgttct 540

cattgccctt attatttttg cattgtgaat tgtgtccccc aataaagcaa cgtgaatggt 600

ggaagagagt tgaatggctt tgttgagtaa ttgttttgag ttactatagc attgctctac 660

taaaattgaa atcttgctgt gaggctatgt atgagaagca agttcatgct ttttgactgt 720

tgggatggaa gtatgagcaa tctttttaat agaaaatgga cgaatcatga agtttttcct 780

ttttattgaa aaagatgatc gaaaaatatg tgcaagatag aaaaacactg aaaagataaa 840

atgagaagta aaagtggaag tctaggagaa gaaaatttaa gagaaatatc ttcaatgaga 900

ggatgtgtgc accaacaaag ccaactttca ctaaagaatg taatgactca cctctacttt 960

cttcgaataa ggggttccca gttgtggaaa gtatatagaa tcttctgaaa gactgagtaa 1020

atggagcaat tccttctaag aaatattatg gcatttctct cccacgaaat ttcaaagcaa 1080

agagcagcta gtagttgatc ctctaatctc ttaattgaag tttggaattt ctcttgcctc 1140

tatttggccc aaaggtcatg aagatctacc ggccaacctc ttaagttgaa ttagatctta 1200

atagaagtcc aaatgcttct tgtagaagaa catctaataa ataaatgagt gatagattct 1260

aatccagaga caaagagcac acctcgaatt cacttgccat ccttttctag ctagaacttc 1320

tctagcatga aacttgttcc ttaaggcaag ccaaataaat actcacattt taggaatgac 1380

tgccttccaa ataattttat aatatggaca aattagacca ccattattga taaacttgca 1440

atgaacaatt ataaatgagt tttcaggttg gcacattagc aatataggat ggtttgatta 1500

ttaaaaggat gatatgaagg gtttcaaggt ggtttgcctc gttcaaatca aaggattttg 1560

aagattaata ttccaagata aggttctcca actccattag gaaagtgtct tcatgtcatc 1620

ttagagaagc agctcgtacc aaacttgaca gatgttttat ttatttagag tgacacagat 1680

accctttggc aatactctcc atccttgtcc gaacaacttc taatcacacc tcacttatct 1740

tgcatctaac tcagaggcta caagttacac ctttcaacaa accttttcgg tttgaaaatt 1800

tgtgatttca ttatttagag ttcgaagagc atatcaagta ttggtcggag ttggcaccca 1860

aagcaaacga aacagttact gacatggtcc aaaagctgag atttctaaga tcccaactta 1920

agcactgaat aaagccatta tgggaaatat cattttaacg aaagaggaat ttagagtaag 1980

aattgattct cttgataccg aagaagaact aatacagctt tcatcacttc aaaatgatga 2040

acagatgcat ctcaagtcag cactagacca tcttctaaaa taggaagatc tatggaagca 2100

acactcccaa atgcagtggc ttcaaaatgg ggattgcaat acgaagttta tccatgtttg 2160

ggcaagtaac aggaaaaaaa gaatactatc actgaactct agcaaggcga tcagaagatt 2220

atcgaatagc agcaaatcca atccacattc tacaactttt tttctaccct actaggctcg 2280

actgaggaat gactcatcca agctgattgg aagattcttt atccagaagg acctctggat 2340

cttgctgaca ttgagtatcc atttatggag aaagaaatcc atgatacagt gtatgacttg 2400

gctttggaaa agtcacccgg atgatatttt cccattctcc ttctataagc acttctagtg 2460

tatcatcaaa catgacctga tgaacctact gtaaaatcag ctaatgtaga ccatctgaac 2520

tacttgttca tcacccttat cccaaaaaaa aattggtgtg tattcagtta gagacttcag 2580

gccaataagc ctgattaatg gagtaataaa aaatatttca aaaactctat cgaaaaggct 2640

cccacagaaa atgaatttgt taattttatc cacagagctt gctttcaaca gaggaagaaa 2700

tatctctgaa tattttgtaa tgactatgga aactatacac ttctgcaaag ctgaagtaca 2760

caaggatctc aattataaag tcgacttcga gaaagctttt gacaatgtgg attggagctt 2820

tctattgaaa ttgctatcca gcacggggct ttgattcgag gtggtgtcaa tggatagaat 2880

atctgattta tacagctaaa ttctcagtcc ttattaatgg tgataaaggt aaacttttta 2940

aattgaggaa agatctcagg caaggagatc ctctattcgc ctagctcttt ctcttagttg 3000

ttgatataga atgatcaagg gagcaagtag gttcaatctt tttgttggaa ttggatcata 3060

taatatcatg ggataacttc aaagctttta gttcactgat gacacactta tattttgcag 3120

atatgatcta aaatacatca aaactcttaa atttttactc tatagttatg agctactgat 3180

gggtctcaaa attaactttg aaaaattcca attttttggc ttgagaattg caaagatgtc 3240

agtacagcaa gttgcatcta tcctagaaag caaggtggct acattttcca ttacttattt 3300

gggtctccca ctccatcatt ctaaactgag gaaaacttat tggaatccac tccttgagaa 3360

ggttcagaag aaattgatcg ggtagaaagg taaacttctt aacctctagg gtaggcttat 3420

actaactaat gcagtgctta cagggatccc actactctgg agggatacat tccttctccc 3480

tcaattcatt atcaaataaa ttgataaaat ccatcgatca ttcatttgga gaggaaacga 3540

ggagtataac taagggcact ctagaatatg ttggtcgaat atttgtcgat caaaaaaatt 3600

tggaggactg ggggttcctc aatctaaaaa ttttcaatac aattcttctt tgtaaatggt 3660

ggtggaagct ctactctaat gctggtgacc cgtggtgtag ttttattgcc actgtccacc 3720

caacttcaca ctagagatct aaaggtatac acaaatcaac ctcttcattt tggaatggtt 3780

tacagcacac atgaaatatt tctactccta atccactttc aagttagcaa ctagtattat 3840

tttggaaaga tagttggtta cataatcatc cactgaagga tcgatttcct cacctttaca 3900

caatagcatt gaagtgcaac aactcagtgg caaaggtatt aagcaatcta cttgataata 3960

gctcttttag tactcctctt cctcaaagat accaagaaga ttttcagagt ctataggaaa 4020

gcattgaaca aattacatta acggaacgac ctgatactat a 4061

<210> 44

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 44

tcttctgaaa gactgagtaa atggagcaat tccttctaag aaatattatg gcatttctct 60

cccacgaaat ttcaaagcaa agagcagcta gtagttgatc ctctaatctc ttaattgaag 120

tttggaattt ctcttgcctc tatttggccc aaaggtcatg aagatctacc ggccaacctc 180

ttaagttgaa ttagatctta atagaagtcc aaatgcttct tgtagaagaa catctaataa 240

ataaatgagt gatagattct aatccagaga caaagagcac acctcgaatt cacttgccat 300

ccttttctag ctagaacttc tctagcatga aacttgttcc ttaaggcaag ccaaataaat 360

actcacattt taggaatgac tgccttccaa ataattttat aatatggaca aattagacca 420

ccattattga taaacttgca atgaacaatt ataaatgagt tttcaggttg gcacattagc 480

aatataggat ggtttgatta ttaaaaggat gatatgaagg gtttcaaggt ggtttgcctc 540

gttcaaatca aaggattttg aagattaata ttccaagata aggttctcca actccattag 600

gaaagtgtct tcatgtcatc ttagagaagc agctcgtacc aaacttgaca gatgttttat 660

ttatttagag tgacacagat accctttggc aatactctcc atccttgtcc gaacaacttc 720

taatcacacc tcacttatct tgcatctaac tcagaggcta caagttacac ctttcaacaa 780

accttttcgg tttgaaaatt tgtgatttca ttatttagag ttcgaagagc atatcaagta 840

ttggtcggag ttggcaccca aagcaaacga aacagttact gacatggtcc aaaagctgag 900

atttctaaga tcccaactta agcactgaat aaagccatta tgggaaatat cattttaacg 960

aaagaggaat ttagagtaag aattgattct cttgataccg aagaagaact aatacagctt 1020

tcatcacttc aaaatgatga acagatgcat ctcaagtcag cactagacca tcttctaaaa 1080

taggaagatc tatggaagca acactcccaa atgcagtggc ttcaaaatgg ggattgcaat 1140

acgaagttta tccatgtttg ggcaagtaac aggaaaaaaa gaatactatc actgaactct 1200

agcaaggcga tcagaagatt atcgaatagc agcaaatcca atccacattc tacaactttt 1260

tttctaccct actaggctcg actgaggaat gactcatcca agctgattgg aagattcttt 1320

atccagaagg acctctggat cttgctgaca ttgagtatcc atttatggag aaagaaatcc 1380

atgatacagt gtatgacttg gctttggaaa agtcacccgg atgatatttt cccattctcc 1440

ttctataagc acttctagtg tatcatcaaa catgacctga tgaacctact gtaaaatcag 1500

ctaatgtaga ccatctgaac tacttgttca tcacccttat cccaaaaaaa aattggtgtg 1560

tattcagtta gagacttcag gccaataagc ctgattaatg gagtaataaa aaatatttca 1620

aaaactctat cgaaaaggct cccacagaaa atgaatttgt taattttatc cacagagctt 1680

gctttcaaca gaggaagaaa tatctctgaa tattttgtaa tgactatgga aactatacac 1740

ttctgcaaag ctgaagtaca caaggatctc aattataaag tcgacttcga gaaagctttt 1800

gacaatgtgg attggagctt tctattgaaa ttgctatcca gcacggggct ttgattcgag 1860

gtggtgtcaa tggatagaat atctgattta tacagctaaa ttctcagtcc ttattaatgg 1920

tgataaaggt aaacttttta aattgaggaa agatctcagg caaggagatc ctctattcgc 1980

ctagctcttt ctcttagttg ttgatataga atgatcaagg gagcaagtag gttcaatctt 2040

tttgttggaa ttggatcata taatatcatg ggataacttc aaagctttta gttcactgat 2100

gacacactta tattttgcag atatgatcta aaatacatca aaactcttaa atttttactc 2160

tatagttatg agctactgat gggtctcaaa attaactttg aaaaattcca attttttggc 2220

ttgagaattg caaagatgtc agtacagcaa gttgcatcta tcctagaaag caaggtggct 2280

acattttcca ttacttattt gggtctccca ctccatcatt ctaaactgag gaaaacttat 2340

tggaatccac tccttgagaa ggttcagaag aaattgatcg ggtagaaagg taaacttctt 2400

aacctctagg gtaggcttat actaactaat gcagtgctta cagggatccc actactctgg 2460

agggatacat tccttctccc tcaattcatt atcaaataaa ttgataaaat ccatcgatca 2520

ttcatttgga gaggaaacga ggagtataac taagggcact ctagaatatg ttggtcgaat 2580

atttgtcgat caaaaaaatt tggaggactg ggggttcctc aatctaaaaa ttttcaatac 2640

aattcttctt tgtaaatggt ggtggaagct ctactctaat gctggtgacc cgtggtgtag 2700

ttttattgcc actgtccacc caacttcaca ctagagatct aaaggtatac acaaatcaac 2760

ctcttcattt tggaatggtt tacagcacac atgaaatatt tctactccta atccactttc 2820

aagttagcaa ctagtattat tttggaaaga tagttggtta cataatcatc cactgaagga 2880

tcgatttcct cacctttaca caatagcatt gaagtgcaac aactcagtgg caaaggtatt 2940

aagcaatcta cttgataata gctcttttag tactcctctt cctcaaagat accaagaaga 3000

ttttcagagt ctataggaaa gcattgaaca aattacatta acggaacgac ctgatactat 3060

acaatggaaa tggtttagta gcaatatttt tttggcatga aggatctact attttctgca 3120

agatggagga gtttggcctc tactgagtaa tattatataa aaactcctaa taccaaagaa 3180

agccaagtta tttgcttggc taagtgctca caacaaaatc ccaatgaaag ctaatcttct 3240

taatagagga ataattggaa ctgattactg tacactttgc gatgacttat cagaaactaa 3300

tgatcatcta atgctcatct atactttttc aaaagcaatt tggaatcaag tactttcaga 3360

cctgcaattg tcgaaacttt tatgcatgct taacacccta tgggatactt ggagactcat 3420

caatatgcaa cacgatagaa gacctaaact agctgctcta ttcgtaattg gtcaatggtg 3480

tctttggaag gaaagaaata aaagattatt cgacttctat actttttatc cacgatcgat 3540

tgctgaaact gtgtcacttt ttctttcttg ggcatcacac ctaacaacgg agcaactaaa 3600

gatgttagct cctgttcgag aagttctctt atctaagaat gaaaacacac aatctttagt 3660

gagaattaca gatgctaaca ggcgcagatg aatgttttat gagcattttt atagctgcag 3720

cttatatgtg atctatggtg caaggagtta attataacca tggatattag ttaggttgac 3780

tatcagaaat catctccaat acattctatg taaccactga tcaattccat gttcaactag 3840

ataggaacct gcctatatac aggtatgtcc ctgatgtaac tatagtatac tattattcat 3900

aaataaataa cgaaggtttt accttcttct cataaaaaaa aagtatcttc atgtcatcct 3960

atatgtcatg catctccttt gctacttctt ttatttactt cttaaacttg gttctaccat 4020

atattatcag ccccttttaa atttgctttt ggatattgca t 4061

<210> 45

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 45

gctttcaaca gaggaagaaa tatctctgaa tattttgtaa tgactatgga aactatacac 60

ttctgcaaag ctgaagtaca caaggatctc aattataaag tcgacttcga gaaagctttt 120

gacaatgtgg attggagctt tctattgaaa ttgctatcca gcacggggct ttgattcgag 180

gtggtgtcaa tggatagaat atctgattta tacagctaaa ttctcagtcc ttattaatgg 240

tgataaaggt aaacttttta aattgaggaa agatctcagg caaggagatc ctctattcgc 300

ctagctcttt ctcttagttg ttgatataga atgatcaagg gagcaagtag gttcaatctt 360

tttgttggaa ttggatcata taatatcatg ggataacttc aaagctttta gttcactgat 420

gacacactta tattttgcag atatgatcta aaatacatca aaactcttaa atttttactc 480

tatagttatg agctactgat gggtctcaaa attaactttg aaaaattcca attttttggc 540

ttgagaattg caaagatgtc agtacagcaa gttgcatcta tcctagaaag caaggtggct 600

acattttcca ttacttattt gggtctccca ctccatcatt ctaaactgag gaaaacttat 660

tggaatccac tccttgagaa ggttcagaag aaattgatcg ggtagaaagg taaacttctt 720

aacctctagg gtaggcttat actaactaat gcagtgctta cagggatccc actactctgg 780

agggatacat tccttctccc tcaattcatt atcaaataaa ttgataaaat ccatcgatca 840

ttcatttgga gaggaaacga ggagtataac taagggcact ctagaatatg ttggtcgaat 900

atttgtcgat caaaaaaatt tggaggactg ggggttcctc aatctaaaaa ttttcaatac 960

aattcttctt tgtaaatggt ggtggaagct ctactctaat gctggtgacc cgtggtgtag 1020

ttttattgcc actgtccacc caacttcaca ctagagatct aaaggtatac acaaatcaac 1080

ctcttcattt tggaatggtt tacagcacac atgaaatatt tctactccta atccactttc 1140

aagttagcaa ctagtattat tttggaaaga tagttggtta cataatcatc cactgaagga 1200

tcgatttcct cacctttaca caatagcatt gaagtgcaac aactcagtgg caaaggtatt 1260

aagcaatcta cttgataata gctcttttag tactcctctt cctcaaagat accaagaaga 1320

ttttcagagt ctataggaaa gcattgaaca aattacatta acggaacgac ctgatactat 1380

acaatggaaa tggtttagta gcaatatttt tttggcatga aggatctact attttctgca 1440

agatggagga gtttggcctc tactgagtaa tattatataa aaactcctaa taccaaagaa 1500

agccaagtta tttgcttggc taagtgctca caacaaaatc ccaatgaaag ctaatcttct 1560

taatagagga ataattggaa ctgattactg tacactttgc gatgacttat cagaaactaa 1620

tgatcatcta atgctcatct atactttttc aaaagcaatt tggaatcaag tactttcaga 1680

cctgcaattg tcgaaacttt tatgcatgct taacacccta tgggatactt ggagactcat 1740

caatatgcaa cacgatagaa gacctaaact agctgctcta ttcgtaattg gtcaatggtg 1800

tctttggaag gaaagaaata aaagattatt cgacttctat actttttatc cacgatcgat 1860

tgctgaaact gtgtcacttt ttctttcttg ggcatcacac ctaacaacgg agcaactaaa 1920

gatgttagct cctgttcgag aagttctctt atctaagaat gaaaacacac aatctttagt 1980

gagaattaca gatgctaaca ggcgcagatg aatgttttat gagcattttt atagctgcag 2040

cttatatgtg atctatggtg caaggagtta attataacca tggatattag ttaggttgac 2100

tatcagaaat catctccaat acattctatg taaccactga tcaattccat gttcaactag 2160

ataggaacct gcctatatac aggtatgtcc ctgatgtaac tatagtatac tattattcat 2220

aaataaataa cgaaggtttt accttcttct cataaaaaaa aagtatcttc atgtcatcct 2280

atatgtcatg catctccttt gctacttctt ttatttactt cttaaacttg gttctaccat 2340

atattatcag ccccttttaa atttgctttt ggatattgca tattccactc ttcaatcacc 2400

tcatgccaag caaaacattt attcacactt gaaaaccaat ataagaatac caaagaattt 2460

atccatgaaa ttctagaaac tttggtttta ctcctttctc catcattcaa aaaggttcaa 2520

aatgatgata actctatata gcttatttat caaatttacg aggttggtgt tcaatgtttt 2580

tgtgaaaaaa atatcttgct atccacatag tttgaatcca tacttttgct atcttgagtt 2640

tcaaaaattt taatttgcta caatttgttg ctattagcat atgactactt ttaagaagat 2700

aagccaatat actattttcc taagaattta aaaaatcaaa aataaaaatt tttatttaag 2760

attttttaag ggttgttttc caaatgtgca atggggctta atcttggcat cattttctaa 2820

cttgtagaat tttgacccaa gtaacatttg tccaatcact tagaacttct ataacttcgt 2880

acaatcattt gttaatgttg ttcatctatt tatctatatt atctatctgg aatatagttg 2940

ctcttaatta tttttatata tcgcctatta tccaccctaa gctttcatgt tcatcctcat 3000

gttgttggag gtgcatgtct tattccaaac tatttaccat tgctgtagat tttaaaaaat 3060

ttgctagttt aggacttttt aatcttttga tatcatgttg atgtaagcta accctctaag 3120

gctagtcata atacatttta aggatttatg ttatatgaga ccaaaatttt aacaaaatga 3180

agtgttggaa attggtagaa tggaagtgta aagatgctta gagacataga actagccctg 3240

ggccatgtaa atcttccaaa agaagaagaa aataataaaa ttaagatcat attcaatctc 3300

tacagaaaag ttggtctttg ttgtataata agccatctta acatatgatg gacaataaaa 3360

tatataaact tatgagtttt aatacttaga tggaagaaaa gggacagata tgtcacaccc 3420

catcctacta gcatgagtag gcacatgata cacggttgca tgccctgcag agtttgactc 3480

atgaggcatg caaggtattg aatagtagtc taggtaaaat taaaaaactt ggagcattct 3540

aaaaataaat caagttcatt ttataaaatc aatatttatt atggactcca tcaaatatta 3600

tgcgcataac attttatttg caaatagaag aagataagtc ctagatccta agtctcctac 3660

tcttagtctc ataattcatc caagctatcc accaaatatc taaaacgaaa aagaaaaacg 3720

atagtatgct aatagctttg taagtcacct tttatctcta attagatcaa gcatattaga 3780

tataaaacaa taattttcaa agtatatgat ttgcaattag gaataaatat ttgataaata 3840

cagaataaat tttcataaag catatttact aacattattt ataaaatata taatgcttat 3900

atcaataaat taatttctaa atcaatatat ataaactatc cattctgtct tagccttaca 3960

actattgcta ccattccctg tagcatggtt aggaagagac tagctcttga atactcatgt 4020

catttatcaa catatgcgaa tgatcattcg actaatatag t 4061

<210> 46

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 46

tttgttggaa ttggatcata taatatcatg ggataacttc aaagctttta gttcactgat 60

gacacactta tattttgcag atatgatcta aaatacatca aaactcttaa atttttactc 120

tatagttatg agctactgat gggtctcaaa attaactttg aaaaattcca attttttggc 180

ttgagaattg caaagatgtc agtacagcaa gttgcatcta tcctagaaag caaggtggct 240

acattttcca ttacttattt gggtctccca ctccatcatt ctaaactgag gaaaacttat 300

tggaatccac tccttgagaa ggttcagaag aaattgatcg ggtagaaagg taaacttctt 360

aacctctagg gtaggcttat actaactaat gcagtgctta cagggatccc actactctgg 420

agggatacat tccttctccc tcaattcatt atcaaataaa ttgataaaat ccatcgatca 480

ttcatttgga gaggaaacga ggagtataac taagggcact ctagaatatg ttggtcgaat 540

atttgtcgat caaaaaaatt tggaggactg ggggttcctc aatctaaaaa ttttcaatac 600

aattcttctt tgtaaatggt ggtggaagct ctactctaat gctggtgacc cgtggtgtag 660

ttttattgcc actgtccacc caacttcaca ctagagatct aaaggtatac acaaatcaac 720

ctcttcattt tggaatggtt tacagcacac atgaaatatt tctactccta atccactttc 780

aagttagcaa ctagtattat tttggaaaga tagttggtta cataatcatc cactgaagga 840

tcgatttcct cacctttaca caatagcatt gaagtgcaac aactcagtgg caaaggtatt 900

aagcaatcta cttgataata gctcttttag tactcctctt cctcaaagat accaagaaga 960

ttttcagagt ctataggaaa gcattgaaca aattacatta acggaacgac ctgatactat 1020

acaatggaaa tggtttagta gcaatatttt tttggcatga aggatctact attttctgca 1080

agatggagga gtttggcctc tactgagtaa tattatataa aaactcctaa taccaaagaa 1140

agccaagtta tttgcttggc taagtgctca caacaaaatc ccaatgaaag ctaatcttct 1200

taatagagga ataattggaa ctgattactg tacactttgc gatgacttat cagaaactaa 1260

tgatcatcta atgctcatct atactttttc aaaagcaatt tggaatcaag tactttcaga 1320

cctgcaattg tcgaaacttt tatgcatgct taacacccta tgggatactt ggagactcat 1380

caatatgcaa cacgatagaa gacctaaact agctgctcta ttcgtaattg gtcaatggtg 1440

tctttggaag gaaagaaata aaagattatt cgacttctat actttttatc cacgatcgat 1500

tgctgaaact gtgtcacttt ttctttcttg ggcatcacac ctaacaacgg agcaactaaa 1560

gatgttagct cctgttcgag aagttctctt atctaagaat gaaaacacac aatctttagt 1620

gagaattaca gatgctaaca ggcgcagatg aatgttttat gagcattttt atagctgcag 1680

cttatatgtg atctatggtg caaggagtta attataacca tggatattag ttaggttgac 1740

tatcagaaat catctccaat acattctatg taaccactga tcaattccat gttcaactag 1800

ataggaacct gcctatatac aggtatgtcc ctgatgtaac tatagtatac tattattcat 1860

aaataaataa cgaaggtttt accttcttct cataaaaaaa aagtatcttc atgtcatcct 1920

atatgtcatg catctccttt gctacttctt ttatttactt cttaaacttg gttctaccat 1980

atattatcag ccccttttaa atttgctttt ggatattgca tattccactc ttcaatcacc 2040

tcatgccaag caaaacattt attcacactt gaaaaccaat ataagaatac caaagaattt 2100

atccatgaaa ttctagaaac tttggtttta ctcctttctc catcattcaa aaaggttcaa 2160

aatgatgata actctatata gcttatttat caaatttacg aggttggtgt tcaatgtttt 2220

tgtgaaaaaa atatcttgct atccacatag tttgaatcca tacttttgct atcttgagtt 2280

tcaaaaattt taatttgcta caatttgttg ctattagcat atgactactt ttaagaagat 2340

aagccaatat actattttcc taagaattta aaaaatcaaa aataaaaatt tttatttaag 2400

attttttaag ggttgttttc caaatgtgca atggggctta atcttggcat cattttctaa 2460

cttgtagaat tttgacccaa gtaacatttg tccaatcact tagaacttct ataacttcgt 2520

acaatcattt gttaatgttg ttcatctatt tatctatatt atctatctgg aatatagttg 2580

ctcttaatta tttttatata tcgcctatta tccaccctaa gctttcatgt tcatcctcat 2640

gttgttggag gtgcatgtct tattccaaac tatttaccat tgctgtagat tttaaaaaat 2700

ttgctagttt aggacttttt aatcttttga tatcatgttg atgtaagcta accctctaag 2760

gctagtcata atacatttta aggatttatg ttatatgaga ccaaaatttt aacaaaatga 2820

agtgttggaa attggtagaa tggaagtgta aagatgctta gagacataga actagccctg 2880

ggccatgtaa atcttccaaa agaagaagaa aataataaaa ttaagatcat attcaatctc 2940

tacagaaaag ttggtctttg ttgtataata agccatctta acatatgatg gacaataaaa 3000

tatataaact tatgagtttt aatacttaga tggaagaaaa gggacagata tgtcacaccc 3060

catcctacta gcatgagtag gcacatgata cacggttgca tgccctgcag agtttgactc 3120

atgaggcatg caaggtattg aatagtagtc taggtaaaat taaaaaactt ggagcattct 3180

aaaaataaat caagttcatt ttataaaatc aatatttatt atggactcca tcaaatatta 3240

tgcgcataac attttatttg caaatagaag aagataagtc ctagatccta agtctcctac 3300

tcttagtctc ataattcatc caagctatcc accaaatatc taaaacgaaa aagaaaaacg 3360

atagtatgct aatagctttg taagtcacct tttatctcta attagatcaa gcatattaga 3420

tataaaacaa taattttcaa agtatatgat ttgcaattag gaataaatat ttgataaata 3480

cagaataaat tttcataaag catatttact aacattattt ataaaatata taatgcttat 3540

atcaataaat taatttctaa atcaatatat ataaactatc cattctgtct tagccttaca 3600

actattgcta ccattccctg tagcatggtt aggaagagac tagctcttga atactcatgt 3660

catttatcaa catatgcgaa tgatcattcg actaatatag tcaaaaaaaa attactctga 3720

tttatataaa ttaaaaatta gtaaataata tatgctagta atcaccttac cagctaagct 3780

ctaaagaaaa ttagcttttg aatatacatc atgctattga ttattatatg tcagtgcttg 3840

tctcattttg tggcatgcaa gaagactaga tcctaaactt atatgcatag tcagattaaa 3900

gagcaaatgt tgcatctgat tatatgaaca tctattatga tgtagagttt gtatcatgta 3960

tatttaattt aaacacaaat ataattatac ataaataata ttcatatttt aaattttaaa 4020

tatttagata attattctag tgcaggtata aaaataagca a 4061

<210> 47

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 47

ttggcctcta ctgagtaata ttatataaaa actcctaata ccaaagaaag ccaagttatt 60

tgcttggcta agtgctcaca acaaaatccc aatgaaagct aatcttctta atagaggaat 120

aattggaact gattactgta cactttgcga tgacttatca gaaactaatg atcatctaat 180

gctcatctat actttttcaa aagcaatttg gaatcaagta ctttcagacc tgcaattgtc 240

gaaactttta tgcatgctta acaccctatg ggatacttgg agactcatca atatgcaaca 300

cgatagaaga cctaaactag ctgctctatt cgtaattggt caatggtgtc tttggaagga 360

aagaaataaa agattattcg acttctatac tttttatcca cgatcgattg ctgaaactgt 420

gtcacttttt ctttcttggg catcacacct aacaacggag caactaaaga tgttagctcc 480

tgttcgagaa gttctcttat ctaagaatga aaacacacaa tctttagtga gaattacaga 540

tgctaacagg cgcagatgaa tgttttatga gcatttttat agctgcagct tatatgtgat 600

ctatggtgca aggagttaat tataaccatg gatattagtt aggttgacta tcagaaatca 660

tctccaatac attctatgta accactgatc aattccatgt tcaactagat aggaacctgc 720

ctatatacag gtatgtccct gatgtaacta tagtatacta ttattcataa ataaataacg 780

aaggttttac cttcttctca taaaaaaaaa gtatcttcat gtcatcctat atgtcatgca 840

tctcctttgc tacttctttt atttacttct taaacttggt tctaccatat attatcagcc 900

ccttttaaat ttgcttttgg atattgcata ttccactctt caatcacctc atgccaagca 960

aaacatttat tcacacttga aaaccaatat aagaatacca aagaatttat ccatgaaatt 1020

ctagaaactt tggttttact cctttctcca tcattcaaaa aggttcaaaa tgatgataac 1080

tctatatagc ttatttatca aatttacgag gttggtgttc aatgtttttg tgaaaaaaat 1140

atcttgctat ccacatagtt tgaatccata cttttgctat cttgagtttc aaaaatttta 1200

atttgctaca atttgttgct attagcatat gactactttt aagaagataa gccaatatac 1260

tattttccta agaatttaaa aaatcaaaaa taaaaatttt tatttaagat tttttaaggg 1320

ttgttttcca aatgtgcaat ggggcttaat cttggcatca ttttctaact tgtagaattt 1380

tgacccaagt aacatttgtc caatcactta gaacttctat aacttcgtac aatcatttgt 1440

taatgttgtt catctattta tctatattat ctatctggaa tatagttgct cttaattatt 1500

tttatatatc gcctattatc caccctaagc tttcatgttc atcctcatgt tgttggaggt 1560

gcatgtctta ttccaaacta tttaccattg ctgtagattt taaaaaattt gctagtttag 1620

gactttttaa tcttttgata tcatgttgat gtaagctaac cctctaaggc tagtcataat 1680

acattttaag gatttatgtt atatgagacc aaaattttaa caaaatgaag tgttggaaat 1740

tggtagaatg gaagtgtaaa gatgcttaga gacatagaac tagccctggg ccatgtaaat 1800

cttccaaaag aagaagaaaa taataaaatt aagatcatat tcaatctcta cagaaaagtt 1860

ggtctttgtt gtataataag ccatcttaac atatgatgga caataaaata tataaactta 1920

tgagttttaa tacttagatg gaagaaaagg gacagatatg tcacacccca tcctactagc 1980

atgagtaggc acatgataca cggttgcatg ccctgcagag tttgactcat gaggcatgca 2040

aggtattgaa tagtagtcta ggtaaaatta aaaaacttgg agcattctaa aaataaatca 2100

agttcatttt ataaaatcaa tatttattat ggactccatc aaatattatg cgcataacat 2160

tttatttgca aatagaagaa gataagtcct agatcctaag tctcctactc ttagtctcat 2220

aattcatcca agctatccac caaatatcta aaacgaaaaa gaaaaacgat agtatgctaa 2280

tagctttgta agtcaccttt tatctctaat tagatcaagc atattagata taaaacaata 2340

attttcaaag tatatgattt gcaattagga ataaatattt gataaataca gaataaattt 2400

tcataaagca tatttactaa cattatttat aaaatatata atgcttatat caataaatta 2460

atttctaaat caatatatat aaactatcca ttctgtctta gccttacaac tattgctacc 2520

attccctgta gcatggttag gaagagacta gctcttgaat actcatgtca tttatcaaca 2580

tatgcgaatg atcattcgac taatatagtc aaaaaaaaat tactctgatt tatataaatt 2640

aaaaattagt aaataatata tgctagtaat caccttacca gctaagctct aaagaaaatt 2700

agcttttgaa tatacatcat gctattgatt attatatgtc agtgcttgtc tcattttgtg 2760

gcatgcaaga agactagatc ctaaacttat atgcatagtc agattaaaga gcaaatgttg 2820

catctgatta tatgaacatc tattatgatg tagagtttgt atcatgtata tttaatttaa 2880

acacaaatat aattatacat aaataatatt catattttaa attttaaata tttagataat 2940

tattctagtg caggtataaa aataagcaat ataaaatttt aaatcgattt atataacatg 3000

cataataaaa aaaattaagg atagaggtac ttactgctca actcataaaa cataagaaat 3060

ctctttaact aactttagtg caacctagat agaacatatt aatgattaag ttttcatcta 3120

aaataaacat agatatcatt ttaaaatctt aggcatttaa atggtctcat gatttgtgag 3180

gctttcttca gattctacaa ttttgaaatt ttttcaaatt ataatttttt taccttgatt 3240

gataacaaag ccaataatac acctcaaatc caaatgtatt cctaatagtt ttcaataaat 3300

ctaatatcaa taaatcataa ttaagatatc aatccattct atgaatttga ccataaatcc 3360

tacttgtttc tctgaccttc actataaatt aatcatcaaa ctaaataagt gaggggatca 3420

taattctttt acgacaatcc aagaattcaa gtctagcatc cacattagat ggcttcctgt 3480

ccagatattt gcgcctctcc aaaattgaga ttatcagatt aagaaaaata aaataagaga 3540

gagggttaaa ggacaatgcc ttctaggtag tgatgtccga catcataatt ttgatcaaat 3600

ctatggggca accaataata ttagggaaag aggattggat ttgagcaaga atagcaaagt 3660

cattgtcatc aatggcctga ttcattgagt tcaatgaagg attggtggtt gagtggtgga 3720

ggtggcatct aggaaggaga gagaaagaaa aagatagaga gaaagagata agaaaaatag 3780

agagaaggtg gcagttaaga tccctttttg tgattaatat atagccgtaa gatactcaaa 3840

gatctcacct tatcgacctc aaacactaag ggaggtggaa ggagggacta ctacccatga 3900

agctagagaa agggatgatg atgattggag gaaggaagaa ggaaaaatag tagactcgat 3960

gatgataaga ctaaaagaaa agggtttgac ttagccactt ggtatataat gaggtttggt 4020

atggagtcaa tagcttgagt aatagcatgg aaagagagaa g 4061

<210> 48

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 48

aaatatctaa aacgaaaaag aaaaacgata gtatgctaat agctttgtaa gtcacctttt 60

atctctaatt agatcaagca tattagatat aaaacaataa ttttcaaagt atatgatttg 120

caattaggaa taaatatttg ataaatacag aataaatttt cataaagcat atttactaac 180

attatttata aaatatataa tgcttatatc aataaattaa tttctaaatc aatatatata 240

aactatccat tctgtcttag ccttacaact attgctacca ttccctgtag catggttagg 300

aagagactag ctcttgaata ctcatgtcat ttatcaacat atgcgaatga tcattcgact 360

aatatagtca aaaaaaaatt actctgattt atataaatta aaaattagta aataatatat 420

gctagtaatc accttaccag ctaagctcta aagaaaatta gcttttgaat atacatcatg 480

ctattgatta ttatatgtca gtgcttgtct cattttgtgg catgcaagaa gactagatcc 540

taaacttata tgcatagtca gattaaagag caaatgttgc atctgattat atgaacatct 600

attatgatgt agagtttgta tcatgtatat ttaatttaaa cacaaatata attatacata 660

aataatattc atattttaaa ttttaaatat ttagataatt attctagtgc aggtataaaa 720

ataagcaata taaaatttta aatcgattta tataacatgc ataataaaaa aaattaagga 780

tagaggtact tactgctcaa ctcataaaac ataagaaatc tctttaacta actttagtgc 840

aacctagata gaacatatta atgattaagt tttcatctaa aataaacata gatatcattt 900

taaaatctta ggcatttaaa tggtctcatg atttgtgagg ctttcttcag attctacaat 960

tttgaaattt tttcaaatta taattttttt accttgattg ataacaaagc caataataca 1020

cctcaaatcc aaatgtattc ctaatagttt tcaataaatc taatatcaat aaatcataat 1080

taagatatca atccattcta tgaatttgac cataaatcct acttgtttct ctgaccttca 1140

ctataaatta atcatcaaac taaataagtg aggggatcat aattctttta cgacaatcca 1200

agaattcaag tctagcatcc acattagatg gcttcctgtc cagatatttg cgcctctcca 1260

aaattgagat tatcagatta agaaaaataa aataagagag agggttaaag gacaatgcct 1320

tctaggtagt gatgtccgac atcataattt tgatcaaatc tatggggcaa ccaataatat 1380

tagggaaaga ggattggatt tgagcaagaa tagcaaagtc attgtcatca atggcctgat 1440

tcattgagtt caatgaagga ttggtggttg agtggtggag gtggcatcta ggaaggagag 1500

agaaagaaaa agatagagag aaagagataa gaaaaataga gagaaggtgg cagttaagat 1560

ccctttttgt gattaatata tagccgtaag atactcaaag atctcacctt atcgacctca 1620

aacactaagg gaggtggaag gagggactac tacccatgaa gctagagaaa gggatgatga 1680

tgattggagg aaggaagaag gaaaaatagt agactcgatg atgataagac taaaagaaaa 1740

gggtttgact tagccacttg gtatataatg aggtttggta tggagtcaat agcttgagta 1800

atagcatgga aagagagaag gagctgaaga gagtactaag tcttattaga ataaagaaag 1860

atagaatctt agcgaaaaat agggcctcaa atctttcagg tagaggaaaa agagggatca 1920

acgaatgaaa gactaaggaa aaggtgtgga gtaggatata ctctcgatta gtctctcaat 1980

catggattct agtagggctt cgtcagctgc tcaatcatgg attctgatag ctcaaatggt 2040

ggtaagtaga aagagagaga tctaaagaga ttgatagtgg ccttaaaacc agcacggtca 2100

aggataggca tgccttagag agaggaaaag agagagagat taatggaaat aagcgagaaa 2160

aatatattct tagagaatag attggcgata agaagaggag gtggttgggg catgcttaaa 2220

gaaataaaga aaattgagta ggcggaaagt ggtgatgctt ggcgatgaga agatttgaga 2280

gagagagcaa aaaaatgtgg atgatggtca taggataggg aaaggaaaga acaaagaagg 2340

gggtgctaag ctaactcttt ctaccttcct cacaccctga agcaaaggat ttggccaagg 2400

atggacaaat gggcgagggc tttggtggat ccatgcctac cctttctccc tctcacgatg 2460

attctagtca agctatctat ctttgatagc ttgagccaag ccaattgact tgatccaatc 2520

tctctaaatc catacaaact taagagagtg tattgattca cttattctct tctaagttga 2580

taagaaacat aattaagtgg agctcattaa gtatttcagg tagttgctaa cttggcaaaa 2640

tggaagcaat aataaatctt aaaagactat agcttggtat aatctcaacc atccatgatt 2700

tagaaagatc ttcagactca atatagatta ctttggctac tacaggtaag agctaaatag 2760

gatccaaaag taagatccat cacattagta agtcaaatta tatgtcaaat tttagtaggt 2820

atacttagtc ctacgatgcc taattaaaat gatcatcatt tgaaccttaa aatggactag 2880

tcaactaaaa tttttctttt tgaagaagat ttagaccata aaatatcttc taatctgtga 2940

agaattagat agagcgagga atataaaatt gatgtagaaa tcaagatcta tcatatatac 3000

aattttaata tttttttcat aatttttaaa tatttatctt ctttttttat aggtctagtc 3060

ctatttaaac taggaagagg agtccaactt gacttatgca ataggggatg tccttctaga 3120

agataagaat aatttgatca gaattatata agagcaaacc tcattattat aaataggggc 3180

tatatacatc aatttatgag atagagaatc aatgaaacaa aagtagactt aagttttatt 3240

ttcataattc ttctatcttc tacttttttt ctaggagatt caagttgagt ggattgaaga 3300

aaatctttca tcttctcgat cggatcatat tggtattaga gcgttggtct tctatattta 3360

tggagagctt taatgtattg tttaaatacg tgaacaatac aaacaatcaa gagaagtgct 3420

atccatgctt caaatacatc gaaatataaa agcaaatatg gctactaatt ctttttcaat 3480

ggacaatgag ataaaaggat gtcttacaca actcaaggag aagattgtgc aactcatgaa 3540

gattgtctcc agattgaaga taatttcaat acaagcacaa acaccagcaa ctcatgttgt 3600

gaaactgttt cctatgtttg gagatgaaga tcttctatct agtgaggaga ttgaattacc 3660

taaaagtatg aaaaatcttt cttcaatcat tgaaagttaa agcttgaatt gagatcccca 3720

tatataatgg aaccattgat gaaaaaaagc tagataattg gctaaactaa ttacaaacct 3780

attttattat ctatagatat tatggcatct agaagatagc ttttacttat ctcaagcttt 3840

ctagccatgc tcttatctga tgaaattcat atatgagaaa taataatatt tttaatatgg 3900

tgcagagcca attcaaaggt ttaatcaaga agtaatttta tctaattggc cataaggaag 3960

atcggtggat caaatgataa tacttatgat agaaacataa tcaatccact taggactata 4020

ccaccaagtt ccacaaacag gcaatctgcc ttggaatctt t 4061

<210> 49

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 49

aaagagataa gaaaaataga gagaaggtgg cagttaagat ccctttttgt gattaatata 60

tagccgtaag atactcaaag atctcacctt atcgacctca aacactaagg gaggtggaag 120

gagggactac tacccatgaa gctagagaaa gggatgatga tgattggagg aaggaagaag 180

gaaaaatagt agactcgatg atgataagac taaaagaaaa gggtttgact tagccacttg 240

gtatataatg aggtttggta tggagtcaat agcttgagta atagcatgga aagagagaag 300

gagctgaaga gagtactaag tcttattaga ataaagaaag atagaatctt agcgaaaaat 360

agggcctcaa atctttcagg tagaggaaaa agagggatca acgaatgaaa gactaaggaa 420

aaggtgtgga gtaggatata ctctcgatta gtctctcaat catggattct agtagggctt 480

cgtcagctgc tcaatcatgg attctgatag ctcaaatggt ggtaagtaga aagagagaga 540

tctaaagaga ttgatagtgg ccttaaaacc agcacggtca aggataggca tgccttagag 600

agaggaaaag agagagagat taatggaaat aagcgagaaa aatatattct tagagaatag 660

attggcgata agaagaggag gtggttgggg catgcttaaa gaaataaaga aaattgagta 720

ggcggaaagt ggtgatgctt ggcgatgaga agatttgaga gagagagcaa aaaaatgtgg 780

atgatggtca taggataggg aaaggaaaga acaaagaagg gggtgctaag ctaactcttt 840

ctaccttcct cacaccctga agcaaaggat ttggccaagg atggacaaat gggcgagggc 900

tttggtggat ccatgcctac cctttctccc tctcacgatg attctagtca agctatctat 960

ctttgatagc ttgagccaag ccaattgact tgatccaatc tctctaaatc catacaaact 1020

taagagagtg tattgattca cttattctct tctaagttga taagaaacat aattaagtgg 1080

agctcattaa gtatttcagg tagttgctaa cttggcaaaa tggaagcaat aataaatctt 1140

aaaagactat agcttggtat aatctcaacc atccatgatt tagaaagatc ttcagactca 1200

atatagatta ctttggctac tacaggtaag agctaaatag gatccaaaag taagatccat 1260

cacattagta agtcaaatta tatgtcaaat tttagtaggt atacttagtc ctacgatgcc 1320

taattaaaat gatcatcatt tgaaccttaa aatggactag tcaactaaaa tttttctttt 1380

tgaagaagat ttagaccata aaatatcttc taatctgtga agaattagat agagcgagga 1440

atataaaatt gatgtagaaa tcaagatcta tcatatatac aattttaata tttttttcat 1500

aatttttaaa tatttatctt ctttttttat aggtctagtc ctatttaaac taggaagagg 1560

agtccaactt gacttatgca ataggggatg tccttctaga agataagaat aatttgatca 1620

gaattatata agagcaaacc tcattattat aaataggggc tatatacatc aatttatgag 1680

atagagaatc aatgaaacaa aagtagactt aagttttatt ttcataattc ttctatcttc 1740

tacttttttt ctaggagatt caagttgagt ggattgaaga aaatctttca tcttctcgat 1800

cggatcatat tggtattaga gcgttggtct tctatattta tggagagctt taatgtattg 1860

tttaaatacg tgaacaatac aaacaatcaa gagaagtgct atccatgctt caaatacatc 1920

gaaatataaa agcaaatatg gctactaatt ctttttcaat ggacaatgag ataaaaggat 1980

gtcttacaca actcaaggag aagattgtgc aactcatgaa gattgtctcc agattgaaga 2040

taatttcaat acaagcacaa acaccagcaa ctcatgttgt gaaactgttt cctatgtttg 2100

gagatgaaga tcttctatct agtgaggaga ttgaattacc taaaagtatg aaaaatcttt 2160

cttcaatcat tgaaagttaa agcttgaatt gagatcccca tatataatgg aaccattgat 2220

gaaaaaaagc tagataattg gctaaactaa ttacaaacct attttattat ctatagatat 2280

tatggcatct agaagatagc ttttacttat ctcaagcttt ctagccatgc tcttatctga 2340

tgaaattcat atatgagaaa taataatatt tttaatatgg tgcagagcca attcaaaggt 2400

ttaatcaaga agtaatttta tctaattggc cataaggaag atcggtggat caaatgataa 2460

tacttatgat agaaacataa tcaatccact taggactata ccaccaagtt ccacaaacag 2520

gcaatctgcc ttggaatctt tatcaacaat tatacaattt ttataaagta tgttgaaagt 2580

cttcatgaga gcatctaaaa aaagatgaaa ctctttaagg ttgatgatat cagtaaagct 2640

aacatgaaag tcatagagat tgaggagaaa aatcaaatta gagaagataa ggaaggcaaa 2700

aagcatatca acataactca aaaaaaaaaa ttatgatcat tgaaatcttt gaaaatacat 2760

caaggagaag tattgaaagt ttcatcctga attggagcta aagtagaaga agcccaagga 2820

tgataatttt aagaaaaata aaaagtggtc ctcaattcta tagagattga ggagctatct 2880

gaacttgagt aagcaaactt caaattgagc ttgatggtga gaaaacctaa tacaacaatt 2940

aaaacggatc tagaggtaca tgacaactca cccacttaaa gattcaagtg aagcagagta 3000

tcattaaggc tattataaat ctttgaagct agaagaacct cattttccaa tatttggttc 3060

agaaatcgag gttgtagatc aagcctcatc catatcctta tcctcttagt tggattcaga 3120

aggatgtcaa gttaaaaatt atgagatagt gtaccttcaa gttagccatc actgagaggt 3180

ttatttgtga ggtaactttt gaaatagttt ctttggatat ttgtcaagtt atccttagaa 3240

atgtgtacct ttagaatcaa gatgcaattt tctatagacg atagagaaag tatcatctta 3300

taagggatga gaaaaagttc atgatcaaca cctcaagaac ataaggtaac tttgaccttg 3360

caactgttgc ccaagtgaag tgatttgtta atgtttgtga tgagtgcatg atgatggtat 3420

aaagaaccga tatcactcat gagaggtcaa ggccttgtcc tttggttcca tcaatcgatc 3480

aatagagatt gagattaagg aggagtcact atagtccttg tcgatgagga aggatgacaa 3540

caagcattcc taccatgaag tctagatttg agagcaaatg aaagtaatcc actgagacct 3600

gagagcaaaa aaaggcgaga ccaaaaatca tcttcaagta aagtcaaatg gttcaaccat 3660

gagatgggga agtaagtatt ttcccacctt caattctaac tttgtagaaa ctaaatccct 3720

taaacagggg agccctaatt taagaggatc ctcagattca ttgtggacta ctttggctat 3780

tacaataaga gctggatagg aatcgaaagc aaaattcacc acattaggaa gccaaattgt 3840

atggcaaact tcaagagacc ataacttgat cacatgaaat ccaattaaga tgattttatt 3900

tttgaatttg aatatttttt tgagatctat aactttagat ctaaatcaag ctaaaatttt 3960

attgcttatg ccttcaaaat aggctagtca aatcaaaact tttcttttca aaaaagactt 4020

tgactgaaag atatctttca atctatgaag aatcaagtag a 4061

<210> 50

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 50

ctctcgatta gtctctcaat catggattct agtagggctt cgtcagctgc tcaatcatgg 60

attctgatag ctcaaatggt ggtaagtaga aagagagaga tctaaagaga ttgatagtgg 120

ccttaaaacc agcacggtca aggataggca tgccttagag agaggaaaag agagagagat 180

taatggaaat aagcgagaaa aatatattct tagagaatag attggcgata agaagaggag 240

gtggttgggg catgcttaaa gaaataaaga aaattgagta ggcggaaagt ggtgatgctt 300

ggcgatgaga agatttgaga gagagagcaa aaaaatgtgg atgatggtca taggataggg 360

aaaggaaaga acaaagaagg gggtgctaag ctaactcttt ctaccttcct cacaccctga 420

agcaaaggat ttggccaagg atggacaaat gggcgagggc tttggtggat ccatgcctac 480

cctttctccc tctcacgatg attctagtca agctatctat ctttgatagc ttgagccaag 540

ccaattgact tgatccaatc tctctaaatc catacaaact taagagagtg tattgattca 600

cttattctct tctaagttga taagaaacat aattaagtgg agctcattaa gtatttcagg 660

tagttgctaa cttggcaaaa tggaagcaat aataaatctt aaaagactat agcttggtat 720

aatctcaacc atccatgatt tagaaagatc ttcagactca atatagatta ctttggctac 780

tacaggtaag agctaaatag gatccaaaag taagatccat cacattagta agtcaaatta 840

tatgtcaaat tttagtaggt atacttagtc ctacgatgcc taattaaaat gatcatcatt 900

tgaaccttaa aatggactag tcaactaaaa tttttctttt tgaagaagat ttagaccata 960

aaatatcttc taatctgtga agaattagat agagcgagga atataaaatt gatgtagaaa 1020

tcaagatcta tcatatatac aattttaata tttttttcat aatttttaaa tatttatctt 1080

ctttttttat aggtctagtc ctatttaaac taggaagagg agtccaactt gacttatgca 1140

ataggggatg tccttctaga agataagaat aatttgatca gaattatata agagcaaacc 1200

tcattattat aaataggggc tatatacatc aatttatgag atagagaatc aatgaaacaa 1260

aagtagactt aagttttatt ttcataattc ttctatcttc tacttttttt ctaggagatt 1320

caagttgagt ggattgaaga aaatctttca tcttctcgat cggatcatat tggtattaga 1380

gcgttggtct tctatattta tggagagctt taatgtattg tttaaatacg tgaacaatac 1440

aaacaatcaa gagaagtgct atccatgctt caaatacatc gaaatataaa agcaaatatg 1500

gctactaatt ctttttcaat ggacaatgag ataaaaggat gtcttacaca actcaaggag 1560

aagattgtgc aactcatgaa gattgtctcc agattgaaga taatttcaat acaagcacaa 1620

acaccagcaa ctcatgttgt gaaactgttt cctatgtttg gagatgaaga tcttctatct 1680

agtgaggaga ttgaattacc taaaagtatg aaaaatcttt cttcaatcat tgaaagttaa 1740

agcttgaatt gagatcccca tatataatgg aaccattgat gaaaaaaagc tagataattg 1800

gctaaactaa ttacaaacct attttattat ctatagatat tatggcatct agaagatagc 1860

ttttacttat ctcaagcttt ctagccatgc tcttatctga tgaaattcat atatgagaaa 1920

taataatatt tttaatatgg tgcagagcca attcaaaggt ttaatcaaga agtaatttta 1980

tctaattggc cataaggaag atcggtggat caaatgataa tacttatgat agaaacataa 2040

tcaatccact taggactata ccaccaagtt ccacaaacag gcaatctgcc ttggaatctt 2100

tatcaacaat tatacaattt ttataaagta tgttgaaagt cttcatgaga gcatctaaaa 2160

aaagatgaaa ctctttaagg ttgatgatat cagtaaagct aacatgaaag tcatagagat 2220

tgaggagaaa aatcaaatta gagaagataa ggaaggcaaa aagcatatca acataactca 2280

aaaaaaaaaa ttatgatcat tgaaatcttt gaaaatacat caaggagaag tattgaaagt 2340

ttcatcctga attggagcta aagtagaaga agcccaagga tgataatttt aagaaaaata 2400

aaaagtggtc ctcaattcta tagagattga ggagctatct gaacttgagt aagcaaactt 2460

caaattgagc ttgatggtga gaaaacctaa tacaacaatt aaaacggatc tagaggtaca 2520

tgacaactca cccacttaaa gattcaagtg aagcagagta tcattaaggc tattataaat 2580

ctttgaagct agaagaacct cattttccaa tatttggttc agaaatcgag gttgtagatc 2640

aagcctcatc catatcctta tcctcttagt tggattcaga aggatgtcaa gttaaaaatt 2700

atgagatagt gtaccttcaa gttagccatc actgagaggt ttatttgtga ggtaactttt 2760

gaaatagttt ctttggatat ttgtcaagtt atccttagaa atgtgtacct ttagaatcaa 2820

gatgcaattt tctatagacg atagagaaag tatcatctta taagggatga gaaaaagttc 2880

atgatcaaca cctcaagaac ataaggtaac tttgaccttg caactgttgc ccaagtgaag 2940

tgatttgtta atgtttgtga tgagtgcatg atgatggtat aaagaaccga tatcactcat 3000

gagaggtcaa ggccttgtcc tttggttcca tcaatcgatc aatagagatt gagattaagg 3060

aggagtcact atagtccttg tcgatgagga aggatgacaa caagcattcc taccatgaag 3120

tctagatttg agagcaaatg aaagtaatcc actgagacct gagagcaaaa aaaggcgaga 3180

ccaaaaatca tcttcaagta aagtcaaatg gttcaaccat gagatgggga agtaagtatt 3240

ttcccacctt caattctaac tttgtagaaa ctaaatccct taaacagggg agccctaatt 3300

taagaggatc ctcagattca ttgtggacta ctttggctat tacaataaga gctggatagg 3360

aatcgaaagc aaaattcacc acattaggaa gccaaattgt atggcaaact tcaagagacc 3420

ataacttgat cacatgaaat ccaattaaga tgattttatt tttgaatttg aatatttttt 3480

tgagatctat aactttagat ctaaatcaag ctaaaatttt attgcttatg ccttcaaaat 3540

aggctagtca aatcaaaact tttcttttca aaaaagactt tgactgaaag atatctttca 3600

atctatgaag aatcaagtag agtgatgaaa gataaagttg atataaaaat tgagatctat 3660

ctcttataaa attttagtaa ttttattttt tttaatattt atctttattt agagatctat 3720

tcctatttaa actagaaaga attgtccaac ctaacttgtt caatgatcaa catcctccta 3780

aaagataaaa agaagaatct gactcaaatt ataaaagggc ggaccttttt ttttgatgaa 3840

aagggaggaa aaaaatccat caaaatttat taagaaaaaa agagtacaag aaaagaagga 3900

tatgaaagag taagagaagc cccacaacat ccatcaatat ttaaaattta aatttaaatc 3960

tcccccatca ttctatcaat atttgatatt caaatttaaa ttcttcgcag catcccacca 4020

acatttgaaa ttcaaatcct ttcatacaaa caaaataata t 4061

<210> 51

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 51

caaggagaag tattgaaagt ttcatcctga attggagcta aagtagaaga agcccaagga 60

tgataatttt aagaaaaata aaaagtggtc ctcaattcta tagagattga ggagctatct 120

gaacttgagt aagcaaactt caaattgagc ttgatggtga gaaaacctaa tacaacaatt 180

aaaacggatc tagaggtaca tgacaactca cccacttaaa gattcaagtg aagcagagta 240

tcattaaggc tattataaat ctttgaagct agaagaacct cattttccaa tatttggttc 300

agaaatcgag gttgtagatc aagcctcatc catatcctta tcctcttagt tggattcaga 360

aggatgtcaa gttaaaaatt atgagatagt gtaccttcaa gttagccatc actgagaggt 420

ttatttgtga ggtaactttt gaaatagttt ctttggatat ttgtcaagtt atccttagaa 480

atgtgtacct ttagaatcaa gatgcaattt tctatagacg atagagaaag tatcatctta 540

taagggatga gaaaaagttc atgatcaaca cctcaagaac ataaggtaac tttgaccttg 600

caactgttgc ccaagtgaag tgatttgtta atgtttgtga tgagtgcatg atgatggtat 660

aaagaaccga tatcactcat gagaggtcaa ggccttgtcc tttggttcca tcaatcgatc 720

aatagagatt gagattaagg aggagtcact atagtccttg tcgatgagga aggatgacaa 780

caagcattcc taccatgaag tctagatttg agagcaaatg aaagtaatcc actgagacct 840

gagagcaaaa aaaggcgaga ccaaaaatca tcttcaagta aagtcaaatg gttcaaccat 900

gagatgggga agtaagtatt ttcccacctt caattctaac tttgtagaaa ctaaatccct 960

taaacagggg agccctaatt taagaggatc ctcagattca ttgtggacta ctttggctat 1020

tacaataaga gctggatagg aatcgaaagc aaaattcacc acattaggaa gccaaattgt 1080

atggcaaact tcaagagacc ataacttgat cacatgaaat ccaattaaga tgattttatt 1140

tttgaatttg aatatttttt tgagatctat aactttagat ctaaatcaag ctaaaatttt 1200

attgcttatg ccttcaaaat aggctagtca aatcaaaact tttcttttca aaaaagactt 1260

tgactgaaag atatctttca atctatgaag aatcaagtag agtgatgaaa gataaagttg 1320

atataaaaat tgagatctat ctcttataaa attttagtaa ttttattttt tttaatattt 1380

atctttattt agagatctat tcctatttaa actagaaaga attgtccaac ctaacttgtt 1440

caatgatcaa catcctccta aaagataaaa agaagaatct gactcaaatt ataaaagggc 1500

ggaccttttt ttttgatgaa aagggaggaa aaaaatccat caaaatttat taagaaaaaa 1560

agagtacaag aaaagaagga tatgaaagag taagagaagc cccacaacat ccatcaatat 1620

ttaaaattta aatttaaatc tcccccatca ttctatcaat atttgatatt caaatttaaa 1680

ttcttcgcag catcccacca acatttgaaa ttcaaatcct ttcatacaaa caaaataata 1740

tttttcaaat tctcaacttt gagtttcaaa attgagaagc ctacatattg tctgctcttc 1800

accaaagagg ggagattgtt ggcttagctt ggcccaagag aagagaagaa ggccaaggcc 1860

caatctgtag cctagagaag gagggtttgg tagctactta ataatcggat ctaaccgata 1920

aagacactat ctctattaga agaaaaggta gagagaaaaa gaggcaattg gttaacttca 1980

gagggggagg aggtaagctg ttgaggagat taatctgacg caaggaaaaa agaagagctg 2040

acaactagcc aatgatcgag aagggctgga gacaatccaa gcccagcacc aagaagcaag 2100

agaaagaatt tggaggtcaa aggaggagtc caggaagaga gagcgaaaca caatgttcgg 2160

atctagccga caacgatacc aattatacta ggaaagaagg taaaaaggga aagagcaatc 2220

gatcatcttc agcaaagaaa aataaaagag gcacccgaca gtcaagccca tggccaaatc 2280

agtcagcaag aggacctcac aagatctaga cggtgctaag gggaagggag gaagaaaaga 2340

gatccagtaa ctgtccaaca ccaggaaaag gaggagataa gaggaaggga gaagtcattt 2400

ttctatcttg ggccgaagga gggagaagga agaaagagga aagaacatcc tcaaagtcga 2460

aggaaggaag gaaagagagg ggggaagggg tcacagtcag atataccaga agggatagat 2520

ccagtgtcaa agagagaaaa gagagaggag atcagaaaat aaaatttgat gactgactaa 2580

ttgtcatgaa aggctaatga caactcataa aaaaagtata gtagtaaaga gagggggata 2640

ggcttggtta gggaagagat tccgacaaca aagagaaaga aagagagaga gagagagaac 2700

cggctcccag ccaaaaatag cttgacccac catcgagaag gaccgacaaa gagagagaaa 2760

gatagaatag ggagaatagc ttggcttcga atcaaaaatg atctaacaca ctgctgaaaa 2820

ggactaggaa gagagagaga gggggtaggg gagtatctcg gctcgcaatc agaatcaact 2880

ggccaatgcc agaaaagaga ggaagagaga gatagagaag atatagcaaa agagaagaga 2940

tggacaaaag gagagaggaa gggagggaga gagagaaaaa ataggagaga gaggggcttg 3000

gtggctgact gtcagaagaa gcctcgatgc tcgaagatta gatggaagaa aaaaaaattt 3060

ctcaaaactt ctcttttcta taagagcaaa cctcactatt ataaataggg ttatgtatct 3120

cagtttatga tgtgaagaat taatgaaaaa ttggacttta gctctatttt tgtaattctt 3180

tcatcttcta tttttatgaa attcaagttg agccgattaa aagaaataat ctttctttcc 3240

gattggatca atccattaac tagatacttc aaaaatcaaa atgacctatc taaaatccta 3300

aatcaaatac aaaaccaaaa taactaaatt aagatagaac aaactacaat tacaaaaaac 3360

tggctaaagt gtttaaatgc ttttactcct aagtttcttc ttgctcacca ttaatgcttg 3420

atctttagct gggatcatat cagccttatg accactataa gaccaacata acaactcact 3480

tgtattgctc ctttaaaatt atacaaaact agtgtctaat atgtaccatg cgaatgtctg 3540

tttctcacca gaaaatggat gggcttcttg tgcaagcacc ttcttcctac aaataataaa 3600

atatgcatcc cttctctcat cttactaaat aaaataatta aaggctttac tatcaggaaa 3660

tctggcttta tccatataat tttggaagtt ttatttgaac ataacattac gagtactaga 3720

ttacatcagg aggtggttcc tcttatttct attaagagaa aaatcaattt tcttttaaga 3780

aagatcattt cattttcatc aggtagcgta ctctactaat atacttccac aacaatatat 3840

agggattaga ttataggatg gactttaagg cttcttttcg agagccctga tttctcaatc 3900

acattccctt ttctttctca tgtaatggca tttaagagtg catccagggc ccaacaatta 3960

gtcacaagtg ttctttttat acatggtaca tatttgctat tttttagctt attttaactt 4020

gattgtgaag atatcatgag aaaattagat ttaaagccta g 4061

<210> 52

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 52

ctttcaaaaa tatcttttga taggactaat gagataagtc aggaccaatg gatatctcgg 60

tcaacccaac cactgctcaa gtttgagatg gaaaatctat ctcggacaac agctgaagtt 120

agtacctcag gttaggatga tctagaatct cctataagag attttttaga ttatttcggc 180

ccaagtactg aacaatctgt cctgaccaat ctcgatcttt aggaacttaa gaaaaaatat 240

tcgattcagc ttataactcc aagttgggat ggtaggatta ttgaacctcc agaaggttat 300

gtcgtatttt atgatgaggc acttcgatct ggactttaat ttctcttaca tcctttcttc 360

agtaatgttt tagacttcta taaactccat ccaatctagg ttactcccaa tgccattagg 420

atgatcatag ttttcattat ctatcgtaaa ttttttgcta tagaactaag aatttctctc 480

tttaggatgc tggtcatcct aagaaaacat ccttatgaaa aagactgatg gtatttctta 540

ccttggcctc aatataaatt cggtcccact cttccttttt caatacataa ttgaaaaaat 600

cattttttct ttatttcttc taatgtttcg tagggtttta tttgtaaata gtctaagcct 660

aaaaccaaat ggaactcaaa taacaaaata ttatctgagg atgaggagac ttttgtagag 720

cttttagata tgaaagtatc caagttgagc ctactggtgt ccaatcagtc cttgtttgac 780

accgacatca gtcagatctc tccttaagat aagtctgatg ttaattcttt ttctttattg 840

ctttatcatt tttcatcatt tttcttttct aacaatcttt ttccttatat agtagcaata 900

atgaagttca acctacaaag gctggctaac tcaaagaaga ggaagaagga tctaaccgat 960

tgctctcaag aagagtaagg agactgctcc tctaagatcg attggccccc gatcatcacc 1020

tgggccaata ttaattgaca tagatgctac atcgatctcc actataccac cagcaaaatc 1080

aactcatcaa cctactaagg tggcttgtcc acctcctaaa gagtctgcac atccaaagta 1140

ggcatcttcc ccaacacctc caacatcggc caagttagtt tggctgagca atcagcatct 1200

gaggtcacag actcctgatg tcaacccacc aactttctca tcaaaaaaaa ttgacttggc 1260

gaaggtatca cttttggaga cacccagact aggcaaggac ttgctctgta caatgatgcc 1320

tcaaaaggac ctagatgctg ataggaggga tctttctttg gagcaaataa taaattatgg 1380

attcaacagt atcatgaacg tgagtcttca ttctcttcca ctctcttctt tctttttctt 1440

ttttttttta cattggctat ttgttgatct gaatatatct ttctttttgc agtcggttgt 1500

gtatttcaag ttgctcaatg agcacttgac atggttcttc aaaaataaaa tttttttgaa 1560

agagaggctc aaggccaaga aagaggccaa aaaagcagtt gaggaggtca agaaggcagt 1620

aaagaagaag gctgtcaaag aaagcaaaat gatggcgggg ctgaagaaac agctccaaga 1680

aaaaatagat tccattaagg agactggaca accaatgaca gatgaatgat aaagatgaca 1740

agttgtaaaa acagcctgaa aaaaatctca aagttggagg ccaagctgaa ggaggtcgag 1800

tcaataattg aaaagcatga tgaagctctt gtcccatatt agagacaact tgataaagac 1860

aaagagtgga tgtcaaggat tattgaagat tataagaatt ccgacacttt tcaagatgac 1920

gttactgagg cctcaaaagg agctttcaat tatggctttt tgagctacag gagtttaatt 1980

atcaagctct ttcctaacct tgatctcagc aaggtcataa tagaagcagc tctagaagta 2040

gtagccgaag tgacttctgc aacaactact gagcttgctt ccacttctat cattggagtt 2100

tctccgatcg aagtcccaaa cagtccaatc gaggcctcca tcatcgaagc tatttcgaag 2160

gaatcagtcg gcaaagacct tacctcaact cctccaacaa ataactccca agctaaggcc 2220

tgaattatct tcttcttttt ttctaaacat ttgtattagc ccgatgtggg cttctataaa 2280

tactttttac attaatgaat gagtttttca atgtcaatat tttttctttt taactaatac 2340

taatcttgga tgatccgatc tgggttggat gtctcaaaaa atatcattca cgatagatag 2400

ttattttctg acttcggtta gatgattatg agtatatgta attcaacctt ggttaggtaa 2460

gtaatcaaat attaactatt ctcaaaccaa gtagataacg aagtcaatgt gattaacttt 2520

aacaagtaag attgttatgg aatgaaattg aatcagatca actaactata gataacttaa 2580

tctctcataa ttcactgtaa aggttctaaa agtaccttta tctaagttcg aagtgacaag 2640

tcgggttctt ttattcgtgg atttatgacc catgctgtct ttttgtgatc ttcattatta 2700

atcaccttaa atcgatatag caaaatccag tttatagatc tgagtgcttt cttgtcagat 2760

tgagtctatc ctattatctg tgaaacctga tctagagatc aagtatttta ggttttttat 2820

ttaaggtcca attcgaagat tgagtatcca atgtcatatt gttaggtcca atttggagat 2880

tggatgtctc actatcatct cgtgaggtcc aatccaaaga tcgaatatct cactatcatc 2940

tcatgaggtc caatccagag attggatgtc tcacatcatc ttgtgagatc caattcgaag 3000

attggatgtc tcacatcatc tcatcctatt gtggttggaa tttttgtagc cttagtttga 3060

ctttttctga cctcatttgg acacctaaat cttattatca tcgtttgatc gatttttact 3120

aatctacttt ggatgaaaaa gaattcttca atggaacttt tgattagaac tttatcttca 3180

ttgggataga aatcgaatgc tttattgaaa gattttattg ataatacatt ctgagatttt 3240

taatatttca tgttctcgaa atgatcgtac catctaaatt tttaattcga taagctcttg 3300

gatggatcac ctcagtaatc tgataaggtc cttcccaatt cgggatgagt ttttcttact 3360

ccattggttt tgagacttca gctcattgga gaaccaaatc tccttataaa aaattttagg 3420

ctttacctga gagttgtaat atctggctac tttttgttta taaactacca tatgaatctg 3480

ggctttttct cgagttttct caaataaatt gagatcagtc ctcagttgat ctgaattatt 3540

ttcttcatga aaattttcta ttctggttgt aggtaaactg atctcgacta gtattatagc 3600

ctctgttccg aaagtaagtt taaaagatat ttctctagtt ggtctctgag gtgtagttct 3660

gtatacccat aaaatattat aaaattattc taccccgaga cttttagcct caatgagttt 3720

tatttttagg ccttgaaaga tagttctata aataaattta gcttctccat ttgattgtag 3780

atgtccaatc gaagtaaata tatgatctat gtagagctca gaataaattt ttttaaaatt 3840

ttgattatca aattattgct cattattagt aattataact caaggcaaac caaaatggta 3900

aataattatt tttcacataa aatctcatat tttttctcag tgatttatgt cagaggttca 3960

atttctatcc attgggtaaa ataatcaata gtcacaacta aaaattttct ttgctccatg 4020

gccattagaa aggatcccag aatatccatt ctccatatag c 4061

<210> 53

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 53

aaaattattc taccccgaga cttttagcct caatgagttt tatttttagg ccttgaaaga 60

tagttctata aataaattta gcttctccat ttgattgtag atgtccaatc gaagtaaata 120

tatgatctat gtagagctca gaataaattt ttttaaaatt ttgattatca aattattgct 180

cattattagt aattataact caaggcaaac caaaatggta aataattatt tttcacataa 240

aatctcatat tttttctcag tgatttatgt cagaggttca atttctatcc attgggtaaa 300

ataatcaata gtcacaacta aaaattttct ttgctccatg gccattagaa aggatcccag 360

aatatccatt ctccatatag caaaaggcca cagcactgta atagaaataa gttcagttgt 420

aggctgatgt tatatattgg cgtacctttg acactgatcg cagtacttat taataaagtc 480

ggttgaatct ttttgaatag taggccaata ataatcttac tgaattattt cataagctaa 540

aattttaccc cccaaatggt tactagagat tcctttatga acttctcgaa ggatgtaatc 600

agcttccgat ggccttaggc ataggagcag tgggagtgaa tataacctct gatataattg 660

attatcttga acaacatacc atggggcctg tcttttaatt cttgttcctt cgactggatc 720

aaccggtaga ggttctttag taatatactc cattaatggg tcaatggaac ttagctcata 780

ttaaatttgg acaattagta aggcctcgat actagacttt ttaagaatat caataagaac 840

accttgattt agtttgaaaa aatctgatgt ggctaaatga gatagggcat cagctcagac 900

attttgtcct tggtatttgc atgatcttca gattttcaaa gttttttaat aattctttca 960

tattatataa atattgaaac atcataaaat ctttagcttc aaattaatct catacctgac 1020

tgacgataaa ttgagaatca ataaaaattt taattttttt aacattaagc tccttagcca 1080

ttttgagtcc tacaattagc gtttcatatt ctactccatt gtttgagtgt taaaattaaa 1140

tctcaaagca cgctcactaa caatgccttc tagactcgtt agaattaaac tagttctact 1200

ttctttcgaa tttgaggctc catcaatgta cagtatcaaa taagaatctt tgatattttt 1260

caattctttt aagattggtt cttcattagg aatagagcat tcaataataa aatcagctaa 1320

tacttaaact ttcaatgaag atcgaggccc atattgatat caaattcatt taattcaata 1380

gcctatttga atatccttct taaagtatca agctactgta aaattaattt taaaggttga 1440

tcgatcagaa ttataataga atgagcctaa aaatacgatc aaagtcatct tgctaatgca 1500

atgagggtat aaattatctt ctcaatttta gaatatcgag tttcaacatc tctaaataat 1560

ttatttgtat aataaatgga tctttgtatc cctgcatcat ttcaagctaa aatcgaacta 1620

acagcatttg ctgaaataga tagatacatg aataattttt gacctttgat cggctttgat 1680

agtaatggag ctgtgccgag atatttcttg agatcatcga aggctgcttg acattcatct 1740

tatcaatcga agtctttgat ctgccttaga attttaaaga aaggaagata tttatcagct 1800

gatctgaaaa taaattaact aagcaatgct actcatccag taagttggtg tacttctttg 1860

atggagctcg gatgcttcat ttcacataga gcttgaattt tcttaagatt gactttaatt 1920

cctctttgag ttacaaaaaa atctaaaaaa atttttgaag ttacttcaaa agcatatttg 1980

ttgggattga gcttcatttg atattttcgt agtctctaaa ggcttcttcc agattggcaa 2040

tatactgatc tgactcagta ttttttacta atatatcatc aacataaact ttgatattaa 2100

tttcaatttg ttacttaaaa atcttattaa tcaagtatta gtatgtagca cctacatttt 2160

taagatcaaa agacatcatt ttataacaat gcaaatcttt ttcagtgatg aaggccatat 2220

tttcttcatc ctcaagtgcc attttgatct gatataacca gaaaaagtat ccataaagct 2280

tagtaatttg tgtcttgaag tagcatcaac aagctgatca atttttgaga gagaaaaact 2340

atcttttagg caagctttat tgagatcggt ataatcaaca tagatccttc atttttcatt 2400

agccttttta accatgacaa catttacaat ccactttgga tattatgctt ctctgatgaa 2460

tttgtctttc aagagtttgt cgacttcctc atctattatt ttttatcttt tcggggtgaa 2520

acttcttttc ttctgttgca ttggtttatg ctttggatca acattcagct tatgtacaat 2580

aagatcagtt aaaatctcag gcatattaga gactgactaa acaaagacat cggcattcat 2640

ccgaagaaaa gatattaatt tctccctcag atcaggcttc aatagagatc caatttggac 2700

agtttttttt ggatcatcac acaaaagaac aataataagt ttctcgactg gttctcctcg 2760

atttttgatg atatcaactt tactttcttg atcaagtatt ttaattggta gagcttccac 2820

agaccttttc atttttacag ctatcagaaa atactactta gcaagtatct gatttcctca 2880

tatttctcca actccatact tagtttggaa ttggattagt aaatgataag tgaagactat 2940

agccttaagg gcgttgagcc taggtcggtc aagaatagca ttataagctg atggtatttt 3000

gacaataaaa aaagtgagtc ttacagttga ctggcatggt tctatccctg cagtgacgga 3060

caaagtgacc tctccttcca cagctacagg atttctagaa aatccaatta cgggggtacc 3120

aacctattta gctaatttat catattcatt ctttggaatg tatcatagaa caatatatta 3180

gcagagcttt cattatcaat aagtattctt tttatatcat atttggctat tgccataaag 3240

atgacaacag catcattacg aggagtttga actctaacat catcatcgaa aaatgaaatt 3300

atgtgatcca tgcactgatg ctttggaagg ctttcagtaa tctcagccac ctcctcagtt 3360

ccgtcgagat ctgagatcat attgatgact gcagcagtag acttgttgtg atcattctca 3420

ttgttgggct tctatcattg gtcagtagct tgacttgccc gatctcgaac atatttacta 3480

aagtaacatt agtggatcaa tacttcaatt ttatctttta attatcgatg ctcctcagta 3540

tcatggccat agtctcgatg gaaatgacag tattttctct tatctctctt tgctggaggg 3600

gctttcatag gattaggttg gcgaatatat cctaaatcct cgatttctat cagtatctga 3660

gctcgaggag tagatagtga ggtatagatg tcgaatcacc gaggtgggct tttgaacttc 3720

agattcttct gaggtcgttc agagttatcc tgttggtttt tatgatcttc ttcctagggc 3780

cacttttttc catctctttt tttcttcacc taacgaagta tgcatgctct ctttcttttc 3840

agcttgagca tacttacaaa cctagatcaa tatttgttca taattgtttg ggtagttctt 3900

attaagagag aagatcaggc gattactctt gagtccttgc ttcaaagctg ccattgcaat 3960

ggactcattg aagttcttca ctttcagtat ggcggcatta aagcatgcca catattcttg 4020

aagagattca ccttcctact atttgatagt aaaaagattg c 4061

<210> 54

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (2978)..(3705)

<223> n is a, c, g, or t

<400> 54

catcatcgaa aaatgaaatt atgtgatcca tgcactgatg ctttggaagg ctttcagtaa 60

tctcagccac ctcctcagtt ccgtcgagat ctgagatcat attgatgact gcagcagtag 120

acttgttgtg atcattctca ttgttgggct tctatcattg gtcagtagct tgacttgccc 180

gatctcgaac atatttacta aagtaacatt agtggatcaa tacttcaatt ttatctttta 240

attatcgatg ctcctcagta tcatggccat agtctcgatg gaaatgacag tattttctct 300

tatctctctt tgctggaggg gctttcatag gattaggttg gcgaatatat cctaaatcct 360

cgatttctat cagtatctga gctcgaggag tagatagtga ggtatagatg tcgaatcacc 420

gaggtgggct tttgaacttc agattcttct gaggtcgttc agagttatcc tgttggtttt 480

tatgatcttc ttcctagggc cacttttttc catctctttt tttcttcacc taacgaagta 540

tgcatgctct ctttcttttc agcttgagca tacttacaaa cctagatcaa tatttgttca 600

taattgtttg ggtagttctt attaagagag aagatcaggc gattactctt gagtccttgc 660

ttcaaagctg ccattgcaat ggactcattg aagttcttca ctttcagtat ggcggcatta 720

aagcatgcca catattcttg aagagattca ccttcctact atttgatagt aaaaagattg 780

ctagtatttt tcaaatgaat ccatttatta tcaaaatacg tgatgaatat ttgctaactg 840

tgtgaaagat gaaatagatc atgtctggag gtcagagaac tagattcttg cagatgtttt 900

gagagtgatt ggaaaagtga tgcaaaatag ggcattagat accccttgta gtcttataat 960

ggctctgaag ccttcaagat gatttaaggg attgatggag ccatcgaatg tttccaatgt 1020

aggtatcttg aatcgaggag gaactgattt accaagaatt ttttgagaaa aaagagatcg 1080

taagttgaaa tctcttctac cttgagaatg gcttccaatc tatatctcca tcattttctt 1140

ctcaagattt tgaatctttt gtccaagacc ctcctccata catggcttct tatgtggagc 1200

agatttcact tcccaagagt gatcagtatg gtcaagaaga tgatcatgat gaagatcttg 1260

aggagttggt tgctaagtgt gatgtgattg gactacttgg ggggctactt tttgctaccg 1320

ttctgtcgta tactacagca gtaagagctt ggacctgctg aaccaagaga ctaaactatt 1380

gtggatcaat aataattgaa ggttaggtat tctcctgaac atcttcagga gaagatgaag 1440

taggtaaagg atgatttggt gccttcttgt tcaccatttc tactaaaata ttttaagtgc 1500

ccttcctcta acactaatct attactgcaa ggcttcaaaa gacaggcaac gagatgggtc 1560

ttgaatcgaa ctagaatgtt tcttggttga atttggcgaa gtctgtaaca aatcttgcaa 1620

agaaaatctc gaaacctacg ggtaccttct ggttcaagat cctctgatgg ataagttagg 1680

taaagtcttg agaataggtt gtgaaaatag aagaatagaa ggatgagaag agagattgtc 1740

ggtaaatgga gagatgactc ttatttcttt caatggggga gctgaaaata attcagcaga 1800

gtttccactc tatcaatcct gacttatttt gtggagggta ccttggcccc ttcatatata 1860

ggggatgaag aggcctggta aggttgttag actattagga gagtttgtta gatcgttaat 1920

ttattataat agaatgacca gctatataaa aatcatggag tatttaccca catggtgatt 1980

gactgtagta taactgaaag atagctaatg cttagctgga tgactgctgt tagataactg 2040

tctgcattct tacggtacat tgatatttta ccaatgtgac atagcttaaa tcggcaactg 2100

gctgaactaa atattatgta tccctttagt taacaatcat gtcggttaga gatcaatgta 2160

attcgcagca gatcgatcat aagctgagat gagtatcata ttttaagaac aacgctgggc 2220

gagttaggcc gatcaaatgt cagactgaaa aagcagatca ataaacctct gatgtgatct 2280

gaaagaatat ttatgattta aataataatc tatcaccacg tatccagata atgaggtcat 2340

ataacatgta ccaacagtgc atttttccat ctagttaaga ggttggttag tggcatttgt 2400

cttcgatatg taatgttcac ataactaatg tgcttagtag cattcttttg taaggttaaa 2460

tcttcaatga tcttaagttc acataattgc ctttgtgccc tattagttta tagttgacct 2520

tttaattcaa gagacagtca ccttagcaat cgatgtctgc ttagattggg ccaattaggt 2580

actcacatta atatattgaa tcatgtttga atataaagga ttagattgat ttataagttt 2640

ccttttattg tttacatact gatacttaga ttgacttact acattatttg atatgttatg 2700

ttctaatttt tggattaaaa ttgttgtttc tgatttctcc ttacatctaa tactttgtat 2760

aatttattat tttttagcat gattgagtgt agaggattag attgattttt aagtttattt 2820

tgattattta catgcccata cttaaattga cttactacat tattcaatat gttatgtttc 2880

aattattgag ttaaaatttt tatttctgat ttctactgat gtccagtgtg tgtgtgtgta 2940

cgtatgtgtg tatatattta tttacatata tatgtatnnn nnnnnnnnnn nnnnnnnnnn 3000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnatgta tacatataca 3720

tgtatacata catatataga tatatatata tacatatatg tatatatata tatatatata 3780

cacatatata ggttatttgg aacctaagaa acttgcaaag ttactagatg caatgttcgg 3840

aaaccatgga ccgtaacaac tggagtagta tttgggtcat gaattcatgg ctagatcatg 3900

aattgagtgg gagtcaaccg aagtagggcc agctcagaca cttgtattta ggtcccatgc 3960

ttgcgtgcat tctcttccct gatatccttt ggctttgctg cctcaaatcc tcgagctatc 4020

ttatcatcat cgcattgagc tccatacctt gctctttcct a 4061

<210> 55

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (2098)..(2825)

<223> n is a, c, g, or t

<400> 55

tagattcttg cagatgtttt gagagtgatt ggaaaagtga tgcaaaatag ggcattagat 60

accccttgta gtcttataat ggctctgaag ccttcaagat gatttaaggg attgatggag 120

ccatcgaatg tttccaatgt aggtatcttg aatcgaggag gaactgattt accaagaatt 180

ttttgagaaa aaagagatcg taagttgaaa tctcttctac cttgagaatg gcttccaatc 240

tatatctcca tcattttctt ctcaagattt tgaatctttt gtccaagacc ctcctccata 300

catggcttct tatgtggagc agatttcact tcccaagagt gatcagtatg gtcaagaaga 360

tgatcatgat gaagatcttg aggagttggt tgctaagtgt gatgtgattg gactacttgg 420

ggggctactt tttgctaccg ttctgtcgta tactacagca gtaagagctt ggacctgctg 480

aaccaagaga ctaaactatt gtggatcaat aataattgaa ggttaggtat tctcctgaac 540

atcttcagga gaagatgaag taggtaaagg atgatttggt gccttcttgt tcaccatttc 600

tactaaaata ttttaagtgc ccttcctcta acactaatct attactgcaa ggcttcaaaa 660

gacaggcaac gagatgggtc ttgaatcgaa ctagaatgtt tcttggttga atttggcgaa 720

gtctgtaaca aatcttgcaa agaaaatctc gaaacctacg ggtaccttct ggttcaagat 780

cctctgatgg ataagttagg taaagtcttg agaataggtt gtgaaaatag aagaatagaa 840

ggatgagaag agagattgtc ggtaaatgga gagatgactc ttatttcttt caatggggga 900

gctgaaaata attcagcaga gtttccactc tatcaatcct gacttatttt gtggagggta 960

ccttggcccc ttcatatata ggggatgaag aggcctggta aggttgttag actattagga 1020

gagtttgtta gatcgttaat ttattataat agaatgacca gctatataaa aatcatggag 1080

tatttaccca catggtgatt gactgtagta taactgaaag atagctaatg cttagctgga 1140

tgactgctgt tagataactg tctgcattct tacggtacat tgatatttta ccaatgtgac 1200

atagcttaaa tcggcaactg gctgaactaa atattatgta tccctttagt taacaatcat 1260

gtcggttaga gatcaatgta attcgcagca gatcgatcat aagctgagat gagtatcata 1320

ttttaagaac aacgctgggc gagttaggcc gatcaaatgt cagactgaaa aagcagatca 1380

ataaacctct gatgtgatct gaaagaatat ttatgattta aataataatc tatcaccacg 1440

tatccagata atgaggtcat ataacatgta ccaacagtgc atttttccat ctagttaaga 1500

ggttggttag tggcatttgt cttcgatatg taatgttcac ataactaatg tgcttagtag 1560

cattcttttg taaggttaaa tcttcaatga tcttaagttc acataattgc ctttgtgccc 1620

tattagttta tagttgacct tttaattcaa gagacagtca ccttagcaat cgatgtctgc 1680

ttagattggg ccaattaggt actcacatta atatattgaa tcatgtttga atataaagga 1740

ttagattgat ttataagttt ccttttattg tttacatact gatacttaga ttgacttact 1800

acattatttg atatgttatg ttctaatttt tggattaaaa ttgttgtttc tgatttctcc 1860

ttacatctaa tactttgtat aatttattat tttttagcat gattgagtgt agaggattag 1920

attgattttt aagtttattt tgattattta catgcccata cttaaattga cttactacat 1980

tattcaatat gttatgtttc aattattgag ttaaaatttt tatttctgat ttctactgat 2040

gtccagtgtg tgtgtgtgta cgtatgtgtg tatatattta tttacatata tatgtatnnn 2100

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2160

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2220

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2280

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2340

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820

nnnnnatgta tacatataca tgtatacata catatataga tatatatata tacatatatg 2880

tatatatata tatatatata cacatatata ggttatttgg aacctaagaa acttgcaaag 2940

ttactagatg caatgttcgg aaaccatgga ccgtaacaac tggagtagta tttgggtcat 3000

gaattcatgg ctagatcatg aattgagtgg gagtcaaccg aagtagggcc agctcagaca 3060

cttgtattta ggtcccatgc ttgcgtgcat tctcttccct gatatccttt ggctttgctg 3120

cctcaaatcc tcgagctatc ttatcatcat cgcattgagc tccatacctt gctctttcct 3180

aactgccccc atcaaacctc cggagatcct ctttcttctc caatgttgag atttgttgga 3240

gtcttcccac cttctcactt caatgggtgg caatttcaag tgccagttcc cttatttgtc 3300

ccagctatat tgacaatggg gcttattcta gggtttctca tggacatagt gataataata 3360

atcaagggac caagagagaa aaatctttct agtctgtgtt ctttaagttt gagagatagg 3420

cagcacattt ttttaataag cctttttcac tcatcggatc ctgattttca gttgttcgac 3480

ctgaacagtt caagcaattg aactgcttgg gtcactattt tggacgattt tcagccattt 3540

ttaagtattg tttgactgga tccacgctgc gtagtgggca ttgcgttgat caagtagacc 3600

tgtaagggtc aacaaggtct gagaacactg aatggatgct ccataatcct cttgttatct 3660

gtcaaccatt tggaatcttt taaaacaaca tgtggtgata atatatatga taaactgtga 3720

tagattcatg tatagattat acatatgaaa atgtagagtg cttagtaaaa gtgatgaaga 3780

gcaatgcgtt agaatgtgct agcctttgac ctaaaaattg gaatgcccaa tgatgagtta 3840

tgataaaatt gtgacgtgat ttatgaagtc taatgtttag ttggcttgca gtttcagatg 3900

cgataaagaa ttttatgatt tagctctttg gttttttaac atgcaaacat ttaattgtac 3960

tgaaaaacat ttatttcgaa acatgtagga gactattgga tattgaaatt aaaattgact 4020

ttttggtgtt tcacaatatt tcttaataaa cactacgact a 4061

<210> 56

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (218)..(1631)

<223> n is a, c, g, or t

<400> 56

aagctccgtg cttctgtctt tgagaagtgt ctgagtaggt agtcgatccc aggcaacctt 60

ctagaggaaa agtctgatcc tagagtggat agccatgtgt atatatatat atatatatat 120

gtatgtatgt atgtatgtat gtatgtatgt atgtacgtac atacatacat acacacacat 180

acatacatat acatacatac atatacatac atacatannn nnnnnnnnnn nnnnnnnnnn 240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 600

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 660

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 720

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 780

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 840

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 900

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 960

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1020

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1080

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1140

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1200

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1260

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1320

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1380

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1440

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1500

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1560

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1620

nnnnnnnnnn ntatatatat atagtatact atatagtata tatatagtat atatagtata 1680

tatatatata tatatatata gtatatatat atatatatat atatatatgt gtgtgtgtgt 1740

gtgtgcgcgt gcgcgcacgc acgtgtgtat ctcgatctgt gtgtgtgtgg tccatcttca 1800

cacttttccc tcaaaaaaac cccccttgag attttgttca gctgaaaggg gttcataaaa 1860

cttgcccttg cttggtccta gggtttaaga tttatatgca atattcatta agacgtctaa 1920

atgtcataat attttgaggt tacaaatatt aacaaacagc cttggataca aacctttttc 1980

tcgaagaatc ttgtatctgt tcttcctcag atgacatgtg atttatgcta cggcctagtt 2040

ctaaggactt ttctctgtca ttaacataaa aaaaaacaga aatatattcc ttagtaagga 2100

aatagttgtg cactatgatt gctatgtctc tcaaaattat accaaacttt ttatgatata 2160

gagtgaaaat caaatcagca tgtctggtct atttgccaaa tagggttgag cataggtcgg 2220

gttcggtcga gttgagagaa aaatttcatc cgatcaaatt caatcggatt gaagaaaatt 2280

caatccactg ccaatcattc attatgcata aactatctaa aactgaaatg aatagtttgt 2340

agcaggatca ggtgttatgt cagtttggac ttcaatgtta acccaatatt gattttaaat 2400

ccaacattgg tccacttaga cttatttatt tatttttatc aatttaatat aaaaaagatc 2460

taaacctcat aagtcataaa ttttggattt atttttgaac atgtacaaaa taaaacagaa 2520

aaaagaaaaa attacttatc taaaagtaac tatatctgaa aactttcact ttagaattgt 2580

cttaaattaa tgtacttcca tcaacaattc aatgttaata tttttatgaa tccaaatgga 2640

tgatagagta ttttttagaa tgaagtattg aagtctaaat gacatcgtcc caaaataaaa 2700

gtgaatttat gaaatactac atctgtcgga ttcggtttca tacggattaa aagtgtagga 2760

atagaatccg attataaata attatttttt tataaattct aattcaattt tattcgattt 2820

atatttttta accggtcaaa attaatattt attaagtagg attggatgga tttattcgta 2880

tctcgattat ttgctcagcc cattgccaaa tctaaactct tttcagatag gttccatgtg 2940

aacatgatac atgagatgca gtgtgatagt acacaccatt gctaagaaaa ctttggagtt 3000

tgcgtaacaa tatctgttta ccatttaaaa aatggcagtt ttgaatttta acacgctctc 3060

ctccagattc agcttatgaa cttttcgaat aaaaataccc ctggactatt tttccaaaaa 3120

gtaccagcat cttttgaact tgaatggaaa ttcggccaat aaaatgtttt catttattga 3180

agaaataaac agggtaacgc agtagctcta tttcctctgc ttttcttttc tatattaata 3240

acatgattat tcatctctct cggatcacaa aaaaattaag ctattcaagc tttatttata 3300

tttcattttt aaatttttta cttaaataca aaatctccca tcccactact acggcagcat 3360

gttttctatg tatgattatt ttcattcaaa tgatatcatt ttttataatt tatattgtat 3420

gtaattaatt catttatagt tcttacattt tcctgtttct agtagataca ataaagcggt 3480

tttggactag tagcttgttc tctgtatcga agtttaacta aagctttgac aataatatat 3540

gaatccatat cactgggtag gagaggaata tgttgggtat aaaggattta aggaattaga 3600

tattttcata caattgtatt gcattgcaga cagtaattag attactatgc aattattctc 3660

tctctccatg tttgttgcag ttgaagaact ctaatgaagc tcacaaaaat ttactgcatg 3720

aacttgtaag tggaattaga cgactccgtt gtcctccatt ttcttttatt ttctttaaaa 3780

tcatctgcca ttcaaataga cagaaaaaaa aggattgatt agctattgga tgcctcttga 3840

attcaggaaa tgaaggacga gcacccagtt tatggttttg tggatgatga ccctagcaac 3900

tacgcaggtg cactagctct tgccaatggg gcttcccaca tgtatgcttt ccgtgttcag 3960

ccgagccagc cgaatctcca tcgaatgggg tttggctccc atgacctgcg ccttgcttga 4020

ttttattgta gcttaaagac cttacaactt ccagagtggt g 4061

<210> 57

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 57

cagtttggac ttcaatgtta acccaatatt gattttaaat ccaacattgg tccacttaga 60

cttatttatt tatttttatc aatttaatat aaaaaagatc taaacctcat aagtcataaa 120

ttttggattt atttttgaac atgtacaaaa taaaacagaa aaaagaaaaa attacttatc 180

taaaagtaac tatatctgaa aactttcact ttagaattgt cttaaattaa tgtacttcca 240

tcaacaattc aatgttaata tttttatgaa tccaaatgga tgatagagta ttttttagaa 300

tgaagtattg aagtctaaat gacatcgtcc caaaataaaa gtgaatttat gaaatactac 360

atctgtcgga ttcggtttca tacggattaa aagtgtagga atagaatccg attataaata 420

attatttttt tataaattct aattcaattt tattcgattt atatttttta accggtcaaa 480

attaatattt attaagtagg attggatgga tttattcgta tctcgattat ttgctcagcc 540

cattgccaaa tctaaactct tttcagatag gttccatgtg aacatgatac atgagatgca 600

gtgtgatagt acacaccatt gctaagaaaa ctttggagtt tgcgtaacaa tatctgttta 660

ccatttaaaa aatggcagtt ttgaatttta acacgctctc ctccagattc agcttatgaa 720

cttttcgaat aaaaataccc ctggactatt tttccaaaaa gtaccagcat cttttgaact 780

tgaatggaaa ttcggccaat aaaatgtttt catttattga agaaataaac agggtaacgc 840

agtagctcta tttcctctgc ttttcttttc tatattaata acatgattat tcatctctct 900

cggatcacaa aaaaattaag ctattcaagc tttatttata tttcattttt aaatttttta 960

cttaaataca aaatctccca tcccactact acggcagcat gttttctatg tatgattatt 1020

ttcattcaaa tgatatcatt ttttataatt tatattgtat gtaattaatt catttatagt 1080

tcttacattt tcctgtttct agtagataca ataaagcggt tttggactag tagcttgttc 1140

tctgtatcga agtttaacta aagctttgac aataatatat gaatccatat cactgggtag 1200

gagaggaata tgttgggtat aaaggattta aggaattaga tattttcata caattgtatt 1260

gcattgcaga cagtaattag attactatgc aattattctc tctctccatg tttgttgcag 1320

ttgaagaact ctaatgaagc tcacaaaaat ttactgcatg aacttgtaag tggaattaga 1380

cgactccgtt gtcctccatt ttcttttatt ttctttaaaa tcatctgcca ttcaaataga 1440

cagaaaaaaa aggattgatt agctattgga tgcctcttga attcaggaaa tgaaggacga 1500

gcacccagtt tatggttttg tggatgatga ccctagcaac tacgcaggtg cactagctct 1560

tgccaatggg gcttcccaca tgtatgcttt ccgtgttcag ccgagccagc cgaatctcca 1620

tcgaatgggg tttggctccc atgacctgcg ccttgcttga ttttattgta gcttaaagac 1680

cttacaactt ccagagtggt gttatatatt agtatcttaa gctatgacag tggtaagcct 1740

ctctatccgc tacttgttat cctttaggta ctttgcatgt ggtgcaaggt tataattgcc 1800

ttgtgtttct attgtcttcc tcatggtact tactggactg atgatgtcaa gtgaaatgga 1860

gttgtttgaa tcctgactga aatttctctt ggtccatcaa gtgcaagagt aagtttagac 1920

atcactcgca agcttttgct aggaaataag tagtttcatt gcactaatga tttcgaattt 1980

ttgttttcgg gttagagaaa cctagattaa tgctgttatt ggatgctggc agtcagatga 2040

agattatgtt tgattgtacc tcgttggaca gatgctcatg cgtagatcca taactctatt 2100

tcatttcatt tccctgtaca caattgaaac agggcatata tgaataggta tagaacagat 2160

gattcctgca atattggagg tggctagctc agcttagact aaagttggtc tagctgggat 2220

attctgaaca cctgagatgt tcaaataatg tgggataact tggcccaact caactaaaca 2280

ttggctcaaa gcatagtcaa ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc 2340

cgagctgagc ccgggccgct tgtttagctg atgaactgaa ttcaaatagc cggtactcag 2400

cttggctcca ctcgattcat gagttcgaat cccctcaagt tcaacctcga acttgacggt 2460

gtagtcccac aaccatggcc accttataat gtgggacggc cattatgcat tcctctagtg 2520

cctgctccat atgacttttg ttctcattat accatgcacc taaatgagtg ctcatagtga 2580

caatgtttag cctccacgta taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa 2640

atttctgcaa tgttgtggtt gtaaaacgct cctacgttga gacatgatgg tatctaagat 2700

tatagacaaa ctatcatgct gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa 2760

gccgagctcc attgaaatag tacaatggat tctgcacttg aagaacatta caaaatcatt 2820

ttttcccaaa aagaaacatt gcgaacagac caaagcgtaa agaaattaca tgattcaact 2880

aattcaagct ttccatgatg taggcactcg ctagatgtag tagggtgata acttgctttg 2940

tgagggtgga tcataagctt aacctcaatc tatcccaatc tatcctttcc cttgacctat 3000

ccatgccaat ctaggccatt tctgcataaa tataacttaa tcccagtgga tccggcctag 3060

tttcactcac tccaacacat tcctactcaa tggtagccaa tcctttcttt agccctcaaa 3120

tataatccta atctagcata gccaaccatc aatcatgcct aataaagccc gactacacca 3180

acccgatcat tcctgatcgt acacaatcaa gacttatcct aattgatcct agcttttttt 3240

aggcctctct tatagaacct gtgccaattc tggacaagct aatccaatct tagcagccaa 3300

aaatattaca tgtttaatta gccaaatcga acctatcata aacccaatat ataatcggac 3360

cataccaaga tcatcatcct atatttcctt ctcttgttat aactacacct aaaaaggaat 3420

ttcttcatac ttatgagggg tatattatga taaaaattcc ttcattttag ccctccatcc 3480

ttgtctattt ttgggaccac tagccaagta acaccttaag agccctccat cttaatattc 3540

cctctaacta gctcgatttc ttcttcattc tttctttgcg atgtgtcccc tccaatttaa 3600

ttcttacatg ttgggatttg agtactgaaa aataatagat aaagagaaag taaaaactat 3660

gctaatgata ataccaaagg cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt 3720

ttatggttcg gcctaagcct atatctacat agggacgaga gtaagaagaa gcttccacta 3780

taataatagt ttagagtaca aaaacttctc tgacaccatg tagggaacat cgcttctaat 3840

acaagaaaga agaaatccaa gattaaacaa acctctagaa aaattcttct cgatggaata 3900

actctaatct gagattgaac aatcttctcc aatcgatgat ctccaatctt cttttcttaa 3960

atgaagcacc cttcaagcct ctcttctttt ctctcttcct atcctctttt gtggctcaca 4020

acctcctctc ctttttatgt tctatgttcc tcacatcaca t 4061

<210> 58

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 58

tttcagatag gttccatgtg aacatgatac atgagatgca gtgtgatagt acacaccatt 60

gctaagaaaa ctttggagtt tgcgtaacaa tatctgttta ccatttaaaa aatggcagtt 120

ttgaatttta acacgctctc ctccagattc agcttatgaa cttttcgaat aaaaataccc 180

ctggactatt tttccaaaaa gtaccagcat cttttgaact tgaatggaaa ttcggccaat 240

aaaatgtttt catttattga agaaataaac agggtaacgc agtagctcta tttcctctgc 300

ttttcttttc tatattaata acatgattat tcatctctct cggatcacaa aaaaattaag 360

ctattcaagc tttatttata tttcattttt aaatttttta cttaaataca aaatctccca 420

tcccactact acggcagcat gttttctatg tatgattatt ttcattcaaa tgatatcatt 480

ttttataatt tatattgtat gtaattaatt catttatagt tcttacattt tcctgtttct 540

agtagataca ataaagcggt tttggactag tagcttgttc tctgtatcga agtttaacta 600

aagctttgac aataatatat gaatccatat cactgggtag gagaggaata tgttgggtat 660

aaaggattta aggaattaga tattttcata caattgtatt gcattgcaga cagtaattag 720

attactatgc aattattctc tctctccatg tttgttgcag ttgaagaact ctaatgaagc 780

tcacaaaaat ttactgcatg aacttgtaag tggaattaga cgactccgtt gtcctccatt 840

ttcttttatt ttctttaaaa tcatctgcca ttcaaataga cagaaaaaaa aggattgatt 900

agctattgga tgcctcttga attcaggaaa tgaaggacga gcacccagtt tatggttttg 960

tggatgatga ccctagcaac tacgcaggtg cactagctct tgccaatggg gcttcccaca 1020

tgtatgcttt ccgtgttcag ccgagccagc cgaatctcca tcgaatgggg tttggctccc 1080

atgacctgcg ccttgcttga ttttattgta gcttaaagac cttacaactt ccagagtggt 1140

gttatatatt agtatcttaa gctatgacag tggtaagcct ctctatccgc tacttgttat 1200

cctttaggta ctttgcatgt ggtgcaaggt tataattgcc ttgtgtttct attgtcttcc 1260

tcatggtact tactggactg atgatgtcaa gtgaaatgga gttgtttgaa tcctgactga 1320

aatttctctt ggtccatcaa gtgcaagagt aagtttagac atcactcgca agcttttgct 1380

aggaaataag tagtttcatt gcactaatga tttcgaattt ttgttttcgg gttagagaaa 1440

cctagattaa tgctgttatt ggatgctggc agtcagatga agattatgtt tgattgtacc 1500

tcgttggaca gatgctcatg cgtagatcca taactctatt tcatttcatt tccctgtaca 1560

caattgaaac agggcatata tgaataggta tagaacagat gattcctgca atattggagg 1620

tggctagctc agcttagact aaagttggtc tagctgggat attctgaaca cctgagatgt 1680

tcaaataatg tgggataact tggcccaact caactaaaca ttggctcaaa gcatagtcaa 1740

ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc cgagctgagc ccgggccgct 1800

tgtttagctg atgaactgaa ttcaaatagc cggtactcag cttggctcca ctcgattcat 1860

gagttcgaat cccctcaagt tcaacctcga acttgacggt gtagtcccac aaccatggcc 1920

accttataat gtgggacggc cattatgcat tcctctagtg cctgctccat atgacttttg 1980

ttctcattat accatgcacc taaatgagtg ctcatagtga caatgtttag cctccacgta 2040

taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa atttctgcaa tgttgtggtt 2100

gtaaaacgct cctacgttga gacatgatgg tatctaagat tatagacaaa ctatcatgct 2160

gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa gccgagctcc attgaaatag 2220

tacaatggat tctgcacttg aagaacatta caaaatcatt ttttcccaaa aagaaacatt 2280

gcgaacagac caaagcgtaa agaaattaca tgattcaact aattcaagct ttccatgatg 2340

taggcactcg ctagatgtag tagggtgata acttgctttg tgagggtgga tcataagctt 2400

aacctcaatc tatcccaatc tatcctttcc cttgacctat ccatgccaat ctaggccatt 2460

tctgcataaa tataacttaa tcccagtgga tccggcctag tttcactcac tccaacacat 2520

tcctactcaa tggtagccaa tcctttcttt agccctcaaa tataatccta atctagcata 2580

gccaaccatc aatcatgcct aataaagccc gactacacca acccgatcat tcctgatcgt 2640

acacaatcaa gacttatcct aattgatcct agcttttttt aggcctctct tatagaacct 2700

gtgccaattc tggacaagct aatccaatct tagcagccaa aaatattaca tgtttaatta 2760

gccaaatcga acctatcata aacccaatat ataatcggac cataccaaga tcatcatcct 2820

atatttcctt ctcttgttat aactacacct aaaaaggaat ttcttcatac ttatgagggg 2880

tatattatga taaaaattcc ttcattttag ccctccatcc ttgtctattt ttgggaccac 2940

tagccaagta acaccttaag agccctccat cttaatattc cctctaacta gctcgatttc 3000

ttcttcattc tttctttgcg atgtgtcccc tccaatttaa ttcttacatg ttgggatttg 3060

agtactgaaa aataatagat aaagagaaag taaaaactat gctaatgata ataccaaagg 3120

cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt ttatggttcg gcctaagcct 3180

atatctacat agggacgaga gtaagaagaa gcttccacta taataatagt ttagagtaca 3240

aaaacttctc tgacaccatg tagggaacat cgcttctaat acaagaaaga agaaatccaa 3300

gattaaacaa acctctagaa aaattcttct cgatggaata actctaatct gagattgaac 3360

aatcttctcc aatcgatgat ctccaatctt cttttcttaa atgaagcacc cttcaagcct 3420

ctcttctttt ctctcttcct atcctctttt gtggctcaca acctcctctc ctttttatgt 3480

tctatgttcc tcacatcaca tccacagact catttttata gataaaaaat tagagtctat 3540

ttcggactcc ttttccacac acaagatggc ttcccacgcc attggttccg tgcgcatgac 3600

ttttttcatg ccacaaagga ttccgtgctg caaaagtttt ccatatccat gcagtttcca 3660

cacaccacaa aaactttcgc acacttctcg aaggcttttc atgctcgacc ctttttggtt 3720

ttcaattaaa ttgatggatc ccatatgagg agggaccaca ccaataaatc tcctccttct 3780

aactcatatg gtaggttcca tcaagcctgt agcacctttg cattttatca gttttgttcc 3840

tgaagccggc ttcatcaata tattagaact attttcttca gtgtcaactt ttttaagctt 3900

gaaccacttc atctctagca tattgacatg cttttggaaa gtatgtcaaa ttgctcaaaa 3960

ttaatcttac ggttctcttt ttcgttagat tctagtgcat attacgcact ttaacataag 4020

atctaaggaa ggaagaggac tgaggtaagg tgaagtgatt t 4061

<210> 59

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (3947)..(4061)

<223> n is a, c, g, or t

<400> 59

cctagattaa tgctgttatt ggatgctggc agtcagatga agattatgtt tgattgtacc 60

tcgttggaca gatgctcatg cgtagatcca taactctatt tcatttcatt tccctgtaca 120

caattgaaac agggcatata tgaataggta tagaacagat gattcctgca atattggagg 180

tggctagctc agcttagact aaagttggtc tagctgggat attctgaaca cctgagatgt 240

tcaaataatg tgggataact tggcccaact caactaaaca ttggctcaaa gcatagtcaa 300

ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc cgagctgagc ccgggccgct 360

tgtttagctg atgaactgaa ttcaaatagc cggtactcag cttggctcca ctcgattcat 420

gagttcgaat cccctcaagt tcaacctcga acttgacggt gtagtcccac aaccatggcc 480

accttataat gtgggacggc cattatgcat tcctctagtg cctgctccat atgacttttg 540

ttctcattat accatgcacc taaatgagtg ctcatagtga caatgtttag cctccacgta 600

taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa atttctgcaa tgttgtggtt 660

gtaaaacgct cctacgttga gacatgatgg tatctaagat tatagacaaa ctatcatgct 720

gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa gccgagctcc attgaaatag 780

tacaatggat tctgcacttg aagaacatta caaaatcatt ttttcccaaa aagaaacatt 840

gcgaacagac caaagcgtaa agaaattaca tgattcaact aattcaagct ttccatgatg 900

taggcactcg ctagatgtag tagggtgata acttgctttg tgagggtgga tcataagctt 960

aacctcaatc tatcccaatc tatcctttcc cttgacctat ccatgccaat ctaggccatt 1020

tctgcataaa tataacttaa tcccagtgga tccggcctag tttcactcac tccaacacat 1080

tcctactcaa tggtagccaa tcctttcttt agccctcaaa tataatccta atctagcata 1140

gccaaccatc aatcatgcct aataaagccc gactacacca acccgatcat tcctgatcgt 1200

acacaatcaa gacttatcct aattgatcct agcttttttt aggcctctct tatagaacct 1260

gtgccaattc tggacaagct aatccaatct tagcagccaa aaatattaca tgtttaatta 1320

gccaaatcga acctatcata aacccaatat ataatcggac cataccaaga tcatcatcct 1380

atatttcctt ctcttgttat aactacacct aaaaaggaat ttcttcatac ttatgagggg 1440

tatattatga taaaaattcc ttcattttag ccctccatcc ttgtctattt ttgggaccac 1500

tagccaagta acaccttaag agccctccat cttaatattc cctctaacta gctcgatttc 1560

ttcttcattc tttctttgcg atgtgtcccc tccaatttaa ttcttacatg ttgggatttg 1620

agtactgaaa aataatagat aaagagaaag taaaaactat gctaatgata ataccaaagg 1680

cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt ttatggttcg gcctaagcct 1740

atatctacat agggacgaga gtaagaagaa gcttccacta taataatagt ttagagtaca 1800

aaaacttctc tgacaccatg tagggaacat cgcttctaat acaagaaaga agaaatccaa 1860

gattaaacaa acctctagaa aaattcttct cgatggaata actctaatct gagattgaac 1920

aatcttctcc aatcgatgat ctccaatctt cttttcttaa atgaagcacc cttcaagcct 1980

ctcttctttt ctctcttcct atcctctttt gtggctcaca acctcctctc ctttttatgt 2040

tctatgttcc tcacatcaca tccacagact catttttata gataaaaaat tagagtctat 2100

ttcggactcc ttttccacac acaagatggc ttcccacgcc attggttccg tgcgcatgac 2160

ttttttcatg ccacaaagga ttccgtgctg caaaagtttt ccatatccat gcagtttcca 2220

cacaccacaa aaactttcgc acacttctcg aaggcttttc atgctcgacc ctttttggtt 2280

ttcaattaaa ttgatggatc ccatatgagg agggaccaca ccaataaatc tcctccttct 2340

aactcatatg gtaggttcca tcaagcctgt agcacctttg cattttatca gttttgttcc 2400

tgaagccggc ttcatcaata tattagaact attttcttca gtgtcaactt ttttaagctt 2460

gaaccacttc atctctagca tattgacatg cttttggaaa gtatgtcaaa ttgctcaaaa 2520

ttaatcttac ggttctcttt ttcgttagat tctagtgcat attacgcact ttaacataag 2580

atctaaggaa ggaagaggac tgaggtaagg tgaagtgatt ttttttgagt tggtaatggt 2640

acaaaagtta tactagaccg tgggtaccta atctcggaga ttaccattta gatttggttc 2700

ttgatcattt gtatagtgat gcatttaaaa aattatttga gcaaaacagt gaatgccatt 2760

gggtctgaga gatccaaaac caaataacct aaagtatata gatggttcct ttagctagat 2820

catgtatgag aaaaaatgat ctgccgactg gaaaaaatag atctttgagc tcattgattg 2880

ttaagtcata tctagtctgt gaatcatctc tttgaggatt aatgatcaag ctatctttta 2940

tgggttaaaa gaataggatc actgaaatac ttatcctagt atacatataa tgtgcatggc 3000

ctatttgatg agtcagacta gaaggttatc actacttcat cacctttact gatgagcaat 3060

catgatatag atatgtatgt gagatacaaa tctaaaagat tttgaatggt tcaaagaatt 3120

cagatatgaa gtagaaaaga taaatcaaaa aatttttaaa ggtacttgat cggatctaga 3180

atgcaatacc aaataaaaaa tttgttgatt atctaaaaaa agtgatatag tttcatgatg 3240

gaattcttct tgtacacctc agctcaacgg tatatatatg aggagcaata gcactatatg 3300

agatatggtc cggtccatca tgaatatcac taatttaatt attatttatt taagagcaag 3360

atttaatttt taaaatttaa attagatttt ttctaaaatt ggtttcaccg caccatatga 3420

gatatgattt ggtggataag ttagaggata ggtctgtgag aactcattta tagggtatcc 3480

caaaaggtat ttaaaatatt actttttctt tctagtagtt gacaatatga ttgtgagcaa 3540

tcatactgtt ttcttaaaaa cagtggaagg atgaactcaa aaagaaagtc tctaaagaac 3600

aacgagtcac aagacctata caacctattt aagatgagcc agtatatgta gtacttcctt 3660

cacctcatca atttagtagg atctcctatc ctttagaaag atactcggta ttcttacaaa 3720

ggatttagag aaagtgtttc ttgagggaga ttgagaatat agggatgatc tcaaaaccta 3780

caatgacata atataaggaa tcatgtagtt acatgaaggt cagtgggagg gttccatact 3840

gacatcgatt atgatgtggt tacatataga attttttttt caaagatcta gatcaaacat 3900

tctgaaaata aaaggtctat agagataaat ccgaaaagga tgtttgnnnn nnnnnnnnnn 3960

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn n 4061

<210> 60

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 60

tataccatag atttttctgt taaccacatg tcaattcttc tcctccattg attttcatta 60

caatattcag gaacagctgc tttcatcttc tcaacaaata agtcaacatt aaaatggtta 120

gactttagat cattcttcca atgcctccac atagccccta ttttttccag tagagacttt 180

cttatggcat ccatgtactt agataaaaat ataaatatat cctacaccta gaaactgact 240

tttagaaaaa gtgtatatat acctaaataa aatgatttaa gatgaaaata ttcactatac 300

ctctagttca gctatcatct tttccttgaa gcctgatggc acatcatgcc aagagtcata 360

atcgattgga gcattatcaa attgtcttac cattgactgt atataatttg acaaattagt 420

agcttccacc cggattgatt gtccaagttc acttaggttg gcaacaacat gctctccctc 480

ttttagatca cgtaactcag acatacgtat gtatcctctc cttctaggcc agctagtcga 540

acctacaaat atgtatacac aattaaaaaa atacataaaa tgtaagaaaa tgatccctca 600

aaattaataa ttatcatatg caccatcctt tatttggtta ttagtgatct atttatgcaa 660

ttcattcgaa gaagattata tatgtatacc tagttgactt tcattggtag ctaagggagg 720

tagctcttag gcaactgatt cagttttctc ataattttgg gcttcaagtg actgctccta 780

ttgattatga gatggaggct caccttgatt ctgactttaa gagttttctg taccactaat 840

attgacaatt gtctgcttgt gttttgccat tattaatgta atttgaaaga aaaaaataga 900

attcatatat ctgaatgtta gtgaccaaaa aaacttgcaa gtatctcccc aaccatctaa 960

agattatacg ctattttatt tttcaaatct taaaaggcta acaaggcaca tagcaattac 1020

atgaagcaaa aaaagaaaat aaataaagca ccaaggaaac cattacactg tcattactga 1080

aattacattc aatagtatta tgcattaaaa caaaaactac attgataaaa taaaattgaa 1140

aataagaaac tacaagctcg tgggtgttcc ctcttgatca aaacatatcc tcaaactcta 1200

aatcttcatc gtgttggtgc acttcttgaa caaccacttc tttaaatggc tcttcacctc 1260

gaatcaaatc tgaaggttga agctgatcct catacatttg ttgtggcaca tgatcactaa 1320

caatagagtt cacatctccc aaatcataat tgtctctaac tttaaccgac ttaacaataa 1380

ccacatcttt atgtctagga gtattaatat agaacatctt tgcttgagat gcaaatacga 1440

aaggatcgtc aagcacacct tcaccagtat gtgctaagta agaaaaattc acaagtacaa 1500

taaaatttat ctttcttgca tcctttattg atatcaaccc aatcgcactt gaataaatca 1560

atcttgattt tgcaatgata atttaattga ataatgtcct ttaatatacc ataatactct 1620

attttttctt tcaacaggct acctatctct agtcctagtg taacccattg attcaactat 1680

caccacaacc ccactatttt gagttctcaa cttcctctca agtgcttttg tgtggaatct 1740

aaagccattc ataacgtaac cggtatatca tcgtgcaaca tcaagtggct ttcgagcaag 1800

gcacctaatt tgtttagtaa tatagacatc accttgttga ttcatgcatg caacctaaat 1860

taacatggat ttcaaatagt atattacaag atagaacatt atgaggtaaa tatatggtgt 1920

ttatatattc aaattataaa ttataaagga gcatataaaa cactcattta tgaaaccact 1980

cgaaaaattc ctgactatga atcctttcaa tctcataaga agttaaatga catggatgac 2040

atgaagcttt gatatgcatc gaaacatatt cacatggtta ttaatgagat gagtgatagt 2100

ttggtagact tgccaactta ataactaact taataacaaa atctccttac tctcgaaata 2160

cggtaattgc atcgtagtta aataggatat atctgtgcgc ttgcatcaac tctttctcat 2220

caagatggac ccttggcact cgacttcacc tttctggcct ccatgacttt tgctacttcc 2280

tttctaaaga tttttctggc ctaaacattc ttgaatcgac atcaagttgg tcttcaccat 2340

catcgcctac aagttggtct tcaccatcat ctcctacaag tagatcttcg ctattatcat 2400

tccttcatgg ccaattgaac cttatttgaa tcccacttaa gtgtcgtaag cagaatgtac 2460

attatacatt catttgcaag atatgcttct gctattgagc cctctggagg agctctattg 2520

cacacatata tcttaaggta accaagaagc ctaaataaaa aattgaaaga aatgataaca 2580

taaattaatc atcaaaaaat atcataacac ataatgaacc aaattttaac tataacacat 2640

ccaaaattat acctctcaat aggatacatt catctatgat gaactggatc agtcatctta 2700

gcctcgctcg ctagatgaac cactaagtga accataactg tgaaaaaaga tggtggaaaa 2760

atcttcctat ttgacaaaag gtaagagcag ctcaagattg aagccgctca agattatcca 2820

catccaaaac cttgctataa agttctatga aaaaattgca tagatcaata acagctaaag 2880

aaacatggtc aggaaaagac ccaggggtag caattggaag gatttcttca atcaggacat 2940

gacagtcata cgacttaagg tgagcaagct tgtgttgtct caactacaca cacctctaaa 3000

tgttggatga acactcttct ggaaatttca attccttaat cacattgcaa aaatcatcct 3060

tttcttttgc attcatttga ggcataaact tcaaataagt attgttgggt ataaaatacc 3120

ccccggctga agtctgtaaa agaccgaccc ttccaggact ctttcggctt ccgaccttgt 3180

gtgtggcatc actccaaacc cccatgaccg tccggacttc tccgatagag aacttctgca 3240

ttcgtctacc gagccgcccc aaaatgctct ctgggcctca ccaccagccg accttctaca 3300

gtgatcaact attctccgaa ctccttccga actctgccaa tatccaagct tcttcgacaa 3360

cgagatttct acagtaatca gactccatcc aagtttctac gacggtcgac cgccttcagg 3420

attccaactg ggctcctgtg agagccaaac ttctactacg gacagtctac tccgaactca 3480

tacagtgagc ggtctactct ggatatccac tataagcaaa ctccattcga gcctctgctg 3540

taaacaaatt tcttccaaac tttcgttaca ggtagacttc gatcgagctt cttcgtagcc 3600

ggatcccata cgagcttcta cgatggggca ggatccaccg gccaggtcgt tactccgagc 3660

tcccacgaca accgatcttc gatcgagctc caacaataag tggcttcctt tcggcctccc 3720

acaagaacca gactccgtcc gagcttccac agtggatgga ttctggatga gctttcgcaa 3780

tggacgagct ctagcagctg gatttctaca atgactgatc acctccgacg tctgtcgaac 3840

ctccccagcg ccatccgaag tccatcacca gctgacctcc tgccagatcc ttcatgaaat 3900

caaagttctc caatggatca tcttcagatg agcttccaca tcaggtaaat ctcagacgga 3960

ctcctctagc aatcgaactt ctgttgggct tcaccaacga aaagtctcca tccgagcttc 4020

tacaacagat gactcccacc tgtggtatca gcgcctaagg t 4061

<210> 61

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 61

attttaaaat ttttaatagg ataaaaaatt ttagttagct ttgtgatagg cctagcgaat 60

ccacgagcta ccattctttg cttttggaca aattgcagat gcacgaagcc aatcatgata 120

tagttagcaa aactccttca ataggacagg aatgacaaac tggctggcca aagcctcagt 180

cggtgctttc aaagtgtatc gtcacctaac aataaagtag atattagaat caccacaagg 240

taaaaaattt ttaacgataa aattatttgt gatagataaa atttttatta taaataataa 300

tgtcaatgat ggtaaaaaat tttcatcgat aataaaaaaa tatttacgat gaataaattt 360

tttcattata aataaaagta attaacgacg aaaatattgc ttacgtcgta acaaacagaa 420

tatttgcgat gaaaatttta atcataaata agaaaatatt ttttaaataa aaatatagag 480

atattaccga tgaaattatt tttgttagaa atattaaaag ttttttcgat gaaatcaggt 540

tttgcatcat caataacatt atttacgata aatttttttt gtcactaata aatcaaaaaa 600

aattaaaaat tagatatttt caattatttg tgatgtaaat tttagtcgta aataatttga 660

ctatttgaaa actgagacat acctttaaaa aaaataaata aataaaaatt gatccagctc 720

gagatgatga tatatattta atatattaat tatatctatc tatataacaa taataaaatg 780

atatacaggt attaggggta gcattcttta ttgacacata aagattataa gatgatccct 840

aaagtcttct ttaatttttt ttttatttat tttttgtttt tctttaattt tttctcttct 900

tatttttgct gccatctgct gcctctgttt tctctgctcc tgctgcctcc ttttatagag 960

cacagcttct tcgaattata agcatctatg gactttcaat tcccactatc ttttattttg 1020

attgggattt taaaacttta tccgcatccc agcatcttgt ttcacgcgag atcctagcgt 1080

ccacatgtgt tttgaattcc ttatgggcca cagaccattt aaaccaccaa agaccacttt 1140

actattttga tttgaatccc atggaagccg gctgcctctg gtctcattca cccttccagt 1200

gcttcacatg ggtcccatta atttgaattc ctatgagcca catccaagct tttgaatcca 1260

agccttcctt attttttaaa tcaattaaaa ctttgcttta aatgccttgt agaccctcct 1320

atttgcatgc tacgtgagaa cattgttaag ctcctcttgg cccacttaag aacttctatg 1380

ggctacatgc ttttggctag ctttaaaatg gttttgggcc taactttgga tcaccattcg 1440

aagtccattt tgaattcaat ttatttttat tttttttttt aaccttacaa atcgagctct 1500

tttattggtg atcatttttc ctataaaaca aaaacaaaaa gcatcaagtc ttaagaaata 1560

aaagttaatt aatatatatt ttgatacttt tattgggata tttaatgtac ttatcactag 1620

atatgaaatc caatgggtca cacactttga aatttgatct tagtctaatc taactaggat 1680

ttattataaa tcttatgggt taaatttaca tgctagcaca tgaattaact caagttttca 1740

attggattta gttctaaggt gtttgagcta accctatcct gataccttaa acctaattag 1800

attagatttg aacctatggt tttcttgatg ccttatgctt attacatgaa agagtttcat 1860

gtgacttaaa ttcctccatg ccaccacatc ttcatccatg ccaaattaat atggaacgcc 1920

ccatttaatt gtgcatttaa gaaggaatag tccttcttaa acactcctct taatttccca 1980

cactttcctt tgttctacac accatcaaat ggcttttgga aatatgcggg cgcagaagta 2040

gaggtgtcct atatgaaggc tcttccacat tataagttat cacatggtga attaaatcat 2100

tgtgtgagaa aatcatgcgc caagagttgg caccccttgg gagttttagg cactccttat 2160

cctataaata aggggcaccc catatggata aatacaaggg aattcaagtt taggcatgag 2220

attgagagga gaaaaagaca caaaaatctg agaaaaagat aagaaaaaaa aagagagaaa 2280

aatagaaaga aaagacgaga gaaaatgaaa ggcaagggtt gctaatccta gggttcaatt 2340

tttcaatagt tggatttctg aatcaatttg gggtggtgag attttttgag aaaaagtttc 2400

tgatgtggcc ctagtagaag attgaaggca ttcagatgat ggtgcaatcc gtttttgaaa 2460

aagaaaagtg agtagtatac ttatgaagaa agctgcaaca ctacatcaaa ttggaaagga 2520

ccttgatcaa acccatatgg atcaccgttg caggatatct actttggtat cttgtgaagg 2580

ttattttttt tatcagatca tcatcttcaa aaaggtataa ttttctacct aatatgcatg 2640

cttgatttgt ttgattaaaa tctataaagt gttcataagg tttgtgttct gattgtattg 2700

ttttaagtat taaaacttac tttaaaaata taaaaaaatt tgaaaactat cttctactgt 2760

gcaactaaaa tccaacagaa taaccctaat atgagattga gcgatctccg ccaatgttct 2820

cgatcttctt ttcttgaatg aagccttttc aagcctctct tcttctctct ctctccctat 2880

cttcttttgt ggcccacggc ctcctcttct ttttatgttt tgtgtttctc atgtcacatc 2940

cataaactcc cttttataga taaaaaatta gagtccattt tggactcctt ttccatgcat 3000

aagaaggctt cccacgccat tggttctgtg cacacgactt tttccatgct acaaaagttt 3060

ttcatgtctc acgtagtttc catgcgccat aaaattttgc atacttctcc aagacttttt 3120

atgctcgacc ctttttggtt ttcatttaaa tcagtgggtc ccatatgacg agggatcaca 3180

ccaacatcat atgctctcct caccatacca aatggtatcc ccaactataa gacaaaacat 3240

tcatcaaatt gctaacaggg ttgaggatca gcattcacta tagaaatttt gtttttcaat 3300

ctgtaacccc tcccaccatc ctggcctctt ggatatcgga cccatcaagt gggtcccgcg 3360

agcccgcacg gcactgtcag tccccaaact caattttttt tttaggaaaa atgttacctg 3420

cagtagaaga aagagacctc caaaaaaatt atgaaaaaaa agccttaaaa taaaaatgaa 3480

aaggatgaag attaaaaggg gtgcaacagg aggagttccc agggggtcat ccatccctgt 3540

acgactctcg cccaagcacg ctcgactgtg gagttctgat gggatccggt gcattagtgc 3600

tggtatgatc gcacccatca tgatctcttc gaaattcata gatataacat agcttccgtt 3660

gcacgccatc cataaccctc ccaccgtccg ggcctgcagg gtaccagact catcaagtgg 3720

gctcgcgagc ccgcacgtca ctataggtct ccagacttag ttttttttga tagagaacat 3780

taaccatggt agaagaaaga gatctccata aaaattatga aaaaaaatat tgaaataaaa 3840

ataaaaggct taaaaattat ggaaaaaaag gcttgaaata gaaataaaaa ggacgaagat 3900

taaaagggat gcaacatgag gtcctcccag gggttcatcc atcttagaac tactctcgcc 3960

caagcatgct taactacgaa gttctgatgg gatctgacgt attggtgctg gcatgatctc 4020

ctcgaaattc ttagatataa cgtagcgacc gtcgcacccc a 4061

<210> 62

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 62

gccggctgcc tctggtctca ttcacccttc cagtgcttca catgggtccc attaatttga 60

attcctatga gccacatcca agcttttgaa tccaagcctt ccttattttt taaatcaatt 120

aaaactttgc tttaaatgcc ttgtagaccc tcctatttgc atgctacgtg agaacattgt 180

taagctcctc ttggcccact taagaacttc tatgggctac atgcttttgg ctagctttaa 240

aatggttttg ggcctaactt tggatcacca ttcgaagtcc attttgaatt caatttattt 300

ttattttttt ttttaacctt acaaatcgag ctcttttatt ggtgatcatt tttcctataa 360

aacaaaaaca aaaagcatca agtcttaaga aataaaagtt aattaatata tattttgata 420

cttttattgg gatatttaat gtacttatca ctagatatga aatccaatgg gtcacacact 480

ttgaaatttg atcttagtct aatctaacta ggatttatta taaatcttat gggttaaatt 540

tacatgctag cacatgaatt aactcaagtt ttcaattgga tttagttcta aggtgtttga 600

gctaacccta tcctgatacc ttaaacctaa ttagattaga tttgaaccta tggttttctt 660

gatgccttat gcttattaca tgaaagagtt tcatgtgact taaattcctc catgccacca 720

catcttcatc catgccaaat taatatggaa cgccccattt aattgtgcat ttaagaagga 780

atagtccttc ttaaacactc ctcttaattt cccacacttt cctttgttct acacaccatc 840

aaatggcttt tggaaatatg cgggcgcaga agtagaggtg tcctatatga aggctcttcc 900

acattataag ttatcacatg gtgaattaaa tcattgtgtg agaaaatcat gcgccaagag 960

ttggcacccc ttgggagttt taggcactcc ttatcctata aataaggggc accccatatg 1020

gataaataca agggaattca agtttaggca tgagattgag aggagaaaaa gacacaaaaa 1080

tctgagaaaa agataagaaa aaaaaagaga gaaaaataga aagaaaagac gagagaaaat 1140

gaaaggcaag ggttgctaat cctagggttc aatttttcaa tagttggatt tctgaatcaa 1200

tttggggtgg tgagattttt tgagaaaaag tttctgatgt ggccctagta gaagattgaa 1260

ggcattcaga tgatggtgca atccgttttt gaaaaagaaa agtgagtagt atacttatga 1320

agaaagctgc aacactacat caaattggaa aggaccttga tcaaacccat atggatcacc 1380

gttgcaggat atctactttg gtatcttgtg aaggttattt tttttatcag atcatcatct 1440

tcaaaaaggt ataattttct acctaatatg catgcttgat ttgtttgatt aaaatctata 1500

aagtgttcat aaggtttgtg ttctgattgt attgttttaa gtattaaaac ttactttaaa 1560

aatataaaaa aatttgaaaa ctatcttcta ctgtgcaact aaaatccaac agaataaccc 1620

taatatgaga ttgagcgatc tccgccaatg ttctcgatct tcttttcttg aatgaagcct 1680

tttcaagcct ctcttcttct ctctctctcc ctatcttctt ttgtggccca cggcctcctc 1740

ttctttttat gttttgtgtt tctcatgtca catccataaa ctccctttta tagataaaaa 1800

attagagtcc attttggact ccttttccat gcataagaag gcttcccacg ccattggttc 1860

tgtgcacacg actttttcca tgctacaaaa gtttttcatg tctcacgtag tttccatgcg 1920

ccataaaatt ttgcatactt ctccaagact ttttatgctc gacccttttt ggttttcatt 1980

taaatcagtg ggtcccatat gacgagggat cacaccaaca tcatatgctc tcctcaccat 2040

accaaatggt atccccaact ataagacaaa acattcatca aattgctaac agggttgagg 2100

atcagcattc actatagaaa ttttgttttt caatctgtaa cccctcccac catcctggcc 2160

tcttggatat cggacccatc aagtgggtcc cgcgagcccg cacggcactg tcagtcccca 2220

aactcaattt tttttttagg aaaaatgtta cctgcagtag aagaaagaga cctccaaaaa 2280

aattatgaaa aaaaagcctt aaaataaaaa tgaaaaggat gaagattaaa aggggtgcaa 2340

caggaggagt tcccaggggg tcatccatcc ctgtacgact ctcgcccaag cacgctcgac 2400

tgtggagttc tgatgggatc cggtgcatta gtgctggtat gatcgcaccc atcatgatct 2460

cttcgaaatt catagatata acatagcttc cgttgcacgc catccataac cctcccaccg 2520

tccgggcctg cagggtacca gactcatcaa gtgggctcgc gagcccgcac gtcactatag 2580

gtctccagac ttagtttttt ttgatagaga acattaacca tggtagaaga aagagatctc 2640

cataaaaatt atgaaaaaaa atattgaaat aaaaataaaa ggcttaaaaa ttatggaaaa 2700

aaaggcttga aatagaaata aaaaggacga agattaaaag ggatgcaaca tgaggtcctc 2760

ccaggggttc atccatctta gaactactct cgcccaagca tgcttaacta cgaagttctg 2820

atgggatctg acgtattggt gctggcatga tctcctcgaa attcttagat ataacgtagc 2880

gaccgtcgca ccccatcaat aaccctccca cgtccaggcc tgtagggcac cggacctttc 2940

atgtgcatcc ccataaaaat tgtggaaaaa agtattgaat taaaaataaa atagacaaag 3000

attaaaaaaa atgcaacacg cccatcccag tacaactctc acccaagctc gttcgactgc 3060

ggagttttga tgggatccgg tgcattagtg ctggtatgat cacacccatc acgatctctt 3120

cgaaattcat gtatataacg tagcttcaat tgcacgccat ctgtaaccct cccaccattc 3180

gggcctgtag ggtatcggac ccttcatgcg agctcgtacg gcactgtagg tctccagacc 3240

cagttttttt ttgagagaaa acgttaacct tggcagaaga aagagatctc tataaaaatt 3300

gtagaagaaa gtgtttgaat aaaaataaaa agcataaaaa ttacaaaaaa aatcttgaaa 3360

tagaaataaa aaggatgaag attaaaaggg atgcaacatg tggacctcgc tgggggttac 3420

ccttcctagt tctactctcg atcaagcatg cttaactacg gagttctgat gggatccaat 3480

gtattagtgc tggcatgatc gcacccatca tgatctctta gaaattctta gatataacgt 3540

agcggccgtt gcatgccatc agtaaacctc ccacgtccag gcctgtaggg cactagacct 3600

atcaagtgga tccggtgagg ccgcacggca ctgcctgtct ccagactcaa tttatttttt 3660

taagaattgt ggaaagtgat ccccataaaa attatgaaaa aaagtgttga attaaaaata 3720

aaatagatga agattaaaaa agatgcaaca cgaggacttc ccaggggtag atataacgta 3780

gcggccgttg catgccatca gtaaacctcc cacgtccagg cctgtagggc actagaccta 3840

tcaagtggat cccgcgaggc cgcacggcac tgcctgtctc cagactcaat ttattttttt 3900

aagaattgtg gaaagtgatc cccataaaaa ttatggaaaa aagtgttgaa ttaaaaataa 3960

aatagatgaa gattaaaaaa gatgcaacaa gaggacttcc caggggttca cccatcctaa 4020

tattactctc gtccaagcac gcttaactat agagttctga a 4061

<210> 63

<211> 6704

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 63

aaatctatta gtatctgaca aaagttaaat tagagtcgaa acactaaatg acaattaggg 60

atcaacttga tcaagtagat agagaatatt agaaaagaga gaaattaaca agatagaaca 120

tgattaatta ggtgacatag cccgacaatc caattggtct aagcaagttg atttaatcaa 180

atcacggttg aactaatata tagatagctc aataaaaatc atacataatt gaatctaatg 240

atatttggat ctgaccaaga tggaatttga catgctgtcc gatgatcgtg aatcaagact 300

ctctttgcta attaagatca aattagaatc attgaaagag aatcttttac tggatcaaga 360

gagagaaata tataaagaga gtgaaatagt ctatagaaaa aaattttaga gagagaaatt 420

aagaagaaaa aataaatttt ttagagaaag aaagtgggta tacaagctca gagaagggag 480

agaggaaaga gagagaaatg ctctcttatt ttcttttttt tcttttttct tcttttcttt 540

tttttttcct attcttcttt cccttttctg cttaatggaa taggggacct cccattcccc 600

ttctatttct agagttgggg gctcaaaatt gatgatagct atcattgggg atgtaggcta 660

tggtgatgca gtagaggatc accgaccgat gatcgatggt gatgttgcaa tcaaaaaatc 720

aagaaagata gatggaaaat aaaggaaaat aaggagaaat agatctcaac ttgtttggat 780

gctaacccac tcactgacga ctccacttca actatggccg gagcttgcta tggaaaagaa 840

gccaaggcct tcaaggatga acaccaatgg tgaggaagat ggtcgaaaat agaagaatgg 900

ctggcttttc taatcgacaa aatagggtat cgcccttctt agcaaatatt cggcaataaa 960

tatctagaat ccaggatcct aggactatgg aagagggaga ggagggcaag tcaaaggatg 1020

ccagattctt atctagcttc cgacaatgat ggggccctat tttcgataaa cacaattgag 1080

gatgttcgga aaagggtttt ttcgatgatg attctagtga ccaactatga gatttcaaag 1140

ggggtgaggg gggtttaaat aagatgggag ggaagtttga atcctcctta aatctgaacc 1200

tttttcgaca aagccaagag cgtgaaggag actccttcgt gaagtcaaag atggaataga 1260

ctcccttcgg gagtttggtt catcacccaa cttccctagc atgtgcggag tatgtgctag 1320

ccttttctct cttttttttt catttttttt catcctttaa gatccatgca gtttctaggt 1380

tgagggattg gggtatcaca ttctctctcc taaaaaaaaa ttattttcaa aattttttta 1440

cctatatttt caaaagttgg gattcatggt ccaaatctca tccttgaatt tttttgatat 1500

tctaattctc gaaaaaattt catcgttaaa tcatttcata agagaaaagt caatacctca 1560

agagttgatc tgaatcaaaa ttattatctc tagtaatcga aatcaatatc ttaatttcaa 1620

ataagaatat ccagtttatt gtcaaaatta ttaactactc ttgacttaat tgatctatta 1680

cataatcgta aataaattct aacatactct tgaagtgtag aatataagat tgataaacaa 1740

tcctatatcc gttctaatag atataaaagc ataaacttta aatattttaa atccaagatt 1800

aagaatcaat gatccactta tcctagactc aagatattag aaattttttt ttgtacaata 1860

gatagaggat gtactggtga aaatcatgta gcgatatcca aaataatttt taattaaaaa 1920

tattatcctt ttcattatca atgaatttta tctataagaa agatcaaatc atatgatcca 1980

tcttaaattt ttaactcaaa aaattaatat tgcaaactag ctcaaaataa ttttgatcac 2040

tacatttctg ctgtgcattc taatttaaac cgttcacatt ttttagattc atgaaataat 2100

tttgaccaaa gtattactcc atactatagt caaaaaagat taaaatatta gattctaatt 2160

aaagccaaag ataaactttt gattctcatc cttaattttg cctaaagtat aattattttg 2220

attaaccctt aagcgcaata acacattcaa aaccaacaga taggtttact ataatccaaa 2280

tgaattaaat cttaattctt ttatcaattc atttagacaa tttcaaatca aaattctata 2340

agtaatatca ataaaaaaaa tttttgatgc tccaataagt tagaacttaa atcaaaatat 2400

ataagtaaaa ttgatttaat catctcttct aaagtttctt ctattaagat ctttaatatc 2460

tatcaaatac attccacaat aatcatgcaa accttttaaa aattaaattc tcaatgcctt 2520

tactacattt taacaccaag ctcgataata gtgataaaga aacatctaga tcagctttat 2580

aatcaaaaat tttgacttac aattttacgt gtgtctcaaa atcttgaata aatataaata 2640

agatctttta tcttgatcca aaaatagtaa tcaaggattt cattagtaac ttcaacaaca 2700

atggtaaaaa aattttctat ccattgataa acccaaattt tgaattgaag tttcatgcat 2760

accatatagc ctttaataag atctattatt tggatctaaa gatagtaatt aaaattgtta 2820

atgattccac taagatgaat actttacaat ctcataatta atttcttcaa taaaaataga 2880

cttcttgata atgtctccaa ttgtatattt ttttttattt ctacaagaaa acttcataca 2940

ttttttacgt tccaatataa atcttaaaaa gttattccaa tcaaatatca taaaagatct 3000

tcttagtcca accttaaata acttttatga atgaatcttt atcttgccac taaataatga 3060

attttaaaat caagagcaac atcacagcat tctgtcatgt caaatttgtg ttagatgtat 3120

gtcctagaaa tcaattagat tgacaatgta aattttttaa ggatataatt tatatatttt 3180

gatttattaa taaaataaaa tttaaattaa tttttattca tattttttta tctatgaatc 3240

atctaaagaa ttaataagat gatgatacat attcttaaga gttcaaaatt tgaaatatat 3300

gtcattgatg attaatttct gaatactttt gaattcttaa gagtttagaa gatcttgacc 3360

caagtagtgt gaatagtgaa aaaaagtttt cacatacttc acatcaaaaa tttaagttga 3420

ataaattgta catatgacag gtattatagt ttgacgagta atctataacc tctatcttat 3480

caaaattctg atagaaagat tgtattgtat gataactgta cttagaggtt caccttttat 3540

tttactggat taccactaca tgttgctaga tgtcactggt ggattgtgag atctacgaag 3600

attatcttga tgatcgataa ttctcattga aaagattgaa actattttaa tgatgttgtg 3660

atagagatca taatatatct tattatcaga cagaatagaa ttctatggga tcatacacaa 3720

taggagatta agactgatca aatagttgaa tgatgattaa gaatcattac ggagttcaga 3780

ttatcaatat aattgataat tagactaact tataattgtt acaagtagca aggacttaac 3840

tgctaaaggt taataggttc aaaaagaact tatgtataaa tgttgtgcat cttaatttga 3900

ttggatcaaa ttagttatgg ctgaattcaa gatgaatcaa ataggaattt ggttcaattg 3960

aatttgggtc aagctttagg cttaggtcac atatacccaa aatcatttgg atgcatcagg 4020

tgtgtgacac ctgaatcagg cctttctaaa ctattttgag taagtttgat caagtcaaaa 4080

ggatccacac cctaaggttt cttgaataaa accttaggca ccacattgag gacctatagg 4140

aaactttgac cctctctcat atggggtggc acactgaggt tttataaaaa ccttaggcac 4200

ccattttagc cataaaaaaa aagctccaag ggatggggca gtagccatga agaatccttg 4260

gctgtcagga ctctattcaa aagagttctc aaggttttgg actcttatgg agccctagga 4320

tttgtttgcc tataaataga tggccacccc aaggctttag ataatgttag agacttgtga 4380

agctctcccc tttctcttgg ttgccggccc accctctctc ctctctcttc catgccccaa 4440

gacttctttc ttgtctccat catcttgctg aaatttagat ttcagcaaga aaagtcaagt 4500

agaagtcaaa gttctaatgt agctcacaag atgttgagaa cttcctccat ctggcaaagg 4560

ttctgcaaga gagctagcat cctgagaaac aaaaagattg ctgatcagcc ctcatctcca 4620

tatggatatt tgtagagatc aaatgcatgc atagctagaa gagaatctta tcacgatcat 4680

cactcgtgaa gatcatctac ctgtgcaaag gtatgagata agaaaaatat tttttttatc 4740

ataattcatg aatcctttgc ttatattata ctgagattct tggaatggat tttttctcta 4800

gtaaaactct agagatcaga tctcaaagtc ttcttcacat aaaggttttg aaagttcttt 4860

atatttccgc tgctttgatt caaaataaat tagatctatt ttgcctttca acctttctca 4920

tatttattga catataaagc tttaattaat gagattaatg aaaagcatgt gcgaaatact 4980

gagaaaatcc taacagtgat atcagagcta cttttgtaca taagaaaagg attcaagtta 5040

aataaaatat gtttgattta agtaaatgaa tcaatcaaaa tttatcctaa cataagtttg 5100

tcctggtata atggtcaaga ccattatgtt gaaaggttat cctaggacaa aaagtctaag 5160

taaaatctat tttatttaag taaatgaatc aattaaagtt tattctaata taagattgcc 5220

ttagcataat ggtgaagacc cttatgttga aaggttgtcc taggatggaa agtgattgat 5280

gagacaaata tatcatgaaa gtatttttca cagatggaat aaaatatata tattttgttt 5340

gtgaaaatga gatttcatga atgtgtttgt cattcaatat gtgtggtgat catcttgaat 5400

tgccacaaat cctttttgga ttagggttgt atcatgactc acaaatcctg atggtttgca 5460

aaattttgca ttctgtagtg atagaaacca aaagttaatc caattttgga ataagattga 5520

tcaattggta tctaaggcaa gtattttata atggtggtta cttaattagt tataaaagta 5580

cgaagagtct cctaccaatc ttacacttat ctagccaatt tggttgattg aattctgaat 5640

ttgggttgct taagtgttaa gttcactaca aatatattgc aaccatgatt ccgacttagt 5700

caaccaagcc tagatctctt gaatagattc atgttaatta tggatttaca taggatataa 5760

ataaataatt aaaacttgaa gagatctaaa tgaaaccttc tcgtacatat taaatcgaat 5820

gatcttccat cattgtagat atacggatac tctactgatg ttgatgattt tcgactagat 5880

atagtacttt ggttgcatcg aaaaagtaca accactttat aacatgagat gttgcagggt 5940

agagatgggg ttgggcccaa taattgttag gtgaggatcc aaatgatggc tgcacttgcg 6000

tgtgaatggc gagtctgact taattaagaa atagagctaa taactattag atgaggcttc 6060

aggacttaga gacttatgac cactacaact tacttgagaa gcaatggata aagagtcgtc 6120

tatttatcaa ctgacgcatc accaataact atcagatgga gtgatgtata attagtggga 6180

ctatagtatc cacttgaaat cttaatcgta aaaatttttg tttctccacc tgaagagcat 6240

gggagattcg aaaaaatagt gggggtagtt tatttttaaa ataaagctcc taaaataaac 6300

taaaataagt taaatacaaa gtctaactag aatcttcttc tctctgtaga aaatatctgc 6360

ttccaacctc tatttcatat ccttaagact aattgtttga ctagacccag ttataaagat 6420

tgactctaaa acttaaagat agtcttgagt tttgaaaaga tgagctatgt cctggatcaa 6480

gatatcctct ctctaccagc ttgtcccacc cctaatcaag gggcatccta tgaaaagtgg 6540

ttaaacgatg ataacaaggc ttggtgctgt gtgctgacat ctatgtccat tgaactccaa 6600

tgccagcata agggtacaaa ctgtccaagg tatattgact catctacaag agttatatag 6660

tgagtagagc catgtatctc actaggaagt atttaagaga ctct 6704

<210> 64

<211> 4741

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (3017)..(3951)

<223> n is a, c, g, or t

<400> 64

cagattatca atataattga taattggact aacttgtaat tattataagt agcaaagatt 60

taattgctaa aggttagcag attcaaggag gacttatgtg taaataatgt acatcttaat 120

ttgattggat caacttagtt atggctaaat ttaagatgaa tcaaacaggg atttagttta 180

atcgaatttg ggtcaagctt tgggcttagg tcacatgcac tcaaaagggt ttggatacat 240

caagtgtgtg acacccaaac caagcctccc taaactattt tgagttggtt ttgaccaagt 300

caaaagggtc cacaccctag ggtttcttga ataaaaccct aggtgccaca ttgaggacca 360

attaggaaac tttgacattc tttcacacgg agcagcacac tagggtttca tgaaaaccct 420

aggcacccat tttagccata aaaggaaagc tccaagggat gggatggtgc catgaagaat 480

ccctggccat tgggactcca ttcaaaagtt ctctaggttt tgggctctta tagagcccta 540

gggtttgttt gcctataaat aggtcgctac cccaaggctt tagataatgc tagaggcttg 600

tgaagctctc tcctttctct tgtttgccat cccaccttct ctcctctctc ctccatgcct 660

caagacttct ttcttctctc catcatcttg ttgaaattta gatttcaatg agaaggatca 720

agtagagtca gagttctact gcagttctca aggtgttgag aactttcttc atcaggcaaa 780

gattctgcaa aggagttagc acctcaaaga accaagaaag ttgctaatct gccctcatct 840

ccatgtggat acttatagag gccaagcatg acgagaagag ccttatcacg atcatcactc 900

gtggagatca tctacccgcg caaaggtatg agataagaaa aaaatatttt tcttatcatg 960

attcatgaat cctttgctta tgttacattg agactcttgg attagatttt ttctctaata 1020

aaatttcaaa gattagatct cgaagtcttc ttcacctaaa ggtattgaaa gttctttata 1080

ttttcgctac tttgattcaa aatagattag atttgttttg cctttcaatt tttctcatat 1140

ttattgagat atgaagcttt aattaatgag attaataaaa agcatatgtg aaatactgag 1200

aacatcctaa caatttgagc ttacaattca cttaaacaac taatgatcaa attaataatc 1260

acaatgcaca ataaaaattc atgataaatc tttttgttgt tactttagat caaaatccaa 1320

ctaatcataa catgatccac ggattgccta tcatatatca aaccctctga attattaatc 1380

ttaaacgatc ttttcattca tgatcataag atttagttaa aaatcatgaa gacaacttat 1440

attgtaatca tcatagatct gtatcttaac atccttagtg tttacctacc tatactcatc 1500

ctatgtttga ttctatatat cataatttat tcactaatac tttgatatca tataaattat 1560

cgcatcccca atctaagatc atattggtac tttaatattt cattagtggg ggttatgcat 1620

tagtactttg ataccttatc agttgaatgg ttaaacactg gtactttgat atcctatcag 1680

tggaggttat acgctggtac tttaatatcc tatcagtaag atggttaaat actgatactt 1740

tgataacctc ccagtgggtg ttgtatgcta gtactttatt atcctaccaa tggggcagtt 1800

aaatgctact actttgatac gctaccaatg ggatagttaa acgctagtaa tctaatctta 1860

gcttgacata aagtaacgtc gactcgagtt tagggtcgac tcgagagaat gttagggtta 1920

gcttgatatg aaagagggtc gctcgtcaat attttggagt caactcttgt ttatggacga 1980

tctagaaagt gtcagagtga gctcgagtac tgcatatttc tgatacattg tctatgctag 2040

aatgtgctag aactgattat cttctttatc aaagttgatt tttgagtaac ttgatgatca 2100

atttttctag gctagacttg ctttgtcaaa atgagcactt gttagtttag agaatcttca 2160

cctacacatg atctcaagca ttcattagta ccaaaaatac ttaagtattt tgatatcatc 2220

aaaatcaatt cttgggttaa cacaatactt ttcaaataat aagcatacag atataatcct 2280

ataacaattt aaattttgtt catatatcaa tttctttaaa aatattatat tcatcttgat 2340

agctatgaac taaatcaaaa tacatactag tatacaactt ttactgggag agtattagat 2400

taccagcatt taaccatccc actggcaagg tatcaaatta ccaatacaca acccctattt 2460

ataaagtatc aaagtaccag tgttcaactg cctcactggc aggatatcat agtactagta 2520

tttaactacc acattgacag gatatggaat tatcagtatt taaccatcat tagtagaatt 2580

ttgatgcata gtcaggctgc gagtcaaaat ctatctcaaa tcaaaatatt gatcacatgt 2640

ctaattctgt atcataattc attcccttat gctctaatat tatattaatt gtcatacttc 2700

tagctcgaga tcatgagcca aggattgcag taactaccgc atacttatag agaactcttt 2760

ctataagcat acaagatatt ctaaatatac tatcaatata tcatagagaa attaatttaa 2820

ataactaaaa gttaatattc aattaataaa ttcaactggc aaatgtattt aaaaatttta 2880

catcaaataa atcttgatta ataaatatta attaataaca atagatttaa atcgaaacaa 2940

ggttgatatt gttagaattt gatgcctcaa gattcagccc acattgagtc cacagtgagg 3000

ttcgcgacga aaaatgnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3060

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3120

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3180

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3240

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3300

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3360

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3420

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3480

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3540

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3600

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3780

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3840

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nagatattac 3960

taaattttgc ttctaatctc actcttaaat agtacttacc tttgaaacta ggcatttgaa 4020

tctgaaaaag aaagaggaga ttatgagctt gatagttcag taaatcatga ataaattagc 4080

taaataaatc tatgaataat agtatattaa aaataaatat gtaagataca ataattcaaa 4140

aatgaattca tatatataat actttccaaa taataagtat gtggctgcaa tcctttcgta 4200

attcaaattt tgttcattaa ttattttttt caaaacatca catggatagt catgaactaa 4260

atcaaagtac cagtgcataa cccctattga taaagaatca aataacaagt gtttgactgc 4320

ctcattatca ggatatcaaa ttattaatgc ataacctcca ctgctagggt atcaaagtag 4380

caacctcaat cacctcactg gaagggcatc tagtttcagt atttaactac tccactggca 4440

aggtgttaaa ttatcaatat ttaacctcca ctgataggat tttgatatat agtcagactg 4500

cgagccaaaa ttcatttcaa accaaaatat ttttctcaaa gacatatttt atgtttcaca 4560

ttgaaaaatt cacaaaaatt atgcgatatt gaaatcaatt ggataaaatc cacgtcaaat 4620

ttagtatatt caatcataaa tcatttacta ttctagaaaa ggtatattaa aagtataatg 4680

catcaatttc ataaatcata aatatctcaa tataaaaaat attttattat ttattaataa 4740

a 4741

<210> 65

<211> 5462

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 65

agtatattca atcataaatc atttactatt ctagaaaagg tatattaaaa gtataatgca 60

tcaatttcat aaatcataaa tatctcaata taaaaaatat tttattattt attaataaat 120

ctaggagaag tgaagcatta cttatcttgt aagtaaaact aaccaactga tcaaattaat 180

tctgagaatc tttctcaaaa ctcatcacca ctatatcaaa aacttgtgct tcttgctatg 240

taagagcata gaccctttct tcgatctggg gttccaagtt tctattttat tttgttcaac 300

tatcaaatta gactgacttt tcattttttt gtggatattc agctatttta tggcctttct 360

aacaataacc aaagtatgta ccaatattcc aacaataatc atttattgca tgattttcac 420

cgcatcgaaa tatttgatat tatcaatcaa tccaaacttg ttattcactg acctcttatt 480

caaaccctta gtatatttaa tattctacct ttgtgattca ttcaatcgat ttcttttttt 540

tattttcttt ccctttctat atgctcttca ttaacttttc tttcaattat caatgcttta 600

ttcaatacat ctgtataagt agttaactca tatagtacca tttattttct aatttctatc 660

ctcaattcca actcaaattt atctactcag tcacattcat cttcaaccaa tctcgaagca 720

aacttgacaa gctccataaa tttagcttca tattctacaa ctattatatt tctttatttc 780

agataaataa atttttattc tttctgaatc ctcatactct aagaaaaata tttttatcat 840

aaaatatctt ttgaaatcac tcccaagcga gttgttctcc atcttgttca tatttaggtt 900

tcattctcta ttatcaatta aatgtctcat ctttcaacat gtatgatgca tataagattt 960

tttcatcatc atggtatctc ttaacaataa atgctttctc catctccata agctaatttt 1020

tagctcctat ttcatagttt tcttaaaagt caatggagac aacttcttaa attctatgat 1080

attactttat tgctcctatt gctcttatgt ccttgtggtg acaatattta ttgttgcact 1140

tgctgtagag gcagttactg ttactgcaat tgctattacg attccatcaa gccgactagt 1200

gtctgcatta tttggataat agttgatttt tgctacttta tttagatgtt ggtggcaaaa 1260

tcaatgactt ctttttgctg agagatgcca ccaacctact aagtatcatc atcttattgg 1320

ttgatacctt tagcagcacc tcgagtggtt ctttttatct gatatggaac catcttaatc 1380

ttgcatgaaa aacaaacttc gcaaaatttt cttttaaaat ctaatatcta atattatact 1440

tttattaaaa tttaattatg attattttaa gaataaaaaa tttaaatttt gaaatcctca 1500

caaggctggc caagagataa tgaccatcat cctagtcggt ttgacgtagg acatccaaag 1560

atcaactata attcaagcat catattgaga tgctaggata taatcgatgg tgaaatttaa 1620

tgatgctcga ctgatcaaga tgggggccgg cccgatggcc tgttcaacaa tcattgatca 1680

aaatttttta accaaggtct atcaagatca ttaaaaagtc tttctaagat ctataaattg 1740

taataaagag acacaatcta gagagagaca ctttttacat aaagaaagta gaaattttag 1800

ggagagaaat tagagagaaa ggggaaagag agaggaagct gagaggaaga aagaaaagag 1860

aaagactctc tctctttttc ttttctttct tttctttctt ttctttttct tttctttttt 1920

tcttcctttt ctttctttct ttctttggct cattagaaaa ataggggacc tattgatccc 1980

cttgtttcct aaatagggga ggaatctcat cttggtagct atggccggcg atgtgagcca 2040

aagtggcaaa atcatgaatc tcccaacttg cagccgacat tgacttttgg cactggaaaa 2100

tcaaagaaat ttgacaaaaa atgggaaaaa attgaaacca aaatagggac caaaatccgg 2160

taatagctag ccaaaaatcc ttgatctttg ctcatggagg ataggaaaaa agattattca 2220

agagattaag ggaatcttat ctcatttttt tgctgtgctt cggccatggt ggttgcagaa 2280

atcgtttgtg aaagctcgac aaactctgca atttcctcgg gcttgggcct cgatctttaa 2340

taggagaaga gagaagtcct ctttctttta aatagagtcg gagggaagga gtttgatttc 2400

ctccttatgg tggtttcaaa ctctgatcgg aagtccattg gaaaagaaga ctcccattag 2460

ttttaaaatc taataagatt tattgattag aaaattgata aaaaatgatt attaaaaaag 2520

tagcataatt atttaaatca atgatgctta gattgttgga ggtaaatagt aataaaatca 2580

aaaaattaaa attcatggga ccaaaaaata atgaacaaga tttgaaagaa atgtctataa 2640

ataagaattt atgaaacagg ggaacattga tcaaaggtgt gttaaatagt gtccttaaag 2700

tgttattgtc cctctcacgt agactttgtg tgttgggaga gaacatagta attctctcaa 2760

cctatgcaac ctaaatcttt tgaaaagaaa tttaaaatta tagaaaaatt ggcaaactag 2820

aattttggtc attttcttta ttagtaaaaa atatactaag ttatatgtct ttatttatac 2880

tagtgaggtc tatctttgca caattcagac caaatttata ttctagttaa aagaggtata 2940

gattttttaa aatagatata actagtggaa atagtcatag aaaagttaaa aatcaatgaa 3000

aggtagattt cacttctata ttggctttat ttgtggtcac tttatctaat tctttttttt 3060

gatggagcaa tataccctgt taaaatcttc tcgatttttt tttcacttta agcaacctat 3120

ttcgatgcct aaacaatgga atttagttta accacttaat atgctacact tttaaaagga 3180

gcaccatatt gtagggcttg aaaagttact tgatttaaaa aaagagcatc ttaattggac 3240

atcatacaag taagttatga cctctgaaaa tttgatacat gatttatcat cttgatatgg 3300

taaatcttgt taagatttcc tcatggtgtc taaagtggcc ggttcatact gagtttggtg 3360

attcttctgg tcaatggtta attgctcgaa tatttttaag atataactaa tctccaactc 3420

tgccgactcc ttagtagtat gagcacatgg aaagcttgac ctaattgatt tcttaaattg 3480

cttgaaatca gtacttagaa aatatgcaaa atggatgaaa tgtttattgc agcgagagct 3540

ttctgatctg tacgaccgag agcttactag ttttttatga gctatacgtt ttgcacttaa 3600

gcctaattta aatagtgaaa tagttttgca acaattcaaa acaattaaaa tcaaaagaca 3660

agctgctatg catgttcaac tgactcggct ttcaatcgca atatgtcaca taggctggcc 3720

tagaatgcag atgcgtgcgt ggtgagcatc ctaaaaacct acatatccaa taaattccca 3780

ctagttggtg aagtattaaa tgtaactcgt attaactttt taatgtagga ctaaagttta 3840

ttcgactaat taagaactaa atactttaat aattgaactt ttccaaccag aaatcagaaa 3900

atatttaagt aattaaatat tacataataa ctagatcaaa atatcatggt tcctctctcg 3960

ctcgagatca attgggatgt tggtttatct tggtcatcca tcgagatgac tctatcttag 4020

cctttcaaaa cggcgcggta ccacgggtct caccgcttcg ttacatcgaa tgccaccatc 4080

cctttttttt ttttttttat ttatttatgc tttcttgctc ctagattggt gcggcctcat 4140

tacaactcca ctgctacttg atgcttccct ctagcatctc ctttgcagct ctctcacttc 4200

caccactctt cggcctaatg ttgggaaacg acgaaggggc cttacaaaaa tgtcatccat 4260

gatggcagtg gagaagaaaa catcgctggg gctttccttc gatatccttc gcagccaaag 4320

ctcttatagg gttatatggg agaacgctgc attatttggg tgatcttttt ggatggtgtt 4380

gttgactgat gctagttttg cttcatgaat tgaatattta cacaagatga gaatacaatc 4440

tagtacaatt ggtaccaatt acctgggttt gactcctgct cgcatctgat tgaagcttgg 4500

ttaatgtgca tctcaattaa ttcagaaaga tcatcggact tcatgtgaat tattttgact 4560

agcatgaata gggctaaata aggctgaaat atgtgttaaa tttttaaaat tataacttga 4620

tcatatgatg tccaattgag atgttttcaa atcaaaaatt tttttcgaga tttatcactt 4680

aatgttaaac tcttagaagg tcgaaacaga ctgaaagttt tcttttcaag atgtattttg 4740

accgagtata taacttgatg atcatatgat gcccaattga gatgttttca aatgaaaatt 4800

ttttttgaga tttatgactt aatgttaaac tcttaaaagg tcgaaacaga ctgaaagttt 4860

tcttttcaag atgtattttg accaaatata tctcataatc tataaagaat atatttcata 4920

atctatgaat aattagatag agcgacagaa gataatgcta atgtaaaaat cacgatctat 4980

tttttataaa atttaatatt tttatataat cacttttact atagtcatat ttattttaaa 5040

aaatttagtt atatttaaaa tatcaaaaaa atttgacttg aattatataa gaaaggatct 5100

tcctactatt atagatagaa gctttatatc atagtttaca gtgtatggat catcaatgaa 5160

agaaagaggg atgtaaacct tacttttgaa atttttctat ttgtttctaa attttttaaa 5220

ggatccaagt tgagaattga gagaattctt tctttctgca aatcaaatca ttagtataat 5280

ccacatggag acgttgtaat agaaagtaga aactatattt tatgaataat agaaagggag 5340

ttgatttacg ccaagccttt tgtttgcttg attaattatt tatttttatg gtgttagctg 5400

gaccccatga atagcaacca tcgttgggtc agggtcgtgt atttgttttg gggtcttcat 5460

ta 5462

<210> 66

<211> 8953

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 66

caagtactcc agaatcaaaa ttgtgaaaga aaaataggat aaatctggtt aagctgtaat 60

ttatttactt actttctatc tatattaaaa ttattcagat tattttgcaa atttatggat 120

atgcttgaat cacgtatctg atactttctc ttcatctgga tggcagtacc atgtgatcac 180

cacgcagacg gatacctaca agaaaaaggc aaggctaaca tgctttctta ccatcattct 240

ttacggtctt tgatccggtt ttgcgtgtcc acttcttacg tagtcttttt caaacattcc 300

tatctaagac tgaaggtaat gatttgcaaa ggaatagctt tactgttttc ctctaagtag 360

atgaaatatt actcacgtag aaaggagcca tcataattgc agaaagaata aaactgaatg 420

gaatatgagt agaattgtca aaatcttggt ttaagggttt taatagccag atgagaaagc 480

aacctacttt tcttgaacaa cttgtttgtg actgtcttgt tgctcccatc ttgcatctat 540

gattagcaaa atatatgata aatagatatt cagatttgat cgaaaagaag gaagattttc 600

tttaatccat ttaatttgaa tctcacaaaa aaaaagtaga agatttggac acgatcgctg 660

ggggcagcac gctcttaata gaatggtgtc acgttgcaga tctcgaaaaa ttattcaatt 720

ttttttaaaa aaaaagagtc attgaaatta gacgttgtat gaccatgtta tgatctctga 780

aagtttgact tctgactcaa cttcccaatg tagcagattt tactcctgaa ccatgtttaa 840

cctcctgact catagtggcc aaagtatcta catcgagttc actggtcttc ttggatcaca 900

ttcataagaa tacttcccat aattttgctc aacgttgttt ttctcatcaa ccaaaggtat 960

atgcttttta aaattgaaat gcccatgaat attatggcat tcttttattt gacattttgg 1020

ttgatcctat attgtttgtt tggcattcaa cacttcttca tgggaacctt tgaaatgagg 1080

taggtgctag gatttttctt tttacctatc catatcatat ttccaatgtc ttcttttaca 1140

ttaggttctt tagtgacaat aggggaaacg acccaatata atacccttga aaatttgggc 1200

aatatctact aaaactaact tgaataaaat attaacataa aaagggattt agtaacataa 1260

aagcataact caaaatcact caccttgtgt gccacgttct cattgccctt attatttttg 1320

cattgtgaat tgtgtccccc aataaagcaa cgtgaatggt ggaagagagt tgaatggctt 1380

tgttgagtaa ttgttttgag ttactatagc attgctctac taaaattgaa atcttgctgt 1440

gaggctatgt atgagaagca agttcatgct ttttgactgt tgggatggaa gtatgagcaa 1500

tctttttaat agaaaatgga cgaatcatga agtttttcct ttttattgaa aaagatgatc 1560

gaaaaatatg tgcaagatag aaaaacactg aaaagataaa atgagaagta aaagtggaag 1620

tctaggagaa gaaaatttaa gagaaatatc ttcaatgaga ggatgtgtgc accaacaaag 1680

ccaactttca ctaaagaatg taatgactca cctctacttt cttcgaataa ggggttccca 1740

gttgtggaaa gtatatagaa tcttctgaaa gactgagtaa atggagcaat tccttctaag 1800

aaatattatg gcatttctct cccacgaaat ttcaaagcaa agagcagcta gtagttgatc 1860

ctctaatctc ttaattgaag tttggaattt ctcttgcctc tatttggccc aaaggtcatg 1920

aagatctacc ggccaacctc ttaagttgaa ttagatctta atagaagtcc aaatgcttct 1980

tgtagaagaa catctaataa ataaatgagt gatagattct aatccagaga caaagagcac 2040

acctcgaatt cacttgccat ccttttctag ctagaacttc tctagcatga aacttgttcc 2100

ttaaggcaag ccaaataaat actcacattt taggaatgac tgccttccaa ataattttat 2160

aatatggaca aattagacca ccattattga taaacttgca atgaacaatt ataaatgagt 2220

tttcaggttg gcacattagc aatataggat ggtttgatta ttaaaaggat gatatgaagg 2280

gtttcaaggt ggtttgcctc gttcaaatca aaggattttg aagattaata ttccaagata 2340

aggttctcca actccattag gaaagtgtct tcatgtcatc ttagagaagc agctcgtacc 2400

aaacttgaca gatgttttat ttatttagag tgacacagat accctttggc aatactctcc 2460

atccttgtcc gaacaacttc taatcacacc tcacttatct tgcatctaac tcagaggcta 2520

caagttacac ctttcaacaa accttttcgg tttgaaaatt tgtgatttca ttatttagag 2580

ttcgaagagc atatcaagta ttggtcggag ttggcaccca aagcaaacga aacagttact 2640

gacatggtcc aaaagctgag atttctaaga tcccaactta agcactgaat aaagccatta 2700

tgggaaatat cattttaacg aaagaggaat ttagagtaag aattgattct cttgataccg 2760

aagaagaact aatacagctt tcatcacttc aaaatgatga acagatgcat ctcaagtcag 2820

cactagacca tcttctaaaa taggaagatc tatggaagca acactcccaa atgcagtggc 2880

ttcaaaatgg ggattgcaat acgaagttta tccatgtttg ggcaagtaac aggaaaaaaa 2940

gaatactatc actgaactct agcaaggcga tcagaagatt atcgaatagc agcaaatcca 3000

atccacattc tacaactttt tttctaccct actaggctcg actgaggaat gactcatcca 3060

agctgattgg aagattcttt atccagaagg acctctggat cttgctgaca ttgagtatcc 3120

atttatggag aaagaaatcc atgatacagt gtatgacttg gctttggaaa agtcacccgg 3180

atgatatttt cccattctcc ttctataagc acttctagtg tatcatcaaa catgacctga 3240

tgaacctact gtaaaatcag ctaatgtaga ccatctgaac tacttgttca tcacccttat 3300

cccaaaaaaa aattggtgtg tattcagtta gagacttcag gccaataagc ctgattaatg 3360

gagtaataaa aaatatttca aaaactctat cgaaaaggct cccacagaaa atgaatttgt 3420

taattttatc cacagagctt gctttcaaca gaggaagaaa tatctctgaa tattttgtaa 3480

tgactatgga aactatacac ttctgcaaag ctgaagtaca caaggatctc aattataaag 3540

tcgacttcga gaaagctttt gacaatgtgg attggagctt tctattgaaa ttgctatcca 3600

gcacggggct ttgattcgag gtggtgtcaa tggatagaat atctgattta tacagctaaa 3660

ttctcagtcc ttattaatgg tgataaaggt aaacttttta aattgaggaa agatctcagg 3720

caaggagatc ctctattcgc ctagctcttt ctcttagttg ttgatataga atgatcaagg 3780

gagcaagtag gttcaatctt tttgttggaa ttggatcata taatatcatg ggataacttc 3840

aaagctttta gttcactgat gacacactta tattttgcag atatgatcta aaatacatca 3900

aaactcttaa atttttactc tatagttatg agctactgat gggtctcaaa attaactttg 3960

aaaaattcca attttttggc ttgagaattg caaagatgtc agtacagcaa gttgcatcta 4020

tcctagaaag caaggtggct acattttcca ttacttattt gggtctccca ctccatcatt 4080

ctaaactgag gaaaacttat tggaatccac tccttgagaa ggttcagaag aaattgatcg 4140

ggtagaaagg taaacttctt aacctctagg gtaggcttat actaactaat gcagtgctta 4200

cagggatccc actactctgg agggatacat tccttctccc tcaattcatt atcaaataaa 4260

ttgataaaat ccatcgatca ttcatttgga gaggaaacga ggagtataac taagggcact 4320

ctagaatatg ttggtcgaat atttgtcgat caaaaaaatt tggaggactg ggggttcctc 4380

aatctaaaaa ttttcaatac aattcttctt tgtaaatggt ggtggaagct ctactctaat 4440

gctggtgacc cgtggtgtag ttttattgcc actgtccacc caacttcaca ctagagatct 4500

aaaggtatac acaaatcaac ctcttcattt tggaatggtt tacagcacac atgaaatatt 4560

tctactccta atccactttc aagttagcaa ctagtattat tttggaaaga tagttggtta 4620

cataatcatc cactgaagga tcgatttcct cacctttaca caatagcatt gaagtgcaac 4680

aactcagtgg caaaggtatt aagcaatcta cttgataata gctcttttag tactcctctt 4740

cctcaaagat accaagaaga ttttcagagt ctataggaaa gcattgaaca aattacatta 4800

acggaacgac ctgatactat acaatggaaa tggtttagta gcaatatttt tttggcatga 4860

aggatctact attttctgca agatggagga gtttggcctc tactgagtaa tattatataa 4920

aaactcctaa taccaaagaa agccaagtta tttgcttggc taagtgctca caacaaaatc 4980

ccaatgaaag ctaatcttct taatagagga ataattggaa ctgattactg tacactttgc 5040

gatgacttat cagaaactaa tgatcatcta atgctcatct atactttttc aaaagcaatt 5100

tggaatcaag tactttcaga cctgcaattg tcgaaacttt tatgcatgct taacacccta 5160

tgggatactt ggagactcat caatatgcaa cacgatagaa gacctaaact agctgctcta 5220

ttcgtaattg gtcaatggtg tctttggaag gaaagaaata aaagattatt cgacttctat 5280

actttttatc cacgatcgat tgctgaaact gtgtcacttt ttctttcttg ggcatcacac 5340

ctaacaacgg agcaactaaa gatgttagct cctgttcgag aagttctctt atctaagaat 5400

gaaaacacac aatctttagt gagaattaca gatgctaaca ggcgcagatg aatgttttat 5460

gagcattttt atagctgcag cttatatgtg atctatggtg caaggagtta attataacca 5520

tggatattag ttaggttgac tatcagaaat catctccaat acattctatg taaccactga 5580

tcaattccat gttcaactag ataggaacct gcctatatac aggtatgtcc ctgatgtaac 5640

tatagtatac tattattcat aaataaataa cgaaggtttt accttcttct cataaaaaaa 5700

aagtatcttc atgtcatcct atatgtcatg catctccttt gctacttctt ttatttactt 5760

cttaaacttg gttctaccat atattatcag ccccttttaa atttgctttt ggatattgca 5820

tattccactc ttcaatcacc tcatgccaag caaaacattt attcacactt gaaaaccaat 5880

ataagaatac caaagaattt atccatgaaa ttctagaaac tttggtttta ctcctttctc 5940

catcattcaa aaaggttcaa aatgatgata actctatata gcttatttat caaatttacg 6000

aggttggtgt tcaatgtttt tgtgaaaaaa atatcttgct atccacatag tttgaatcca 6060

tacttttgct atcttgagtt tcaaaaattt taatttgcta caatttgttg ctattagcat 6120

atgactactt ttaagaagat aagccaatat actattttcc taagaattta aaaaatcaaa 6180

aataaaaatt tttatttaag attttttaag ggttgttttc caaatgtgca atggggctta 6240

atcttggcat cattttctaa cttgtagaat tttgacccaa gtaacatttg tccaatcact 6300

tagaacttct ataacttcgt acaatcattt gttaatgttg ttcatctatt tatctatatt 6360

atctatctgg aatatagttg ctcttaatta tttttatata tcgcctatta tccaccctaa 6420

gctttcatgt tcatcctcat gttgttggag gtgcatgtct tattccaaac tatttaccat 6480

tgctgtagat tttaaaaaat ttgctagttt aggacttttt aatcttttga tatcatgttg 6540

atgtaagcta accctctaag gctagtcata atacatttta aggatttatg ttatatgaga 6600

ccaaaatttt aacaaaatga agtgttggaa attggtagaa tggaagtgta aagatgctta 6660

gagacataga actagccctg ggccatgtaa atcttccaaa agaagaagaa aataataaaa 6720

ttaagatcat attcaatctc tacagaaaag ttggtctttg ttgtataata agccatctta 6780

acatatgatg gacaataaaa tatataaact tatgagtttt aatacttaga tggaagaaaa 6840

gggacagata tgtcacaccc catcctacta gcatgagtag gcacatgata cacggttgca 6900

tgccctgcag agtttgactc atgaggcatg caaggtattg aatagtagtc taggtaaaat 6960

taaaaaactt ggagcattct aaaaataaat caagttcatt ttataaaatc aatatttatt 7020

atggactcca tcaaatatta tgcgcataac attttatttg caaatagaag aagataagtc 7080

ctagatccta agtctcctac tcttagtctc ataattcatc caagctatcc accaaatatc 7140

taaaacgaaa aagaaaaacg atagtatgct aatagctttg taagtcacct tttatctcta 7200

attagatcaa gcatattaga tataaaacaa taattttcaa agtatatgat ttgcaattag 7260

gaataaatat ttgataaata cagaataaat tttcataaag catatttact aacattattt 7320

ataaaatata taatgcttat atcaataaat taatttctaa atcaatatat ataaactatc 7380

cattctgtct tagccttaca actattgcta ccattccctg tagcatggtt aggaagagac 7440

tagctcttga atactcatgt catttatcaa catatgcgaa tgatcattcg actaatatag 7500

tcaaaaaaaa attactctga tttatataaa ttaaaaatta gtaaataata tatgctagta 7560

atcaccttac cagctaagct ctaaagaaaa ttagcttttg aatatacatc atgctattga 7620

ttattatatg tcagtgcttg tctcattttg tggcatgcaa gaagactaga tcctaaactt 7680

atatgcatag tcagattaaa gagcaaatgt tgcatctgat tatatgaaca tctattatga 7740

tgtagagttt gtatcatgta tatttaattt aaacacaaat ataattatac ataaataata 7800

ttcatatttt aaattttaaa tatttagata attattctag tgcaggtata aaaataagca 7860

atataaaatt ttaaatcgat ttatataaca tgcataataa aaaaaattaa ggatagaggt 7920

acttactgct caactcataa aacataagaa atctctttaa ctaactttag tgcaacctag 7980

atagaacata ttaatgatta agttttcatc taaaataaac atagatatca ttttaaaatc 8040

ttaggcattt aaatggtctc atgatttgtg aggctttctt cagattctac aattttgaaa 8100

ttttttcaaa ttataatttt tttaccttga ttgataacaa agccaataat acacctcaaa 8160

tccaaatgta ttcctaatag ttttcaataa atctaatatc aataaatcat aattaagata 8220

tcaatccatt ctatgaattt gaccataaat cctacttgtt tctctgacct tcactataaa 8280

ttaatcatca aactaaataa gtgaggggat cataattctt ttacgacaat ccaagaattc 8340

aagtctagca tccacattag atggcttcct gtccagatat ttgcgcctct ccaaaattga 8400

gattatcaga ttaagaaaaa taaaataaga gagagggtta aaggacaatg ccttctaggt 8460

agtgatgtcc gacatcataa ttttgatcaa atctatgggg caaccaataa tattagggaa 8520

agaggattgg atttgagcaa gaatagcaaa gtcattgtca tcaatggcct gattcattga 8580

gttcaatgaa ggattggtgg ttgagtggtg gaggtggcat ctaggaagga gagagaaaga 8640

aaaagataga gagaaagaga taagaaaaat agagagaagg tggcagttaa gatccctttt 8700

tgtgattaat atatagccgt aagatactca aagatctcac cttatcgacc tcaaacacta 8760

agggaggtgg aaggagggac tactacccat gaagctagag aaagggatga tgatgattgg 8820

aggaaggaag aaggaaaaat agtagactcg atgatgataa gactaaaaga aaagggtttg 8880

acttagccac ttggtatata atgaggtttg gtatggagtc aatagcttga gtaatagcat 8940

ggaaagagag aag 8953

<210> 67

<211> 6021

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 67

aaatatctaa aacgaaaaag aaaaacgata gtatgctaat agctttgtaa gtcacctttt 60

atctctaatt agatcaagca tattagatat aaaacaataa ttttcaaagt atatgatttg 120

caattaggaa taaatatttg ataaatacag aataaatttt cataaagcat atttactaac 180

attatttata aaatatataa tgcttatatc aataaattaa tttctaaatc aatatatata 240

aactatccat tctgtcttag ccttacaact attgctacca ttccctgtag catggttagg 300

aagagactag ctcttgaata ctcatgtcat ttatcaacat atgcgaatga tcattcgact 360

aatatagtca aaaaaaaatt actctgattt atataaatta aaaattagta aataatatat 420

gctagtaatc accttaccag ctaagctcta aagaaaatta gcttttgaat atacatcatg 480

ctattgatta ttatatgtca gtgcttgtct cattttgtgg catgcaagaa gactagatcc 540

taaacttata tgcatagtca gattaaagag caaatgttgc atctgattat atgaacatct 600

attatgatgt agagtttgta tcatgtatat ttaatttaaa cacaaatata attatacata 660

aataatattc atattttaaa ttttaaatat ttagataatt attctagtgc aggtataaaa 720

ataagcaata taaaatttta aatcgattta tataacatgc ataataaaaa aaattaagga 780

tagaggtact tactgctcaa ctcataaaac ataagaaatc tctttaacta actttagtgc 840

aacctagata gaacatatta atgattaagt tttcatctaa aataaacata gatatcattt 900

taaaatctta ggcatttaaa tggtctcatg atttgtgagg ctttcttcag attctacaat 960

tttgaaattt tttcaaatta taattttttt accttgattg ataacaaagc caataataca 1020

cctcaaatcc aaatgtattc ctaatagttt tcaataaatc taatatcaat aaatcataat 1080

taagatatca atccattcta tgaatttgac cataaatcct acttgtttct ctgaccttca 1140

ctataaatta atcatcaaac taaataagtg aggggatcat aattctttta cgacaatcca 1200

agaattcaag tctagcatcc acattagatg gcttcctgtc cagatatttg cgcctctcca 1260

aaattgagat tatcagatta agaaaaataa aataagagag agggttaaag gacaatgcct 1320

tctaggtagt gatgtccgac atcataattt tgatcaaatc tatggggcaa ccaataatat 1380

tagggaaaga ggattggatt tgagcaagaa tagcaaagtc attgtcatca atggcctgat 1440

tcattgagtt caatgaagga ttggtggttg agtggtggag gtggcatcta ggaaggagag 1500

agaaagaaaa agatagagag aaagagataa gaaaaataga gagaaggtgg cagttaagat 1560

ccctttttgt gattaatata tagccgtaag atactcaaag atctcacctt atcgacctca 1620

aacactaagg gaggtggaag gagggactac tacccatgaa gctagagaaa gggatgatga 1680

tgattggagg aaggaagaag gaaaaatagt agactcgatg atgataagac taaaagaaaa 1740

gggtttgact tagccacttg gtatataatg aggtttggta tggagtcaat agcttgagta 1800

atagcatgga aagagagaag gagctgaaga gagtactaag tcttattaga ataaagaaag 1860

atagaatctt agcgaaaaat agggcctcaa atctttcagg tagaggaaaa agagggatca 1920

acgaatgaaa gactaaggaa aaggtgtgga gtaggatata ctctcgatta gtctctcaat 1980

catggattct agtagggctt cgtcagctgc tcaatcatgg attctgatag ctcaaatggt 2040

ggtaagtaga aagagagaga tctaaagaga ttgatagtgg ccttaaaacc agcacggtca 2100

aggataggca tgccttagag agaggaaaag agagagagat taatggaaat aagcgagaaa 2160

aatatattct tagagaatag attggcgata agaagaggag gtggttgggg catgcttaaa 2220

gaaataaaga aaattgagta ggcggaaagt ggtgatgctt ggcgatgaga agatttgaga 2280

gagagagcaa aaaaatgtgg atgatggtca taggataggg aaaggaaaga acaaagaagg 2340

gggtgctaag ctaactcttt ctaccttcct cacaccctga agcaaaggat ttggccaagg 2400

atggacaaat gggcgagggc tttggtggat ccatgcctac cctttctccc tctcacgatg 2460

attctagtca agctatctat ctttgatagc ttgagccaag ccaattgact tgatccaatc 2520

tctctaaatc catacaaact taagagagtg tattgattca cttattctct tctaagttga 2580

taagaaacat aattaagtgg agctcattaa gtatttcagg tagttgctaa cttggcaaaa 2640

tggaagcaat aataaatctt aaaagactat agcttggtat aatctcaacc atccatgatt 2700

tagaaagatc ttcagactca atatagatta ctttggctac tacaggtaag agctaaatag 2760

gatccaaaag taagatccat cacattagta agtcaaatta tatgtcaaat tttagtaggt 2820

atacttagtc ctacgatgcc taattaaaat gatcatcatt tgaaccttaa aatggactag 2880

tcaactaaaa tttttctttt tgaagaagat ttagaccata aaatatcttc taatctgtga 2940

agaattagat agagcgagga atataaaatt gatgtagaaa tcaagatcta tcatatatac 3000

aattttaata tttttttcat aatttttaaa tatttatctt ctttttttat aggtctagtc 3060

ctatttaaac taggaagagg agtccaactt gacttatgca ataggggatg tccttctaga 3120

agataagaat aatttgatca gaattatata agagcaaacc tcattattat aaataggggc 3180

tatatacatc aatttatgag atagagaatc aatgaaacaa aagtagactt aagttttatt 3240

ttcataattc ttctatcttc tacttttttt ctaggagatt caagttgagt ggattgaaga 3300

aaatctttca tcttctcgat cggatcatat tggtattaga gcgttggtct tctatattta 3360

tggagagctt taatgtattg tttaaatacg tgaacaatac aaacaatcaa gagaagtgct 3420

atccatgctt caaatacatc gaaatataaa agcaaatatg gctactaatt ctttttcaat 3480

ggacaatgag ataaaaggat gtcttacaca actcaaggag aagattgtgc aactcatgaa 3540

gattgtctcc agattgaaga taatttcaat acaagcacaa acaccagcaa ctcatgttgt 3600

gaaactgttt cctatgtttg gagatgaaga tcttctatct agtgaggaga ttgaattacc 3660

taaaagtatg aaaaatcttt cttcaatcat tgaaagttaa agcttgaatt gagatcccca 3720

tatataatgg aaccattgat gaaaaaaagc tagataattg gctaaactaa ttacaaacct 3780

attttattat ctatagatat tatggcatct agaagatagc ttttacttat ctcaagcttt 3840

ctagccatgc tcttatctga tgaaattcat atatgagaaa taataatatt tttaatatgg 3900

tgcagagcca attcaaaggt ttaatcaaga agtaatttta tctaattggc cataaggaag 3960

atcggtggat caaatgataa tacttatgat agaaacataa tcaatccact taggactata 4020

ccaccaagtt ccacaaacag gcaatctgcc ttggaatctt tatcaacaat tatacaattt 4080

ttataaagta tgttgaaagt cttcatgaga gcatctaaaa aaagatgaaa ctctttaagg 4140

ttgatgatat cagtaaagct aacatgaaag tcatagagat tgaggagaaa aatcaaatta 4200

gagaagataa ggaaggcaaa aagcatatca acataactca aaaaaaaaaa ttatgatcat 4260

tgaaatcttt gaaaatacat caaggagaag tattgaaagt ttcatcctga attggagcta 4320

aagtagaaga agcccaagga tgataatttt aagaaaaata aaaagtggtc ctcaattcta 4380

tagagattga ggagctatct gaacttgagt aagcaaactt caaattgagc ttgatggtga 4440

gaaaacctaa tacaacaatt aaaacggatc tagaggtaca tgacaactca cccacttaaa 4500

gattcaagtg aagcagagta tcattaaggc tattataaat ctttgaagct agaagaacct 4560

cattttccaa tatttggttc agaaatcgag gttgtagatc aagcctcatc catatcctta 4620

tcctcttagt tggattcaga aggatgtcaa gttaaaaatt atgagatagt gtaccttcaa 4680

gttagccatc actgagaggt ttatttgtga ggtaactttt gaaatagttt ctttggatat 4740

ttgtcaagtt atccttagaa atgtgtacct ttagaatcaa gatgcaattt tctatagacg 4800

atagagaaag tatcatctta taagggatga gaaaaagttc atgatcaaca cctcaagaac 4860

ataaggtaac tttgaccttg caactgttgc ccaagtgaag tgatttgtta atgtttgtga 4920

tgagtgcatg atgatggtat aaagaaccga tatcactcat gagaggtcaa ggccttgtcc 4980

tttggttcca tcaatcgatc aatagagatt gagattaagg aggagtcact atagtccttg 5040

tcgatgagga aggatgacaa caagcattcc taccatgaag tctagatttg agagcaaatg 5100

aaagtaatcc actgagacct gagagcaaaa aaaggcgaga ccaaaaatca tcttcaagta 5160

aagtcaaatg gttcaaccat gagatgggga agtaagtatt ttcccacctt caattctaac 5220

tttgtagaaa ctaaatccct taaacagggg agccctaatt taagaggatc ctcagattca 5280

ttgtggacta ctttggctat tacaataaga gctggatagg aatcgaaagc aaaattcacc 5340

acattaggaa gccaaattgt atggcaaact tcaagagacc ataacttgat cacatgaaat 5400

ccaattaaga tgattttatt tttgaatttg aatatttttt tgagatctat aactttagat 5460

ctaaatcaag ctaaaatttt attgcttatg ccttcaaaat aggctagtca aatcaaaact 5520

tttcttttca aaaaagactt tgactgaaag atatctttca atctatgaag aatcaagtag 5580

agtgatgaaa gataaagttg atataaaaat tgagatctat ctcttataaa attttagtaa 5640

ttttattttt tttaatattt atctttattt agagatctat tcctatttaa actagaaaga 5700

attgtccaac ctaacttgtt caatgatcaa catcctccta aaagataaaa agaagaatct 5760

gactcaaatt ataaaagggc ggaccttttt ttttgatgaa aagggaggaa aaaaatccat 5820

caaaatttat taagaaaaaa agagtacaag aaaagaagga tatgaaagag taagagaagc 5880

cccacaacat ccatcaatat ttaaaattta aatttaaatc tcccccatca ttctatcaat 5940

atttgatatt caaatttaaa ttcttcgcag catcccacca acatttgaaa ttcaaatcct 6000

ttcatacaaa caaaataata t 6021

<210> 68

<211> 5329

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (4258)..(4985)

<223> n is a, c, g, or t

<400> 68

atattttcgt agtctctaaa ggcttcttcc agattggcaa tatactgatc tgactcagta 60

ttttttacta atatatcatc aacataaact ttgatattaa tttcaatttg ttacttaaaa 120

atcttattaa tcaagtatta gtatgtagca cctacatttt taagatcaaa agacatcatt 180

ttataacaat gcaaatcttt ttcagtgatg aaggccatat tttcttcatc ctcaagtgcc 240

attttgatct gatataacca gaaaaagtat ccataaagct tagtaatttg tgtcttgaag 300

tagcatcaac aagctgatca atttttgaga gagaaaaact atcttttagg caagctttat 360

tgagatcggt ataatcaaca tagatccttc atttttcatt agccttttta accatgacaa 420

catttacaat ccactttgga tattatgctt ctctgatgaa tttgtctttc aagagtttgt 480

cgacttcctc atctattatt ttttatcttt tcggggtgaa acttcttttc ttctgttgca 540

ttggtttatg ctttggatca acattcagct tatgtacaat aagatcagtt aaaatctcag 600

gcatattaga gactgactaa acaaagacat cggcattcat ccgaagaaaa gatattaatt 660

tctccctcag atcaggcttc aatagagatc caatttggac agtttttttt ggatcatcac 720

acaaaagaac aataataagt ttctcgactg gttctcctcg atttttgatg atatcaactt 780

tactttcttg atcaagtatt ttaattggta gagcttccac agaccttttc atttttacag 840

ctatcagaaa atactactta gcaagtatct gatttcctca tatttctcca actccatact 900

tagtttggaa ttggattagt aaatgataag tgaagactat agccttaagg gcgttgagcc 960

taggtcggtc aagaatagca ttataagctg atggtatttt gacaataaaa aaagtgagtc 1020

ttacagttga ctggcatggt tctatccctg cagtgacgga caaagtgacc tctccttcca 1080

cagctacagg atttctagaa aatccaatta cgggggtacc aacctattta gctaatttat 1140

catattcatt ctttggaatg tatcatagaa caatatatta gcagagcttt cattatcaat 1200

aagtattctt tttatatcat atttggctat tgccataaag atgacaacag catcattacg 1260

aggagtttga actctaacat catcatcgaa aaatgaaatt atgtgatcca tgcactgatg 1320

ctttggaagg ctttcagtaa tctcagccac ctcctcagtt ccgtcgagat ctgagatcat 1380

attgatgact gcagcagtag acttgttgtg atcattctca ttgttgggct tctatcattg 1440

gtcagtagct tgacttgccc gatctcgaac atatttacta aagtaacatt agtggatcaa 1500

tacttcaatt ttatctttta attatcgatg ctcctcagta tcatggccat agtctcgatg 1560

gaaatgacag tattttctct tatctctctt tgctggaggg gctttcatag gattaggttg 1620

gcgaatatat cctaaatcct cgatttctat cagtatctga gctcgaggag tagatagtga 1680

ggtatagatg tcgaatcacc gaggtgggct tttgaacttc agattcttct gaggtcgttc 1740

agagttatcc tgttggtttt tatgatcttc ttcctagggc cacttttttc catctctttt 1800

tttcttcacc taacgaagta tgcatgctct ctttcttttc agcttgagca tacttacaaa 1860

cctagatcaa tatttgttca taattgtttg ggtagttctt attaagagag aagatcaggc 1920

gattactctt gagtccttgc ttcaaagctg ccattgcaat ggactcattg aagttcttca 1980

ctttcagtat ggcggcatta aagcatgcca catattcttg aagagattca ccttcctact 2040

atttgatagt aaaaagattg ctagtatttt tcaaatgaat ccatttatta tcaaaatacg 2100

tgatgaatat ttgctaactg tgtgaaagat gaaatagatc atgtctggag gtcagagaac 2160

tagattcttg cagatgtttt gagagtgatt ggaaaagtga tgcaaaatag ggcattagat 2220

accccttgta gtcttataat ggctctgaag ccttcaagat gatttaaggg attgatggag 2280

ccatcgaatg tttccaatgt aggtatcttg aatcgaggag gaactgattt accaagaatt 2340

ttttgagaaa aaagagatcg taagttgaaa tctcttctac cttgagaatg gcttccaatc 2400

tatatctcca tcattttctt ctcaagattt tgaatctttt gtccaagacc ctcctccata 2460

catggcttct tatgtggagc agatttcact tcccaagagt gatcagtatg gtcaagaaga 2520

tgatcatgat gaagatcttg aggagttggt tgctaagtgt gatgtgattg gactacttgg 2580

ggggctactt tttgctaccg ttctgtcgta tactacagca gtaagagctt ggacctgctg 2640

aaccaagaga ctaaactatt gtggatcaat aataattgaa ggttaggtat tctcctgaac 2700

atcttcagga gaagatgaag taggtaaagg atgatttggt gccttcttgt tcaccatttc 2760

tactaaaata ttttaagtgc ccttcctcta acactaatct attactgcaa ggcttcaaaa 2820

gacaggcaac gagatgggtc ttgaatcgaa ctagaatgtt tcttggttga atttggcgaa 2880

gtctgtaaca aatcttgcaa agaaaatctc gaaacctacg ggtaccttct ggttcaagat 2940

cctctgatgg ataagttagg taaagtcttg agaataggtt gtgaaaatag aagaatagaa 3000

ggatgagaag agagattgtc ggtaaatgga gagatgactc ttatttcttt caatggggga 3060

gctgaaaata attcagcaga gtttccactc tatcaatcct gacttatttt gtggagggta 3120

ccttggcccc ttcatatata ggggatgaag aggcctggta aggttgttag actattagga 3180

gagtttgtta gatcgttaat ttattataat agaatgacca gctatataaa aatcatggag 3240

tatttaccca catggtgatt gactgtagta taactgaaag atagctaatg cttagctgga 3300

tgactgctgt tagataactg tctgcattct tacggtacat tgatatttta ccaatgtgac 3360

atagcttaaa tcggcaactg gctgaactaa atattatgta tccctttagt taacaatcat 3420

gtcggttaga gatcaatgta attcgcagca gatcgatcat aagctgagat gagtatcata 3480

ttttaagaac aacgctgggc gagttaggcc gatcaaatgt cagactgaaa aagcagatca 3540

ataaacctct gatgtgatct gaaagaatat ttatgattta aataataatc tatcaccacg 3600

tatccagata atgaggtcat ataacatgta ccaacagtgc atttttccat ctagttaaga 3660

ggttggttag tggcatttgt cttcgatatg taatgttcac ataactaatg tgcttagtag 3720

cattcttttg taaggttaaa tcttcaatga tcttaagttc acataattgc ctttgtgccc 3780

tattagttta tagttgacct tttaattcaa gagacagtca ccttagcaat cgatgtctgc 3840

ttagattggg ccaattaggt actcacatta atatattgaa tcatgtttga atataaagga 3900

ttagattgat ttataagttt ccttttattg tttacatact gatacttaga ttgacttact 3960

acattatttg atatgttatg ttctaatttt tggattaaaa ttgttgtttc tgatttctcc 4020

ttacatctaa tactttgtat aatttattat tttttagcat gattgagtgt agaggattag 4080

attgattttt aagtttattt tgattattta catgcccata cttaaattga cttactacat 4140

tattcaatat gttatgtttc aattattgag ttaaaatttt tatttctgat ttctactgat 4200

gtccagtgtg tgtgtgtgta cgtatgtgtg tatatattta tttacatata tatgtatnnn 4260

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4320

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4380

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4440

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4500

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4560

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4620

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4680

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4740

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4800

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4860

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4920

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4980

nnnnnatgta tacatataca tgtatacata catatataga tatatatata tacatatatg 5040

tatatatata tatatatata cacatatata ggttatttgg aacctaagaa acttgcaaag 5100

ttactagatg caatgttcgg aaaccatgga ccgtaacaac tggagtagta tttgggtcat 5160

gaattcatgg ctagatcatg aattgagtgg gagtcaaccg aagtagggcc agctcagaca 5220

cttgtattta ggtcccatgc ttgcgtgcat tctcttccct gatatccttt ggctttgctg 5280

cctcaaatcc tcgagctatc ttatcatcat cgcattgagc tccatacct 5329

<210> 69

<211> 6061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (5947)..(6061)

<223> n is a, c, g, or t

<400> 69

cagtttggac ttcaatgtta acccaatatt gattttaaat ccaacattgg tccacttaga 60

cttatttatt tatttttatc aatttaatat aaaaaagatc taaacctcat aagtcataaa 120

ttttggattt atttttgaac atgtacaaaa taaaacagaa aaaagaaaaa attacttatc 180

taaaagtaac tatatctgaa aactttcact ttagaattgt cttaaattaa tgtacttcca 240

tcaacaattc aatgttaata tttttatgaa tccaaatgga tgatagagta ttttttagaa 300

tgaagtattg aagtctaaat gacatcgtcc caaaataaaa gtgaatttat gaaatactac 360

atctgtcgga ttcggtttca tacggattaa aagtgtagga atagaatccg attataaata 420

attatttttt tataaattct aattcaattt tattcgattt atatttttta accggtcaaa 480

attaatattt attaagtagg attggatgga tttattcgta tctcgattat ttgctcagcc 540

cattgccaaa tctaaactct tttcagatag gttccatgtg aacatgatac atgagatgca 600

gtgtgatagt acacaccatt gctaagaaaa ctttggagtt tgcgtaacaa tatctgttta 660

ccatttaaaa aatggcagtt ttgaatttta acacgctctc ctccagattc agcttatgaa 720

cttttcgaat aaaaataccc ctggactatt tttccaaaaa gtaccagcat cttttgaact 780

tgaatggaaa ttcggccaat aaaatgtttt catttattga agaaataaac agggtaacgc 840

agtagctcta tttcctctgc ttttcttttc tatattaata acatgattat tcatctctct 900

cggatcacaa aaaaattaag ctattcaagc tttatttata tttcattttt aaatttttta 960

cttaaataca aaatctccca tcccactact acggcagcat gttttctatg tatgattatt 1020

ttcattcaaa tgatatcatt ttttataatt tatattgtat gtaattaatt catttatagt 1080

tcttacattt tcctgtttct agtagataca ataaagcggt tttggactag tagcttgttc 1140

tctgtatcga agtttaacta aagctttgac aataatatat gaatccatat cactgggtag 1200

gagaggaata tgttgggtat aaaggattta aggaattaga tattttcata caattgtatt 1260

gcattgcaga cagtaattag attactatgc aattattctc tctctccatg tttgttgcag 1320

ttgaagaact ctaatgaagc tcacaaaaat ttactgcatg aacttgtaag tggaattaga 1380

cgactccgtt gtcctccatt ttcttttatt ttctttaaaa tcatctgcca ttcaaataga 1440

cagaaaaaaa aggattgatt agctattgga tgcctcttga attcaggaaa tgaaggacga 1500

gcacccagtt tatggttttg tggatgatga ccctagcaac tacgcaggtg cactagctct 1560

tgccaatggg gcttcccaca tgtatgcttt ccgtgttcag ccgagccagc cgaatctcca 1620

tcgaatgggg tttggctccc atgacctgcg ccttgcttga ttttattgta gcttaaagac 1680

cttacaactt ccagagtggt gttatatatt agtatcttaa gctatgacag tggtaagcct 1740

ctctatccgc tacttgttat cctttaggta ctttgcatgt ggtgcaaggt tataattgcc 1800

ttgtgtttct attgtcttcc tcatggtact tactggactg atgatgtcaa gtgaaatgga 1860

gttgtttgaa tcctgactga aatttctctt ggtccatcaa gtgcaagagt aagtttagac 1920

atcactcgca agcttttgct aggaaataag tagtttcatt gcactaatga tttcgaattt 1980

ttgttttcgg gttagagaaa cctagattaa tgctgttatt ggatgctggc agtcagatga 2040

agattatgtt tgattgtacc tcgttggaca gatgctcatg cgtagatcca taactctatt 2100

tcatttcatt tccctgtaca caattgaaac agggcatata tgaataggta tagaacagat 2160

gattcctgca atattggagg tggctagctc agcttagact aaagttggtc tagctgggat 2220

attctgaaca cctgagatgt tcaaataatg tgggataact tggcccaact caactaaaca 2280

ttggctcaaa gcatagtcaa ggtaaagctt gagcaagctc ttttgagctt ggttcgagtc 2340

cgagctgagc ccgggccgct tgtttagctg atgaactgaa ttcaaatagc cggtactcag 2400

cttggctcca ctcgattcat gagttcgaat cccctcaagt tcaacctcga acttgacggt 2460

gtagtcccac aaccatggcc accttataat gtgggacggc cattatgcat tcctctagtg 2520

cctgctccat atgacttttg ttctcattat accatgcacc taaatgagtg ctcatagtga 2580

caatgtttag cctccacgta taatgtgtgc cagctaacta gaagcctaaa ctttggtgaa 2640

atttctgcaa tgttgtggtt gtaaaacgct cctacgttga gacatgatgg tatctaagat 2700

tatagacaaa ctatcatgct gaatcaaccc aaatccaagg tgaataaaac ttgatacaaa 2760

gccgagctcc attgaaatag tacaatggat tctgcacttg aagaacatta caaaatcatt 2820

ttttcccaaa aagaaacatt gcgaacagac caaagcgtaa agaaattaca tgattcaact 2880

aattcaagct ttccatgatg taggcactcg ctagatgtag tagggtgata acttgctttg 2940

tgagggtgga tcataagctt aacctcaatc tatcccaatc tatcctttcc cttgacctat 3000

ccatgccaat ctaggccatt tctgcataaa tataacttaa tcccagtgga tccggcctag 3060

tttcactcac tccaacacat tcctactcaa tggtagccaa tcctttcttt agccctcaaa 3120

tataatccta atctagcata gccaaccatc aatcatgcct aataaagccc gactacacca 3180

acccgatcat tcctgatcgt acacaatcaa gacttatcct aattgatcct agcttttttt 3240

aggcctctct tatagaacct gtgccaattc tggacaagct aatccaatct tagcagccaa 3300

aaatattaca tgtttaatta gccaaatcga acctatcata aacccaatat ataatcggac 3360

cataccaaga tcatcatcct atatttcctt ctcttgttat aactacacct aaaaaggaat 3420

ttcttcatac ttatgagggg tatattatga taaaaattcc ttcattttag ccctccatcc 3480

ttgtctattt ttgggaccac tagccaagta acaccttaag agccctccat cttaatattc 3540

cctctaacta gctcgatttc ttcttcattc tttctttgcg atgtgtcccc tccaatttaa 3600

ttcttacatg ttgggatttg agtactgaaa aataatagat aaagagaaag taaaaactat 3660

gctaatgata ataccaaagg cataaagaaa tcacagcagt cgcaaaaaca tcaaattttt 3720

ttatggttcg gcctaagcct atatctacat agggacgaga gtaagaagaa gcttccacta 3780

taataatagt ttagagtaca aaaacttctc tgacaccatg tagggaacat cgcttctaat 3840

acaagaaaga agaaatccaa gattaaacaa acctctagaa aaattcttct cgatggaata 3900

actctaatct gagattgaac aatcttctcc aatcgatgat ctccaatctt cttttcttaa 3960

atgaagcacc cttcaagcct ctcttctttt ctctcttcct atcctctttt gtggctcaca 4020

acctcctctc ctttttatgt tctatgttcc tcacatcaca tccacagact catttttata 4080

gataaaaaat tagagtctat ttcggactcc ttttccacac acaagatggc ttcccacgcc 4140

attggttccg tgcgcatgac ttttttcatg ccacaaagga ttccgtgctg caaaagtttt 4200

ccatatccat gcagtttcca cacaccacaa aaactttcgc acacttctcg aaggcttttc 4260

atgctcgacc ctttttggtt ttcaattaaa ttgatggatc ccatatgagg agggaccaca 4320

ccaataaatc tcctccttct aactcatatg gtaggttcca tcaagcctgt agcacctttg 4380

cattttatca gttttgttcc tgaagccggc ttcatcaata tattagaact attttcttca 4440

gtgtcaactt ttttaagctt gaaccacttc atctctagca tattgacatg cttttggaaa 4500

gtatgtcaaa ttgctcaaaa ttaatcttac ggttctcttt ttcgttagat tctagtgcat 4560

attacgcact ttaacataag atctaaggaa ggaagaggac tgaggtaagg tgaagtgatt 4620

ttttttgagt tggtaatggt acaaaagtta tactagaccg tgggtaccta atctcggaga 4680

ttaccattta gatttggttc ttgatcattt gtatagtgat gcatttaaaa aattatttga 4740

gcaaaacagt gaatgccatt gggtctgaga gatccaaaac caaataacct aaagtatata 4800

gatggttcct ttagctagat catgtatgag aaaaaatgat ctgccgactg gaaaaaatag 4860

atctttgagc tcattgattg ttaagtcata tctagtctgt gaatcatctc tttgaggatt 4920

aatgatcaag ctatctttta tgggttaaaa gaataggatc actgaaatac ttatcctagt 4980

atacatataa tgtgcatggc ctatttgatg agtcagacta gaaggttatc actacttcat 5040

cacctttact gatgagcaat catgatatag atatgtatgt gagatacaaa tctaaaagat 5100

tttgaatggt tcaaagaatt cagatatgaa gtagaaaaga taaatcaaaa aatttttaaa 5160

ggtacttgat cggatctaga atgcaatacc aaataaaaaa tttgttgatt atctaaaaaa 5220

agtgatatag tttcatgatg gaattcttct tgtacacctc agctcaacgg tatatatatg 5280

aggagcaata gcactatatg agatatggtc cggtccatca tgaatatcac taatttaatt 5340

attatttatt taagagcaag atttaatttt taaaatttaa attagatttt ttctaaaatt 5400

ggtttcaccg caccatatga gatatgattt ggtggataag ttagaggata ggtctgtgag 5460

aactcattta tagggtatcc caaaaggtat ttaaaatatt actttttctt tctagtagtt 5520

gacaatatga ttgtgagcaa tcatactgtt ttcttaaaaa cagtggaagg atgaactcaa 5580

aaagaaagtc tctaaagaac aacgagtcac aagacctata caacctattt aagatgagcc 5640

agtatatgta gtacttcctt cacctcatca atttagtagg atctcctatc ctttagaaag 5700

atactcggta ttcttacaaa ggatttagag aaagtgtttc ttgagggaga ttgagaatat 5760

agggatgatc tcaaaaccta caatgacata atataaggaa tcatgtagtt acatgaaggt 5820

cagtgggagg gttccatact gacatcgatt atgatgtggt tacatataga attttttttt 5880

caaagatcta gatcaaacat tctgaaaata aaaggtctat agagataaat ccgaaaagga 5940

tgtttgnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6000

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 6060

n 6061

<210> 70

<211> 14226

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (1949)..(2907)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (3857)..(4532)

<223> n is a, c, g, or t

<400> 70

atcctctttt gtggctcaca acctcctctc ctttttatgt tctatgttcc tcacatcaca 60

tccacagact catttttata gataaaaaat tagagtctat ttcggactcc ttttccacac 120

acaagatggc ttcccacgcc attggttccg tgcgcatgac ttttttcatg ccacaaagga 180

ttccgtgctg caaaagtttt ccatatccat gcagtttcca cacaccacaa aaactttcgc 240

acacttctcg aaggcttttc atgctcgacc ctttttggtt ttcaattaaa ttgatggatc 300

ccatatgagg agggaccaca ccaataaatc tcctccttct aactcatatg gtaggttcca 360

tcaagcctgt agcacctttg cattttatca gttttgttcc tgaagccggc ttcatcaata 420

tattagaact attttcttca gtgtcaactt ttttaagctt gaaccacttc atctctagca 480

tattgacatg cttttggaaa gtatgtcaaa ttgctcaaaa ttaatcttac ggttctcttt 540

ttcgttagat tctagtgcat attacgcact ttaacataag atctaaggaa ggaagaggac 600

tgaggtaagg tgaagtgatt tttttttgag ttggtaatgg tacaaaagtt atactagacc 660

gtgggtacct aatctcggag attaccattt agatttggtt cttgatcatt tgtatagtga 720

tgcatttaaa aaattatttg agcaaaacag tgaatgccat tgggtctgag agatccaaaa 780

tcaaataacc taaagtatat agatggttcc tttagctagg tcatgtatga gaaaaaatga 840

tctgccgact ggagaaaata gatctttgag ctcattgact gttaagtcat atctagtctg 900

tgaatcatct ctttgaggat taatgatcaa gctatccttt atgggttaaa agaataggat 960

cactgaaata cttatcctag tatacatata atgtgcatgg cctatttgat gagtcagact 1020

agaaggttat cactacttca tcacctttac tgatgagcaa tcatgatatg gatatgtatg 1080

tgagatacaa atctaaaaga ttttgaatgg ttcaaagaat tcagatatga agtagaaaag 1140

ataaatcaaa aaatttttaa aggtacttga tcggatctag aatgcaatac caaataaaaa 1200

atttgttgat tatctaaaaa aagtgatata gtttcatgat ggaattcttc ttgtacacct 1260

cagctcaacg gtatatatat gaggagcaat agcactatat gagatatggt ccggtccatc 1320

atgaatatca ctaatttaat tattatttat ttaagagcaa gatttaattt ttaaaattta 1380

aattagattt tttctaaaat tggtttcacc gcaccatatg agatatgatt tggtggataa 1440

gttagaggat agatctgtga gaactcattt atagggtatc ccaaaaggta tttaaaatat 1500

tactttttct ttccagtagt tgacaatatg attgtgagca atcatactgt tttcttaaaa 1560

atagtggaag gatgaactca aaaagaaagt ctctaaagaa caacgagtca caagacctat 1620

acaacctatt taagatgagc cagtatatgt agtacttcct tcacctcatc aatttagtag 1680

gatctcctat cttttagaaa gatactcggt attcttacaa aggatttaga gaaagtgttt 1740

cttgagggag attgagaata tagggatgat ctcaaaacct acaatgacat aatataagga 1800

atcatgtagt tacatgaagg tcagtgggag ggttccatac tgacatcgat tatgatgtgg 1860

ttacatatag aatttttttt tcaaagatct agatcaaaca ttctgaaaat aaaaggtcta 1920

tagagataaa tccgaaaagg atgtttgann nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1980

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2040

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2100

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2160

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2220

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2280

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2340

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2400

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2460

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2520

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2580

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2640

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2700

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2760

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2820

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 2880

nnnnnnnnnn nnnnnnnnnn nnnnnnnact atgtatgttg gctatgtagg ttccgattcg 2940

ctgtttggaa tatgatatac ctagatgaaa tctatcgatc ttgatagaaa aagagaagtc 3000

ctatgtgatt cgtaagactg agttcagaaa aatctctgac cagagtaagt gtgaatattg 3060

aaaaattttt tttacgaaat tcacaaatga actcgagtcg agccaatgta gcatatgact 3120

gatgatagag tttgacgagt tctcaatgac ctccgtcaaa ttgggactct cgatagaggg 3180

attgtatcac acgataactg cacctaggga ttcacttttc tattttgcta gcttgccact 3240

atatgttgct agacgtcact ggtggatcgt gagaactcac taaaatcatt ttcggatcaa 3300

cgatctttgc tgaggtaagt tggaatcgtt tcagtccatc gaaaagagtt tcgatgatac 3360

tgtgatggag atcacgatat gtctcactat caaacagaat agaacctgag gagtcacata 3420

caaaaagagc ttaacctgat caatggcttg gattatattt gaattatcaa ttagattgat 3480

agtttgaata ttagaaactg ctaatttgta accgttacag ttttgacaac tactaattgt 3540

tagcgcaagg acttaattgc aagtattata atttttttga ggctgattaa attataaatt 3600

aaattttaat taatttaatt cagatttaat ttaattagac ttaatttaat ttaatattaa 3660

ttggattcaa ttatccaaat cagatttgga tttcaagcct gattggatca ggcttgacag 3720

ccttttcgaa tttggctcat tttagactcg atttgaatcc gtttgaggtt ctatttggat 3780

cagataaacc atgacttaga gagctcaagt tttttgggac tctctttaga aatcatgtca 3840

aaaggagaag tagagcnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3900

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3960

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4020

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4080

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4140

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4200

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4260

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4320

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4380

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4440

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4500

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnccccatcg aaaagagttt cgatgatact 4560

gtgatggaga tcacgatatg tctcactatc aaacagaata gaacctgagg agtcatatac 4620

aaaaggagct taacctgatc aatggcttgg attatatttg aattatcaat tagattgata 4680

gtttgaatat tagaaactgc taatttgtaa ccgttacagt tttgacaact actaattgtt 4740

agcgcaagga cttaattgca agtattgtat tttttttgag gctgattaaa ttataaatta 4800

aattttaatt aatttaattc agatttaatt taattagact taatttaatt taatattaat 4860

taggttcaat tatccaaatc agatttggat ttcaagcctg attggatcag gcttgacagt 4920

cttttcgaat ttggctcatt ttagactcga tttgaatccg tttgaggttc tatttggatc 4980

agatgaacca tgacttagag agctcaagtt ttttgggact ctctctagaa atcatgtcaa 5040

aaggagaagt agagtattat ttttttcatc cttctttctt cacacgcatg aaaggagagg 5100

gggcaccaat agttggtgcc ctgccttatc tggatgtctt tttcatccaa tttttttttt 5160

aattgaattt gatttaaaat agaatagaaa tatcttagat taaggtatag aagtactttt 5220

tttatgtgat aaaaaaaata gagaaagagg acgtgcgcta attattggcg tgagacatct 5280

ttccttcttt cttcccttat ctcaacgcac atctatcctt tgatttgttt ttgaacacct 5340

tggattaaaa gagatgagat ctcttgggca ttaagaagga gttgtgcgtg ggatttgaga 5400

tgtggtgcga caaaaaatta aaagaggatg catgaaggga ggtggcgtgc gttagatgcg 5460

agaggcttct ttcttacatc tttctctcct ccccaatgcc tcttccttcc ttctccactt 5520

cacgtccatg cccagattca ataaagatca gatctaagaa aagaaaagag agagaaaaag 5580

agaagaagaa gggttcttct tttcttcatg gtgatctggt atagatcctg ttggatttgt 5640

gcgaaagagt ttgagcaacg atctgcttct ttaagatctg aaagaaaaga tcaagatcca 5700

tggatgaaga gtgagatctg caaggtgcta gcacaccagt gatctcggtg ctccgatcaa 5760

atggctccgt gtggatatca gctgaggtcg aacgcgtgca tggctacgat cagaatctgc 5820

gatatctgca ggatccgaga tatggagatt cgatctccat tttatttttc taacagttta 5880

tttttctatt tcagatatca gatcgtgggt acatatttgt atcaagatct ttactatggt 5940

tttcagatct gatttgatac gtaaataaat taaaattatt ttaatttatt tattttcact 6000

gtgtagatgt ctagaaaaaa ttttaaacta cacgtacgaa atcgaagcat tttctaacaa 6060

ctctgactat caccatagac gacgtatatc tcttgcttcc caccaaactt ctttaataag 6120

ttctttagcc atagcatttc tttatcgacc tttgttatgg tgatgtattc aacctccatc 6180

gacgataatg tgacactttt atgactttga ttgccacaac accgctccct ctgagaatat 6240

catcagataa tctgacgtgg atttctgtat gtccacatca tcgatcatgt ccgtatctgt 6300

gtaagcctgt agcataggat ctccactatc atggcataaa tatatcctgg atatctattt 6360

aagatatctt attttccact tcattgcttt ccggtgctcc tttccaaagt ttgaaagaaa 6420

ccgattgacc ataccatcca cttgagcaat attagacctg gtgtacacca tagcatacat 6480

aagactcccc accacttagt ccttctcact ctttctgctt tgctctttaa tcaatgtaaa 6540

gtgtcctaca agcagacacc accggcttca ctctactcat gttgaatcaa tccagcacct 6600

tctcaacata ggcctcctat gacaaccata ggacctggat ctcctatctc tagcaattct 6660

tatccttaat atcattttga cctatcccaa gtcttccgtc ataaatgttc gatccaactt 6720

taccttcaaa tcattgattt tggtaatgtg gcatcccaca atcagcatgt catcaacata 6780

tagcaaaaat ttgataaaat tattgtcaaa atattttttc atgaacatgc aatggtcaga 6840

acttactttc ttatatccat tctccattat gatggaatca aacttcttgt actactatca 6900

tggtgcctgc ttcagttcat aaagattttt cttcaagcaa cacactatgt tctcattaac 6960

ctttcatttc aaactcttct agttactcta tatattctcc tcctccaagt cgccatgaag 7020

gaatgccatc ttcacatcaa attgttccac ctcaacatct aaacagccag cgagatcgag 7080

gataactcga gtagacgtga gctttacaac gattgagaaa atctcttcaa aatcgatact 7140

ttttctctga ccaaaatctt tcacaactaa tctcatcttg taccttggtt ataaactatt 7200

ctcctatggc ttcaatctga acatctattt atttttgagt gcttgctttt tcttaggtat 7260

attcaccaac tcatatgtat tatttttcta taaagaattc atctcctctt tcattgcctt 7320

catccactcc tcactatgct ggagctctat ggcttcagag taggactcaa gctcttccac 7380

atctgttaat agcacataat cctatggtgg atatcttatg gatggcgtcc actctcttgt 7440

gaatctctgg acctcttatg caggtggttc aacatgcaac tcaatttgaa caccatccgc 7500

actctcctca gcctcatgac tatcatatgt accgtcatct gtagttgctc tcctgttatc 7560

aagacttctc gaagaggtat ctgggcataa gtctataggg ctgctcgggg ttgacttcgg 7620

cttcttaggc ttcttaaaat catcgatcgt ctgatcctcc aaaaaaataa tgtcatagtt 7680

gcacacgatc ttccactcca tagaatccca caatcgatag ttgaactctc cgtcctcact 7740

atagctcagg aatatgcact gcttcacctt gacatctagt ttggatctct catctttagg 7800

aatatgcacg aatgtcctgc atccaaagat tttcaaataa tcataagaaa tatctttctc 7860

caacaatatt ctctatagtg tatcacactt aagagtataa gaaaaaaaaa gattaatgct 7920

atggatcaca gtcatcaatg cctccctcca gaatgccttc gatagtttag cataagagcg 7980

catgctcccg atcctctcgc aaatcatcct gttcaccctc tcaacaatct cattttgttg 8040

tggcatctta ggcactgtct tctctagtct gatgccattt cattgatagt attttttgaa 8100

agaacccctg tattcacccc tgttgtccgt ccaaatatac ttcagctttt gcccagtctt 8160

tctttcaaca gagatgtcaa attacttgaa tattatcgag cacttgatcc ttcattttta 8220

aaatatatgt ccaaattttt tagaagtgat catcaataaa agtcatgaag taagaacatc 8280

cataaaaaat tttatcactc agagaacaaa catcactgtg aataagatct aatgcaccaa 8340

tttttctttt agaaaaaaat tctaaaaaga aacttggatt tgcttaccca tcaagcaact 8400

ttcatatatc ttcaatccaa aactatgaat aggaagagca ttcttcttag tcaaaattga 8460

cattcctttt tggcttatat gtcccagtcg tcaatgccat aattctaagg tagaagattc 8520

ttccactaca ttcacctccc ctttaccgag cttggcttgt atgaagtaga gaaagccttg 8580

cttgatactt ttggctacta ctagcgattt tttggttagc ttctatttgc tgtctccaaa 8640

tatattgtag tagtcctcct catctaatac ccctatcgat aacaagttca gatgaatatc 8700

tagtacatgt cgaatatttt tcaaaaatag cctgtacccc aagctcgtga tcagcataat 8760

atctccaata tcaaggattt ttaattctcc atcattctcc atctttattg tcccaaagtt 8820

actgaaatga caagatgaga ataattttca cctcactgta acatgatacg aagtggccaa 8880

atcgatcacc cagatagagt ctcaaccaat agtacttgca agatcatcat ttgttgtgcc 8940

acaagcaacg atcatctctc catccgtagc tactgctatc atcttattgt tcgagctgga 9000

gtcatcactt gattattttt tgacttctcc ttttttagta atcggtagtc tttcttaaag 9060

tgatcctttt tgccgtagtt gtaatatcta tcacttcgag acttggatct cttccgtaat 9120

ttagtggggc catcattcaa gttagattgg gagtccttgt gcttgtttct tccctttctt 9180

tctatgatga gagcctcatg gtggctcgag acaccttgct cctttctcct agcctcctca 9240

ttaagcatat agtctttcac cattgccaag gctatcgaac tatctggtga agaattgctt 9300

agagacacca ccaaagtctc ctaactatcg agtaagaaac ttaacaatag taaagcctag 9360

agctcctcat ctaacagcat cttcatcaca gtaagctggt tcaccacgtt ctaaaagttg 9420

cttagatgct ccaccatata agctccctcc ttatatttca tatttatcag tttgtgaatt 9480

aggaacacct tgttctatac catctctctt gtatagactt tttagtttca accaaaggcc 9540

atgagcatta acctccattg aaatatggtg gaagatgcta tcatcaatcc actgttggat 9600

aatcccaacg attttatgat tcaatttctc ccattcttta tttgacatct tatcaaactg 9660

aataataaca tcctcgattg gatcatgaaa atcttagcag taaaggaggt cttccatgta 9720

aggattccag attgagtagt tagttaatgt cagcttgatc gtagtgcccg acgaagattg 9780

gttctccatc tattagcatc ttaatttctt tttgaatact ttagattttg taaaatttgg 9840

ctctgatacc acttattggg atttgagtac taaaagataa tagaaaaagc aaaagcaaaa 9900

atcacgccaa cgataatacc aaaggcacaa agaatcatag caatcgcaag agcactagaa 9960

ttttttatgg ctcgatcaaa gtctatgtct gcacagggat gaaaataaaa agaaactttt 10020

actataataa tagtttagag tataaaaact tctctgacac tacgccgaca atactacttc 10080

taatacaaga aagaagaaat tcaagattaa acaaacctcc agaagaatcc tttttgatgg 10140

aatatgaaag aataatattc tacaagtcaa tcgcatgagt aatgcaataa gatattgttc 10200

tatattttat cttccaaatt catatatttg atattaatta ttaataaaat tagatatttt 10260

atttcattat atgctgcatt ttaatacttg tttaaaatta taatgaactc cataggttag 10320

gacaataatt ttaaggtcat gatgagatca taccagtgag atttaaatct ttgataacct 10380

taatctaaaa tattctcaat agtaggatca ttaagtcaaa aatcaatgat actgataaaa 10440

ctggtacatc ctatatattc tcgacagaga gggtggttga tgtcataatc acttgtgtgg 10500

agacactaat acgaagatgt ggtgctcatt agagaataag ttcattgaat ttactgatcg 10560

agagaatata tgatgcaagt gatcctttga cctaagatca ccatggtgcc ttgtatatat 10620

gaatctatgt tttggttcat tctttagctt cattttttga gccttgtgtg gggtgctccg 10680

gacatggtgc agtatgtatg gaggttgtga gtggtcaaca aaaaatcaat cactccttgt 10740

aaaaggagcg aatatcttat gtgatcttat aggttgatcc aaaaaatctt tgaccaaagc 10800

agaatgataa ttagaaagag tttttaatat atcattaact gaatcaatat cttctgatcg 10860

agatacatat aaataagtat ttgaatttga catgatttta tatccataac taatctgaaa 10920

tattgtatga ttgaagaatt gaattgtaca attttttacc attgaaaaaa atttttgata 10980

ttttttttca aatttaatat ctttttgata gtcatgacat gttgctagac atcaatcttg 11040

acttgtgggc tcacaaaaat taaaaagatt ttatttgaaa gttaattaga aagtattctg 11100

attaattgat gtatttggac tgacctaatc taattggatt gatttaggtc atgagcttga 11160

gcccactgct ggctagatga tcgctgtcgt aggcagtcaa gaataaaaat caactcaaac 11220

tatatagata gggtgagtag ggatcatttc tatggagatc taggatgatt atcttttttt 11280

ttaagaaaaa ataaaaagag aattgattgt agaagaatta aaagaaatag aatagcaaga 11340

attaaattaa aagtatgaat taatttatga aaaaaaataa gtcagagaaa taactcagaa 11400

attttgaatc caccatgcaa attagattta ttttcttctt ttttttatgt tgcaacatta 11460

attcttgtga ttaaggtatt agtatagctt atctctaaga gatacggact gtatcagtag 11520

attacaactc gtcctgttga agtataaact atctaaattc aattacaaaa tataagattc 11580

aatctaacat actacgatct atctctccaa agcacgtatc gtatctaggg atcacgatac 11640

gtcaatagag ggtataagcc gtgtaggctg gatcaatacc tcaaaaaaaa ataaaaagat 11700

atgaaataaa agtataattt tattacataa aaatttaata taaaaaaaaa ccgtttacag 11760

gctttatcat atttctggat tgaagagatt tagccacgca tcaagctctc tagctccata 11820

atctctcaat aattgatccc taaagctctt taattttttt ttttattatt tttttgtttt 11880

ttctttaatt tttttctctt cttatttttg ctgccatctg ctgcctctgt tttctctgct 11940

cctgctgcct ccttttatag agcacagctt cttcgaatta taagcatcta tggactttca 12000

attcccacta tcttttattt tgattgggat tttaaaactt tatccgcatc ccagcatctt 12060

gtttcacgcg agatcctagc gtccacatgt gttttgaatt ccttatgggc cacagaccat 12120

ttaaaccacc aaagaccact ttactatttt gatttgaatc ccatggaagc cggctgcctc 12180

tggtctcatt cacccttcca gtgcttcaca tgggtcccat taatttgaat tcctatgagc 12240

cacatccaag cttttgaatc caagccttcc ttatttttta aatcaattaa aactttgctt 12300

taaatgcctt gtagaccctc ctatttgcat gctacgtgag aacattgtta agctcctctt 12360

ggcccactta agaacttcta tgggctacat gcttttggct agctttaaaa tggttttggg 12420

cctaactttg gatcaccatt cgaagtccat tttgaattca atttattttt attttttttt 12480

ttaacctaca aatcgagctc ttttattggt gatcattttt cctataaaac aaaaacaaaa 12540

agcatcaagt cttaagaaat aaaagttaat taatatatat tttgatactt ttattgggat 12600

atttaatgta cttatcacta gatatgaaat ccaatgggtc acacactttg aaatttgatc 12660

ttagtctaat ctaactagga tttattataa atcttatggg ttaaatttac atgctagcac 12720

atgaattaac tcaagttttc aattggattt agttctaagg tgtttgagct aaccctatcc 12780

tgatacctta aacctaatta gattagattt gaacctatgg ttttcttgat gccttatgct 12840

tattacatga aagagtttca tgtgacttaa attcctccat gccaccacat cttcatccat 12900

gccaaattaa tatggaacac cccatttaat tgtgcattta agaaggaata gtccttctta 12960

aacactcctc ttaatttccc acactttcct ttgttctaca caccatcaaa tggcttttgg 13020

aaatatgcgg gcgcagaagt ggaggtgtcc tatatgaagg ctcttccaca ttataagtta 13080

tcacatggtg aattaaatta ttgtgtgaga aaatcatgcg ccaagagttg gcaccccttg 13140

ggagttttag gcactccttc ttatcctata aataaggggc accccatatg gataaataca 13200

agggaattca agtttaggca tgagattgag aggagaaaaa gacacaaaaa tctgaaaaaa 13260

agataagaaa aaaaaagaga gaaaaataga aagaaaagac gagagaaaac gaaaggcaag 13320

ggttgctaat cctagggttc aatttttcaa tagttggatt tctgaatcaa tttggggtgg 13380

tgagattttt tgagaaaaag tttctgatgt ggccctagta gaagattgaa ggcattcaga 13440

tgatggtgca atccgttttt gaaaaagaaa agtgagtagt atacttgtga agaaagctgc 13500

aacactacat caaattggaa aggaccttga tcaaacccat atggatcacc gttgcaggat 13560

atctactttg gtatcttgtg aaggttattt tttttatcag atcatcatct tcaaaaaggt 13620

ataattttct acctaatatg catgcttgat ttgtttgatt aaaatctata aagtgttcat 13680

aaggtttgtg ttctgattgt attgttttaa gtattaaaac ttactttaaa aatataaaaa 13740

aatttgaaaa ctatcttcta ctgtgcaact aaaatccaac agaataaccc taatatgaga 13800

ttgagcgatc tccgtcaacc gatgttctct gatcttcttt tcttgaatga agcctcttca 13860

agcctttctt cttctctctc tctccctatc ttcttttgtg gcccacggcc tcctcttctt 13920

tttatgtttt gtatttctca tgtcacatcc ataaactccc ttttatagat aaaaaattag 13980

agtccatttt ggactccttt tccatgcttc ccacgccatt ggttctgtgc acacgacttt 14040

ttccatgcta caaaagtttt tcatgtctca cgtagtttcc atgcgccata aaattttgca 14100

tacttctcca agacttttta tgctcgaccc tttttggttt tcatttaaat cagtgggtcc 14160

catatgacga gggatcacac caacatcata tgctctcctc accataccaa atggtatccc 14220

caacta 14226

<210> 71

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 71

tttgggtcaa gctttaggct taggtcacat atacccaaaa tcatttggat gcatcaggtg 60

t 61

<210> 72

<211> 61

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 72

ttggctttgc tgcctcaaat cctcgagcta tcttatcatc atcgcattga gctccatacc 60

t 61

<210> 73

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 73

atcaaatcat atgatccatc ttaaattttt aactcaaaaa attaatattg caaactagct 60

caaaataatt ttgatcacta catttctgct gtgcattcta atttaaaccg ttcacatttt 120

ttagattcat gaaataattt tgaccaaagt attactccat actatagtca aaaaagatta 180

aaatattaga ttctaattaa agccaaagat aaacttttga ttctcatcct taattttgcc 240

taaagtataa ttattttgat taacccttaa gcgcaataac acattcaaaa ccaacagata 300

ggtttactat aatccaaatg aattaaatct taattctttt atcaattcat ttagacaatt 360

tcaaatcaaa attctataag taatatcaat aaaaaaaatt tttgatgctc caataagtta 420

gaacttaaat caaaatatat aagtaaaatt gatttaatca tctcttctaa agtttcttct 480

attaagatct ttaatatcta tcaaatacat tccacaataa tcatgcaaac cttttaaaaa 540

ttaaattctc aatgccttta ctacatttta acaccaagct cgataatagt gataaagaaa 600

catctagatc agctttataa tcaaaaattt tgacttacaa ttttacgtgt gtctcaaaat 660

cttgaataaa tataaataag atcttttatc ttgatccaaa aatagtaatc aaggatttca 720

ttagtaactt caacaacaat ggtaaaaaaa ttttctatcc attgataaac ccaaattttg 780

aattgaagtt tcatgcatac catatagcct ttaataagat ctattatttg gatctaaaga 840

tagtaattaa aattgttaat gattccacta agatgaatac tttacaatct cataattaat 900

ttcttcaata aaaatagact tcttgataat gtctccaatt gtatattttt ttttatttct 960

acaagaaaac ttcatacatt ttttacgttc caatataaat cttaaaaagt tattccaatc 1020

aaatatcata aaagatcttc ttagtccaac cttaaataac ttttatgaat gaatctttat 1080

cttgccacta aataatgaat tttaaaatca agagcaacat cacagcattc tgtcatgtca 1140

aatttgtgtt agatgtatgt cctagaaatc aattagattg acaatgtaaa ttttttaagg 1200

atataattta tatattttga tttattaata aaataaaatt taaattaatt tttattcata 1260

tttttttatc tatgaatcat ctaaagaatt aataagatga tgatacatat tcttaagagt 1320

tcaaaatttg aaatatatgt cattgatgat taatttctga atacttttga attcttaaga 1380

gtttagaaga tcttgaccca agtagtgtga atagtgaaaa aaagttttca catacttcac 1440

atcaaaaatt taagttgaat aaattgtaca tatgacaggt attatagttt gacgagtaat 1500

ctataacctc tatcttatca aaattctgat agaaagattg tattgtatga taactgtact 1560

tagaggttca ccttttattt tactggatta ccactacatg ttgctagatg tcactggtgg 1620

attgtgagat ctacgaagat tatcttgatg atcgataatt ctcattgaaa agattgaaac 1680

tattttaatg atgttgtgat agagatcata atatatctta ttatcagaca gaatagaatt 1740

ctatgggatc atacacaata ggagattaag actgatcaaa tagttgaatg atgattaaga 1800

atcattacgg agttcagatt atcaatataa ttgataatta gactaactta taattgttac 1860

aagtagcaag gacttaactg ctaaaggtta ataggttcaa aaagaactta tgtataaatg 1920

ttgtgcatct taatttgatt ggatcaaatt agttatggct gaattcaaga tgaatcaaat 1980

aggaatttgg ttcaattgaa tttgggtcaa gctttaggct taggtcacat atacccaaaa 2040

tcatttggat gcatcaggtg tgtgacacct gaatcaggcc tttctaaact attttgagta 2100

agtttgatca agtcaaaagg atccacaccc taaggtttct tgaataaaac cttaggcacc 2160

acattgagga cctataggaa actttgaccc tctctcatat ggggtggcac actgaggttt 2220

tataaaaacc ttaggcaccc attttagcca taaaaaaaaa gctccaaggg atggggcagt 2280

agccatgaag aatccttggc tgtcaggact ctattcaaaa gagttctcaa ggttttggac 2340

tcttatggag ccctaggatt tgtttgccta taaatagatg gccaccccaa ggctttagat 2400

aatgttagag acttgtgaag ctctcccctt tctcttggtt gccggcccac cctctctcct 2460

ctctcttcca tgccccaaga cttctttctt gtctccatca tcttgctgaa atttagattt 2520

cagcaagaaa agtcaagtag aagtcaaagt tctaatgtag ctcacaagat gttgagaact 2580

tcctccatct ggcaaaggtt ctgcaagaga gctagcatcc tgagaaacaa aaagattgct 2640

gatcagccct catctccata tggatatttg tagagatcaa atgcatgcat agctagaaga 2700

gaatcttatc acgatcatca ctcgtgaaga tcatctacct gtgcaaaggt atgagataag 2760

aaaaatattt tttttatcat aattcatgaa tcctttgctt atattatact gagattcttg 2820

gaatggattt tttctctagt aaaactctag agatcagatc tcaaagtctt cttcacataa 2880

aggttttgaa agttctttat atttccgctg ctttgattca aaataaatta gatctatttt 2940

gcctttcaac ctttctcata tttattgaca tataaagctt taattaatga gattaatgaa 3000

aagcatgtgc gaaatactga gaaaatccta acagtgatat cagagctact tttgtacata 3060

agaaaaggat tcaagttaaa taaaatatgt ttgatttaag taaatgaatc aatcaaaatt 3120

tatcctaaca taagtttgtc ctggtataat ggtcaagacc attatgttga aaggttatcc 3180

taggacaaaa agtctaagta aaatctattt tatttaagta aatgaatcaa ttaaagttta 3240

ttctaatata agattgcctt agcataatgg tgaagaccct tatgttgaaa ggttgtccta 3300

ggatggaaag tgattgatga gacaaatata tcatgaaagt atttttcaca gatggaataa 3360

aatatatata ttttgtttgt gaaaatgaga tttcatgaat gtgtttgtca ttcaatatgt 3420

gtggtgatca tcttgaattg ccacaaatcc tttttggatt agggttgtat catgactcac 3480

aaatcctgat ggtttgcaaa attttgcatt ctgtagtgat agaaaccaaa agttaatcca 3540

attttggaat aagattgatc aattggtatc taaggcaagt attttataat ggtggttact 3600

taattagtta taaaagtacg aagagtctcc taccaatctt acacttatct agccaatttg 3660

gttgattgaa ttctgaattt gggttgctta agtgttaagt tcactacaaa tatattgcaa 3720

ccatgattcc gacttagtca accaagccta gatctcttga atagattcat gttaattatg 3780

gatttacata ggatataaat aaataattaa aacttgaaga gatctaaatg aaaccttctc 3840

gtacatatta aatcgaatga tcttccatca ttgtagatat acggatactc tactgatgtt 3900

gatgattttc gactagatat agtactttgg ttgcatcgaa aaagtacaac cactttataa 3960

catgagatgt tgcagggtag agatggggtt gggcccaata attgttaggt gaggatccaa 4020

atgatggctg cacttgcgtg tgaatggcga gtctgactta a 4061

<210> 74

<211> 4061

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<220>

<221> misc_feature

<222> (990)..(1717)

<223> n is a, c, g, or t

<400> 74

tataactgaa agatagctaa tgcttagctg gatgactgct gttagataac tgtctgcatt 60

cttacggtac attgatattt taccaatgtg acatagctta aatcggcaac tggctgaact 120

aaatattatg tatcccttta gttaacaatc atgtcggtta gagatcaatg taattcgcag 180

cagatcgatc ataagctgag atgagtatca tattttaaga acaacgctgg gcgagttagg 240

ccgatcaaat gtcagactga aaaagcagat caataaacct ctgatgtgat ctgaaagaat 300

atttatgatt taaataataa tctatcacca cgtatccaga taatgaggtc atataacatg 360

taccaacagt gcatttttcc atctagttaa gaggttggtt agtggcattt gtcttcgata 420

tgtaatgttc acataactaa tgtgcttagt agcattcttt tgtaaggtta aatcttcaat 480

gatcttaagt tcacataatt gcctttgtgc cctattagtt tatagttgac cttttaattc 540

aagagacagt caccttagca atcgatgtct gcttagattg ggccaattag gtactcacat 600

taatatattg aatcatgttt gaatataaag gattagattg atttataagt ttccttttat 660

tgtttacata ctgatactta gattgactta ctacattatt tgatatgtta tgttctaatt 720

tttggattaa aattgttgtt tctgatttct ccttacatct aatactttgt ataatttatt 780

attttttagc atgattgagt gtagaggatt agattgattt ttaagtttat tttgattatt 840

tacatgccca tacttaaatt gacttactac attattcaat atgttatgtt tcaattattg 900

agttaaaatt tttatttctg atttctactg atgtccagtg tgtgtgtgtg tacgtatgtg 960

tgtatatatt tatttacata tatatgtatn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1020

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1080

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1140

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1200

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1260

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1320

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1380

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1440

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1500

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1560

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1620

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1680

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnatg tatacatata catgtataca 1740

tacatatata gatatatata tatacatata tgtatatata tatatatata tacacatata 1800

taggttattt ggaacctaag aaacttgcaa agttactaga tgcaatgttc ggaaaccatg 1860

gaccgtaaca actggagtag tatttgggtc atgaattcat ggctagatca tgaattgagt 1920

gggagtcaac cgaagtaggg ccagctcaga cacttgtatt taggtcccat gcttgcgtgc 1980

attctcttcc ctgatatcct ttggctttgc tgcctcaaat cctcgagcta tcttatcatc 2040

atcgcattga gctccatacc ttgctctttc ctaactgccc ccatcaaacc tccggagatc 2100

ctctttcttc tccaatgttg agatttgttg gagtcttccc accttctcac ttcaatgggt 2160

ggcaatttca agtgccagtt cccttatttg tcccagctat attgacaatg gggcttattc 2220

tagggtttct catggacata gtgataataa taatcaaggg accaagagag aaaaatcttt 2280

ctagtctgtg ttctttaagt ttgagagata ggcagcacat ttttttaata agcctttttc 2340

actcatcgga tcctgatttt cagttgttcg acctgaacag ttcaagcaat tgaactgctt 2400

gggtcactat tttggacgat tttcagccat ttttaagtat tgtttgactg gatccacgct 2460

gcgtagtggg cattgcgttg atcaagtaga cctgtaaggg tcaacaaggt ctgagaacac 2520

tgaatggatg ctccataatc ctcttgttat ctgtcaacca tttggaatct tttaaaacaa 2580

catgtggtga taatatatat gataaactgt gatagattca tgtatagatt atacatatga 2640

aaatgtagag tgcttagtaa aagtgatgaa gagcaatgcg ttagaatgtg ctagcctttg 2700

acctaaaaat tggaatgccc aatgatgagt tatgataaaa ttgtgacgtg atttatgaag 2760

tctaatgttt agttggcttg cagtttcaga tgcgataaag aattttatga tttagctctt 2820

tggtttttta acatgcaaac atttaattgt actgaaaaac atttatttcg aaacatgtag 2880

gagactattg gatattgaaa ttaaaattga ctttttggtg tttcacaata tttcttaata 2940

aacactacga ctatgtaaat aggtggtgga tcaaagggaa agaaatgttt ggtgattatt 3000

tttagaaaag acaagaagta tttgataaat ggttattttt caaccgatta atgagagaat 3060

gactatgaac ctatgaggtg cacctcttat gatgttgcat ggatgaagca tctaatccat 3120

gggtacaatt tactaaaata taggcccaat tctgagacag gaacatttac aactcatgta 3180

caaagaagaa acttaaagta tcatggatgc cgggatattt ccttcttcaa atctttcaaa 3240

agctgtagtt ttcattataa ggaaaaatga ttataactaa catcttctat aggtgatgag 3300

tggacactag aaggctttcc tataataaca gtagagagag tagaaaagcc tgtcagcatg 3360

cggtccataa gtatatatac atattttcag cgcttaaagt aaattttctt gtaccaaaaa 3420

aagataaatt ttcaaaataa aaactaaaat caactgaaat gtttgaaatc tgattcgtag 3480

gtacatggag aagagtgtaa gacagcaaat atcataaagg cagaataaga gctggtaatc 3540

ttgtaacctg gcgcaactat gttatgcatg tctatatgtg tgcatgttta tgtataacaa 3600

gtaatatttc ttttcttatt tactcacttc agttaggaag tcaatccaat ctccctttgc 3660

ttgggtgtgt tcagattatc aagggccata acagtagtgc tggtaagcac ctgtttaatg 3720

gataaatggc gacaaattct ctccccttct gctcactcta ttatcatacc ttccgtctta 3780

cccatctgct atatcttata aggaacataa ggatcgacat agcttcatgc tatcacatta 3840

caagctaaga tcggaataat acctaatctt ttcgatctac tattaggtat tactataggg 3900

ttgtaaattg ggtttaggtt ttgaactata ttatattttg gtgtaagaat atagtgccac 3960

actatcttga accagactag ctgttgcact ttttttgcag gcatcaatat tttgttcatc 4020

caaaaaaaaa tattgcacat gcacagatga agtatgaggg c 4061

<210> 75

<211> 680

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 75

atggggaggg ggaagataga gatcaagaag atagagaatc ctacaaacag gcaggtgacc 60

tactccaaga ggaggacggg gatcatgaag aaggctaagg aactgacggt gctttgcgat 120

gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180

ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240

agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300

ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360

ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420

catgtgatca ccacgcagac ggatacctac aagaaaaagg caaggctaac atgctttctt 480

accatcattc tttacggtct ttgatccggt tttgcgtgtc cacttcttac gtagtctttt 540

tcaaacattc ctatctaaga ctgaaggtaa tgatttgcaa aggaatagct ttactgtttt 600

cctctaagta gatgaaatat tactcacgta gaaaggagcc atcataattg cagaaagaat 660

aaaactgaat ggaatatgag 680

<210> 76

<211> 167

<212> PRT

<213> Artificial Sequence

<220>

<223> synthetic predicted sequence of tDEF1

<400> 76

Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn

1 5 10 15

Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala

20 25 30

Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe

35 40 45

Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr

50 55 60

Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp

65 70 75 80

Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu

85 90 95

Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp

100 105 110

Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu

115 120 125

Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr

130 135 140

Thr Gln Thr Asp Thr Tyr Lys Lys Lys Ala Arg Leu Thr Cys Phe Leu

145 150 155 160

Thr Ile Ile Leu Tyr Gly Leu

165

<210> 77

<211> 1850

<212> DNA

<213> Elaeis guineensis

<400> 77

aaatcagcta atgtagacca tctgaactac ttgttcatca cccttatccc aaaaaaaaat 60

tggtgtgtat tcagttagag acttcaggcc aataagcctg attaatggag taataaaaaa 120

tatttcaaaa actctatcga aaaggctctc acagaaaatg aatttgttaa ttttatccac 180

agagcttgct ttcaacaaag gaagaaatat ctctgaatat tttgtaatga ctatggaaac 240

tatacacttc tgcaaagctg aagtacacaa ggatctcaat tataaagtcg acttcgagaa 300

agcttttgac aatgtggatt ggagctttct attgaaattg ctatccagca cggggctttg 360

attcgaggtg gtgtcaatgg atagaatatc tgatttatac agctaaattc tcagtcctta 420

ttaatggtga taaaggtaaa ctttttaaat tgaggaaaga tctcaggcaa ggagatcctc 480

tattcgccta gctctttctc ttagttgttg atatagaatg atcaagggag caagtaggtt 540

caatcttttt gttggaattg gatcatataa tatcatggga taacttcaaa gcttttagtt 600

cactgatgac acacttatat tttgcagata tgatctaaaa tacatcaaaa ctcttaaatt 660

tttactctat agttatgagc tactgatggg tctcaaaatt aactttgaaa aattccaatt 720

ttttggcttg agaattgcaa agatgtcagt acagcaagtt gcatctatcc tagaaagcaa 780

ggtggctaca ttttccatta cttatttggg tctcccactc catcattcta aactgaggaa 840

aacttattgg aatccactcc ttgagaaggt tcagaagaaa ttgatcgggt agaaaggtaa 900

acttcttaac ctctagggta ggcttatact aactaatgca gtgcttacag ggatcccact 960

actctggagg gatacattcc ttctccctca attcattatc aaataaattg ataaaatcca 1020

tcgatcattc atttggagag gaaacgagga gtataactaa gggcactcta gaatatgttg 1080

gtcgaatatt tgtcgatcaa aaaaatttgg aggactgggg gttcctcaat ctaaaaattt 1140

tcaatacaat tcttctttgt aaatggtggt ggaagctcta ctctaatgct ggtgacccgt 1200

ggtgtagttt tattgccact atccacccaa cttcacacta gagatctaaa ggtatacaca 1260

aatcaacctc ttcattttgg aatggtttac agcacacatg aaatatttct actcctaatc 1320

cactttcaag ttagcaacta gtattatttt ggaaagatag ttggttacat aatcatccac 1380

tgaaggatcg atttcctcac ctttacacaa tagcattgaa gtgcaacaac tcagtggcaa 1440

aggtattaag caatctactt gataatagct cttttagtac tcctcttcct caaagatacc 1500

aagaagattt tcagagtcta taggaaagca ttgaacaaat tacattaacg gaacgacctg 1560

atactataca atggaaatgg tttagtagca atattttttt ggcatgaagg atctactatt 1620

ttctgcaaga tggaggagtt tggcctctac tgagtaatat tatataaaaa ctcctaatac 1680

caaagaaagc caagttattt gcttggctaa gtgctcacaa caaaatccca atgaaagcta 1740

atcttcttaa tagaggaata attggaactg attactgtac actttgcgat gacttatcag 1800

aaactaatga tcatctaatg ctcatctata ctttttcaaa agcaatttgg 1850

<210> 78

<211> 498

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 78

atggggaggg ggaagataga gatcaagaag atagagaatc ctaccaacag gcaggtgacc 60

tactccaaga ggaggacggg gatcatgaag aaggctaagg agctgacggt gctttgcgat 120

gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180

ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240

agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300

ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360

ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420

catgtgatca ccacgcagac ggatacctac aagaaaaaga tgcatctcaa gtcagcacta 480

gaccatcttc taaaatag 498

<210> 79

<211> 165

<212> PRT

<213> Artificial Sequence

<220>

<223> synthetic

<400> 79

Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn

1 5 10 15

Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala

20 25 30

Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe

35 40 45

Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr

50 55 60

Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp

65 70 75 80

Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu

85 90 95

Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp

100 105 110

Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu

115 120 125

Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr

130 135 140

Thr Gln Thr Asp Thr Tyr Lys Lys Lys Met His Leu Lys Ser Ala Leu

145 150 155 160

Asp His Leu Leu Lys

165

<210> 80

<211> 459

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 80

atggggaggg ggaagataga gatcaagaag atagagaatc ctacaaacag gcaggtgacc 60

tactccaaga ggaggacggg gatcatgaag aaggctaagg aactgacggt gctttgcgat 120

gctgaggtct cgcttatcat gttctccagc accggcaagt tctccgagta ttgcagcccc 180

ctttccgaca ccaagaccat atttgatcgc taccagcagg tgtcagggat caacctgtgg 240

agcgcccaat acgagaaaat gcaaaacact ttgaaccatc tgagggagat caaccagaac 300

ctccgcagag aaataaggca gcggatgggt gaagatctcg acagtttggg catccatgaa 360

ctgcgcggtc ttgagcaaaa tttagatgag gctttgaagg ttgttcgtca cagaaaatac 420

catgtgatca ccacgcagac ggatacctac aagaaaaag 459

<210> 81

<211> 153

<212> PRT

<213> Artificial Sequence

<220>

<223> synthetic

<400> 81

Met Gly Arg Gly Lys Ile Glu Ile Lys Lys Ile Glu Asn Pro Thr Asn

1 5 10 15

Arg Gln Val Thr Tyr Ser Lys Arg Arg Thr Gly Ile Met Lys Lys Ala

20 25 30

Lys Glu Leu Thr Val Leu Cys Asp Ala Glu Val Ser Leu Ile Met Phe

35 40 45

Ser Ser Thr Gly Lys Phe Ser Glu Tyr Cys Ser Pro Leu Ser Asp Thr

50 55 60

Lys Thr Ile Phe Asp Arg Tyr Gln Gln Val Ser Gly Ile Asn Leu Trp

65 70 75 80

Ser Ala Gln Tyr Glu Lys Met Gln Asn Thr Leu Asn His Leu Arg Glu

85 90 95

Ile Asn Gln Asn Leu Arg Arg Glu Ile Arg Gln Arg Met Gly Glu Asp

100 105 110

Leu Asp Ser Leu Gly Ile His Glu Leu Arg Gly Leu Glu Gln Asn Leu

115 120 125

Asp Glu Ala Leu Lys Val Val Arg His Arg Lys Tyr His Val Ile Thr

130 135 140

Thr Gln Thr Asp Thr Tyr Lys Lys Lys

145 150

<210> 82

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 82

tgatatgaag ggtttcaagg t 21

<210> 83

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 83

tcctatttta gaagatggtc tagtg 25

<210> 84

<211> 576

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 84

tgatatgaag ggtttcaagg tggtttgcct cgttcaaatc aaaggatttt gaagattaat 60

attccaagat aaggttctcc aactccatta ggaaagtgtc ttcatgtcat cttagagaag 120

cagctcgtac caaacttgac agatgtttta tttatttaga gtgacacaga taccctttgg 180

caatactctc catccttgtc cgaacaactt ctaatcacac ctcacttatc ttgcatctaa 240

ctcagaggct acaagttaca cctttcaaca aaccttttcg gtttgaaaat ttgtgatttc 300

attatttaga gttcgaagag catatcaagt attggtcgga gttggcaccc aaagcaaacg 360

aaacagttac tgacatggtc caaaagctga gatttctaag atcccaactt aagcactgaa 420

taaagccatt atgggaaata tcattttaac gaaagaggaa tttagagtaa gaattgattc 480

tcttgatacc gaagaagaac taatacagct ttcatcactt caaaatgatg aacagatgca 540

tctcaagtca gcactagacc atcttctaaa atagga 576

<210> 85

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 85

agaattgatt ctcttgatac cg 22

<210> 86

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 86

ttttattact ccattaatca ggct 24

<210> 87

<211> 633

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 87

agaattgatt ctcttgatac cgaagaagaa ctaatacagc tttcatcact tcaaaatgat 60

gaacagatgc atctcaagtc agcactagac catcttctaa aataggaaga tctatggaag 120

caacactccc aaatgcagtg gcttcaaaat ggggattgca atacgaagtt tatccatgtt 180

tgggcaagta acaggaaaaa aagaatacta tcactgaact ctagcaaggc gatcagaaga 240

ttatcgaata gcagcaaatc caatccacat tctacaactt tttttctacc ctactaggct 300

cgactgagga atgactcatc caagctgatt ggaagattct ttatccagaa ggacctctgg 360

atcttgctga cattgagtat ccatttatgg agaaagaaat ccatgataca gtgtatgact 420

tggctttgga aaagtcaccc ggatgatatt ttcccattct ccttctataa gcacttctag 480

tgtatcatca aacatgacct gatgaaccta ctgtaaaatc agctaatgta gaccatctga 540

actacttgtt catcaccctt atcccaaaaa aaaattggtg tgtattcagt tagagacttc 600

aggccaataa gcctgattaa tggagtaata aaa 633

<210> 88

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 88

gcaaggagat cctctattcg 20

<210> 89

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 89

gatcgacaaa tattcgacca 20

<210> 90

<211> 632

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 90

gcaaggagat cctctattcg cctagctctt tctcttagtt gttgatatag aatgatcaag 60

ggagcaagta ggttcaatct ttttgttgga attggatcat ataatatcat gggataactt 120

caaagctttt agttcactga tgacacactt atattttgca gatatgatct aaaatacatc 180

aaaactctta aatttttact ctatagttat gagctactga tgggtctcaa aattaacttt 240

gaaaaattcc aattttttgg cttgagaatt gcaaagatgt cagtacagca agttgcatct 300

atcctagaaa gcaaggtggc tacattttcc attacttatt tgggtctccc actccatcat 360

tctaaactga ggaaaactta ttggaatcca ctccttgaga aggttcagaa gaaattgatc 420

gggtagaaag gtaaacttct taacctctag ggtaggctta tactaactaa tgcagtgctt 480

acagggatcc cactactctg gagggataca ttccttctcc ctcaattcat tatcaaataa 540

attgataaaa tccatcgatc attcatttgg agaggaaacg aggagtataa ctaagggcac 600

tctagaatat gttggtcgaa tatttgtcga tc 632

<210> 91

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 91

ctctagcaag gcgatcagaa gatt 24

<210> 92

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 92

tcaggtgtta tgtcagtttg gact 24

<210> 93

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 93

aagtctccac tctatctatc ccga 24

<210> 94

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 94

gggtcaacaa ggtctgagaa cact 24

<210> 95

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 95

cgcaatcaga atcaactggc caat 24

<210> 96

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 96

atgatacacg gttgcatgcc ctgc 24

<210> 97

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 97

gatctatggt gcaaggagtt aatt 24

<210> 98

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 98

agagagaggg ttaaaggaca atgc 24

<210> 99

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 99

atagggagaa tagcttggct tcga 24

<210> 100

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 100

tcgggttctt ttattcgtgg attt 24

<210> 101

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 101

aggggagatt gttggcttag cttg 24

<210> 102

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 102

agtagactcg atgatgataa gact 24

<210> 103

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 103

accagcacgg tcaaggatag gcat 24

<210> 104

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 104

atagtagact cgatgatgat aaga 24

<210> 105

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 105

cctccaacat cggccaagtt agtt 24

<210> 106

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 106

aaatcctact tgtttctctg acct 24

<210> 107

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 107

catgaggcat gcaaggtatt gaat 24

<210> 108

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 108

aaggctggct aactcaaaga agag 24

<210> 109

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 109

aatgatcgag aagggctgga gaca 24

<210> 110

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 110

tgacccacca tcgagaagga ccga 24

<210> 111

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 111

ataactgaca agtggcattg atct 24

<210> 112

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 112

agaaggatga gaagagagat tgtc 24

<210> 113

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 113

aaagatgtta gctcctgttc gaga 24

<210> 114

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 114

aaaggctggc taactcaaag aaga 24

<210> 115

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 115

agagattgtg aacaaatgga gaga 24

<210> 116

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 116

atattgtctg ctcttcacca aaga 24

<210> 117

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 117

ctcgtaaggc ccaagggtag tcat 24

<210> 118

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 118

aaaatagctt gacccaccat cgag 24

<210> 119

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 119

atagaatagg gagaatagct tggc 24

<210> 120

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 120

tcctgtccag atatttgcgc ctct 24

<210> 121

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 121

acaactagcc aatgatcgag aagg 24

<210> 122

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 122

aacacactgc tgaaaaggac tagg 24

<210> 123

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 123

aaactcatgg tgtcaaggga cgtg 24

<210> 124

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 124

gctacacagg cacaatctcg attt 24

<210> 125

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 125

ctttccgaca ccaagacca 19

<210> 126

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 126

caagtagcgg atagagaggc ttac 24

<210> 127

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 127

gttcgtcaca gaaaatacca tgt 23

<210> 128

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 128

tcttctgatc gccttgctag a 21

<210> 129

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> synthetic

<400> 129

accggatcaa agaccgtaaa g 21

<210> 130

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 130

aaattcttac ttctgagcat actt 24

<210> 131

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 131

cgaggtggtg tcaatggata gaat 24

<210> 132

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 132

ctctttgtta tacaatcacg gtgt 24

<210> 133

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 133

caaggcgatc agaagattat cgaa 24

<210> 134

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 134

gtgccatatg tcatagtcaa ctgt 24

<210> 135

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 135

aatctgatat tggcatccac atga 24

<210> 136

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 136

cctgactttc ggttggctgt ctct 24

<210> 137

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 137

aatcctactt gtttctctga cctt 24

<210> 138

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 138

ctctagcaag gcgatcagaa gatt 24

<210> 139

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 139

aaatggcata ctctggcaat tcga 24

<210> 140

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 140

tctatctcat ccctctcaac caat 24

<210> 141

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 141

gtagcccatg tctttgtttt ccct 24

<210> 142

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 142

tgtggatggc taacgatatg gact 24

<210> 143

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 143

actagcacca tgtgtcgtta tggg 24

<210> 144

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 144

ttcagtcaga gacttcaggc caat 24

<210> 145

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 145

aggctctcac agaaaatgaa tttg 24

<210> 146

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 146

ttatacagct aaattctcag tcct 24

<210> 147

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 147

tatacagcta aattctcagt cctt 24

<210> 148

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 148

acagctaaat tctcagtcct tatt 24

<210> 149

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 149

gctaaattct cagtccttat taat 24

<210> 150

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 150

cattctaaac tgaggaaaac ttat 24

<210> 151

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 151

aggttcagaa gaaattgatc gggt 24

<210> 152

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 152

attgatcggg tagaaaggta aact 24

<210> 153

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 153

tgcagtgctt acagggatcc cact 24

<210> 154

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 154

acgaggagta taactaaggg cact 24

<210> 155

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 155

aagggcactc tagaatatgt tggt 24

<210> 156

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 156

aagggcactt tagaatatgt tggt 24

<210> 157

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 157

tggtttacag cacacatgaa atat 24

<210> 158

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 158

ggcatgaagg atctactatt ttct 24

<210> 159

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 159

ggcatgaagg atctactatt ttct 24

<210> 160

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 160

acttttatgc atgcttaaca ccct 24

<210> 161

<211> 24

<212> DNA

<213> Elaeis guineensis

<400> 161

atgcatgctt aacaccctat ggga 24

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1