基于SNP分型的多倍体等位基因分析技术

文档序号:27134767发布日期:2021-10-29 22:50阅读:750来源:国知局
基于SNP分型的多倍体等位基因分析技术
基于snp分型的多倍体等位基因分析技术
技术领域
1.本发明涉及基因分析技术领域,具体为基于snp分型的多倍体等位基因分析技术。


背景技术:

2.基因(遗传因子)是产生一条多肽链或功能rna所需的全部核苷酸序列,基因支持着生命的基本构造和性能,储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息,环境和遗传的互相依赖,演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程,生物体的生、长、衰、病、老、死等一切生命现象都与基因有关,它也是决定生命健康的内在因素,因此,基因具有双重属性:物质性(存在方式)和信息性(根本属性),带有遗传信息的dna片段称为基因,其他的dna序列,有些直接以自身构造发挥作用,有些则参与调控遗传信息的表现,组成简单生命最少要265到350个基因,(这涉及基因工作组的力量,人类的基因工作组与果蝇的基本相似)。
3.基因作为遗传信息的介质,决定了生物的性状表现。基因序列变异的发生是生物体适应环境变化的必然趋势。在二倍体生物或多倍体植物中等位基因是一对控制着相对性状的基因,因此,等位基因特异性表达效应根据细胞类型和发育阶段的不同而变化,表现出不同个体之间的差异。等位基因差异表达(allele

specifcexpression,ase)对基因的表达起到重要的调控作用,并最终可能与生物的表型多态性密切相关。
4.等位基因差异表达作为一种特殊的遗传学现象,成为一种筛选功能性突变的新手段。这种方法具有可以消除组织生理状态等因素的影响,极为准确和灵敏;对样本数量要求不高;检测手段简单可靠、成本低、耗时短;受调控目标基因明确;可大大缩小搜索功能性位点的范围,提高研究效率等优势。等位基因的多态性主要可以归为以下几类:
5.1)单核甘酸多态性(singlenucleotidepolymorphism,snp)。snp是指在染色体基因组水平上单个核苷酸的变异引起的dna序列多态性。dna分子单个核苷酸的变异有碱基替换、插入和缺失等形式,而snp不包括碱基的插入和缺失。根据这种变异发生区域的不同,snp在基因组内可以划分为2种形式:第一是遍布于基因组的大量单碱基变异;第二是基因编码区的功能性突变。后者由于分布在基因编码区,故又称其为csnp(codingsnp)。现有研究表明,snp在基因组中分布广泛单碱基变异的频率在1


6.2)长度多态性。主要是由物种在进化过程中的插入或者缺失造成,如在玉米中由于转座子的存在,从而导致了大量的插入或者缺失(indel)的存在。另外,微卫星dna(microsatellite)的存在,也同样是长度多态性产生的一个重要原因。
7.3)结构变化。例如不同玉米材料在bz

mcc和bz

b73这2个区域存在着很大的结构变化。
8.多倍化是促进植物进化的重要力量。多倍体主要是通过未减数配子融合,体细胞染色体加倍以及多精受精三种方式起源的。其中,不减数配子是多倍体形成的主要机制。三倍体可能在四倍体的进化中起了重要作用。过去认为多倍体只能是进化的死胡同,现在发现很多多倍体类群都是多元起源的而不是单元起源的。当多倍体形成后,基因组中的重复
基因大部分保持原有的功能,也有相当比例的基因发生基因沉默。多倍体通常表现出不存在于二倍体祖先的表型,并且超出了其祖先的分布范围,因为在多倍体中发生了很多基因表达的变化。
9.据统计,被子植物中大约有50%

70%发生过多倍化,如棉花、烟草、马铃薯、小麦等都是自然形成的多倍体,其中增加的染色体组来源于相同物种的是同源多倍体。此外,大约超过70%的开花植物是多倍体且大部分增加的染色体组来自其他物种,因此是异源多倍体。多倍化过程伴随着染色体数目的增加,等位基因的数量也加倍,增加基因拷贝数可能引起基因组内的重复基因发生沉默、激活等现象,还会导致染色体重组、序列消除和基因表达水平的变化。多倍化后,产生大量差异表达基因,进一步影响植物异源多倍体的性状表现。
10.多倍化会给植物多倍体的转录组带来一定的冲击,多倍体转录组缩小的程度要大于基因组缩小的程度。转录组冲击会引起基因表达的变化使得多倍体形成新的基因表达模式。有研究发现多倍化会影响各种功能基因的表达,但是涉及细胞防卫与衰老、植物激素调节和代谢的基因受影响的频率相对较高。说明多倍化对基因表达的影响不是随机的。基因表达变化可能是一种适应性机制,使得多倍体在自然界中快速而稳定地进化。
11.植物多倍体中基因只在某一种组织中高表达而在其它组织中不表达或低表达,这种现象被称为组织特异性表达。roulin等(2013)分析了多倍体中重复基因的三种不同的命运:沉默(无功能化),具有新的功能(新功能化)和获得不同的组织特异性(亚功能化)。对异源六倍体小麦部分同源基因在不同组织中的表达模式进行分析发现55%的部分同源基因表现出组织特异性表达,其中花药中的比例最大(14%),雌蕊中比例最小(7%)。核糖体蛋白基因在异源四倍体甘蓝型油菜中是组织特异性表达的并且与核仁是性相关。研究表明异源多倍体的部分同源染色体交换可导致基因的组织特异性表达。部分同源基因的组织特异性表达也出现在棉花、水稻和婆罗门参多倍体中。多倍体中重复基因的组织特异性表达表现出了重复基因的亚功能化,这是一种向基因新功能化过渡的状态,亚功能化使得复制基因保留下来,复制基因差异的表达模式可能促进了多倍体新表型的形成。因此有必要在多倍体植物中研究每一个亚基因组的基因表达变化,但是由于多倍体各亚基因组基因的序列高度同源,因此很难区分各个等位基因表达差异。
12.目前尚无成熟的多倍体的等位基因(allelic/gene)表达差异分析技术,并且无全套用于该技术分析的生物信息学分析程序。本发明针对这一问题提供了相关分析技术的解决方案。


技术实现要素:

13.本发明的目的在于提供了基于snp分型的多倍体等位基因分析技术,具备开发了可以分析多倍体的等位基因表达分析技术,编写了用于分析该技术相关程序的优点,解决了目前尚无多倍体的等位基因(allelic/gene)表达差异分析技术,并且无全套用于该技术分析程序的问题。
14.为实现上述目的,本发明提供如下技术方案:基于snp分型的多倍体等位基因分析技术,其分析技术包括以下步骤:
15.a、在多倍体植物个体中,分别有来自不同染色体组的等位基因,它们在细胞或不同的外部环境中,由于不同亚染色体组基因的启动子等顺式作用元件不同,导致等位基因
的表达量会有差异,即aei(等位基因表达不平衡);
16.b、由于常规的转录组定量分析技术依赖测序短片段和参考基因组比对,由于多倍体paralog基因序列同源性极强,在测序完成后的比对过程中,来源于不同等位基因short/reads无法准确比对到相应的同源基因片段上,最终导致基因的定量极不准确;
17.c、本技术利用转录组测序snp分型技术,当目的snp位点位于转录区时,可以直接在总rna反转录cdna中观察到不同亚基因组snp对应的不同等位基因的特异性水平,用这个snp作为marker对两条不同allele分别进行表达定量,进而综合多个allele/snp观察在同一杂合子个体中多种不同等位基因型基因对应的表达水平,分析不同等位基因型基因的表达差异,为进一步精细明确等位基因功能打下基础。
18.优选的,所述在步骤b中,特别是在多倍体作物杂种优势利用方面,来源于不同异源多倍体品种的父母本杂交后代(f1)有多套染色体组,不同染色体组的基因表达定量分析难度巨大。
19.优选的,所述在步骤c中,该技术需要研究物种的全基因组序列和目的组织细胞抽提得到的总rna,获取到的转录组测序数据进行后续生物信息分析。
20.优选的,所述在步骤c中,分析过程中,需要首先明确不同染色体组基因的snp,进而利用转录组测序得到的short/reads在该位点的snp将shor/treads分型,根据分型后的short/reads进行基因定量,进一步综合该基因所有的snp位点信息和short/reads信息确定等位基因表达水平,并进行后续差异分析。
21.与现有技术相比,本发明的有益效果如下:
22.本发明适用于多种异源、同源多倍体大田作物:如棉花、小麦、花生、油菜等多倍体植物组织特异性、胁迫响应、不同发育阶段的等位基因表达差异分析,已形成了相关软件可以批量自动化分析,本技术可以准确定量每个多倍体等位基因表达量,克服了多倍体植物等位基因表达量计算不准确的难题,达到了开发了可以分析多倍体的等位基因表达分析技术,编写了用于分析该技术相关程序的优点。
附图说明
23.图1为本发明多倍体等位基因分析技术示意图。
具体实施方式
24.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.请参阅图1,基于snp分型的多倍体等位基因分析技术,其分析技术包括以下步骤:
26.a、在多倍体植物个体中,分别有来自不同染色体组的等位基因,它们在细胞或不同的外部环境中,由于不同亚染色体组基因的启动子等顺式作用元件不同,导致等位基因的表达量会有差异,即aei(等位基因表达不平衡);
27.b、由于常规的转录组定量分析技术依赖测序短片段和参考基因组比对,由于多倍体paralog基因序列同源性极强,在测序完成后的比对过程中,来源于不同等位基因short/
reads无法准确比对到相应的同源基因片段上,最终导致基因的定量极不准确;
28.c、本技术利用转录组测序snp分型技术,当目的snp位点位于转录区时,可以直接在总rna反转录cdna中观察到不同亚基因组snp对应的不同等位基因的特异性水平,用这个snp作为marker对两条不同allele分别进行表达定量,进而综合多个allele/snp观察在同一杂合子个体中多种不同等位基因型基因对应的表达水平,分析不同等位基因型基因的表达差异,为进一步精细明确等位基因功能打下基础,本发明适用于多种异源、同源多倍体大田作物:如棉花、小麦、花生、油菜等多倍体植物组织特异性、胁迫响应、不同发育阶段的等位基因表达差异分析,已形成了相关软件可以批量自动化分析,本技术可以准确定量每个多倍体等位基因表达量,克服了多倍体植物等位基因表达量计算不准确的难题,达到了开发了可以分析多倍体的等位基因表达分析技术,编写了用于分析该技术相关程序的优点。
29.实施例一:
30.基于snp分型的多倍体等位基因分析技术,其分析技术包括以下步骤:
31.a、在多倍体植物个体中,分别有来自不同染色体组的等位基因,它们在细胞或不同的外部环境中,由于不同亚染色体组基因的启动子等顺式作用元件不同,导致等位基因的表达量会有差异,即aei(等位基因表达不平衡);
32.b、由于常规的转录组定量分析技术依赖测序短片段和参考基因组比对,由于多倍体paralog基因序列同源性极强,在测序完成后的比对过程中,来源于不同等位基因short/reads无法准确比对到相应的同源基因片段上,最终导致基因的定量极不准确;
33.c、本技术利用转录组测序snp分型技术,当目的snp位点位于转录区时,可以直接在总rna反转录cdna中观察到不同亚基因组snp对应的不同等位基因的特异性水平,用这个snp作为marker对两条不同allele分别进行表达定量,进而综合多个allele/snp观察在同一杂合子个体中多种不同等位基因型基因对应的表达水平,分析不同等位基因型基因的表达差异,为进一步精细明确等位基因功能打下基础。
34.实施例二:
35.在实施例一中,再加上下述工序:
36.在步骤b中,特别是在多倍体作物杂种优势利用方面,来源于不同异源多倍体品种的父母本杂交后代(f1)有多套染色体组,不同染色体组的基因表达定量分析难度巨大。
37.基于snp分型的多倍体等位基因分析技术,其分析技术包括以下步骤:
38.a、在多倍体植物个体中,分别有来自不同染色体组的等位基因,它们在细胞或不同的外部环境中,由于不同亚染色体组基因的启动子等顺式作用元件不同,导致等位基因的表达量会有差异,即aei(等位基因表达不平衡);
39.b、由于常规的转录组定量分析技术依赖测序短片段和参考基因组比对,由于多倍体paralog基因序列同源性极强,在测序完成后的比对过程中,来源于不同等位基因short/reads无法准确比对到相应的同源基因片段上,最终导致基因的定量极不准确;
40.c、本技术利用转录组测序snp分型技术,当目的snp位点位于转录区时,可以直接在总rna反转录cdna中观察到不同亚基因组snp对应的不同等位基因的特异性水平,用这个snp作为marker对两条不同allele分别进行表达定量,进而综合多个allele/snp观察在同一杂合子个体中多种不同等位基因型基因对应的表达水平,分析不同等位基因型基因的表达差异,为进一步精细明确等位基因功能打下基础。
41.实施例三:
42.在实施例二中,再加上下述工序:
43.在步骤c中,该技术需要研究物种的全基因组序列和目的组织细胞抽提得到的总rna,获取到的转录组测序数据进行后续生物信息分析。
44.基于snp分型的多倍体等位基因分析技术,其分析技术包括以下步骤:
45.a、在多倍体植物个体中,分别有来自不同染色体组的等位基因,它们在细胞或不同的外部环境中,由于不同亚染色体组基因的启动子等顺式作用元件不同,导致等位基因的表达量会有差异,即aei(等位基因表达不平衡);
46.b、由于常规的转录组定量分析技术依赖测序短片段和参考基因组比对,由于多倍体paralog基因序列同源性极强,在测序完成后的比对过程中,来源于不同等位基因short/reads无法准确比对到相应的同源基因片段上,最终导致基因的定量极不准确;
47.c、本技术利用转录组测序snp分型技术,当目的snp位点位于转录区时,可以直接在总rna反转录cdna中观察到不同亚基因组snp对应的不同等位基因的特异性水平,用这个snp作为marker对两条不同allele分别进行表达定量,进而综合多个allele/snp观察在同一杂合子个体中多种不同等位基因型基因对应的表达水平,分析不同等位基因型基因的表达差异,为进一步精细明确等位基因功能打下基础。
48.实施例四:
49.在实施例三中,再加上下述工序:
50.在步骤c中,分析过程中,需要首先明确不同染色体组基因的snp,进而利用转录组测序得到的short/reads在该位点的snp将shor/treads分型,根据分型后的short/reads进行基因定量,进一步综合该基因所有的snp位点信息和short/reads信息确定等位基因表达水平,并进行后续差异分析。
51.基于snp分型的多倍体等位基因分析技术,其分析技术包括以下步骤:
52.a、在多倍体植物个体中,分别有来自不同染色体组的等位基因,它们在细胞或不同的外部环境中,由于不同亚染色体组基因的启动子等顺式作用元件不同,导致等位基因的表达量会有差异,即aei(等位基因表达不平衡);
53.b、由于常规的转录组定量分析技术依赖测序短片段和参考基因组比对,由于多倍体paralog基因序列同源性极强,在测序完成后的比对过程中,来源于不同等位基因short/reads无法准确比对到相应的同源基因片段上,最终导致基因的定量极不准确;
54.c、本技术利用转录组测序snp分型技术,当目的snp位点位于转录区时,可以直接在总rna反转录cdna中观察到不同亚基因组snp对应的不同等位基因的特异性水平,用这个snp作为marker对两条不同allele分别进行表达定量,进而综合多个allele/snp观察在同一杂合子个体中多种不同等位基因型基因对应的表达水平,分析不同等位基因型基因的表达差异,为进一步精细明确等位基因功能打下基础。
55.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1