水稻籽粒大小控制基因smg11的单倍型鉴定标记方法
技术领域
1.本发明涉及水稻基因控制技术领域,尤其是指水稻粒长控制基因gs3的单倍型鉴定标记及其筛选方法。
背景技术:2.水稻是全世界最重要的粮食作物之一,如何提高水稻品种的产量,一直是科学家最主要的目标。籽粒大小是决定水稻产量的一个关键农艺性状,smg11 通过促进籽粒颖壳中细胞的增殖和部分是通过影响一些参与调控细胞增殖基因的表达来控制籽粒大小、籽粒数目和谷物产量。smg11适度的表达会增加籽粒大小、粒重和谷物产量。
3.分子标记是基于遗传物质dna基础上的多态性标记,依据标记和性状的关联关系,能够利用基因的功能标记或者紧密连锁标记,快速的鉴定品种所含有的功能基因。snp标记是数量最多、分布最广泛的一种分子标记。snp标记的开发是基于dna测序基础上的,自从2005年454测序仪问世以来的十多年时间,二代测序技术不断完善,基因组测序效率大大提高,测序成本大幅度下降,大量物种的全基因组序列完成,极大地推进了功能基因组研究的进展。过去几十年里,全球科学家已经克隆了多个水稻基因以及上千份水稻种质资源测序,发现了大量的snp标记。
4.水稻作为单子叶植物研究的模式植物,同时也是全球最重要的粮食作物,对不同的品种进行重测序,利用重测序发现的snp标记,构建高密度的水稻单倍型图谱(hapmap),利用全基因组关联分析(genome-wide association mapping, gwas)对重要农艺性状进行关联分析,确定重要农艺性状相关的候选基因位点,建立起一套高效快速、成熟稳定、成本低、通量高的基因型鉴定方法,是分子生物学研究人员优先考虑的方向。
5.在水稻中,目前已经完成了4726份栽培稻品种的重测序,其中3243份由黎志康课题组完成,发表在gigascience上(the 3,000rice genomes project., 2014),950份由韩斌课题组完成,发表在nat genet上(huang et al.,2010) (huang et al.,2012),533份由华中农业大学水稻课题组完成,发表在nucleicacids res上(zhao et al.,2014)。2021年,四川农业大学钦鹏教授团队完成了33个水稻品种泛基因组的测序和拼装,获得了参考基因组级别的序列,发表在cell上(qin et al.,2021)。大规模的、高质量的水稻基因组测序的完成,为筛选功能基因单倍型奠定了坚实的基础。
6.水稻smg11突变体表现出小粒、密穗以及每穗粒数增加。对smg11基因的克隆和序列分析表明,smg11是dwarf2(d2)的一个新的等位基因,编码一个细胞色素p450(cyp90d2),参与油菜素内酯合成通路。
7.水稻品种之间存在差异,实质上是水稻品种间基因型的差异,而dna分子标记可以直接反映基因水平上的差异。本发明使用的单核苷酸多态性(singlenucleotide polymorphisms,snp)所反映的dna遗传变异更多体现在单个碱基的变异水平,在一定程度上弥补了第一代分子标记(如:限制性片段长度多态性, rflp)和第二代分子标记(如:微卫星dna多态性,ssr)方法的不足,所以被称为第三代基因遗传标记方法。snp的主要优点有:
密度高、分布广,在水稻中则每232bp出现1个snp;可快速实现高通量检测,易实现自动化分析。
8.水稻种群的基因有着丰富的多样性和复杂的作用机制,是水稻育种改良的遗传基础。长期以来,在全球科学家的努力下极大的丰富了水稻种质资源和水稻优良基因多样性的数据库,这为开展水稻全基因组分子设计育种提供足够的基因来源和育种亲本精确选择的遗传信息,为培育高产、优质、多抗水稻新品种奠定基础。本发明基于功能基因开发精准鉴定标记,并将研究成果运用到水稻遗传改良中。
技术实现要素:9.本发明要解决的技术问题是提供水稻籽粒大小控制基因smg11的单倍型鉴定标记方法,利用分子标记鉴定水稻品种的功能基因,来判断水稻品种的表型,更高效、更直接。
10.为了解决上述技术问题,本发明采用如下技术方案:
11.水稻籽粒大小控制基因smg11的单倍型鉴定标记方法,所述单倍型分子标记由7个snp位点组成,snp位点信息如下:
12.snp1所在基因组位置为1号染色体5204790bp,该处碱基为g;
13.snp2所在基因组位置为1号染色体5221997bp,该处碱基为t;
14.snp3所在基因组位置为1号染色体5227603bp,该处碱基为g;
15.snp4所在基因组位置为1号染色体5230051bp,该处碱基为t;
16.snp5所在基因组位置为1号染色体5237810bp,该处碱基为g;
17.snp6所在基因组位置为1号染色体5253059bp,该处碱基为c;
18.snp7所在基因组位置为1号染色体5254135bp,该处碱基为g。
19.以上snp位点的物理位置是基于日本晴的全基因组序列msu7.0版本确定。
20.优选地,所述单倍型分子标记由158个snp位点组成,snp位点信息如下:
21.snp1所在基因组位置为1号染色体5194568bp,该处碱基为g;
22.snp2所在基因组位置为1号染色体5195002bp,该处碱基为c;
23.snp3所在基因组位置为1号染色体5195855bp,该处碱基为c;
24.snp4所在基因组位置为1号染色体5196478bp,该处碱基为t;
25.snp5所在基因组位置为1号染色体5197085bp,该处碱基为a;
26.snp6所在基因组位置为1号染色体5197652bp,该处碱基为a;
27.snp7所在基因组位置为1号染色体5198228bp,该处碱基为a;
28.snp8所在基因组位置为1号染色体5198864bp,该处碱基为c;
29.snp9所在基因组位置为1号染色体5199390bp,该处碱基为a;
30.snp10所在基因组位置为1号染色体5200152bp,该处碱基为g;
31.snp11所在基因组位置为1号染色体5200683bp,该处碱基为g;
32.snp12所在基因组位置为1号染色体5201136bp,该处碱基为t;
33.snp13所在基因组位置为1号染色体5201866bp,该处碱基为g;
34.snp14所在基因组位置为1号染色体5202252bp,该处碱基为c;
35.snp15所在基因组位置为1号染色体5203042bp,该处碱基为g;
36.snp16所在基因组位置为1号染色体5203555bp,该处碱基为g;
37.snp17所在基因组位置为1号染色体5204214bp,该处碱基为t;
38.snp18所在基因组位置为1号染色体5204790bp,该处碱基为g;
39.snp19所在基因组位置为1号染色体5205443bp,该处碱基为c;
40.snp20所在基因组位置为1号染色体5205773bp,该处碱基为a;
41.snp21所在基因组位置为1号染色体5206663bp,该处碱基为t;
42.snp22所在基因组位置为1号染色体5206863bp,该处碱基为g;
43.snp23所在基因组位置为1号染色体5207817bp,该处碱基为g;
44.snp24所在基因组位置为1号染色体5208375bp,该处碱基为a;
45.snp25所在基因组位置为1号染色体5208950bp,该处碱基为c;
46.snp26所在基因组位置为1号染色体5209551bp,该处碱基为c;
47.snp27所在基因组位置为1号染色体5209984bp,该处碱基为c;
48.snp28所在基因组位置为1号染色体5210176bp,该处碱基为t;
49.snp29所在基因组位置为1号染色体5211081bp,该处碱基为c;
50.snp30所在基因组位置为1号染色体5211969bp,该处碱基为c;
51.snp31所在基因组位置为1号染色体5212530bp,该处碱基为g;
52.snp32所在基因组位置为1号染色体5213172bp,该处碱基为t;
53.snp33所在基因组位置为1号染色体5213721bp,该处碱基为g;
54.snp34所在基因组位置为1号染色体5214015bp,该处碱基为a;
55.snp35所在基因组位置为1号染色体5214772bp,该处碱基为g;
56.snp36所在基因组位置为1号染色体5215447bp,该处碱基为g;
57.snp37所在基因组位置为1号染色体5215828bp,该处碱基为g;
58.snp38所在基因组位置为1号染色体5216875bp,该处碱基为t;
59.snp39所在基因组位置为1号染色体5217268bp,该处碱基为a;
60.snp40所在基因组位置为1号染色体5218061bp,该处碱基为c;
61.snp41所在基因组位置为1号染色体5218241bp,该处碱基为c;
62.snp42所在基因组位置为1号染色体5220338bp,该处碱基为g;
63.snp43所在基因组位置为1号染色体5221476bp,该处碱基为c;
64.snp44所在基因组位置为1号染色体5221985bp,该处碱基为g;
65.snp45所在基因组位置为1号染色体5221997bp,该处碱基为t;
66.snp46所在基因组位置为1号染色体5223249bp,该处碱基为g;
67.snp47所在基因组位置为1号染色体5223537bp,该处碱基为a;
68.snp48所在基因组位置为1号染色体5224157bp,该处碱基为c;
69.snp49所在基因组位置为1号染色体5225236bp,该处碱基为t;
70.snp50所在基因组位置为1号染色体5225673bp,该处碱基为g;
71.snp51所在基因组位置为1号染色体5226391bp,该处碱基为t;
72.snp52所在基因组位置为1号染色体5226813bp,该处碱基为t;
73.snp53所在基因组位置为1号染色体5227603bp,该处碱基为g;
74.snp54所在基因组位置为1号染色体5228225bp,该处碱基为g;
75.snp55所在基因组位置为1号染色体5228868bp,该处碱基为c;
76.snp56所在基因组位置为1号染色体5229452bp,该处碱基为t;
77.snp57所在基因组位置为1号染色体5230051bp,该处碱基为t;
78.snp58所在基因组位置为1号染色体5230683bp,该处碱基为t;
79.snp59所在基因组位置为1号染色体5231223bp,该处碱基为c;
80.snp60所在基因组位置为1号染色体5231837bp,该处碱基为g;
81.snp61所在基因组位置为1号染色体5232450bp,该处碱基为a;
82.snp62所在基因组位置为1号染色体5233054bp,该处碱基为g;
83.snp63所在基因组位置为1号染色体5233680bp,该处碱基为g;
84.snp64所在基因组位置为1号染色体5233995bp,该处碱基为a;
85.snp65所在基因组位置为1号染色体5234872bp,该处碱基为c;
86.snp66所在基因组位置为1号染色体5235423bp,该处碱基为g;
87.snp67所在基因组位置为1号染色体5235884bp,该处碱基为g;
88.snp68所在基因组位置为1号染色体5236463bp,该处碱基为t;
89.snp69所在基因组位置为1号染色体5236698bp,该处碱基为g;
90.snp70所在基因组位置为1号染色体5237575bp,该处碱基为t;
91.snp71所在基因组位置为1号染色体5237810bp,该处碱基为g;
92.snp72所在基因组位置为1号染色体5238880bp,该处碱基为g;
93.snp73所在基因组位置为1号染色体5239414bp,该处碱基为t;
94.snp74所在基因组位置为1号染色体5239939bp,该处碱基为c;
95.snp75所在基因组位置为1号染色体5240748bp,该处碱基为t;
96.snp76所在基因组位置为1号染色体5241447bp,该处碱基为g;
97.snp77所在基因组位置为1号染色体5241939bp,该处碱基为c;
98.snp78所在基因组位置为1号染色体5242645bp,该处碱基为g;
99.snp79所在基因组位置为1号染色体5243254bp,该处碱基为g;
100.snp80所在基因组位置为1号染色体5243638bp,该处碱基为a;
101.snp81所在基因组位置为1号染色体5244280bp,该处碱基为t;
102.snp82所在基因组位置为1号染色体5244677bp,该处碱基为c;
103.snp83所在基因组位置为1号染色体5246227bp,该处碱基为a;
104.snp84所在基因组位置为1号染色体5246436bp,该处碱基为c;
105.snp85所在基因组位置为1号染色体5247658bp,该处碱基为t;
106.snp86所在基因组位置为1号染色体5248887bp,该处碱基为g;
107.snp87所在基因组位置为1号染色体5249044bp,该处碱基为t;
108.snp88所在基因组位置为1号染色体5249893bp,该处碱基为g;
109.snp89所在基因组位置为1号染色体5250825bp,该处碱基为c;
110.snp90所在基因组位置为1号染色体5251654bp,该处碱基为g;
111.snp91所在基因组位置为1号染色体5252260bp,该处碱基为g;
112.snp92所在基因组位置为1号染色体5252839bp,该处碱基为g;
113.snp93所在基因组位置为1号染色体5253059bp,该处碱基为c;
114.snp94所在基因组位置为1号染色体5253459bp,该处碱基为t;
115.snp95所在基因组位置为1号染色体5254135bp,该处碱基为g;
116.snp96所在基因组位置为1号染色体5254685bp,该处碱基为g;
117.snp97所在基因组位置为1号染色体5255156bp,该处碱基为g;
118.snp98所在基因组位置为1号染色体5255856bp,该处碱基为c;
119.snp99所在基因组位置为1号染色体5256316bp,该处碱基为g;
120.snp100所在基因组位置为1号染色体5256862bp,该处碱基为g;
121.snp101所在基因组位置为1号染色体5257124bp,该处碱基为a;
122.snp102所在基因组位置为1号染色体5257611bp,该处碱基为a;
123.snp103所在基因组位置为1号染色体5258145bp,该处碱基为t;
124.snp104所在基因组位置为1号染色体5258524bp,该处碱基为t;
125.snp105所在基因组位置为1号染色体5259220bp,该处碱基为t;
126.snp106所在基因组位置为1号染色体5259870bp,该处碱基为g;
127.snp107所在基因组位置为1号染色体5260938bp,该处碱基为t;
128.snp108所在基因组位置为1号染色体5261861bp,该处碱基为t;
129.snp109所在基因组位置为1号染色体5262205bp,该处碱基为c;
130.snp110所在基因组位置为1号染色体5262912bp,该处碱基为g;
131.snp111所在基因组位置为1号染色体5263456bp,该处碱基为c;
132.snp112所在基因组位置为1号染色体5263752bp,该处碱基为g;
133.snp113所在基因组位置为1号染色体5264642bp,该处碱基为c;
134.snp114所在基因组位置为1号染色体5265555bp,该处碱基为a;
135.snp115所在基因组位置为1号染色体5265646bp,该处碱基为a;
136.snp116所在基因组位置为1号染色体5265682bp,该处碱基为c;
137.snp117所在基因组位置为1号染色体5267283bp,该处碱基为c;
138.snp118所在基因组位置为1号染色体5267859bp,该处碱基为c;
139.snp119所在基因组位置为1号染色体5268209bp,该处碱基为t;
140.snp120所在基因组位置为1号染色体5269014bp,该处碱基为t;
141.snp121所在基因组位置为1号染色体5269671bp,该处碱基为c;
142.snp122所在基因组位置为1号染色体5270201bp,该处碱基为t;
143.snp123所在基因组位置为1号染色体5270811bp,该处碱基为a;
144.snp124所在基因组位置为1号染色体5271423bp,该处碱基为t;
145.snp125所在基因组位置为1号染色体5272050bp,该处碱基为a;
146.snp126所在基因组位置为1号染色体5272220bp,该处碱基为a;
147.snp127所在基因组位置为1号染色体5273032bp,该处碱基为t;
148.snp128所在基因组位置为1号染色体5273883bp,该处碱基为g;
149.snp129所在基因组位置为1号染色体5274284bp,该处碱基为g;
150.snp130所在基因组位置为1号染色体5275085bp,该处碱基为t;
151.snp131所在基因组位置为1号染色体5275733bp,该处碱基为a;
152.snp132所在基因组位置为1号染色体5276119bp,该处碱基为g;
153.snp133所在基因组位置为1号染色体5277101bp,该处碱基为g;
154.snp134所在基因组位置为1号染色体5277513bp,该处碱基为g;
155.snp135所在基因组位置为1号染色体5277873bp,该处碱基为t;
156.snp136所在基因组位置为1号染色体5278559bp,该处碱基为c;
157.snp137所在基因组位置为1号染色体5279216bp,该处碱基为g;
158.snp138所在基因组位置为1号染色体5279593bp,该处碱基为c;
159.snp139所在基因组位置为1号染色体5280279bp,该处碱基为a;
160.snp140所在基因组位置为1号染色体5280762bp,该处碱基为c;
161.snp141所在基因组位置为1号染色体5280773bp,该处碱基为c;
162.snp142所在基因组位置为1号染色体5283984bp,该处碱基为a;
163.snp143所在基因组位置为1号染色体5284723bp,该处碱基为g;
164.snp144所在基因组位置为1号染色体5285072bp,该处碱基为c;
165.snp145所在基因组位置为1号染色体5285702bp,该处碱基为c;
166.snp146所在基因组位置为1号染色体5286381bp,该处碱基为c;
167.snp147所在基因组位置为1号染色体5286838bp,该处碱基为g;
168.snp148所在基因组位置为1号染色体5287516bp,该处碱基为t;
169.snp149所在基因组位置为1号染色体5288177bp,该处碱基为c;
170.snp150所在基因组位置为1号染色体5288464bp,该处碱基为a;
171.snp151所在基因组位置为1号染色体5289220bp,该处碱基为a;
172.snp152所在基因组位置为1号染色体5289919bp,该处碱基为g;
173.snp153所在基因组位置为1号染色体5290397bp,该处碱基为c;
174.snp154所在基因组位置为1号染色体5290881bp,该处碱基为t;
175.snp155所在基因组位置为1号染色体5291827bp,该处碱基为a;
176.snp156所在基因组位置为1号染色体5291856bp,该处碱基为g;
177.snp157所在基因组位置为1号染色体5292579bp,该处碱基为a;
178.snp158所在基因组位置为1号染色体5293485bp,该处碱基为g。
179.优选地,所述的单倍型分子标记在鉴定水稻籽粒大小控制基因smg11中的应用。
180.优选地,所述单倍型分子标记筛选所用的基因芯片为gsr40k。
181.本发明的有益效果:
182.本发明利用分子标记鉴定水稻品种的功能基因,来判断水稻品种的表型,更高效、更直接。
183.利用基因核心序列以及基因上下游序列,能够开发足量的单倍型标记,用于鉴定基因的功能。本发明筛选的功能基因的单倍型标记,可以用于水稻籽粒大小控制基因smg11芯片的开发。
184.本发明在筛选优化标记的过程中,既充分保留了多态性的差异snp分型标记,又考虑了标记之间的间距,以及标记附近的具体序列特征,所优化的标记组合能够直接用于芯片设计,或者用于设计基于pcr基础的检测标记,非常实用。
185.本发明通过基因芯片精准检测相对较少的snp单倍型标记就可以鉴定基因的功能。在实际应用中,利用有限的标记,可以对功能基因进行鉴定,新克隆的基因也可以很快的利用类似的方法,优化出鉴定单倍型标记组,不需要对所有的新基因重新设计标记。
附图说明
186.图1为利用实施例2中共有的18个标记对33个水稻品种进行水稻籽粒大小控制基因smg11的基因型鉴定。
187.图2为利用实施例2中筛选的7个标记对33个水稻品种进行水稻籽粒大小控制基因smg11的基因型鉴定。
具体实施方式
188.为了便于本领域技术人员的理解,下面结合实施例对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
189.实施例1
190.根据33个四川农业大学钦鹏教授团队发表在cell上水稻遗传多样性材料的高质量基因组序列(qin et al.,2021)筛选设计已经克隆的水稻籽粒大小控制基因smg11的单倍型标记:
191.1、查找水稻籽粒大小控制基因smg11的功能位点(如下表1所示);筛选出33个高质量基因组序列中基因smg11功能位点上下游各50kb区域内的所有差异snp标记,共3769个snp标记。
192.表1:水稻籽粒大小控制基因smg11的功能位点
193.chrpos_7.0generap idalt_allele_functionref_genoalt_genochr15244076smg11os01g0197100small graingt
194.2、依据步骤1中查找的水稻籽粒大小控制基因smg11的功能位点,通过序列比对,确定33个高质量参考基因组中含有smg11功能基因的品种,如表2 所示。
195.表2:含有水稻籽粒大小控制基因smg11的品种
196.品种染色体位置基因型9311chr15244076td62chr15244076tfh838chr15244076tg630chr15244076tg8chr15244076tir64chr15244076tj4115chr15244076tr527chr15244076ts548chr15244076ttmchr15244076twssmchr15244076ttumbachr15244076ty3551chr15244076ty58schr15244076t
197.3、从步骤1中筛选的snp位点,按照下面的标准选择优化籽粒大小控制基因smg11的单倍型标记:
198.1)水稻品种9311、d62、fh838、g630、g8、ir64、j4115、r527、s548、 tm、wssm、tumba、y3551和y58s都含有的,与参考基因组日本晴不一致,且与另外19个品种不同的(qin et al.,2021)snp标记909个;
199.2)水稻品种9311、d62、fh838、g630、g8、ir64、j4115、r527、s548、 tm、wssm、tumba、y3551、y58s与参考基因组日本晴都一致的snp位点1981 个;
200.3)上述两步共获得可以用于鉴定籽粒大小控制基因smg11的标记组合2890 个;
201.4)筛选过滤掉indel标记1234个,剩余标记1656个;
202.5)保留均匀分布的snp标记:保留相邻距离约600bp的标记共158个。
203.4、籽粒大小控制基因smg11的单倍型标记具体如下(snp位点的物理位置是基于日本晴的全基因组序列msu7.0版本确定):
204.表3籽粒大小控制基因smg11的单倍型标记
205.206.207.208.209.210.[0211][0212]
实施例2
[0213]
依据武汉双绿源创芯科技研究院有限公司自主研发的水稻高密度全基因组 snp芯片gsr40k,进一步筛选优化籽粒大小控制基因smg11的单倍型标记:
[0214]
1、筛选出水稻gsr40k基因芯片在籽粒大小控制基因smg11区段的所有高质量标记,共找到18个高质量的snp标记,如表4所示。这18个snp位点在 33个高质量基因组中均能检测到。
[0215]
表4 gsr40k基因芯片中在籽粒大小控制基因smg11基因区段的标记组合
[0216][0217]
[0218]
2、利用上述标记对33个高质量基因组进行基因型鉴定,结果如图1所示。
[0219]
3、依据实施列1中33个高质量参考基因组材料的具体表型,对筛选出的共同标记组合进行优化,筛选出基因芯片gsr40k中能够精准鉴定水稻籽粒大小控制基因smg11功能的一组标记组合,如表5所示。
[0220]
表5:基因芯片gsr40k中能够精准鉴定水稻籽粒大小控制基因smg11的单倍型标记
[0221][0222]
本实施例中的所有技术特征均可根据实际需要而进行外观修改。
[0223]
上述实施例为本发明较佳的实现方案,除此之外,本发明还可以其它方式实现,在不脱离本技术方案构思的前提下任何显而易见的替换均在本发明的保护范围之内。