本发明属于生物,具体涉及一种突变的mir396及其应用,尤其涉及一种突变的mir396及其在增强玉米抗病性和提高玉米产量中的应用。
背景技术:
::1、玉米是重要的食物、饲料和工业原料,在世界粮食生产中占有重要地位。由于玉米病虫害的发生,使玉米生产受到很大影响,玉米病害包括穗腐病、茎腐病、青枯病、玉米大斑病、南方锈病等。2、为了获得性状优良的玉米株系,我们对玉米中的相关基因进行研究。microrna(mirna)是一类非编码单链小rna分子,它通过碱基配对结合靶基因的mrna,从而调控靶基因。在植物的生长过程中,植物mirna在调控分生组织特性、叶片极性和开花模式等方面发挥着关键性的作用。在对mirna的研究中我们发现,玉米mir396突变后,能够增强玉米抗病性和提高玉米产量。技术实现思路1、本发明目的是提供一种突变的mir396及其应用。2、一方面,本发明提供了一种突变的mir396,所述的突变的mir396相对于亲本mir396具有碱基突变,所述亲本mir396为来源于玉米的野生型mir396,所述mir396包括mir396c和/或mir396d。3、在一个实施方式中,所述碱基突变包括碱基缺失、碱基插入或碱基替换。4、在一个实施方式中,所述突变的mir396选自以下(1)-(5)任意一组:5、(1)所述亲本mir396c的核酸序列如seq id no.3所示序列,所述突变的mir396c相对于seq id no.3所示序列具有碱基缺失;6、(2)所述亲本mir396d的核酸序列如seq id no.4所示序列,所述突变的mir396d相对于seq id no.4所示序列具有碱基缺失;7、(3)所述亲本mir396d的核酸序列如seq id no.4所示序列,所述突变的mir396d相对于seq id no.4所示序列具有碱基插入;8、(4)所述亲本mir396c的核酸序列如seq id no.3所示序列,所述突变的mir396c相对于seq id no.3所示序列具有碱基缺失;所述亲本mir396d的核酸序列如seq idno.4所示序列,所述突变的mir396d相对于seq id no.4所示序列具有碱基插入;9、(5)所述亲本mir396c的核酸序列如seq id no.3所示序列,所述突变的mir396c相对于seq id no.3所示序列具有碱基缺失;所述亲本mir396d的核酸序列如seq idno.4所示序列,所述突变的mir396d相对于seq id no.4所示序列具有碱基缺失。10、在一个实施方式中,所述突变的mir396c缺失相对于seq id no.3所示序列的第141-151位碱基。优选的,所述突变的mir396c的核酸序列如seq id no.5所示。11、在一个实施方式中,所述突变的mir396c缺失相对于seq id no.3所示序列的第151位碱基。优选的,所述突变的mir396c的核酸序列如seq id no.8所示。12、在一个实施方式中,所述突变的mir396c缺失相对于seq id no.3所示序列的第146-156位碱基。优选的,所述突变的mir396c的核酸序列如seq id no.9所示。13、在一个实施方式中,所述突变的mir396d缺失相对于seq id no.4所示序列的第198-208位碱基。优选的,所述突变的mir396d的核酸序列如seq id no.6所示。14、在一个实施方式中,所述突变的mir396d相对于seq id no.4所示序列在第203位碱基后插入一个碱基。优选的,所述突变的mir396d的核酸序列如seq id no.7所示。15、在一个实施方式中,所述突变的mir396c缺失相对于seq id no.3所示序列的第151位碱基,所述突变的mir396d相对于seq id no.4所示序列在第203位碱基后插入一个碱基。优选的,所述突变的mir396c的核酸序列如seq id no.8所示,所述突变的mir396d的核酸序列如seq id no.7所示。16、在一个实施方式中,所述突变的mir396c缺失相对于seq id no.3所示序列的第146-156位碱基,所述突变的mir396d缺失相对于seq id no.4所示序列的第198-208位碱基。优选的,所述突变的mir396c的核酸序列如seq id no.9所示,所述突变的mir396d的核酸序列如seq id no.6所示。17、在一个实施方式中,所述亲本mir396为来源于玉米的野生型mir396。18、在一个实施方式中,所述玉米为玉米自交系昌7-2。19、在一个实施方式中,所述亲本mir396c来源于玉米,且与seq id no.3所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。20、在一个具体的实施方式中,所述亲本mir396c的序列如seq id no.3所示。21、在一个实施方式中,所述亲本mir396d来源于玉米,且与seq id no.4所示的序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%的序列同一性。22、在一个具体的实施方式中,所述亲本mir396d的序列如seq id no.4所示。23、另一方面,本发明提供了上述突变的mir396的用途,所述用途为改良玉米性状,或者在制备玉米性状改良的试剂或试剂盒中的用途,所述改良的性状选自下列(i)-(iv)的一种或多种:24、(i)增强抗病性;25、(ii)提高产量;26、(iii)增大果穗;27、(iv)增加粒重。28、在一个实施方式中,所述增强抗病性是指增强对青枯病和/或茎腐病的抗病性。29、在一个实施方式中,所述增强抗病性是指增强对镰刀菌、腐霉菌或炭疽菌的抗性。30、在一个实施方式中,所述增强抗病性是指含有突变的mir396的玉米比亲本玉米(含有野生型mir396)的抗病性至少增强了10%,优选增强了20%,优选增强了30%,优选增强了40%,优选增强了50%,优选增强了100%,优选增强了200%,优选增强了300%,优选增强了400%,优选增强了500%。31、在一个实施方式中,所述增强抗病性是指含有突变的mir396的玉米比亲本玉米(含有野生型mir396)的抗病等级提高至少一个等级,优选提高2个等级,优选提高3个等级,优选提高4个等级。32、在一个实施方式中,所述提高产量是指含有突变的mir396的玉米比亲本玉米(含有野生型mir396)的产量或单株产量或亩产量至少增加了5%,优选增加了10%,优选增加了15%,优选增加了20%,优选增加了21%,优选增加了25%,优选增加了30%,优选增加了40%,优选增加了50%,优选增加了60%,优选增加了100%。33、在一个实施方式中,所述增大果穗是指含有突变的mir396的玉米比亲本玉米(含有野生型mir396)的果穗至少增加了3%,优选增加了5%,优选增加了6%,优选增加了10%,优选增加了15%,优选增加了20%,优选增加了23%,优选增加了25%,优选增加了30%,优选增加了40%,优选增加了50%,优选增加了100%。34、在一个实施方式中,所述粒重增加是指含有突变的mir396的玉米比亲本玉米(含有野生型mir396)的单粒重或百粒重或千粒重至少增加了5%,优选增加了10%,优选增加了12%,优选增加了13%,优选增加了15%,优选增加了20%,优选增加了25%,优选增加了30%,优选增加了40%,优选增加了50%,优选增加了100%。35、另一方面,本发明提供了一种制备性状改良的玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米的方法,所述方法包括在玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米中引入所述突变的mir396步骤。36、在一个实施方式中,引入所述的突变的mir396包括将玉米的内源性的mir396进行突变从而引入所述突变的mir396的步骤。37、在一个实施方式中,引入突变的方法包括自然变异、物理诱变(如紫外线诱变、x射线或y射线诱变)、化学诱变(如亚硝酸、羟胺、ems、亚硝基胍等)、生物诱变(如病毒或细菌介导的诱变)、基因编辑。38、在一个实施方式中,通过基因编辑的方式在玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米中引入所述突变的mir396。39、在一个实施方式中,所述的方法包括将以下步骤:40、(1)在玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米中引入含有基因编辑工具的表达载体;41、(2)使基因编辑工具作用于玉米内源性mir396,并使其发生突变;42、(3)筛选突变的大玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米;43、(4)分离所述的基因编辑工具。44、在一个实施方式中,所述基因编辑工具包括crispr、talen和zfn。45、在一个实施方式中,所述基因编辑工具为cas酶。46、在一个具体的实施方式中,所述基因编辑为采用cas酶在玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米中进行基因编辑。47、在一种实施方式中,所述引入所述突变的mir396包括将所述突变的mir396在玉米细胞、或玉米种子、或玉米组织、或玉米部分、或玉米中进行表达的步骤。48、另一方面,本发明还提供了一种制备性状改良的玉米或者改良玉米性状的方法,所述方法包括步骤:将上述方法制备的植玉米细胞、或玉米种子、或玉米组织、或玉米部分再生为玉米植株,从而获得所述性状改良的玉米。49、另一方面,本发明还提供了一种对玉米进行基因编辑的方法,所述方法包括步骤:50、(a)利用cas酶和grna在玉米细胞、玉米种子、玉米组织或玉米部分中进行基因编辑,获得经基因编辑的玉米细胞、玉米种子、玉米组织或玉米部分;51、(b)将步骤(a)中的经基因编辑的玉米细胞、玉米种子、玉米组织或玉米部分再生成玉米植株;52、所述grna靶向玉米中的mir396。53、在一个实施方式中,所述cas酶为cas9或cas12i或cas12i突变蛋白(例如cas-sf01)。54、在一个实施方式中,所述cas-sf01的氨基酸序列如seq id no.1所示。55、在一个具体的实施方式中,所述cas酶连接有一个或多个nls序列。在一个实施方式中,所述nls序列连接至所述蛋白的n端和/或c端。56、在一个实施方式中,所述grna包括第一区段和第二区段;所述第一区段又称为“骨架区”、“蛋白质结合区段”、“蛋白质结合序列”、或者“同向重复(direct repeat)序列”;所述第二区段又称为“靶向核酸的靶向序列”或者“靶向核酸的靶向区段”,或者“靶向靶序列的引导序列”。57、所述grna的第一区段、“骨架区”、“蛋白质结合区段”、“蛋白质结合序列”、或者“同向重复序列”能够与本发明的cas酶相互作用,从而使ca酶和grna形成复合物。本发明grna经过靶向核酸的靶向序列的作用将其相互作用的cas酶蛋白引导至靶核酸内的特异性核苷酸序列。58、在一个实施方式中,所述grna包括与cas酶结合的同向重复序列以及与靶序列杂交的引导序列。59、本发明靶向核酸的靶向序列或靶向核酸的靶向区段包含与靶核酸中的序列互补的核苷酸序列。换言之,本发明靶向核酸的靶向序列或靶向核酸的靶向区段经过杂交(即,碱基配对)以序列特异性方式与靶核酸相互作用。因此,靶向核酸的靶向序列或靶向核酸的靶向区段可改变,或可被修饰以杂交靶核酸内的任何希望的序列。60、优选的,所述grna从5’至3’方向包含第一区段和第二区段。61、本发明中,所述第二区段还可以理解为与靶序列杂交的引导序列。62、在一个实施方式中,所述grna的引导序列如seq id no.2所示。63、在一个实施方式中,所述grna的同向重复序列为agagaaugugugcauagucacac。64、在其他的实施方式中,所述grna的同向重复序列在agagaaugugugcauagucacac的基础上,还可以具有碱基缺失、取代或添加,只要其能保证与cas酶的结合能力即可,例如,中国专利申请(cn113337502a)中记载的“agagaaugugugcauagucaacac”、65、“agagaaugugugcauagucuacac”、“agagaaugugugcauaguccacac”或“agagaaugugugcauagucgacac”。66、在一种实施方式中,所述编码所述cas酶的核酸序列和编码指导rna的核酸是人工合成的。67、在一个实施方式中,本发明的基因编辑的方法包括向玉米细胞、玉米种子、玉米组织或玉米部分或玉米中递送cas酶和grna的步骤。68、上述递送可采用本领域已知的任何方法进行递送。此类方法包括但不限于,转化、转染、电穿孔、脂转染、显微注射、声孔效应、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状转染、热激转染、核转染、磁转染、脂转染、穿刺转染、光学转染、试剂增强性核酸摄取、以及经由脂质体、免疫脂质体、病毒颗粒、载体、病毒载体、人工病毒体等的递送。69、在一些实施方式中,使用一种或多种aav载体、慢病毒载体、纳米颗粒或其组合递送cas酶和grna中的一种或多种组分。70、在一个实施方式中,通过农杆菌转化将cas酶和grna递送到玉米细胞、玉米种子、玉米组织或玉米部分或玉米中。71、上述grna在玉米细胞中靶向mir396,并且引导cas蛋白到达所述基因组座位部位,对靶序列进行修饰、编辑或切割,由此该mir396发生突变。72、另一方面,本发明还提供了一种制备杂交玉米的方法,所述方法包括利用上述方法得到的玉米与其他的玉米进行杂交从而制备杂交玉米的步骤。73、术语定义74、除非另有定义,否则本文所用的技术和科学术语具有与所属领域的普通技术人员之一通常理解的相同的含义。75、术语“多核苷酸”、“核苷酸序列”、“核酸序列”、“核酸分子”和“核酸”可以互换使用,包括dna、rna或者其杂交体,可以是双链或单链的。76、术语“蛋白”、“多肽”和“肽”在本发明中可以互换使用,指的是氨基酸残基聚合物,包括其中一个或多个氨基酸残基是天然氨基酸残基的化学类似物的聚合物。本发明的蛋白和多肽可以重组产生,也可以通过化学合成。77、术语“氨基酸”是指含有氨基的羧酸。生物体内的各种蛋白质是由20种基本氨基酸构成的。78、术语“编码”是指多核苷酸中特定核苷酸序列的固有特性,例如基因,cdna或mrna,作为在具有限定的核苷酸序列(即rrna,trna和mrna)或限定的氨基酸序列及其产生的生物学特性的生物学过程中合成其它聚合物和大分子的模板。因此,如果对应于该基因的mrna的转录和翻译在细胞或其它生物系统中产生蛋白质,则该基因编码该蛋白质。79、如本文中所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个dna分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,dna序列ctgact和caggtt共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如align程序(dnastar,inc.)方便地进行的needleman等人(1970)j.mol.biol.48:443-453的方法来实现。还可使用已整合入align程序(版本2.0)的e.meyers和w.miller(comput.applbiosci.,4:11-17(1988))的算法,使用pam120权重残基表(weight residue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入gcg软件包(可在www.gcg.com上获得)的gap程序中的needleman和wunsch(j moibiol.48:444-453(1970))算法,使用blossum 62矩阵或pam250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。80、术语“调控元件”又称“调节元件”,如本文中所使用的,旨在包括启动子、终止子序列、前导序列、多聚腺苷酸化序列、信号肽编码区、标记基因、增强子、内部核糖体进入位点(ires)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚u序列),其详细描述可参考戈德尔(goeddel),《基因表达技术:酶学方法》(gene expressiontechnology:methods in enzymology)185,学术出版社(academic press),圣地亚哥(sandiego),加利福尼亚州(1990)。在某些情况下,调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。在某些情况下,调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在某些情况下,术语“调控元件”涵盖的是增强子元件,如wpre;cmv增强子;在htlv-i的ltr中的r-u5’片段((mol.cell.biol.,第8(1)卷,第466-472页,1988);sv40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(proc.natl.acad.sci.usa.,第78(3)卷,第1527-31页,1981)。81、如本文中所使用的,术语“启动子”具有本领域技术人员公知的含义,其是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型(constitutive)启动子是这样的核苷酸序列:当其与编码或者限定基因产物的多核苷酸可操作地相连时,在细胞的大多数或者所有生理条件下,其导致细胞中基因产物的产生。诱导型启动子是这样的核苷酸序列,当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当对应于所述启动子的诱导物在细胞中存在时,其导致所述基因产物在细胞内产生。组织特异性启动子是这样的核苷酸序列:当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当细胞是该启动子对应的组织类型的细胞时,其才导致在细胞中产生基因产物。82、术语“核定位信号”或“核定位序列”(nls)是对蛋白质“加标签”以通过核转运导入细胞核的氨基酸序列,即,具有nls的蛋白质被转运至细胞核。典型地,nls包含暴露在蛋白质表面的带正电荷的lys或arg残基。示例性核定位序列包括但不限于来自以下的nls:sv40大t抗原,egl-13,c-myc以及tus蛋白。83、如本文中所使用的,术语“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调控元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。84、野生型85、如本文中所使用的,术语“野生型”具有本领域技术人员通常理解的含义,其表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征,其可从自然中的来源分离并且没有被人为有意地修饰。86、载体87、术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如,crispr转录物,如核酸转录物、蛋白质、或酶)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。88、一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。89、另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。90、其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。91、宿主细胞92、如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如微生物细胞、真菌细胞、动物细胞和植物细胞的真核细胞。93、本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。94、动物95、例如哺乳动物,例如牛科动物、马科动物、羊科动物、猪科动物、犬科动物、猫科动物、兔科动物、啮齿类动物(例如,小鼠或大鼠)、非人灵长类动物(例如,猕猴或食蟹猴)或人。在某些实施方式中,所述受试者(例如人)患有病症(例如,疾病相关基因缺陷所导致的病症)。96、植物97、术语“植物”应理解为能够进行光合作用的任何分化的多细胞生物,在包括处于任何成熟或发育阶段的作物植物,特别是单子叶或双子叶植物,蔬菜作物,包括洋蓟、球茎甘蓝、芝麻菜、韭葱、芦笋、莴苣(例如,结球莴苣、叶莴苣、长叶莴苣)、小白菜(bok choy)、黄肉芋、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如,球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、洋白菜(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲防风草、菊苣、胡椒、马铃薯、葫芦(例如,西葫芦、黄瓜、小西葫芦、倭瓜、南瓜)、萝卜、干球洋葱、芜菁甘蓝、紫茄子(也称为茄子)、婆罗门参、苣菜、青葱、苦苣、大蒜、菠菜、绿洋葱、倭瓜、绿叶菜类(greens)、甜菜(糖甜菜和饲料甜菜)、甘薯、唐莴苣、山葵、西红柿、芜菁、以及香辛料;水果和/或蔓生作物,如苹果、杏、樱桃、油桃、桃、梨、李子、西梅、樱桃、榅桲、杏仁、栗子、榛子、山核桃、开心果、胡桃、柑橘、蓝莓、博伊增莓(boysenberry)、小红莓、穗醋栗、罗甘莓、树莓、草莓、黑莓、葡萄、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果、梨果、瓜、芒果、木瓜、以及荔枝;大田作物,如三叶草、苜蓿、月见草、白芒花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、啤酒花、荷荷芭、花生、稻、红花、小粒谷类作物(大麦、燕麦、黑麦、小麦等)、高粱、烟草、木棉、豆科植物(豆类、小扁豆、豌豆、大豆)、含油植物(油菜、芥菜、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生)、拟南芥属、纤维植物(棉花、亚麻、黄麻)、樟科(肉桂、莰酮)、或一种植物如咖啡、甘蔗、茶、以及天然橡胶植物;和/或花坛植物,如开花植物、仙人掌、肉质植物和/或观赏植物,以及树如森林(阔叶树和常绿树,如针叶树)、果树、观赏树、以及结坚果的树(nut-bearing tree)、以及灌木和其他苗木。98、术语“植物组织”或“植物部分”包括植物细胞、原生质体、植物组织培养物、植物愈伤组织、植物块以及植物胚、花粉、胚珠、种子、叶、茎、花、枝、幼苗、果实、核、穗、根、根尖、花药等。99、术语“植物细胞”应理解为来自或发现于植物的任何细胞,其能够形成例如:未分化组织如愈伤组织,分化组织如胚胎,植物的组成部分,植物或种子。100、基因编辑101、术语“基因编辑”技术包括crispr技术、talen技术、zfn技术。crispr技术是指成簇、规律间隔的短回文重复序列(clustered regularly interspaced short palindromicrepeats),其来自微生物的免疫系统。其中基因编辑工具包括guiderna、cas蛋白(如cas9、cpf1、cas12b、cas12i等)。talen技术中所指的基因编辑工具是可以切割特定dna序列的限制酶,其包括一个tal效应子dna结合结构域和一个dna切割结构域。zfn技术中所指的基因编辑工具也是可以切割特定dna序列的限制酶,其包括一个锌指dna结合结构域与一个dna切割结构域。本领域技术人员熟知,将编码基因编辑工具的核苷酸及其他调控元件构建于适宜的载体中,再转化细胞,可以实现对细胞内基因组的编辑,所述编辑的类型包括基因敲除、插入、碱基编辑。102、crispr系统103、如本文中所使用的,术语“规律成簇的间隔短回文重复(crispr)-crispr-相关(cas)(crispr-cas)系统”或“crispr系统”可互换地使用并且具有本领域技术人员通常理解的含义,其通常包含与crispr相关(“cas”)基因的表达有关的转录产物或其他元件,或者能够指导所述cas基因活性的转录产物或其他元件。104、cas蛋白105、cas蛋白、cas酶、或crispr相关蛋白是指适用于crispr(规律成簇间隔短回文重复序列clustered regularly interspaced short palindromic repeats)系统的核酸酶。优选地,所述cas蛋白为crispr酶,其种类包括但并不限于:cas9蛋白、cas12蛋白、cas13蛋白、cas14蛋白、csm1蛋白、fdk1蛋白。所述的cas蛋白可以根据其来源不同而具有不同的结构,如来源于酿脓链球菌(streptococcus pyogenes)的spcas9、来源于葡萄球菌(staphylococcus aureus)的sacas9;还可以根据结构特征(如结构域)进行下位分类,如cas12家族包括cas12a(又名cpf1)、cas12b、cas12c、cas12i等。所述的cas蛋白可以具有双链或单链或无切割活性。本发明所述的cas蛋白可以是野生型或其突变体,所述的突变体的突变类型包括氨基酸的替换、取代或缺失,所述的突变体可以改变也可以不改变cas蛋白的酶切活性。本领域技术人员所知,现有技术中已报到的多种具有核酸切割活性的cas蛋白,该公知蛋白或其改造后的变体均可以实现本发明的功能,本文通过引用方式将其纳入保护范围。106、本领域熟知,可以从蛋白质的n和/或c末端改变(置换、删除、截短或插入)一或多个氨基酸残基而仍保留其功能活性。因此,从cas蛋白的n和/或c末端改变了一或多个氨基酸残基、同时保留了其所需功能活性的蛋白,也在本发明的范围内。这些改变可以包括通过现代分子方法例如pcr而引入的改变,所述方法包括借助于在pcr扩增中使用的寡核苷酸之中包含氨基酸编码序列而改变或延长蛋白质编码序列的pcr扩增。107、应认识到,蛋白质可以以各种方式进行改变,包括氨基酸置换、删除、截短和插入,用于此类操作的方法是本领域通常已知的。例如,可以通过对dna的突变来制备上述蛋白的氨基酸序列变体。还可以通过其他诱变形式和/或通过定向进化来完成,例如,使用已知的诱变、重组和/或改组(shuffling)方法,结合相关的筛选方法,来进行单个或多个氨基酸取代、缺失和/或插入。108、本领域技术人员能够理解,本发明cas蛋白中的这些微小氨基酸变化可以出现(例如天然存在的突变)或者产生(例如使用r-dna技术)而不损失蛋白质功能或活性。如果这些突变出现在蛋白的催化结构域、活性位点或其它功能结构域中,则多肽的性质可改变,但多肽可保持其活性。如果存在的突变不接近催化结构域、活性位点或其它功能结构域中,则可预期较小影响。109、本领域技术人员可以根据本领域已知的方法,例如定位诱变或蛋白进化或生物信息系的分析,来鉴定本发明cas突变蛋白的必需氨基酸。蛋白的催化结构域、活性位点或其它功能结构域也能够通过结构的物理分析而确定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,结合推定的关键位点氨基酸的突变来确定。110、本发明中,氨基酸残基可以用单字母表示,也可以用三字母表示,例如:丙氨酸(ala,a),缬氨酸(val,v),甘氨酸(gly,g),亮氨酸(leu,l),谷酰胺酸(gln,q),苯丙氨酸(phe,f),色氨酸(trp,w),酪氨酸(tyr,y),天冬氨酸(asp,d),天冬酰胺(asn,n),谷氨酸(glu,e),赖氨酸(lys,k),甲硫氨酸(met,m),丝氨酸(ser,s),苏氨酸(thr,t),半胱氨酸(cys,c),脯氨酸(pro,p),异亮氨酸(ile,i),组氨酸(his,h),精氨酸(arg,r)。111、所述cas蛋白的生物学功能包括但不限于,与指导rna结合的活性、核酸内切酶活性、在指导rna引导下与靶序列特定位点结合并切割的活性,包括但不限于cis切割活性和trans切割活性。112、指导rna(guiderna,grna)113、如本文中所使用的,术语“指导rna(guide rna,grna)”、“成熟crrna”、“指导序列”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,指导rna可以包含同向重复序列(direct repeat)和引导序列,或者基本上由或由同向重复序列和引导序列组成。114、在某些情况下,引导序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导crispr/cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中,当最佳比对时,指导序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。115、靶序列116、“靶序列”是指被grna中的引导序列所靶向的多核苷酸,例如与该引导序列具有互补性的序列,其中靶序列与引导序列之间的杂交将促进crispr/cas复合物(包括cas蛋白和grna)的形成。完全互补性不是必需的,只要存在足够互补性以引起杂交并且促进一种crispr/cas复合物的形成即可。117、靶序列可以包含任何多核苷酸,如dna或rna。在某些情况下,所述靶序列位于细胞内或细胞外。在某些情况下,所述靶序列位于细胞的细胞核或细胞质中。在某些情况下,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一个实施方式中,所述编辑模板为外源核酸。在一个实施方式中,该重组是同源重组。118、在本发明中,“靶序列”或“靶多核苷酸”或“靶核酸”可以是对细胞(例如,真核细胞)而言任何内源或外源的多核苷酸。例如,该靶多核苷酸可以是一种存在于真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用dna)。在某些情况下,该靶序列应该与原间隔序列临近基序(pam)相关。119、mir396120、mir396是一类高度保守的内源性的含有20–24个核苷酸长度的非编码单链小rna分子。植物mir396家族,在长时间的生物进化中,序列变化极小,具有高度保守性。mir396通过碱基配对结合靶基因生长调控因子(growth-regulating factors,grfs)的mrna,调节其表达来影响植物的各个器官的生长发育。121、在一个实施方式中,玉米mir396c的序列如seq id no.3所示;玉米mir396d的序列如seq id no.4所示。122、本发明涉及的序列如下:123、
序列号(seq id no.)
序列描述
1
cas-sf01的氨基酸序列
2
grna的引导序列
3
野生型mir396c的核酸序列
4
野生型mir396d的核酸序列
5
突变的mir396c的核酸序列1
6
突变的mir396d的核酸序列1
7
突变的mir396d的核酸序列2
8
突变的mir396c的核酸序列2
9
突变的mir396c的核酸序列3
124、本发明的主要优点:125、本发明通过基因编辑技术定向编辑玉米mir396,发现mir396c和/或mir396d突变后,玉米的抗病性增强、产量提高。当前第1页12当前第1页12