文中术语"稀切核酸内切酶"指天然或工程改造的蛋白质,其具有针对含有长度 为约12_40bp(如长度为14_40bp)的识别序列(目标序列)的核酸序列的核酸内切酶活 性。典型的稀切核酸内切酶在其识别位点内部产生切割,形成具有3' OH或5'OH突出端的 4nt交错切口。这些稀切核酸内切酶可以是大范围核酸酶,如野生型寻靶核酸内切酶或其 变体蛋白质,更具体地属于十二肽家族(LAGLIDADG(SEQ ID NO:79);参见W02004/067736) 或可以是来自关联DNA结合结构域与具有切割活性的催化结构域的融合蛋白。TAL效应 子核酸内切酶和锌指核酸酶(ZFN)是DNA结合结构域与核酸内切酶FokI的催化结构域 融合的示例。自定义的TAL效应子核酸内切酶可以商品名TALEN?(法国巴黎的赛勒柯蒂 斯公司(Cellectis))购得。关于稀切核酸内切酶的综述,参见Baker, Nature Methods 9:23-26, 2012。
[0038]"诱变"在本文中指将突变导入所选DNA序列的过程。例如,在本文所述方法中,诱 变经由靶向植物细胞中所选DNA序列的TAL效应子核酸内切酶生成的双链DNA断裂发生。 这类诱变导致"TAL效应子核酸内切酶诱导的突变"并降低靶基因的表达。诱变后,可使用 已知技术(例如根据自花受粉后的常规生长步骤种植种子)由经处理的细胞再生植物。
[0039] 在一些情况下,核酸可含有与代表性XylT和FucT核苷酸序列具有约75%序列相 同性的核苷酸序列。例如,核苷酸序列可与代表性、天然产生的XylT或FucT核苷酸序列具 有至少75 %、至少80 %、至少85 %、至少90 %、至少91 %、至少92 %、至少93 %、至少94 %、 至少95%、至少96%、至少97%、至少98%或至少99%序列相同性。
[0040] 如下所述测定特定核酸或氨基酸序列与特定序列识别号所指示的序列之间的序 列相同性百分比。首先,使用来自含有BLASTN版本2. 0. 14和BLASTP版本2. 0. 14的BLASTZ 独立版本的BLAST 2序列(B12seq)程序比较核酸或氨基酸序列与特定序列识别号所指示 的序列。该BLASTZ独立版本可在fr. com/blast或ncbi.nlm. nih. gov在线获取。解释如何 使用B12seq程序的说明书可参见BLASTZ附带的自述文件。B12seq使用BLASTN或BLASTP 算法在两种序列之间进行比较。BLASTN用于比较核酸序列,而BLASTP用于比较氨基酸序 列。为比较两种核酸序列,如下所述设置选项设为含有待比较的第一核酸序列的文件 (如C:\seql. txt) ;_j设为含有待比较的第二核酸序列的文件(如C:\seq2. txt) ;_p设 为blastn ;_〇设为任何需要的文件名(如C: \output. txt) ;_q设为-1 ;_r设为2 ;且所有 其他选项都设为其默认设置。例如,以下命令可用于生成含有两种序列之间比较的输出文 件:C: \B12seq_i c:\seql.txt_j c:\seq2.txt_p blastn-o c:\output.txt_q-l_r 2〇 为 比较两种氨基酸序列,如下所述设置B12seq的选项:_i设为含有待比较的第一氨基酸序 列的文件(如C:\seql. txt) ;_j设为含有待比较的第二氨基酸序列的文件(如C:\seq2. txt) ;_p设为blastp;_o设为任何需要的文件名(如C:\output. txt);且所有其他选项都 设为其默认设置。例如,以下命令可用于生成含有两种氨基酸序列之间比较的输出文件: C:\B12seq_i c:\seql.txt_j c:\seq2.txt_p blastp-〇 c:\output. txt。如果两种比较的 序列具有同源性,则指定的输出文件会以经比对序列的形式显示那些同源区域。如果比较 的两种序列不具有同源性,则指定的输出文件不会显示经比对的序列。
[0041] -旦进行比对,即通过对两种序列中存在相同核苷酸或氨基酸的位置的数目进行 计数来测定匹配的数目。将匹配的数目除以鉴定的序列(如SEQ ID NO: 1)中所列序列长 度或连接的长度(如来自鉴定的序列中所列序列的1〇〇个连续核苷酸或氨基酸残基),随后 将结果值乘以100,从而测定序列相同性百分比。例如,与SEQ ID N0:1中所列序列比对时 具有80个匹配的核酸序列与SEQ ID NO: 1中所列序列具有88. 9%相同性(即80 + 90x100 =88. 9)。应注意序列相同性百分比值四舍五入至小数点后第一位。例如,75. 11、75. 12、 75. 13和75. 14向下四舍五入至75. 1,而75. 15、75. 16、75. 17、75. 18和75. 19向上四舍五 入至75. 2。还应注意,长度值始终是整数。
[0042] 可如他处所述进行用于选择内源性目标序列和生成靶向这类序列的TAL效应 子核酸内切酶的方法。参见例如,PCT公开号W0 2011/072246,其通过引用全文纳入 本文。TAL效应子发现于黄单胞菌属(Xanthomonas)中的植物病原性细菌中。这些蛋 白质通过结合宿主DNA并激活效应器特异性宿主基因在疾病或触发防卫方面起重要作 用(参见例如,Gu 等,Nature 435:1122-1125, 2005 ;Yang 等,Proc. Natl. Acad. Sci. USA 103:10503-10508, 2006 ;Kay 等,Science 318:648-651,2007 ;Sugio 等,?1'〇。.恥七1.六。已(1. Sci. USA 104:10720-10725,2007 ;和 R6mer 等,Science 318:645-648,2007)。特异性取决 于效应子-可变不完善数目(effector-variable number of imperfect),通常是34个氨 基酸重复(Schornack 等,J.Plant Physiol. 163:256-272,2006;和 TO 2011/072246)。多 态性主要发生在重复位置12和13,本文将其称为重复可变双残基(RVD)。
[0043] TAL效应子的RVD以直接、线性形式对应于其靶位点的核苷酸,一种RVD对应于一 种核苷酸,有一些简并性且没有明显的环境依赖性。该蛋白质-DNA识别机制能针对新的靶 标特异性TAL效应子进行靶位点预测,以及靶位点选择和对与所选位点具有结合特异性的 新TAL效应子进行工程改造。
[0044] TAL效应子DNA结合结构域可与其他序列(如核酸内切酶序列)融合,生成靶向 特定、经选择的DNA序列的嵌合核酸内切酶并导致在被靶向的序列处或附近的后续DNA切 害J。DNA中的这类切割(即双链断裂)可通过例如NHEJ或同源重组在野生型DNA序列中诱 导突变。在一些情况下,TAL效应子核酸内切酶可用于促进复杂基因组中的定点诱变,高度 准确且高效地敲除或改变基因功能。如下文实施例所述,靶向本赛姆氏烟草XylT和FucT 等位基因中每一个的TAL效应子核酸内切酶可用于诱变内源性基因,生成不具有这些基因 的可检测表达的植物。可使用一些内切核酸酶(如FokI)以二聚物形式起作用的现象来提 高TAL效应子核酸内切酶的靶标特异性。例如,在一些情况下,可使用靶向不同DNA序列的 一对TAL效应子核酸内切酶单体(如图1和2中所示带下划线的靶序列)。当两个TAL效 应子核酸内切酶识别位点紧邻时,如图1和2所示,无活性的单体可聚集在一起以生成切割 DNA的功能性酶。通过需要DNA结合来激活核酸酶,可建立高度位点特异性的限制性酶。
[0045] 术语"表达"在本文中指转录特定核酸序列以生成正义或反义mRNA,和/或翻译正 义RNA分子以生成多肽(如治疗性蛋白质),伴随或不伴随后续的翻译后事件。
[0046] 对于植物或植物细胞中的基因或多肽,"降低表达"包括抑制、中断、敲除或敲减基 因或多肽,使得基因的转录和/或所编码多肽的翻译与相应野生型植物或植物细胞相比降 低。可使用例如以下方法测量表达水平:反转录聚合酶链式反应(RT_PCR)、Northern印迹、 点印迹杂交、原位杂交、核连缀(nuclear run-on)和/或核失控(nuclear run-off)、RNA 酶保护或免疫和酶方法(如ELISA、放射性免疫试验和western印迹)。
[0047] 使用TAL效应子核酸内切酶来生成在内源性基因中具有突变的植物、植物细胞或 植物部分的方法包括,例如,本文实施例中所述的那些。例如,可将编码靶向所选XylT或 FucT序列(如图1所示的XylT序列或图2所示的FucT序列)的TAL效应子核酸内切酶的核 酸转化至植物细胞(如原生质体)中,该核酸在其中表达。随后可以例如如上文所述通过基 于核酸的试验或基于蛋白质的试验检测表达水平,或者使用基于核酸的试验(例如PCR和 DNA测序,或PCR之后的I7E1试验;Mussolino等,NucleicAcidsRes. 39:9283-9293, 2011) 检测基因组基因座处的突变,从而对细胞进行后续分析以确定是否已将突变导入靶位点。
[0048] 可以筛选诱变的群体或该群体的后代中由突变导致的所需特性(例如缺失木糖 基转移酶和岩藻糖基转移酶活性或木糖基转移酶和岩藻糖基转移酶活性降低)。或者,可 以筛选诱变的群体或该群体的后代的XylT或FucT基因中的突变。例如,可以评价札植物 的后代M2代中是否存在XylT或FucT基因中的突变。"群体"是具有共同的基因池的个体 的任何组。如本文所使用,"指与TAL效应子核酸酶接触的植物细胞(和由此长成的植 物),而"Mi"指由凡植物自花授粉产生的种子和由该种子长成的植物。"M 2"是自花授粉的 Mi植物的子代(种子和植物),"M 3"是自花授粉的M2植物的子代,且"M 4"是自花授粉的M3 植物的子代。"M5"是自花授粉的仏植物的子代。"M6"、"M7"等各自是前一代自花授粉植物 的子代。术语"自交"在本文中指自花授粉。
[0049] -种或多种&烟草植物可获自单个、诱变的(MJ植物细胞(和由其长成的植物), 且至少一种所述植物可以被鉴定为含有XylT或FucT基因中的突变。乂烟草植物可以是 XylT和/或FucT基因座处突变体等位基因的杂合子,并由于存在野生型等位基因而表现出 木糖基转移酶或岩藻糖基转移酶活性。或者,1 :烟草植物可以在XylT和/或FucT基因座 处具有突变体等位基因并表现出缺失木糖基转移酶或岩藻糖基转移酶活性的表型。这类植 物可以是杂合子并且由于诸如显性负抑制(dominant negative suppression)的现象而缺 失木糖基转移酶或岩藻糖基转移酶活性(即便存在野生型等位基因也是如此),或者可以 由于XylT或FucT基因座处全部两个等位基因中的独立诱导的突变而成为纯合子。
[0050] 携带突变的XylT和FucT等位基因的烟草植物可用于植物育种项目以创建新型且 有用的株、品种和杂交体。因此,在一些实施方式中,将在XylT基因中含有至少一个突变且 在FucT基因中含有至少一个突变的札1 213或后代烟草植物与第二烟草植物杂交,并鉴定 其中存在XylT和FucT基因突变的杂交后代。应理解,该第二烟草植物可以是上文所述物 种和品种之一。还应理解,该第二烟草植物可含有与其杂交的植物相同的XylT和FucT突 变,不同的XylT和FucT突变或者在XylT和/或FucT基因座处为野生型。