[0051] 可通过已知方法进行育种。DNA指纹图谱、SNP或类似技术可用于标志物辅助选择 (MAS)育种项目以将突变体XylT和FucT等位基因转移或培育至其他烟草内。例如,培育者 可从含有突变体等位基因的基因型与农学上需要的基因型的杂交中创建分离群。可使用由 XylT和FucT序列或其片段开发的标志物筛选&或回交代的植物。经鉴定为具有突变体等 位基因的植物可回交或自花授粉以创建待筛选的第二群体。取决于预期的遗传模式或使用 的MAS技术,需要在各回交循环前对所选植物进行自花授粉以辅助鉴定所需单个植物。可 重复回交或其他育种过程直至恢复所需回归亲本的表型。
[0052] 成功的杂交生成可育且能够在需要时与亲本之一回交的Fi植物。在一些实施方式 中,筛选匕代中植物群体的XylT和FucT基因表达,例如由于根据标准方法不存在XylT和 FucT基因而将植物鉴定为无法表达XylT和FucT,例如使用PCR方法,其中使用基于本文所 述XylT和FucT的核苷酸序列信息的引物。随后将选定的植物与亲本之一回交并使第一回 交(BQ代植物自花授粉以生成BC^群体,再次筛选其中变体XylT和FucT基因表达(例 如沉默类型的XylT和FucT基因)。重复回交、自花授粉和筛选过程,例如重复至少4次直 至最终的筛选生成可育且与回归亲本合理类似的植物。需要时,该植物可以自花授粉并且 可随后再次筛选后代以确认植物缺失XylT和FucT基因表达。可任选地对所选植物进行细 胞遗传分析以确认染色体互补和染色体配对关系。可使用标准方法生成培育者的所选植物 的种子,包括例如田间试验、缺失XylT和FucT的沉默状态和/或分析干燥的叶片以测定木 糖基转移酶和岩藻糖基转移酶活性的水平。
[0053] 在将由第一、突变体烟草亲本与第二、野生型烟草亲本之间杂交得到的最初的Fi 杂交体杂交或回交至突变体烟草亲本的情况下,回交的后代可以自花授粉以建立BC^代, 对其筛选突变体XylT和FucT等位基因。
[0054] 使用本文所述突变体烟草植物进行的植物育种项目可获得新颖且有用的株系、杂 交体和品种。本文所用术语"品种"指共有恒定特性的植物群体,该特性将其与相同种的其 他植物区分开来。品种通常(但不是始终)在市场上有售。虽然具有一种或多种不同特 征,但可通过品种内个体之间非常小的总体差异对该品种进行表征。"纯系"品种可通过若 干代自花授粉和选择来创建,或使用组织或细胞培养技术由单一亲本无性繁殖。某一品种 可基本来源于另一株系或品种。根据《保护植物新品种国际公约》(1961年12月2日,于 1972年11月10日、1978年10月23日和1991年3月19日在日内瓦修订)的定义,某一 品种"基本来源"于某一初始品种的前提是:a)其主要来源于该初始品种,或者来源于主要 源自该初始品种的品种,同时保留该初始品种的基因型或基因型组合所导致的基本特性的 表达;b)其与该初始品种明显不同;以及c)除了衍生作用导致的差异外,其在该初始品种 的基因型或基因型组合所导致的基本特性的表达方面与该初始品种一致。基本衍生的品种 可通过例如选择天然或诱导的突变体、体细胞克隆变体、来自初始品种、回交或转化的植物 的变体个体来获得。不同于某一品种的某一"株系"通常指非商业使用(例如在植物研宄 中使用)的一组植物。某一株系通常显示一种或多种感兴趣特征在个体之间的微小总体差 异,但对于其他特征而言个体之间可能存在一些差异。
[0055] 可通过以下方法生成杂交体烟草品种:阻止第一品种的雌性亲本植物(即种子亲 本)的自花授粉,允许来自第二品种的雄性亲本植物的花粉使该雌性亲本植物受精,并允 许匕杂交体种子在该雌性植物上形成。可通过在花发育早期阶段对花进行去雄来阻止雌 性植物的自花授粉。或者,可使用雄性不育的方式避免在雌性亲本植物上形成花粉。例如, 可通过胞质雄性不育(CMS)或转基因雄性不育(其中转基因抑制小孢子发生和/或花粉形 成)或自交不亲和来产生雄性不育。含有CMS的雌性亲本植物特别有用。在雌性亲本植物 是CMS的实施方式中,从雄性能育植物中收获花粉并人工施涂在CMS雌性亲本植物的柱头 上,随后收获得到的匕种子。
[0056] 本文所述品种和株系可用于形成单交烟草匕杂交体。在这类实施方式中,可以 基本均匀间隔群体的形式种植亲本品种的植物以促进从雄性亲本植物至雌性亲本植物的 天然交叉授粉。通过常规方法选择性地收获雌性亲本植物上形成的匕种子。也可整体 种植两种亲本植物品种并收获通过自花授粉产生的雄性亲本上形成的种子和雌性亲本上 形成的Fi杂交种子的掺混物。或者,可进行三方杂交(three-way crosses),其中单交Fi 杂交体用作雌性亲本并与一种不同的雄性亲本杂交。作为另一种选择,可创建双重杂交 (double-cross)的杂交体,其中使两种不同单交的Fi后代相互杂交。自交不亲和性可特别 有利于阻止在形成双重交杂的杂交体时雌性亲本的自花授粉。
[0057] 本发明还提供了生成多肽(如治疗性糖蛋白)的方法。在一些情况下,本文提供 的植物、细胞、植物部分、种子和后代可含有编码异源多肽(如重组多肽)的核酸分子。在 一些情况下,本文提供的方法可包括提供在多个内源性XylT和FucT等位基因(例如在两 个或更多个内源性XylT等位基因中和两个或更多个内源性FucT等位基因中)的每一个中 都具有TAL效应子内切核酸酶诱导的突变的烟草植物、植物细胞或植物部分,其中该植物、 植物细胞或植物部分还含有编码异源多肽(如重组多肽)的核酸。在一些情况下,本文提 供的方法可包括提供在一个或多个内源性XylT和FucT等位基因中(例如在一个或多个内 源性XylT等位基因中和一个或多个内源性FucT等位基因中)具有TAL效应子内切核酸酶 诱导的突变的烟草植物、植物细胞或植物部分,其中该植物、植物细胞或植物部分还含有编 码异源多肽(如重组多肽)的核酸。异源多肽的编码序列可被可操作地连接至植物可表达 的启动子,且还可被连接至涉及转录终止和聚腺苷酸化的序列。在一些情况下,该方法还可 包括使植物或植物细胞在足以生成多肽的条件下(例如合适的温度、湿度、明/暗、气流和 营养条件,在温室中和/或在水性条件下)保持足以生成多肽的时间(例如6至12小时、 12至24小时、24至48小时、48小时至7天、7天至30天,或超过30天)。在一些情况下, 用于生成多肽的方法还可包括从植物或植物细胞分离表达的多肽。用于分离这类多肽的技 术可包括例如常规技术,如提取、沉淀、色谱、亲和色谱和电泳。
[0058] "植物可表达启动子"是能够在植物细胞中控制(起始)转录的DNA序列。其包括 任何植物来源的启动子以及能够在植物细胞中指导转录的任何非植物来源的启动子[例 如,病毒或细菌来源的启动子(如CaMV35S启动子)、T-DNA基因启动子、组织特异性或器官 特异性启动子(如种子特异性启动子)、器官特异性启动子(如茎、叶、根或叶肉特异性启动 子)]。
[0059] 在一些情况下,本文提供的烟草植物、植物细胞、植物部分、种子或后代可含有编 码异源多肽的核酸。"异源多肽"是:不在植物或植物细胞中天然产生的多肽。这与同源多 肽相反,其是由植物或植物细胞天然表达的多肽。经历翻译后N-糖基化的异源和同源多肽 在本文中分别称作异源或同源糖蛋白。
[0060] 可使用本文所述植物和方法生成的用于给予人或动物的异源多肽的示例包括但 不限于:细胞因子、细胞因子受体、生长因子、生长因子受体、生长激素、胰岛素、胰岛素原、 红细胞生成素、集落刺激因子、白介素、干扰素、肿瘤坏死因子、肿瘤坏死因子受体、促血小 板生成素、凝血酶、利钠肽、凝血因子、抗凝血因子、组织纤溶酶原激活物、尿激酶、卵泡刺激 素、黄体化激素、降钙素、CD蛋白、CTLA蛋白、T细胞和B细胞受体蛋白、骨形态发生蛋白、神 经营养因子、类风湿因子、RANTES、白蛋白、松弛素、巨噬细胞抑制蛋白、病毒蛋白质或抗原、 表面膜蛋白、酶、调节蛋白、免疫调节蛋白、寻靶受体、转运蛋白、超氧化物歧化酶、G-蛋白偶 联受体蛋白、神经调节蛋白、抗原(例如细菌或病毒抗原)和抗体或其片段。在一些情况下, 植物生成的多肽可用作疫苗。
[0061]"抗体"包括抗体类型IgD、IgG、IgA、IgM、IgE以及重组抗体(如单链抗体、嵌合 和人源化抗体以及多特异性抗体)。术语"抗体"还指前述所有物质的片段和衍生物,且还 可包括保留特异性结合表位能力的其任何修饰或衍生的变体。抗体包括单克隆抗体、多克 隆抗体、人源化或嵌合抗体、骆蛇科动物化抗体(camelized antibody)、骆蛇科动物抗体 (camelid antibody)、单链抗体(scFv)、Fab 片段、F(ab')2片段、二硫键连接的 Fvs(sdFv) 片段、抗独特型抗体、胞内抗体(intra-body)、合成的抗体和上述任一种的表位结合片段。 术语"抗体"还指包含相对于免疫球蛋白Fc区的区域的融合蛋白。
[0062] 以下实施例进一步描述了本发明,这些实施例并不限制权利要求书所述的本发明 范围。 实施例
[0063] 实施例1 -工稈改诰序列特异件核酸酶以诱夺FucT和XvlT基闵家族
[0064] 在本赛姆氏烟草中,在两种FucT基因(FucTl和FucT2)和两种XylT基因(XylTl 和XylT2)中寻求突变。由于各基因具有两个等位基因,这些基因的失活需要在八个靶位点 导入突变。
[0065] 为使本赛姆氏烟草中XylT基因家族的成员完全失活或敲除,设计了序列特异性 核酸酶,其靶向起始密码子附近的蛋白质编码区。XylTl和XylT2基因的最初90-bp编码 序列相同(图1)。使用特异性鉴定TAL效应子核酸内切酶识别位点的软件(如TALE-NT 2.0(Doyle 等,Nucleic Acids Res. 40:W117-122, 2012))设计了四对 TAL 效应子核酸内 切酶对,以在最初的90bp内靶向XylT基因家族。XylT基因的TAL效应子核酸内切酶 识别位点在图1中带下划线并列于表1。使用与他处所述的那些方法类似的方法合成 TAL 效应子核酸内切酶(Cermak 等,Nucleic Acids Res. 39:e82, 2011 ;1^7〇11等,似1:. Biotechnol. 30:460-465, 2012 ;和 Zhang 等,Nat. Biotechnol. 29:149-153, 2011) 〇
[0066] FucTl和FucT2基因的最初130-bp编码序列保守但不相同(图2)。使用与上文 所述策略类似的策略工程改造靶向FucT基因家族的TAL效应子核酸内切酶,但因为FucT 基因序列比XylTl和XylT2差异更大,在全部四个TAL效应子核酸内切酶识别位点中都存 在序列变异(图2中粗体)。FucT基因的TAL效应子核酸内切酶识别位点在图2中带下划 线并列于表1。靶位点1和2在TAL效应子核酸内切酶识别位点中包含核苷酸多态性,因此 针对各靶区域生成了两个TAL效应子核酸内切酶对,以增加TAL效应子核酸内切酶识别其 靶标的可能性。对于靶位点3和4,序列变异出现在TAL效应子核酸内切酶DNA识别位点之 间的间隔子区域中,因此单个TAL效应子核酸内切酶对结合两种基因中相同的靶序列。
[0067] 实施例2 -酵母中的FucT和XvlTTAL效应子核酸内切酶活件
[0068] 为评估靶向XylT和FucT基因的TAL效应子核酸内切酶的活性,通过与他处所述 方法(Christian等,Genetics 186:757-761,2010