催化多酚糖基化的酶的制作方法
【专利说明】催化多酚糖基化的酶
[0001] 本发明涉及催化多酚,特别是黄酮类化合物、苯甲酸衍生物、芪类化合物、查尔酮 类化合物、色酮类化合物和香豆素衍生物糖基化的酶。
[0002] 多酚是通过莽草酸和苯丙烷途径生物合成的植物次生代谢产物。它们是在它们的 环系统具有羟基的芳族化合物或其衍生物。黄酮类化合物和苯甲酸衍生物是多酚的例子。 经由环系统中的羟基的二次修饰,形成这些化合物的多种天然衍生物。糖修饰在自然界中 经常发生,因为它们对化合物的溶解度和功能可能有显著影响。多酚化合物是水果和蔬菜 形式的我们日常营养中的一部分,并且已知对人类健康具有积极的影响。除了抗氧化和自 由基清除功能外,它们能够发挥例如抗过敏、抗细菌、抗真菌、抗病毒、抗炎、镇痛以及甚至 癌保护(21)作用。由于这些广泛影响,在化妆品工业、制药工业和营养制品工业中对多酚 类物质如具体的黄酮类化合物的需求日益增长(22-24)。满足这一需求的主要问题来自它 们的可利用性有限。例如,黄酮类化合物仅仅以低水平在植物中产生。提取与大量溶剂的 使用有关,且由于它们相当复杂的结构化学修饰不容易实现(25)。
[0003]由于定向化学修饰大多失败,多酚如黄酮类化合物的区域专一性修饰仍然很困 难。因此,酶已经获得了关注,因为它们能够介导多酚的区域修饰和立体化学修饰(26)。特 别是,研究集中于特定的糖基化,作为修饰影响多酚例如黄酮类化合物的水溶性和生物利 用率(27, 28)。催化反应的酶是糖基转移酶(GT)。通常,GT介导糖残基从供体底物到受体 分子的转移。基于它们的序列相似性,GT目前分类为94个家族(29)。GT家族1(GT1)包括 催化亲脂性小分子糖基化的酶(30)。使用核苷酸活化的供体的这些酶(EC 2.4. 1.x)属于 UDP-糖基转移酶(UGT)超家族,并且也被称为Leloir酶(31,32)。作用于黄酮类化合物的 糖基转移酶也属于GT1 (33)。GT1的酶具有GT-B折叠结构并呈现出关于转移的糖部分的键 合的反相反应机理(34)。EP 2 128 265 A1描述了真菌来源即来自木霉属(Trichoderma) 的糖基转移酶,用于糖基化黄酮类化合物。EP 1 985 704 A1公开了也作用于黄酮类化合 物的来自玫瑰植物的糖基转移酶。迄今为止,已经鉴定并且详细表征了极少数的原核来源 的黄酮类化合物-作用GT1。目前已知的来源于革兰氏阳性细菌的接受黄酮化合物的UGT 都属于甘露糖苷(macroside)糖基转移酶(MGT)亚族,且来源于杆菌(Bacilli)和链霉菌 (Str印tomycetes) (35-37;另见 EP 1 867 729 A1 和 TO 2009/015268 A1)。此外,来源于 革兰氏阴性黄单胞菌(Xanthomonas campestris)的单个黄酮类化合物作用UGT是已知的 (38) 〇
[0004] 因此,仍需要用于修饰如黄酮类化合物、色酮类化合物等多酚的方法。因此,本发 明的一个目的是提供这样的方法。该目的通过独立权利要求的主题来解决。本发明的有利 实施方案具体陈述在从属权利要求中。
[0005] 在第一方面,本发明提供了催化多酚,例如酚酸衍生物、查尔酮类化合物、色酮类 化合物、香豆素衍生物、黄酮类化合物和芪类化合物糖基化的酶,其中所述酶:
[0006] a)包含SEQ ID NO :7-12的序列之一的氨基酸序列;或
[0007] b)由包含SEQIDN0 :1-6的序列之一的核苷酸序列的核酸编码;或
[0008] C)与上述a)或b)限定的酶之一同源;或
[0009] d)由一个核酸编码,所述核酸在严格条件下与互补于包含SEQ ID NO :1_6的序列 之一的核苷酸序列的序列的核酸杂交。
[0010] 本文所描述的新酶表示为GtfC、MgtB、MgtC、MgtS、MgtT和Mgtw,其属于GT 1家族 并且对黄酮类化合物和类似分子等这样的多酚具有高度活性。
[0011] 本文中的术语"包含"涵盖术语"具有",即不被解释为:除了明确提及的要素外的 其它要素一定存在于实施方案中。例如,术语"包含SEQ ID NO :X的氨基酸序列的酶"也涵 盖具有SEQ ID NO :X的氨基酸序列的酶,在这种语境中,"具有"意指仅由SEQ ID NO :X中 的氨基酸组成。
[0012] 在提及核酸、蛋白或肽时本文所用的术语"同源性"是指,一个核酸与另一核酸在 其核苷酸序列上实质相同或相似,或蛋白或肽与另一种蛋白或肽在其氨基酸序列上实质相 同或相似,但与相比较的核酸或蛋白或肽并不完全相同。两个核酸或蛋白或肽之间的同源 性的存在可以通过以下方式来确定:比较第一序列中的位置与第二序列中的对应位置,从 而确定在该位置是否存在相同或相似的残基。当存在某一最小百分比的相同或相似的核 苷酸或氨基酸时,两条比较的序列彼此同源。同一性表示在等同位置比较两条序列时,存在 相同的核苷酸或氨基酸。任选地,可能有必要考虑序列空位以便产生可能的最佳比对。相 似的氨基酸是具有相同或同等化学和/或物理性质的非相同氨基酸。用具有相同或同等 化学和/或物理性质的另一氨基酸替换氨基酸被称为"保守取代"。氨基酸的物理化学性 质的实例是疏水性或电荷。就核酸而言,当编码序列中密码子内的一个核苷酸被替换为另 一核苷酸时,其称为相似核苷酸或保守取代,新密码子例如由于遗传密码的简并性,仍然编 码相同或相似的氨基酸。本领域技术人员知晓哪些核苷酸或氨基酸取代是保守取代。为 了确定两个核酸之间的相似性或同一性程度,优选采用最小长度为60个核苷酸或碱基对, 优选最小长度为 70、80、90、100、110、120、140、160、180、200、250、300、350 或 400 个核苷酸 或碱基对,或各自核苷酸序列中至少25%、30%、40%、50%、60%、70%、80%、90%、91%、 92%、93%、94%、95%、96%、97%、98%、99%、99· 2%或99. 5%的核苷酸的长度。对于蛋白 /肽,优选采用最小长度为20,优选的最小长度为25、30、35、40、45、50、60、80或100,更优 选的最小长度为120、140、160、180或200个氨基酸,或最小长度为比较的各个氨基酸序列 的 25%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%、99. 2%或99. 5%的氨基酸。特别优选各个蛋白或核酸的全长用于比较。两条序 列的相似性或同一性程度可以例如通过使用计算机程序BLAST(19)使用标准参数测定,参 见例如http://www. ncbi. nlm. nih. gov/BLAST/。同源性的确定依赖于比较的序列的长度。 对于本发明的目的的两个核酸,其中较短的核酸包含至少100个核苷酸,当至少70%、至少 75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少 99%、至少99. 2%或99. 5%的核苷酸相同和/或相似(BLAST的"同一性(identities) "或 "相似性(positives)"),优选是相同时,将被认为是同源的。在序列长度为50-99个核苷酸 的情况下,当至少80%、优选至少85%、86%、87%、88%、89%或90%的核苷酸相同和/或 相似时,两个核酸被认为是同源的。在序列长度为15-49个核苷酸的情况下,当至少90%、 优选至少95%、96%、97%、98%、99%、99. 2%或99. 5%的核苷酸相同和/或相似时,两个 核酸被认为是同源的。在编码蛋白质或肽的核酸的情况下,如果翻译的氨基酸序列是同源 的,贝认为存在同源性。基于缩写为BLAST的计算机程序"Basic Local Alignment Search Tool (基本局部比对搜索工具)"(19)(例如见 http://www. ncbi. nlm. nih. gov/BLAST/),使 用 BL0SUM62 取代矩阵(Henikoff, Sand Henikoff, J. Amino acid substitution matrices from protein blocks. Proc Natl. Acad. Sci. USA 89:10915-10919, 1992),由于考虑了相 似的氨基酸特别是那些不相同的氨基酸,其被指定为"相似(positive) ",即在BL0SUM62取 代矩阵中具有相似性得分(positive score)。对于本发明的目的,如果至少55%、优选至 少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少 97 %、至少98 %、至少99 %、至少99. 2 %或至少99. 5 %的氨基酸相同或相似,优选相同,则 认为两条氨基酸序列之间存在同源性。特别是,两条序列之间的同源性被假设为存在的时 候,当使用采用标准参数的计算机程序BLAST(19);参见例如http://www. ncbi. nlm. nih. gov/BLAST/和BL0SUM62取代矩阵(20)时,获得至少55%、优选至少60%、至少65%、至 少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少 99%、至少99. 2%或至少99. 5%的同一性或相似性("相似"),优选同一性。本领域技术 人员使用他的专业知识应容易地确定哪个可用的BLAST程序例如eg BLASTp或PLASTn适 合于测定同源性。此外,本领域技术人员知晓在必要时他可以使用的评估同源性的其它程 序。这类程序例如可从欧洲生物信息研究所(EMBL)的网站(参见例如http://www.ebi. ac. uk/Tools/similarity. html)上获得。在本文中使用"X%同源性"或"X%的同源"等这 类术语的情况下,这被解释为两个蛋白或核酸被认为是同源的,并具有X%例如80%的序 列相似性或同一性,优选同一性。
[0013] 在提到互补核酸的配对时,本文使用了术语"杂交"。杂交和杂交的强度(g卩,核酸 之间的关联强度)受到以下因素的影响,如核酸之间的互补程度,涉及的条件的严格性,形 成的杂交体的核酸的Tm( "熔解温度"),和核酸内的G:C比)。
[0014] 术语"在严格条件下杂交"指的是,在温度、离子强度以及其它化合物如有机溶剂 的存在方面的高严格条件,在该条件下进行核酸杂交。在"高严格"条件下,仅在具有高频 互补碱基序列的核酸之间发生核酸碱基配对。严格杂交条件是本领域技术人员已知的(例 如参见 Green M.R.,Sambrook, J·,Molecular Cloning:A Laboratory Manual (分子克隆: 实验室手册),Cold Spring Harbor Laboratory Press;第4版,2012)。严格杂交条件的 一个例子是,当使用约500个核苷酸长度的探针时,在42°C在由5XSSPE(43. 8g/l NaCl, 6. 9g/l NaH2P04H20 和 1. 85g/l EDTA,pH 值用 NaOH 调节至 7· 4)、0· 5% SDS、5XDenhardt' s 试剂和100 μ g/ml变性鲑精DNA组成的溶液中杂交,随后在42°C用含有0. 1XSSPE、1. 0% SDS的溶液洗涤。
[0015] 术语"糖基化"涉及碳水化合物作为糖基供体被连接至另一个分子(糖基受体)的 羟基或其它官能团的反应。
[0016] 术语"糖基供体"涉及一种碳水化合物,如单糖或低聚糖,其与合适的受体化合物 反应以形成新的糖苷键。
[0017] 术语"碳水化合物"包括碳的水合物,即具有化学计量公式Cn(H20) n的化合 物。通用术语包括单糖、低聚糖和多糖,以及通过还原羰基(糖醇)、通过一个或多个 末端基团氧化为羧酸或通过用氢原子、氨基、硫醇基或类似基团替代一个或多个羟基基 团而从单糖衍生的物质。它也包括这些化合物的衍生物。参见IUPAC,Compendium of Chemical Terminology (化学术语纲要),第 2 版("Gold Book"),由 A. D. McNaught and A. Wilkinson编译,Blackwel 1科学出版社,牛津大学(1997),XML的在线修正版本:http: // goldbook. iupac. org(2006_),由 M. Nic, J. Jirat, B. Kosata 创建;由 A. Jenkins 更新编 译,ISBN0-9678550-9-8. doi : 10. 1351/goldbook.最后更新:2014-02-24 ;版本:2· 3· 3 ; doi:10.1351/goldbook. C00820。
[0018] 术语"多酚"涉及次级植物代谢产物,它们经由莽草酸和苯丙烷途径生物合成的, 且它们是具有一个、两个或更多个羟基直接键合到它们的环系统的芳族化合物或它们的衍 生物。
[0019] 多酚的例子是黄酮类化合物、苯甲酸衍生物、芪类化合物、查耳酮类化合物、色酮 类化合物和香豆素衍生物。
[0020] 术语"黄酮类化合物"涉及一组化合物,包括由2-苯基苯并吡喃-4-酮(2-苯 基-1,4-苯并吡喃酮)(例如槲皮素,芦丁)衍生的黄酮类化合物,由3-苯基苯并吡 喃-4-酮(3-苯基-1,4-苯并吡喃酮)衍生的异黄酮类化合物,由4-苯基香豆素(4-苯 基-1,2-苯并吡喃酮)衍生的新黄酮类化合物。该术语包括如黄酮类化合物(如木犀草 素,芹菜素),黄烷酮类化合物(如橙皮素,柚皮素,圣草酚),黄酮醇类化合物(如桑色素, 槲皮素,芦丁,山奈酸,杨梅素,异鼠李素,非瑟酮),黄烷醇类化合物(如儿茶素,没食子儿 茶素,表儿茶素,表没食子儿茶素酸盐),黄烷酮醇(如黄杉素),查耳酮类化合物(查耳酮 衍生物,如异甘草素,根皮素,黄腐酚),异黄酮类化合物(如木黄酮,黄豆苷元,甘草西定), 色酮类化合物,即色酮的衍生物(1,4-苯并吡喃酮,苯并吡喃-4-酮),特别是羟基色酮衍生 物(如去甲丁香色原酮),花色素(如矢车菊,翠雀,二甲花翠素,花葵素,芍药色素,牵牛花 色素)和橙酮类化合物(如金鱼草素),和前述化合物类的酰化、糖基化、甲氧基化和磺化 衍生物。另参见IUPAC,Compendium of Chemical Terminology (化学术语纲要),第2版 ("Gold Book〃),由 A.D.McNaught and A. Wilkinson编译,Blackwell 科学出版社,牛津大学 (1997),XML 的在线修正版本:http://goldbook. iupac. org(2006_),由 M. Nic, J. Jirat, B. Kosata 创建;由 A. Jenkins 更新编译,ISBN 0-9678550-9-8. doi : 10. 1351/goldbook.最后 更新:2014-02-24 ;版本:2. 3. 3 ;doi : 10. 1351/goldbook. R)2424。
[0021] 术语"芪类"涉及芪的羟基化衍生物,以及它们的衍生物,一个例子是白藜芦醇。
[0022] 术语"香豆素"涉及香豆素(2H-色烯-2-酮,1-苯并吡喃-2-酮)的衍生物, 特别是羟基化衍生物,例如7-羟基-4-甲基香豆素(4-MU,4-甲基伞形酮)。另参见 IUPAC,Compendium of Chemical Terminology (化学术语纲要),第 2 版(〃Gold Book"), 由 A. D. McNaught and A. Wilkinson 编译,Blackwell 科学出版社,牛津大学(1997),XML 的在线修正版本:http://goldbook. iupac. org(2006-),由 M. Nic, J. Jirat, B. Kosata 创建;由 A. Jenkins 更新编译,ISBN 0-9678550-9-8. doi : 10. 1351/goldbook.最后更 新:2014-02-24;版本:2. 3. 3 ;doi :10. 1351/goldbook. CO 1369。
[0023] 术语"苯甲酸衍生物"涉