本发明涉及气味受体和香气受体以及可用于鉴定嗅觉受体和具有至少一种调性的化合物的调性测定的领域。
背景技术
继1991年首次鉴定出气味受体之后,已经做了很多工作来促进对嗅觉的理解以及人类如何感知挥发性化学物质。在人类嗅觉系统的外围,鼻腔内衬的主要嗅觉上皮细胞含有数百万个嗅觉感觉神经元(OSN),每个嗅觉神经元表达来自大约400种完整气味(嗅觉)受体(OR)基因的家族的单个成员。每种OR可以被几种挥发性化合物激活,而单一一种挥发性化合物也可以激活多种OR。这导致每种挥发性化学物质及其混合物的组合OSN激活码。每种受体在OSN中以单基因和单等位基因的方式随机表达,为基因组中存在的每种OR等位基因产生一种OSN类型。根据每种OR的基因选择频率,专用于每种OSN类型的总OSN种群的子集会有所不同。OSN型亚群各自都提供关于分子一种或多种身份以及在任何给定时间与它们接触的挥发性化合物浓度的离散信息通道。每种OSN类型的每个OSN中诱导的活性水平根据其OR接受的挥发性化合物浓度以及与每个OR-化合物对相关的结合和活化参数而变化。此外,一些OR-配体对诱导或增强OSN活性,而另一些则减少或阻止OSN活性。这可以竞争性地发生,其中化合物竞争结合OR,或非竞争性地发生,其中不止一种化合物可以同时结合OR。这大约400个输入通道(即外围嗅觉系统)的组合逻辑被后续的下游神经网络转换,并导致我们的嗅觉感觉。
香氛(fragrance)和风味(调味料/食用香精,flavor)(F&F)行业一直在寻找新的成分、新的香料(日化香精,perfumery)和调味料应用、改善的感官体验以及更稳定、可生物降解且无毒的化合物。
由于气味剂或香气分子可能与几种嗅觉受体(OR)相互作用,因此通常很难仅根据其化学结构推断挥发性化合物的调性(tonality)。相反,由于每种OR可能与几种具有不同化学结构的气味剂和香气分子相互作用并唤起不同组的调性,因此通常很难推断由OR编码的信息的性质。
仍然需要基于OR激活来预测给定化合物或组合物/组合调(composition)的至少一种嗅觉调性,并促进与F&F行业相关的新香料和风味成分的发现。
技术实现要素:
在一个形态中,提供了一种将至少一种嗅觉调性与嗅觉受体相关联的方法,包括:
(a)提供嗅觉受体;
(b)使该嗅觉受体与具有至少一种已知调性的化合物接触;
(c)确定该化合物是否激活该嗅觉受体;
(d)用具有至少一种已知调性的化合物重复步骤(b)和(c),其中步骤(d)的化合物不同于前面重复步骤(b)和(c)的化合物;
(e)将步骤(b)至(d)中激活该嗅觉受体的化合物分类为子集;
(f)鉴定出该子集的化合物所共有的至少一种调性;和
(g)将已鉴定的至少一种调性分配给该嗅觉受体。
在一个形态中,提供了一种筛选至少一种具有特定调性的化合物的方法,包括:
(a)提供具有已鉴定的至少一种调性的嗅觉受体;
(b)使该嗅觉受体与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该嗅觉受体;
(d)如果该至少一种化合物激活该嗅觉受体,则将该至少一种化合物与已鉴定的至少一种调性相关联。
在一些形态中,在步骤(a)中提供多种嗅觉受体,每种嗅觉受体都具有不同的已鉴定的至少一种调性,并且在步骤(d)中将多种已鉴定的调性与根据上述形态的步骤(b)和(c)激活该多种嗅觉受体的化合物或多种化合物的组合相关联。
在一个形态中,提供了一种筛选至少一种化合物的泥土(earthy)调性的方法,包括:
(a)提供包含与SEQ ID NO:11具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将泥土调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的香豆(coumarinic)调性的方法,包括:
(a)提供包含与SEQ ID NO:13具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将香豆调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的内酯椰子(lactonic coconut)调性的方法,包括:
(a)提供包含与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将内酯椰子调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的葫芦巴(fenugreek)调性的方法,包括:
(a)提供包含与SEQ ID NO:17具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将葫芦巴调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的粉香麝香(powdery musk)调性的方法,包括:
(a)提供包含与SEQ ID NO:19具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将粉香麝香调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的动物麝香(animalic musk)调性的方法,包括:
(a)提供包含与SEQ ID NO:21具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将动物麝香调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的紫罗兰(violet)调性的方法,包括:
(a)提供包含与SEQ ID NO:23具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将紫罗兰调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的金黄色木质(blonde wood)调性的方法,包括:
(a)提供包含与SEQ ID NO:25具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活所述多肽,则将金黄色木质调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的铃兰(muguet)调性的方法,包括:
(a)提供包含与SEQ ID NO:27具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将铃兰调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的芳樟(linalic)调性的方法,包括:
(a)提供包含与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该化合物或多种化合物的组合是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将芳樟调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的茉莉(jasmine)调性的方法,包括:
(a)提供包含与SEQ ID NO:31具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该化合物或多种化合物的组合是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将茉莉调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一些形态中,本公开提供了通过本文描述的某些形态的方法鉴定的至少一种化合物。
在一个形态中,提供了一种替换具有香味的组合物中的一种化合物的方法,包括:
(a)在具有香味的组合物中选择一种化合物;
(b)鉴定该组合物中该化合物的调性;
(c)提供与该调性相关联的嗅觉受体;
(d)使该嗅觉受体与测试化合物接触;
(e)确定该测试化合物是否激活该嗅觉受体;和
(f)如果该测试化合物激活该嗅觉受体,则用该测试化合物替换该组合物中所选择的化合物。
在一个形态中,提供了一种替换具有香味的组合物中的多种化合物中的至少一种化合物的方法,包括:
(a)在具有香味的组合物中选择多种化合物,其中该多种化合物中的每种化合物都具有至少一种调性;
(b)鉴定该多种化合物的调性;
(c)提供多种嗅觉受体,其中将与该多种化合物中的至少一种化合物相同的调性分配给多于一种的嗅觉受体;
(d)使至少一种测试化合物与该多于一种的嗅觉受体接触;
(e)确定该至少一种测试化合物是否激活该多于一种的嗅觉受体;和
(f)如果该测试化合物激活与该多种化合物中多于一种的化合物相同的嗅觉受体,则用该测试化合物替换该多种化合物中该多于一种的化合物。
在一个形态中,提供了一种生产具有希望的香味的组合物的方法,包括:
(a)选择希望的香味;
(b)确定组合起来会产生希望的香味的多种调性;和
(c)向组合物中加入具有该多种调性的至少一种化合物。
在一些形态中,具有该多种调性的至少一种化合物根据本文描述的某些形态的方法来鉴定。
在一个形态中,提供了一种去除具有希望的香味的组合物中的至少一种化合物的方法,包括:
(a)选择具有希望的香味的组合物,其中该香味由至少一种调性组成;
(b)鉴定与该至少一种调性相关联的至少一种嗅觉受体;
(c)在该具有希望的香味的组合物中选择至少一种化合物;
(d)使该至少一种化合物与该至少一种嗅觉受体接触;
(e)确定该化合物是否抑制该至少一种嗅觉受体;和
(f)如果该至少一种化合物抑制该至少一种嗅觉受体,则从该具有希望的香味的组合物中去除该至少一种化合物。
在一个形态中,提供了一种将至少一种化合物添加到具有香味的组合物中的方法,包括:
(a)选择具有香味的组合物,其中该香味由至少一种调性组成;
(b)鉴定与该至少一种调性相关联的至少一种嗅觉受体;
(c)使该至少一种嗅觉受体与至少一种测试化合物接触;
(d)确定该至少一种测试化合物是否抑制该至少一种嗅觉受体;和
(e)如果该至少一种测试化合物抑制该至少一种嗅觉受体,则将该至少一种测试化合物添加到该具有香味的组合物中;
其中,将该香味中不希望的调性分配给该至少一种嗅觉受体。
在一个形态中,提供了一种将至少一种化合物添加到具有香氛/香味的组合物中的方法,包括:
(a)选择具有香味的组合物,其中该香味由至少一种调性组成;
(b)鉴定与该至少一种调性中的第一调性相关联的第一嗅觉受体,其中该第一调性是该香味中所希望的;
(c)使该第一嗅觉受体与测试化合物接触;
(d)确定该测试化合物是否激活该第一嗅觉受体;
(e)鉴定与该至少一种调性中的第二调性相关联的第二嗅觉受体,其中该第二调性不是该香味中所希望的;
(f)使该第二嗅觉受体与该测试化合物接触;
(g)确定该测试化合物是否抑制该第二嗅觉受体;和
(h)如果该测试化合物激活该第一嗅觉受体并抑制该第二嗅觉受体,则将该测试化合物添加到该具有香味的组合物中。
在一些形态中,所添加的测试化合物替代了该香氛/香味中的一种化合物。
附图说明
图1总结了特定挥发性化合物如何通过OR激活获得至少一种嗅觉调性。激活多种受体的化合物表现出与已激活的OR相关联的相应调性。
图2显示了OR激活与调性特别是围绕受体OR5AU1(与椰子调性相关联)、OR8B3(与香豆调性相关联)和OR8D1(与葫芦巴调性相关联)的调性之间的相关性。
图3显示了人气味受体OR11A1激活等级,该等级由使用大量不同组的挥发性化合物的单浓度高通量筛选工艺获得。
图4显示了对四种活性激动剂(土臭味素(Geosmin)、Vulcanolide、葑醇(Fenchyl Alcohol)和广藿香醇(Patchouli Alcohol))获得的人气味受体OR11A1剂量反应实验的结果,该实验捕获了每种化合物对受体的效力和功效。
图5显示了OR11A1根据从图3中命中的剂量反应实验获得的效力和功效的分子感受范围。突出显示了最活跃的激动剂。
图6显示了四种最活跃的激动剂和OR11A1的部分激动剂的相应激动剂的化学结构。
图7显示了OR8B3激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中香豆调性是常见的。
图8显示了OR5AU1激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中内酯椰子调性是常见的。
图9显示了OR8D1激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中葫芦巴调性是常见的。
图10显示了OR5AN1激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中粉香麝香调性是常见的。
图11显示了OR1N2激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中动物麝香调性是常见的。
图12显示了OR5A1激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中紫罗兰调性是常见的。
图13显示了OR7A17激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中金黄色木质调性常见的。
图14显示了OR10J5激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中铃兰调性是常见的。
图15显示了OR1C1激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中芳樟调性是常见的。
图16显示了OR5B12激动剂根据效力和功效的分子感受范围,并突出显示了最活跃的激动剂,其中茉莉调性是常见的。
图17显示了激活OR8D1、OR8B3和OR5AU1的成分的活性水平百分比。
图18显示了通过比较模型和体外对照实验,由调和物A和B验证诱导的气味受体活性。
图19显示了芹菜调性的香料评估与模型的感官预测之间的一致性。
图20显示了通过比较模型和体外对照实验,由调和物A、C和D验证诱导的气味受体活性。
图21显示了干草调性的香料评估与模型的感官预测之间的一致性。
图22显示了椰子调性的香料评估与模型的感官预测之间的一致性。
具体实施方式
定义
如本文所用,术语“OR”或“嗅觉受体”或“气味(剂)受体”是指在嗅觉细胞中表达的G蛋白偶联受体(GPCR)家族的一个或多个成员。OSN(嗅觉感觉神经元)也可以根据形态学或通过在嗅觉细胞中特异性表达的蛋白质的表达来识别。OR家族成员可能具有充当嗅觉信号转导的受体的能力。
“OR的激动剂”或“激动剂化合物”是指与OR结合、激活OR并诱导嗅觉受体转导级联的挥发性化合物或配体。
“效力(potency)”是指就产生给定活性水平所需的量或浓度而言,由激动剂(气味剂)的结合所诱导的受体活性的量度。它表明受体对不同激动剂浓度的敏感性,通常通过计算EC50(达到半数最大受体活性所需的激动剂浓度)来评估。
“功效(efficacy)”是指OR响应给定激动剂的活性水平的量度,并且是通过测量组成型(不存在激动剂时的基线)和激动剂诱导的活性之间的激活跨度而获得的。
气味受体的“感受野”或“分子感受范围”是指激活受体的挥发性化合物的范围。它描述了一组不同的挥发性化合物,这些化合物能够与受体结合,触发细胞内的转导级联,并且因此,通过嗅觉感觉神经元将化学刺激传递到大脑。
认为“OR”或“气味受体”或“嗅觉受体”多肽是这样的,它们属于由单个约1kb长外显子编码的七次跨膜结构域G蛋白偶联受体超家族,并表现出特征性嗅觉受体特异性氨基酸性基序。这七个结构域被称为“跨膜”或称“TM”结构域TM I至TM VII,由三个“细胞内环”或称“IC”结构域IC I至IC III和三个“细胞外环”或称“EC”结构域EC I至EC III连接。基序及其变体被定义为但不限于与TM III和IC II重叠的MAYDRYVAIC基序(SEQ ID NO:7)、与IC III和TM VI重叠的FSTCSSH基序(SEQ ID NO:8)、TM VII中的PMLNPFIY基序(SEQ ID NO:9)以及EC II中的三个保守C残基,以及TM I中高度保守的GN残基的存在[Zhang,X.&Firestein,S.Nat.Neurosci.5,124-133(2002);Malnic,B.,et al.Proc.Natl.Acad.Sci.U.S.A.101,2584-2589(2004)]。
I类和II类OR是指系统发育上不同的气味受体GPCR类别。I类OR与在水生物种中占优势的OR更相关。II类OR与陆生物种更相关。哺乳动物携带这两种类型。
如本文所用,“嗅觉调性(tonality)”或“调性”是指特定的嗅觉感知并且涉及化合物对OR的激活。嗅觉调性的非限制性例子包括柑橘调、椰子调、广藿香调等。化合物可以具有多于一种的调性。例如,如图1所示,化合物(1)(β-紫罗兰酮)具有分别由OR5A1和OR7A17的激活产生的紫罗兰调性和金黄色木质调性。
如本文所用,“香氛/香味”是指由至少一种挥发性分子对嗅觉受体的激活、增强和抑制(当存在时)的总和产生的嗅觉感知。因此,通过举例说明而非意图限制本公开的范围,“香氛/香味”源自由激活与椰子调性相关联的OR的第一化合物、激活与芹菜调性相关联的OR的第二化合物、抑制与樟脑调性相关联的OR的第三化合物的总和引起的嗅觉感知。
如本文所用,“调(note)”或“嗅觉调”或“香调”标识调性类别。例如,如图1所示,花香调包括铃兰和紫罗兰调性。
“OR”核酸编码具有七个具有G蛋白偶联受体活性的跨膜区的GPCR家族,例如,它们可响应细胞外刺激而结合G蛋白并通过刺激酶如磷脂酶C和腺苷酸环化酶III而促进第二信使如IP3、cAMP、cGMP和Ca2+的产生。
“N末端结构域”区域从肽或蛋白质的N末端(氨基末端)开始并延伸到接近第一跨膜区起点的区域。
“跨膜区”包括七个“跨膜结构域”,其是指位于质膜内的OR多肽的结构域,并且还可以包括相应的细胞质(细胞内)环和细胞外环。七个跨膜区以及细胞外环和细胞质环可以使用标准方法来鉴定,例如疏水性分布图,或者如Kyte&Doolittle,J.Mol.Biol.,157:105-32(1982)或在Stryer中所描述的。跨膜结构域的一般二级和三级结构,特别是G蛋白偶联受体如嗅觉受体的七个跨膜结构域是本领域已知的。因此,可以基于已知的跨膜结构域序列来预测一级结构序列。这些跨膜结构域可用于体外配体结合测定。
在用于测试调节OR家族成员介导的嗅觉转导的化合物的测定的语境中,短语“功能性效应”包括确定间接或直接受到受体影响的任何参数,例如功能性、物理性和化学性效应。它包括配体结合,离子通量、膜电位、电流、转录、G蛋白结合、GPCR磷酸化或去磷酸化、信号转导受体-配体相互作用、第二信使浓度(例如cAMP、cGMP、IP3或细胞内Ca2+)的变化,体外、体内和离体,还包括其他生理作用,例如神经递质或激素释放的增加或减少。
在测定的语境中,“确定功能性效应”或“确认活性”是指化合物的测定,其增加或减少间接或直接受OR家族成员影响的参数,例如功能性、物理性和化学性效应。这些功能性效应可以通过本领域技术人员已知的任何方法测量,例如,光谱特征(例如荧光、吸光度、折射率)、流体动力学(例如形状)、色谱或溶解度性质、膜片钳、电压敏感染料、全细胞电流、放射性同位素流出、诱导型标记、卵母细胞OR基因表达的变化;组织培养细胞OR表达;OR基因或活性诱导基因(如egr-1或c-fos)的转录激活;配体结合试验;电压、膜电位和电导变化;离子通量测定;细胞内第二信使如cAMP、cGMP和肌醇三磷酸(IP3)的变化;细胞内钙水平的变化;神经递质释放等。
如本文所用,术语“纯化的”、“基本上纯化的”和“分离的”是指不含本发明化合物通常与其天然状态相关的其他不同化合物的状态,因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5%、1%、5%、10%或20%,或至少50%或75%。在一个特定的实施方案中,这些术语是指本发明的化合物占给定样品质量按重量计至少95%、96%、97%、98%、99%或100%。如本文所用,当提及核酸或蛋白质时,核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”,也指不同于天然存在于哺乳动物,特别是人体中的该核酸或蛋白质的纯化或浓缩状态。任何纯化程度或浓度,只要大于天然存在于哺乳动物,特别是人体中的纯度或浓度,包括(1)从其他相关结构或化合物中的纯化,或(2)与在哺乳动物,特别是人体中通常不相关的结构或化合物的缔合,都在“分离的”的含义内。根据本领域技术人员已知的各种方法和过程,本文所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的,或如若不然与它们通常在性质上不相关的结构或化合物相缔合。
术语“核酸”或“核酸序列”是指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸寡核苷酸。该术语包括含有天然核苷酸的已知类似物的核酸,即寡核苷酸。该术语还包括具有合成骨架的核酸样结构。除非另有说明,否则特定核酸序列还隐含地包括其保守修饰的变体(例如简并密码子取代)和互补序列、以及明确指出的序列。具体而言,简并密码子取代可以通过产生例如其中一个或多个选定密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现。
除了本文公开的序列中显示的基因序列之外,变体还包括可能存在于给定群体内的DNA序列多态性,其可能导致本发明公开的多肽的氨基酸序列的变化,这对于本领域技术人员来说是显而易见的。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位基因变体还可包括功能性等同物。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指氨基酸残基的聚合物,无论是否包含天然存在的氨基酸或聚合物和非天然存在的氨基酸或聚合物。当参考核酸的部分使用时,术语“异源的”表示核酸包含两个或更多个在自然界中彼此不存在相同关系的子序列。例如,核酸通常是重组产生的,具有来自无关基因的两个或更多个序列,其被排列以产生新的功能性核酸,例如来自一个来源的启动子和来自另一个来源的编码区。类似地,异源蛋白质表明该蛋白质包含两个或更多个在自然界中彼此不存在相同关系的子序列(例如融合蛋白)。
“非人生物体”或“宿主细胞”是指含有本文所述核酸或表达载体并支持表达载体复制或表达的非人生物体或细胞。宿主细胞可以是原核细胞,例如大肠杆菌,或真核细胞,例如酵母、昆虫、两栖动物或哺乳动物细胞,例如CHO、HeLa、HEK-293等,例如培养的细胞、外植体和体内细胞。
“标签”(tag)或“标签组合”是指可以添加到气味受体蛋白质中的短多肽序列。通常,将编码“标签”或“标签组合”的DNA添加到编码受体的DNA中,最终产生融合蛋白,其中“标签”或“标签组合”融合到受体的N-末端或C-末端。Lucy、和/或Rho标签可以增强受体向细胞膜的运输,因此可以帮助表达功能性气味受体,用于体外基于细胞的测定[Shepard,B.et al.PLoS One 8,e68758-e68758(2013),以及Zhuang,H.&Matsunami,H.J.Biol.Chem.282,15284-15293(2007)]。
参考图2至图16,本发明包括基于它们的OR激活曲线来识别化学和感官上不同的挥发性化合物之间的嗅觉感知共性的方法。不打算受限于任何特定理论,与单独的物理化学相似性相比,OR激活曲线代表给定挥发性化合物的嗅觉调性的更好预测因子。不打算受限于任何特定理论,物理化学相似性可能仅部分预测嗅觉相似性。
本发明包括可以通过针对OR筛选挥发性化合物的化学和感官上不同的文库以鉴定挥发性化合物(其为经筛选的OR的活化剂)所共有的至少一种嗅觉调性,从而可以将至少一种嗅觉调性与OR相关联的方法。
因此,在一个形态中,本发明提供了一种将至少一种嗅觉调性与嗅觉受体相关联的方法,该方法通过如下步骤进行:提供OR,使该OR与具有已知至少一种调性的挥发性化合物接触,确定该化合物是否激活该至少一种嗅觉受体,用具有已知至少一种调性的不同化合物重复该接触和确定步骤,将激活该OR的化合物分类为子集,鉴定出该子集的化合物所共有的至少一种已知调性,并将已鉴定的至少一种已知调性与该OR相关联。
在另一形态中,提供了一种方法,其包括将与已鉴定的至少一种已知调性相关联的OR与至少一种挥发性化合物接触,确定该至少一种化合物是否激活该OR,以及如果该至少一种挥发性化合物激活该OR,则将与该OR相关联的已鉴定的至少一种已知调性与该至少一种挥发性化合物相关联。
在本公开的一些形态中,通过评估由至少一种挥发性化合物诱导的嗅觉受体活性并基于观察到的嗅觉受体活性关联所得的嗅觉调性,使用方法来解码特定嗅觉调性的嗅觉密码。
具有多于一种嗅觉调性的挥发性化合物的多种嗅觉调性可以从挥发性化合物对多种嗅觉受体的激活来推断。此外,根据本发明,挥发性化合物的混合物的多种嗅觉调性可以从混合物对多种嗅觉受体的激活来推断。在一些形态中,混合物包含多于一种挥发性化合物。
在一个形态中,挥发性化合物表现出几种嗅觉调性,这可以通过评估由该化合物诱导的嗅觉受体活性并基于其对多种OR的活性关联所得的嗅觉调性来预测。
在另一形态中,与OR的活性相关的调性可以通过探测受体的接受范围来关联,即生成功能性激活数据以列出其激活剂的综合列表,然后鉴定出其中最常见的调性。
在另一形态中,通过比较化合物的总体描述并确定激活剂中常见的描述符,可以将激活给定受体的化合物的共同嗅觉调性相关联。应该理解,这种嗅觉调性可以用几种方式在语义上描述,例如由调香师来描述。捕获相似嗅觉调性的此类语义相似性的例子包括:海洋、水样和臭氧调;泥土、腐殖质和苔藓调;干草、香豆素和零陵香豆(tonka);芹菜、葫芦巴和枫树;铃兰和山谷百合。
在一个形态中,提供了一种将至少一种嗅觉调性与嗅觉受体相关联的方法,包括:
(a)提供嗅觉受体;
(b)使该嗅觉受体与具有至少一种已知调性的化合物接触;
(c)确定该化合物是否激活该嗅觉受体;
(d)用具有至少一种已知调性的化合物重复步骤(b)和(c),其中步骤(d)的化合物不同于前面重复步骤(b)和(c)的化合物;
(e)将步骤(b)至(d)中激活该嗅觉受体的化合物分类为子集;
(f)鉴定出该子集的化合物所共有的至少一种调性;和
(g)将已鉴定的至少一种调性分配给该嗅觉受体。
在一个形态中,提供了一种筛选至少一种具有特定调性的化合物的方法,包括:
(a)提供嗅觉受体,其具有根据本文提出的一个形态描述的方法的已鉴定的至少一种调性;
(b)使该嗅觉受体与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该嗅觉受体;
(d)如果该至少一种化合物激活该嗅觉受体,则将该至少一种化合物与已鉴定的至少一种调性相关联。
在一些形态中,在步骤(a)中提供多种嗅觉受体,每种嗅觉受体都具有不同的已鉴定的至少一种调性,并且在步骤(d)中将多种已鉴定的调性与根据上述形态的步骤(b)和(c)激活该多种嗅觉受体的化合物或多种化合物的组合相关联。
在一个形态中,提供了一种筛选至少一种化合物的泥土调性的方法,包括:
(a)提供包含与SEQ ID NO:11具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将泥土调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的香豆调性的方法,包括:
(a)提供包含与SEQ ID NO:13具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将香豆调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的内酯椰子调性的方法,包括:
(a)提供包含与SEQ ID NO:15具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将内酯椰子调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的葫芦巴调性的方法,包括:
(a)提供包含与SEQ ID NO:17具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将葫芦巴调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的粉香麝香调性的方法,包括:
(a)提供包含与SEQ ID NO:19具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将粉香麝香调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的动物麝香调性的方法,包括:
(a)提供包含与SEQ ID NO:21具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将动物麝香调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的紫罗兰调性的方法,包括:
(a)提供包含与SEQ ID NO:23具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将紫罗兰调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中y提供了一种筛选至少一种化合物的金黄色木质调性的方法,包括:
(a)提供包含与SEQ ID NO:25具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活所述多肽,则将金黄色木质调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的铃兰调性的方法,包括:
(a)提供包含与SEQ ID NO:27具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该至少一种化合物是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将铃兰调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的芳樟调性的方法,包括:
(a)提供包含与SEQ ID NO:29具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该化合物或多种化合物的组合是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将芳樟调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一个形态中,提供了一种筛选至少一种化合物的茉莉调性的方法,包括:
(a)提供包含与SEQ ID NO:31具有至少90%序列同一性的氨基酸序列的多肽;
(b)使该多肽与至少一种化合物接触;
(c)确定该化合物或多种化合物的组合是否激活该多肽;和
(d)如果该至少一种化合物激活该多肽,则将茉莉调性与该至少一种化合物相关联;
其中该多肽是嗅觉受体。
在一些形态中,本公开提供了通过本文描述的某些形态的方法鉴定的至少一种化合物。
在另一形态中,提供了一种替换具有香味的组合物中的一种挥发性化合物的方法,该方法通过如下步骤进行:在具有香味的组合物中选择一种化合物,鉴定该组合物中该化合物的至少一种已知调性,提供与该至少一种已知调性相关联的OR,使该OR与测试化合物接触,确定该测试化合物是否激活该嗅觉受体,以及如果该测试化合物激活该OR,则用该测试化合物替换该组合物中具有已鉴定的至少一种调性的化合物。
在另一个形态中,提供了一种用单一测试化合物替换具有香味的组合物中的多于一种化合物的方法,该方法通过如下步骤进行:鉴定待替换的组合物中多于一种化合物的已知调性,提供与该已知调性相关联的OR,使OR与单一测试化合物接触,以及如果该测试化合物激活与该香味中多于一种化合物相同的OR,则用该测试化合物替换该组合物中的多于一种化合物。作为假设的例子,具有香味的组合物包括具有椰子调性的化合物A、具有芹菜调性的化合物B和具有柑橘调性的化合物C。测试化合物X激活与椰子和芹菜调性相关联的OR。测试化合物X替换了具有香味的组合物中的化合物A和B。
在另一形态中,提供了一种生产具有希望的香味的组合物的方法,该方法通过如下步骤进行:选择希望的香味;确定组合起来会产生希望的香味的多种调性;以及将一种或多种具有多种调性的化合物组合在组合物中。
在本发明的另一个形态中,提供了一种去除具有希望的香味的组合物中具有至少一种已知调性的化合物的方法,该方法通过如下步骤进行:选择具有希望的香味的组合物,其中该至少一种已知调性是不希望的,或赋予该香味以不希望的调性;鉴定与该至少一种已知的不希望的调性相关联的至少一种嗅觉受体;在该具有希望的香味的组合物中选择一种化合物;使该化合物与嗅觉受体接触;确定该化合物是否抑制该嗅觉受体;以及如果该化合物抑制该嗅觉受体,则从该组合物中去除该化合物。
在另一形态中,提供了一种将化合物添加到具有香味的组合物中的方法,该方法通过如下步骤进行:选择具有香味的组合物,其中所添加的化合物抑制与至少一种已知的不希望的调性相关联的至少一种嗅觉受体,并且其中该香味由至少一种已知调性组成;鉴别与至少一种不希望的调性相关联的至少一种嗅觉受体;使该至少一种嗅觉受体和测试化合物接触;确定该测试化合物是否抑制该嗅觉受体;以及如果该测试化合物抑制该嗅觉受体,则将该测试化合物添加到该具有香味的组合物中。
本发明根据以下步骤提供了向具有香味的组合物中添加或替换化合物的方法:选择具有香味的组合物,其中该香味由至少一种调性组成;鉴定与该至少一种调性中的第一种相关联的第一嗅觉受体,其中该至少一种调性中的第一种是该香味中所希望的;使该第一嗅觉受体与测试化合物接触;确定该测试化合物是否激活该第一嗅觉受体;鉴定与该至少一种调性中的第二种相关联的第二嗅觉受体,其中该至少一种调性中的第二种不是该香味中所希望的;使该第二嗅觉受体与该测试化合物接触;确定该测试化合物是否抑制该第二嗅觉受体;以及如果该测试化合物激活该第一嗅觉受体并抑制该第二嗅觉受体,则将该测试化合物添加到该组合物中或替换该具有香味的组合物中的一种化合物。
在一个形态中,提供了一种替换具有香味的组合物中的一种化合物的方法,包括:
(a)在具有香味的组合物中选择一种化合物;
(b)鉴定该组合物中该化合物的调性;
(c)提供与该调性相关联的嗅觉受体;
(d)使该嗅觉受体与测试化合物接触;
(e)确定该测试化合物是否激活该嗅觉受体;和
(f)如果该测试化合物激活该嗅觉受体,则用该测试化合物替换该组合物中所选择的化合物。
在一个形态中,提供了一种替换具有香味的组合物中的多种化合物中的至少一种化合物的方法,包括:
(a)在具有香味的组合物中选择多种化合物,其中该多种化合物中的每种化合物都具有至少一种调性;
(b)鉴定该多种化合物的调性;
(c)提供多种嗅觉受体,其中将与该多种化合物中的至少一种化合物相同的调性分配给多于一种的嗅觉受体;
(d)使至少一种测试化合物与该多于一种的嗅觉受体接触;
(e)确定该至少一种测试化合物是否激活该多于一种的嗅觉受体;和
(f)如果该测试化合物激活与该多种化合物中多于一种的化合物相同的嗅觉受体,则用该测试化合物替换该多种化合物中该多于一种的化合物。
在一个形态中,提供了一种生产具有希望的香味的组合物的方法,包括:
(a)选择希望的香味;
(b)确定组合起来会产生希望的香味的多种调性;和
(c)向组合物中加入具有该多种调性的至少一种化合物。
在一些形态中,具有该多种调性的至少一种化合物根据本文描述的某些形态的方法来鉴定。
在一个形态中,提供了一种去除具有希望的香味的组合物中的至少一种化合物的方法,包括:
(a)选择具有希望的香味的组合物,其中该香味由至少一种调性组成;
(b)鉴定与该至少一种调性相关联的至少一种嗅觉受体;
(c)在该具有希望的香味的组合物中选择至少一种化合物;
(d)使该至少一种化合物与该至少一种嗅觉受体接触;
(e)确定该化合物是否抑制该至少一种嗅觉受体;和
(f)如果该至少一种化合物抑制该至少一种嗅觉受体,则从该具有希望的香味的组合物中去除该至少一种化合物。
在一个形态中,提供了一种将至少一种化合物添加到具有香味的组合物中的方法,包括:
(a)选择具有香味的组合物,其中该香味由至少一种调性组成;
(b)鉴定与该至少一种调性相关联的至少一种嗅觉受体;
(c)使该至少一种嗅觉受体与至少一种测试化合物接触;
(d)确定该至少一种测试化合物是否抑制该至少一种嗅觉受体;和
(e)如果该至少一种测试化合物抑制该至少一种嗅觉受体,则将该至少一种测试化合物添加到该具有香味的组合物中;
其中,将该香味中不希望的调性分配给该至少一种嗅觉受体。
在一个形态中,提供了一种将至少一种化合物添加到具有香氛/香味的组合物中的方法,包括:
(a)选择具有香味的组合物,其中该香味由至少一种调性组成;
(b)鉴定与该至少一种调性中的第一调性相关联的第一嗅觉受体,其中该第一调性是该香味中所希望的;
(c)使该第一嗅觉受体与测试化合物接触;
(d)确定该测试化合物是否激活该第一嗅觉受体;
(e)鉴定与该至少一种调性中的第二调性相关联的第二嗅觉受体,其中该第二调性不是该香味中所希望的;
(f)使该第二嗅觉受体与该测试化合物接触;
(g)确定该测试化合物是否抑制该第二嗅觉受体;和
(h)如果该测试化合物激活该第一嗅觉受体并抑制该第二嗅觉受体,则将该测试化合物添加到该具有香味的组合物中。
在一些形态中,所添加的测试化合物替代了该香氛/香味中的一种化合物。
本公开进一步涵盖通过本文描述的方法鉴定的化合物。
本公开提供了用于表征相关受体并鉴定具有可用于香料或调味料应用以实现预期感知结果的所希望嗅觉调性的化合物的方法。
人OR库中的每种OR可能存在几种等位基因。每种等位基因都包含不同的单核苷酸多态性(SNP),它们可能会或可能不会影响给定OR的感受范围。因此,OR等位基因变异可以添加或去除化合物并改变激活化合物列表中化合物的绝对和相对效力和功效,因此可以为每个单独的OR等位基因生成不同的调性链接。类似地,其他等位基因差异,包括例如拷贝数变体(CNV)或编码序列截短,也可能导致OR调性特异性的变化。
语义可变性可以通过例如收集、整理和分析化合物和化学混合物的感知和化学描述的多个来源,以及确定给定化合物和混合物的特征(例如品质、强度和相关感受)的心理物理评估来解决。人工智能算法或技术的实施,包括但不限于自然语言处理、图卷积网络、深度神经网络和其他机器学习方法,以及描述符相似性和/或共现或潜在互斥性的统计分析,可以也可用于减轻语义分化的混淆效应。可以实施自动化过程以将OR与调性相关联,利用描述符出现的概率估计和相关分数以及受体活性或结合的测量,包括但不限于效力和功效。使用各种距离度量和聚类方法对描述符或化合物或混合物进行聚类,例如欧几里得距离(Euclidean distance)、搬土距离(earth-movers distance)、k均值最近邻法(k-means nearest neighbor),以及t分布随机邻域嵌入(t-distributed stochastic neighborhood embedding),它们应用于化合物、混合物的任何和所有可能度量,并且描述符可用于可视化和验证一种或多种OR与一种或多种调性以及任何和所有其他特性测量和特征之间的关联,包括但不限于化学、物理、物理化学、心理物理、感官、心理、情感,生物和复合特性。
可以通过比较感兴趣化合物的几种嗅觉描述来源来进一步鉴定常见的嗅觉调性,例如但不限于调香师(perfumer)的描述、调味师(flavorist)的描述、训练有素和未经训练的小组成员的描述、公开可用的香料化合物描述数据库、公开可用的风味化合物描述数据库、F&F行业知识和专业知识。如本文所用,“调香师”是调香领域的专家,其可以区分并描述调性,无论是单独的还是组合在香氛/香味中。
在进一步的实施方案中,与OR的活性相关的调性可以用a)具有共同调性但不同化学结构和b)具有相似化学结构(例如基于结构-活性关系(SAR)方法)但不同调性的多组化合物通过特异性地对受体进行测试来鉴定。两组之间对受体激活的比较揭示了激动作用的化学要求和受体激动剂的共同调性。
根据本发明的方法也可用于表征恶臭化合物的特定调性。可以筛选充分表征的恶臭OR以得到针对调节(例如增强、抑制、变构阻碍)恶臭OR的化合物。
本文提出的方法不限于特定类别的OR,并且包括I类和II类OR、由调味料/风味以及香料或恶臭化合物激活的受体。
监测OR活性的方法
只要OR的功能不受损,它可以以任何形式用于本文所述的方法或测定中。例如,OR可以如下使用:固有表达OR的组织或细胞,例如从生物体中分离的嗅觉感觉神经元,及其培养产物;带有OR的嗅觉细胞膜;经基因修饰以表达OR的重组细胞,及其培养产物;重组细胞的膜;以及携带OR的人工脂质双层膜。
用于监测嗅觉受体活性的指示剂包括例如荧光钙指示剂染料、钙指示剂蛋白(例如GCaMP,一种遗传编码的钙指示剂)、荧光cAMP指示剂、细胞流动测定、细胞动态质量再分布测定、基于无标记细胞的测定、cAMP反应元件(CRE)介导的报告蛋白、生化cAMP HTRF测定、β-抑制蛋白测定或电生理记录。在一个特定的实施方案中,选择可用于监测在嗅觉神经元膜上表达的嗅觉受体(例如Fura-2 AM)的活性的钙指示染料。可以依次筛选分子,并使用荧光显微镜或荧光激活细胞分选仪(FACS)测量钙染料荧光的气味依赖性变化。
作为一个例子,由目标激动剂例如具有特定嗅觉调性的分子激活的嗅觉神经元使用连接到显微操纵器的玻璃微电极或FACS机器来分离。小鼠嗅觉感觉神经元通过类似于先前描述的程序的Ca2+成像进行筛选。Malnic,B.,et al.Cell 96,713-723(1999);Araneda,R.C.et al.J.Physiol.555,743-756(2004);和WO2014/210585。特别是,使用电动可移动显微镜载物台将每个实验可筛选的细胞数量增加到至少1,500个。由于小鼠体内大约有1,200种不同的嗅觉受体,并且每种嗅觉感觉神经元仅表达1,200种嗅觉受体基因中的1种,因此这种筛选能力几乎涵盖了整个小鼠气味受体库。换句话说,用于高通量嗅觉感觉神经元筛选的钙成像组合导致识别出几乎所有对特定气味特征有反应的气味受体。在一种形态中,可分离出对目标激动剂有反应例如具有特定的嗅觉调性的气味受体,用于受体识别。例如,至少一个神经元被分离用于受体识别。
靶激动剂(例如具有一种或多种特定嗅觉调性)的人类或非人类哺乳动物受体可适用于功能测定,该功能测定可用于鉴定结合、压制、阻断、抑制和/或调节嗅觉受体活性的化合物。该测定可以是基于细胞的测定或结合测定,并且用于鉴定化合物的方法可以是高通量筛选测定。更具体而言,本文提供了基于受体的测定,其适于用化合物文库高通量筛选受体,以发现针对特定感兴趣激动剂的正变构调节剂、负变构调节剂、拮抗剂或反向激动剂调节剂化合物。
在一个实施方案中,如下从靶激动剂敏感细胞中鉴定靶激动剂(例如具有至少一种嗅觉调性)受体基因序列。将汇集的神经元加热至75℃持续10分钟以破坏细胞膜并使其mRNA可用于扩增。当使用有限量的起始材料(通常为1至15个细胞)应用NGS技术时,此扩增步骤非常重要。存在多种扩增方案。例如,根据Eberwine方法(IVT)进行的线性扩增可确保维持表达基因的相对转录水平。连续两轮过夜(14小时)体外转录用于产生足够量的cRNA;然后使用扩增的cRNA生成Illumina HiSeq cDNA文库。将得到的通常为75至150个碱基对的短序列(通常称为“读段”(reads))与小鼠的参考基因组(例如UCSC版本mm9或mm10)进行比对,以构建这些细胞的完整转录组。转录组数据的定量分析产生了转录的气味受体基因列表及其各自的表达水平。显示最丰富水平的mRNA(最丰富的“读段”)或存在于多于一次重复实验中的气味受体基因被认为是推定的靶激动剂受体。
然后使用预测的小鼠OR基因来挖掘小鼠和人类基因组数据库,以识别小鼠(旁系同源基因)和人类(直系同源基因)中最密切相关的受体(即最高序列相似性)。该过程可以使用BLAST搜索算法(可在NCBI网站上公开获得)执行,这是一种序列相似性搜索工具,其中先前从初始转录组分析中获得的每个推定基因序列都用作查询序列。在认为旁系同源和直系同源基因极有可能具有相似活性的假设下,从该数据挖掘过程中鉴定的新鉴定的基因被认为是特定嗅觉调性的潜在受体。在一个特定的实施方案中,进行序列同源性的成对比较以鉴定小鼠和人类中密切相关的受体,并且如WO2014/210585中所述鉴定受体。也可以使用其他方法,例如RT-PCR和微阵列或质谱法。
在进一步的实施方案中,为了完成脱孤法,候选OR基因在体外进一步表达以确认针对用于分离嗅觉感觉的化合物的活性,或者如先前实施方案中所述鉴定的它们的人直系同源物,该嗅觉感觉被鉴定为响应于靶激动剂(例如具有一种或多种特定的嗅觉调性),并在其N端用短多肽序列(例如(SEQ ID NO:2)、Rho(SEQ ID NO:4;牛视紫红质受体的头20个氨基酸)和/或Lucy(SEQ ID NO:6;可裂解的富含亮氨酸的信号肽序列)标签)修饰,在HEK 293T细胞中瞬时表达,并用靶激动剂(例如具有特定的嗅觉调性)单独刺激以确认它们作为特定靶激动剂的真正受体的身份。在进一步的实施方案中,无论是通过内源RTP1基因的激活(如WO 2016201153 A1中所述)还是通过转化或病毒转导,RTP1基因也可以在细胞系中表达。在该基于细胞的测定中,人类Gα亚基Gαolf的共表达激活了Gs转导途径,其导致在与合适的配体结合后内部cAMP增加。或者,在基于细胞的测定中,人类Gα亚基Gα15的共表达激活了Gq转导途径,其导致在与合适的配体结合后内部Ca2+增加。
在进一步的实施方案中,化合物与OR或其嵌合体或片段接触,其中OR或其嵌合体或其片段在经重组修饰以表达OR或其嵌合体或片段的细胞中表达。
在进一步的实施方案中,OR的分子3D受体建模用于评估计算机中的结合潜力并鉴定能激活、模拟、阻断、抑制、调节和/或增强OR活性的化合物。在进一步的实施方案中,本领域技术人员已知的机器学习算法,例如支持向量机、随机森林、XGBoost、图卷积网络、循环神经网络、变分自动编码器、生成对抗网络等可以与OR活性数据、分子3D受体结构数据、分子3D化合物结构数据和物理化学数据组合,以评估计算机中的结合潜力并预测能激活、模拟、阻断、抑制、调节和/或增强OR活性的化合物。
化合物的活性可以使用体内、离体、体外和合成筛选系统来确定。
在一个实施方案中,该接触可以用含有本文所述多肽的脂质体或病毒诱导的芽殖膜(budding membranes)进行。
在另一个实施方案中,用于鉴定结合、压制、阻断、抑制和/或调节OR活性的化合物的方法可以在完整细胞或来自表达本文所述多肽的细胞的膜级分上进行。
本文所述的OR可用于鉴定调节化合物,例如会降低对与OR相关联的特定嗅觉调性的感知的抑制剂或拮抗剂。
在进一步的实施方案中,编码特定嗅觉调性的OR的拮抗剂的使用可用于揭示化合物或多种化合物的混合物的其他残余调性。已知人类有意识地同时注意不同嗅觉调性的能力是有限的(例如Keller,A(2011))。在闻到具有多种调性的气味或香气的体验中,注意力在调性之间转移,因此一次只关注一种调性。不希望受限于任何特定的注意力调节理论,压制由拮抗的OR编码的调性必然会将其从竞争注意力的调性池中移除,从而允许剩余的调性占据注意力空间。在某些情况下,剩余OR活性的这种相对而非绝对的变化会导致其编码的调性明显的感知增强。
根据本发明适用的多肽
本发明包括本文具体描述的OR多肽的功能等同物或类似物或功能突变。
功能等同物是指一种多肽,其在用于OR活性的测试中显示高或低至少1%至10%、或至少20%、或至少50%、或至少75%、或至少90%、或至少95%的OR活性。
根据本发明,功能等同物还涵盖特定的突变体,其在本文所述氨基酸序列的至少一个序列位置中具有与具体所述不同的氨基酸,但仍具有上述生物活性之一。因此,功能等同物包括可通过一个或多个,例如1至20个、1至15个或5至10个氨基酸的添加、取代特别是保守取代、缺失和/或倒置而获得的突变体,其中所述变化可发生在任何序列位置,只要它们产生具有根据本发明的特性的突变体。如果活性模式与在突变体和未改变的多肽之间定性地重合,即,如果例如观察到与相同的激动剂或拮抗剂的相互作用,但是速率不同(即,通过EC50或IC50值或任何本技术领域合适的其他参数来表示)。下表显示了合适的(保守)氨基酸取代的例子:
上述意义上的功能等同物还包括所述多肽的前体,以及该多肽的功能衍生物和盐。前体是具有或不具有所希望生物活性的多肽的天然或合成前体。
表述“盐”是指根据本发明的蛋白质分子的羧基的盐以及氨基的酸加成的盐。羧基的盐可以已知的方式产生,包括无机盐,例如钠、钙、铵、铁和锌盐,以及与有机碱例如胺,如三乙醇胺、精氨酸、赖氨酸、哌啶等形成的盐。酸加成的盐,例如与无机酸例如盐酸或硫酸形成的盐,以及与有机酸例如乙酸和草酸形成的盐,也被本发明所涵盖。
根据本发明的多肽的功能衍生物还可以使用已知技术在功能性氨基酸侧基或它们的N末端或C末端产生。这样的衍生物包括例如:羧酸基的脂族酯,羧酸基的酰胺,它们可通过与氨或与伯或仲胺反应获得;游离氨基的N-酰基衍生物,其通过与酰基反应生成;或游离羟基的O-酰基衍生物,其通过与酰基反应生成。
功能等同物还包括可以从其他生物体获得的多肽以及天然存在的变体。例如,可以通过序列比较来确定同源序列区域的面积,并且等同的多肽可以基于本发明的具体参数来确定。
功能等同物还包括根据本发明的多肽的片段,优选单独的结构域或序列基序,其例如显示出所希望的生物学功能。
功能等同物包括融合蛋白,其具有本文所述的多肽序列之一或由其衍生的功能等同物,以及在功能性N-末端或C-末端缔合(即,没有融合蛋白部分的实质性相互功能受损)中的至少一个另外的功能不同的异源序列。这些异源序列的非限制性例子是例如信号肽、组氨酸锚或酶。
根据本发明的功能等同物包括具体公开的多肽的同源物。它们与具体公开的氨基酸序列之一具有至少60%,优选至少75%,特别是至少80或85%,例如90、91、92、93、94、95、96、97、98或99%的同源性(或同一性),其通过Pearson and Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算。根据本发明的同源多肽的以百分比表示的同源性或同一性尤其是指基于本文具体描述的氨基酸序列之一的总长度,以氨基酸残基的百分比表示的同一性。
以百分比表示的同一性数据也可以借助于BLAST比对,算法blastp(蛋白质-蛋白质BLAST)或通过应用本文下面详述的Clustal设置来确定。
在可能的蛋白质糖基化的情况下,根据本发明的功能等同物包括本文所述的去糖基化或糖基化形式的多肽,以及可以通过改变糖基化模式获得的经修饰形式。
根据本发明的多肽的功能等同物或同源物可以通过诱变产生,例如通过点突变,延长或缩短蛋白质或如下文更详细描述。
根据本发明的多肽的功能等同物或同源物可以通过筛选突变体例如缩短的突变体的组合数据库来鉴定。例如,蛋白质变体的多样性数据库可以通过在核酸水平上的组合诱变,例如通过合成寡核苷酸混合物的酶促连接来产生。有许多方法可用于从简并寡核苷酸序列产生潜在同源物的数据库。简并基因序列的化学合成可以在自动DNA合成仪中进行,然后可以将合成基因连接在合适的表达载体中。简并基因组的使用使得可以提供混合物中的所有序列,其编码所需的潜在蛋白质序列集合。简并寡核苷酸的合成方法是本领域技术人员已知的(例如Narang,S.A.(1983);Itakura et al.(1984)(a);Itakura et al.,(1984)(b);Ike et al.(1983))。该方法还涵盖了多肽的产生,该多肽具有密码子优化的核酸序列,即适应宿主细胞的密码子使用频率。
已知几种技术用于筛选通过点突变或缩短产生的组合数据库的基因产物,以及用于筛选具有选定性质的基因产物的cDNA文库。这些技术可以适用于快速筛选通过根据本发明的同源物的组合诱变产生的基因库。最常用于筛选大型基因库的基于高通量分析的技术包括在可复制的表达载体中克隆基因库,用所得载体数据库转化合适的细胞,以及在特定条件下表达组合基因,在所述条件下,所需活性的检测促进编码基因(其产物被检测)的载体的分离。递归整合诱变(REM)是一种提高数据库中功能突变体频率的技术,其可以与筛选测试结合使用,以鉴定同源物(Arkin and Yourvan(1992);Delgrave et al.(1993))。
根据本发明的核酸序列
本发明包括编码本发明多肽的核酸序列。
本发明还涉及与本文具体公开的序列具有一定程度的“同一性”的核酸。两个核酸之间的“同一性”是指在每种情况下在核酸的整个长度上核苷酸的同一性。
例如,同一性可以通过Informax公司(美国)的Vector NTI Suite 7.1程序使用Clustal方法(Higgins DG,Sharp PM.((1989)))通过以下设置来计算:
多重比对参数:
成对比对参数:
或者,同一性可以根据Chenna et al.(2003),网页:http://www.ebi.ac.uk/Tools/clustalw/index.html#的方法和以下设置来确定:
本发明还涉及编码上述多肽之一及其功能等同物的核酸序列(单链和双链DNA和RNA序列,例如cDNA和mRNA),其可以例如使用人工核苷酸类似物获得。
本发明涉及编码根据本发明的多肽或其生物活性区段的分离的核酸分子,并且涉及核酸片段,其可以例如用作杂交探针或引物,用于鉴定或扩增根据本发明的编码核酸。
根据本发明的核酸分子可以另外包含来自编码遗传区域的3'和/或5'末端的非翻译序列。本发明进一步涉及与具体描述的核苷酸序列或其区段互补的核酸分子。
根据本发明的核苷酸序列使得可以产生可用于鉴定和/或克隆其他细胞类型和生物体中的同源序列的探针和引物。此类探针或引物通常包含在“严格”条件下(见下文)与根据本发明的核酸序列的有义链或相应的反义链的至少约12个,优选至少约25个,例如约40、50或75个连续核苷酸杂交的核苷酸序列区域。
“分离的”核酸分子与存在于核酸天然来源中的其他核酸分子分离,并且如果通过重组技术生产,则可以基本上不含其他细胞材料或培养基,或者如果通过化学合成,则可以不含化学前体或其他化学物质。
“杂交”是指多核苷酸或寡核苷酸在标准条件下结合几乎互补的序列的能力,而在这些条件下非互补配对者之间不发生非特异性结合。为此,序列可以是90~100%互补的。能够彼此特异性结合的互补序列的性质被用于例如Northern印迹或Southern印迹或PCR或RT-PCR中的引物结合。
保守区的短寡核苷酸有利地用于杂交。然而,也可能使用更长的本发明核酸片段或完整序列进行杂交。这些标准条件取决于所使用的核酸(寡核苷酸,更长的片段或完整序列)或用于杂交的核酸类型(DNA或RNA)而有所不同。例如,DNA:DNA杂交种的解链温度比相同长度的DNA:RNA杂交种低约10℃。
例如,根据特定核酸的不同,标准条件是指温度在42至58℃,在浓度为0.1至5x SSC(1X SSC=0.15M NaCl,15mM柠檬酸钠,pH 7.2)的缓冲水溶液中,或另外在50%甲酰胺(例如42℃,5x SSC,50%甲酰胺)的存在下。有利地,用于DNA:DNA杂交种的杂交条件是0.1×SSC,温度为约20℃至45℃,优选约30℃至45℃。对于DNA:RNA杂交种,杂交条件有利地为0.1×SSC,并且温度为约30℃至55℃,优选约45℃至55℃。这些所述的杂交温度是对于长度约100个核苷酸的核酸,以及在不存在甲酰胺的情况下G+C含量为50%的经计算的解链温度值的例子。DNA杂交的实验条件已在相关的遗传学教科书(例如Sambrook et al.,1989)中进行了描述,并且可以使用本领域技术人员已知的分子式来计算,例如取决于核酸的长度,杂交种的类型或G+C含量。本领域技术人员可以从以下教科书中获得有关杂交的更多信息:Ausubel et al.(eds),(1985),Brown(ed)(1991)。
杂交可以在严格条件下进行。此类杂交条件例如描述于Sambrook(1989),或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。
如本文所用,术语杂交或在一定条件下杂交旨在描述杂交和洗涤的条件,在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70%,例如至少约80%和例如至少约85%、90%或95%同一性的序列保持彼此结合。
本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols in Molecular Biology,John Wiley&Sons,sections 2,4,and 6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外,严格条件在Sambrook等人(1989,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)中描述。
低严格度的条件如下。含有DNA的滤膜在含有35%甲酰胺,5x SSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中于40℃预处理6小时。杂交在相同的溶液中进行,并进行以下修改:0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖,并使用5-20x106 32P标记的探针。将滤膜在杂交混合物中于40℃孵育18~20小时,然后于55℃洗涤1.5小时。在含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS的溶液中。用新鲜溶液代替洗涤溶液,并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。
中等严格度条件如下。含有DNA的滤膜在含有35%甲酰胺,5x SSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中于50℃预处理7小时。杂交在相同的溶液中进行,并进行以下修改:0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖,并使用5-20x106 32P标记的探针。将滤膜在杂交混合物中于50℃孵育30小时,然后于55℃洗涤1.5小时。在含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS的溶液中。用新鲜溶液代替洗涤溶液,并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。
高严格度条件如下。含DNA的滤膜在由6x SSC,50mM Tris-HCl(pH 7.5),1mM EDTA,0.02%PVP,0.02%Ficoll,0.02%BSA和500μg/ml变性鲑鱼精子DNA组成的缓冲液中于65℃下预杂交8小时至过夜。在含有100μg/ml变性鲑鱼精子DNA和5-20x106 cpm 32P标记探针的预杂交混合物中,将滤膜在65℃下杂交48小时。滤膜在含有2x SSC,0.01%PVP,0.01%Ficoll和0.01%BSA的溶液中于37℃洗涤1小时。然后在0.1x SSC中于50℃洗涤45分钟。
如果上述条件不合适(例如,如用于种间杂交),则可以使用本领域众所周知的其他低、中等和高严格度条件(例如,用于种间杂交)。
根据本发明的其他核酸序列可以衍生自本文具体公开的序列,并且可以通过添加、取代、插入或缺失单个或几个核苷酸而与之不同,并且还编码具有所需特性概貌的多肽。
本发明还涵盖这样的核酸序列,其包含所谓的沉默突变,或根据具体原始或宿主生物体的密码子使用,与具体所述的序列相比已经改变,以及其天然存在的变体,例如剪接变体或等位基因变体。
根据本发明的核酸序列的衍生物是指例如等位基因变体,在所衍生的氨基酸水平上,其具有在整个氨基酸范围至少60%的同源性,优选至少80%的同源性,非常特别优选至少90%的同源性(关于氨基酸水平的同源性,应参考以上对于多肽给出的详细信息)。有利地,同源性可以在序列的部分区域上更高。
此外,衍生物也应理解为根据本发明的核酸序列的同源物,例如动物、植物、真菌或细菌的同源物,缩短的序列,编码和非编码DNA序列的单链DNA或RNA。例如,在DNA水平上,同源物在本文具体公开的序列中给定的整个DNA区域中具有至少40%,优选至少60%,特别优选至少70%,非常特别优选至少80%的同源性。
此外,衍生物应理解为例如与启动子的融合体。添加至所述核苷酸序列的启动子可以通过至少一种核苷酸交换、至少一种插入、倒置和/或缺失进行修饰,但不损害启动子的功能或功效。此外,启动子的功效可以通过改变它们的序列来增加,或者可以与更有效的启动子甚至是不同属的生物体的启动子完全交换。
此外,本领域技术人员熟悉产生功能性突变体的方法,即一种核苷酸序列,其编码多肽,该多肽与SEQ ID NO:2、4、6或8中任一者具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;和/或由核酸分子编码,该核酸分子包含与SEQ ID NO:1、3、5或7具有至少70%序列同一性的核苷酸序列。
取决于所使用的技术,本领域技术人员可以将完全随机的或更有针对性的突变引入到基因或非编码核酸区域(例如对于调节表达很重要)中,并随后产生遗传文库。为此目的所需的分子生物学方法是技术人员已知的,例如描述于Sambrook and Russell,Molecular Cloning.3rd Edition,Cold Spring Harbor Laboratory Press 2001。
修饰基因并由此修饰由其编码的多肽的方法是本领域技术人员长期已知的,举例而言例如:
-位点特异性诱变,其中基因的单个或多个核苷酸以定向方式被替换(Trower MK(Ed.)1996;In vitro mutagenesis protocols.Humana Press,New Jersey),
-饱和诱变,其中任何氨基酸的密码子都可以在基因的任何位点交换或添加(Kegler-Ebo DM,Docktor CM,DiMaio D(1994)Nucleic Acids Res 22:1593;Barettino D,Feigenbutz M,Valcárel R,Stunnenberg HG(1994)Nucleic Acids Res 22:541;Barik S(1995)Mol Biotechnol 3:1),
-易错聚合酶链反应,其中核苷酸序列被易错DNA聚合酶突变(Eckert KA,Kunkel TA(1990)Nucleic Acids Res 18:3739);
-SeSaM法(序列饱和法),其中优选的交换被聚合酶阻止。Schenk et al.,Biospektrum,Vol.3,2006,277-279,
-突变株中的基因传代,其中例如由于DNA修复机制缺陷,核苷酸序列的突变率增加(Greener A,Callahan M,Jerpseth B(1996)An efficient random mutagenesis technique using an E.coli mutator strain.In:Trower MK(Ed.)In vitro mutagenesis protocols.Humana Press,New Jersey),或
-DNA改组,其中形成并消化一组密切相关的基因,并将这些片段用作聚合酶链反应的模板,其中通过重复的链分离和重新结合,最终生成了全长的镶嵌基因(Stemmer WPC(1994)Nature 370:389;Stemmer WPC(1994)Proc Natl Acad Sci USA 91:10747)。
使用所谓的定向进化(尤其描述于Reetz MT and Jaeger K-E(1999),Topics Curr Chem 200:31;Zhao H,Moore JC,Volkov AA,Arnold FH(1999),Methods for optimizing industrial polypeptides by directed evolution,In:Demain AL,Davies JE(Ed.)Manual of industrial microbiology and biotechnology.American Society for Microbiology),熟练的工人可以以定向的方式大规模产生功能性突变体。为此,在第一步中,首先,例如使用上文给出的方法,产生各自多肽的基因文库。基因文库以合适的方式表达,例如通过细菌或噬菌体展示系统来表达。
表达功能性突变体的宿主生物体的相关基因(其功能在很大程度上与所需的特性相对应)可以提交给另一个突变周期。突变和选择或筛选的步骤可以迭代地重复,直到本发明的功能性突变体具有足够程度的所需特性。使用该迭代过程,可以分阶段进行有限数量的突变,例如1、2、3、4或5个突变,并评估和选择它们对所研究活性的影响。然后可以以相同的方式将所选择的突变体进行进一步的突变步骤。这样,可以显著减少待研究的单个突变体的数量。
根据本发明的结果还提供了与相关多肽的结构和序列有关的重要信息,这是以靶向方式产生具有所需修饰特性的其他多肽所必需的。特别地,可以定义所谓的“热点”,即潜在地适合于通过引入靶向突变来修饰特性的序列区段。
也可以推导出有关氨基酸序列位置的信息,在该区域中可以发生可能对活性几乎没有影响的突变,并且可以将其指定为潜在的“沉默突变”。
为了在合适的宿主生物体中表达,将重组核酸构建体或基因构建体有利地插入到宿主特异性载体中,这使得基因在宿主中的最佳表达成为可能。载体是技术人员众所周知的,并且可以在例如\"cloning vectors\"(Pouwels P.H.et al.,Ed.,Elsevier,Amsterdam-New York-Oxford,1985)中找到。
下面列出了本文鉴定和/或使用的核酸和氨基酸序列:
标签
SEQ ID NO:1-DNA
gattacaaggacgacgacgataag
SEQ ID NO:2–蛋白质
DYKDDDDK
Rho标签
SEQ ID NO:3-DNA
atgaacgggaccgagggcccaaacttctacgtgcctttctccaacaagacgggcgtggtg
SEQ ID NO:4-蛋白质
MNGTEGPNFYVPFSNKTGVV
Lucy标签
SEQ ID NO:5-DNA
atgagaccccagatcctgctgctcctggccctgctgaccctaggcctggct
SEQ ID NO:6-蛋白质
MRPQILLLLALLTLGLA
基序
SEQ ID NO:7
MAYDRYVAIC
基序
SEQ ID NO:8
FSTCSSH
基序
SEQ ID NO:9
PMLNPFIY
OR11A1
SEQ ID NO:10-DNAatggaaattgtctccacaggaaacgaaactattactgaatttgtcctccttggcttctatgacatccctgaactgcatttcttgttttttattgtattcactgctgtctatgtcttcatcatcatagggaatatgctgattattgtagcagtggttagctcccagaggctccacaaacccatgtatattttcttggcgaatctgtccttcctggatattctctacacctccgcagtgatgccaaaaatgctggagggcttcctgcaagaagcaactatctctgtggctggttgcttgctccagttctttatcttcggctctctagccacagctgaatgcttactgctggctgtcatggcatatgaccgctacctggcaatttgctacccactccactacccactcctgatggggcccagacggtacatggggctggtggtcacaacctggctctctggatttgtggtagatggactggttgtggccctggtggcccagctgaggttctgtggccccaaccacattgaccagttttactgtgactttatgcttttcgtgggcctggcttgctcggatcccagagtggctcaggtgacaactctcattctgtctgtgttctgcctcactattccttttggactgattctgacatcttatgccagaattgtggtggcagtgctgagagttcctgctggggcaagcaggagaagggctttctccacatgctcctcccacctagctgtagtgaccacattctatggaacgctcatgatcttttatgttgcaccctctgctgtccattcccagctcctctccaaggtcttctccctgctctacactgtggtcacccctctcttcaatcctgtgatctataccatgaggaacaaggaggtgcatcaggcacttcggaagattctctgtatcaaacaaactgaaacacttgattga
SEQ ID NO:11-蛋白质
MEIVSTGNETITEFVLLGFYDIPELHFLFFIVFTAVYVFIIIGNMLIIVAVVSSQRLHKPMYIFLANLSFLDILYTSAVMPKMLEGFLQEATISVAGCLLQFFIFGSLATAECLLLAVMAYDRYLAICYPLHYPLLMGPRRYMGLVVTTWLSGFVVDGLVVALVAQLRFCGPNHIDQFYCDFMLFVGLACSDPRVAQVTTLILSVFCLTIPFGLILTSYARIVVAVLRVPAGASRRRAFSTCSSHLAVVTTFYGTLMIFYVAPSAVHSQLLSKVFSLLYTVVTPLFNPVIYTMRNKEVHQALRKILCIKQTETLD
OR8B3
SEQ ID NO:12-DNA
atgctggctagaaacaactccttagtgactgaatttattcttgctggattaacagatcatccagagttccagcaacccctctttttcctgtttctagtggtctacattgtcaccatggtaggcaaccttggcttgatcattcttttcggtctaaattctcacctccacacaccaatgtactatttcctcttcaatctctccttcattgatctctgttactcctctgttttcactcccaaaatgctaatgaactttgtatcaaaaaagaatattatctcctatgttgggtgcatgactcagctgtttttctttctcttttttgtcatctctgaatgttacatgttgacctcaatggcatatgatcgctatgtggccatctgtaatccattgctgtataaggtcaccatgtcccatcaggtctgttctatgctcacttttgctgcttacataatgggattggctggagccacggcccacaccgggtgcatgcttagactcaccttctgcagtgctaatatcatcaaccattacttgtgtgacatactccccctcctccagctttcctgcaccagcacctatgtcaacgaggtggttgttctcattgttgtgggtattaatatcatggtacccagttgtaccatcctcatttcttatgttttcattgtcactagcattcttcatatcaaatccactcaaggaagatcaaaagccttcagtacttgtagctctcatgtcattgctctgtctctgttttttgggtcagcggcattcatgtatattaaatattcttctggatctatggagcagggaaaagtttcttctgttttctacactaatgtggtgcccatgctcaatcctctcatctacagtttgaggaacaaggatgtcaaagttgcactgaggaaagctctgattaaaattcagagaagaaatatattctaa
SEQ ID NO:13-蛋白质
MLARNNSLVTEFILAGLTDHPEFQQPLFFLFLVVYIVTMVGNLGLIILFGLNSHLHTPMYYFLFNLSFIDLCYSSVFTPKMLMNFVSKKNIISYVGCMTQLFFFLFFVISECYMLTSMAYDRYVAICNPLLYKVTMSHQVCSMLTFAAYIMGLAGATAHTGCMLRLTFCSANIINHYLCDILPLLQLSCTSTYVNEVVVLIVVGINIMVPSCTILISYVFIVTSILHIKSTQGRSKAFSTCSSHVIALSLFFGSAAFMYIKYSSGSMEQGKVSSVFYTNVVPMLNPLIYSLRNKDVKVALRKALIKIQRRNIF
OR5AU1
SEQ ID NO:14-DNA
atgaaaggggcaaacctgagccaagggatggagtttgagctcttgggcctcaccactgacccccagctccagaggctgctcttcgtggtgttcctgggcatgtacacagccactctgctggggaacctggtcatgttcctcctgatccatgtgagtgccaccctgcacacacccatgtactccctcctgaagagcctctccttcttggatttctgctactcctccacggttgtgccccagaccctggtgaacttcttggccaagaggaaagtgatctcttattttggctgcatgactcagatgttcttctatgcgggttttgccaccagtgagtgctatctcatcgctgccatggcctatgaccgctatgccgctatttgtaaccccctgctctactcaaccatcatgtctcctgaggtctgtgcctcgctgattgtgggctcctacagtgcaggattcctcaattctcttatccacactggctgtatctttagtctgaaattctgcggtgctcatgtcgtcactcacttcttctgtgatgggccacccatcctgtccttgtcttgtgtagacacctcactgtgtgagatcctgctcttcatttttgctggtttcaaccttttgagctgcaccctcaccatcttgatctcctacttcttaattctcaacaccatcctgaaaatgagctcggcccagggcaggtttaaggcattttccacctgtgcatcccacctcactgccatctgcctcttctttggcacaacactttttatgtacctgcgccccaggtccagctactccttgacccaggaccgcacagttgctgtcatctacacagtggtgatcccagtgctgaaccccctcatgtactctttgagaaacaaggatgtgaagaaagctttaataaaggtttggggtaggaaaacaatggaatga
SEQ ID NO:15-蛋白质
MKGANLSQGMEFELLGLTTDPQLQRLLFVVFLGMYTATLLGNLVMFLLIHVSATLHTPMYSLLKSLSFLDFCYSSTVVPQTLVNFLAKRKVISYFGCMTQMFFYAGFATSECYLIAAMAYDRYAAICNPLLYSTIMSPEVCASLIVGSYSAGFLNSLIHTGCIFSLKFCGAHVVTHFFCDGPPILSLSCVDTSLCEILLFIFAGFNLLSCTLTILISYFLILNTILKMSSAQGRFKAFSTCASHLTAICLFFGTTLFMYLRPRSSYSLTQDRTVAVIYTVVIPVLNPLMYSLRNKDVKKALIKVWGRKTME
OR8D1
SEQ ID NO:16-DNA
atgaccatggaaaattattctatggcagctcagtttgtcttagatggtttaacacagcaagcagagctccagctgcccctcttcctcctgttcctgggaatctatgtggtcacagtagtgggcaacctgggcatgattctcctgattgcagtcagccctctacttcacacccccatgtactatttcctcagcagcttgtccttcgtcgatttctgctattcctctgtcattactcccaaaatgctggtgaacttcctaggaaagaagaatacaatcctttactctgagtgcatggtccagctctttttctttgtggtctttgtggtggctgagggttacctcctgactgccatggcatatgatcgctatgttgccatctgtagcccactgctttataatgcgatcatgtcctcatgggtctgctcactgctagtgctggctgccttcttcttgggctttctctctgccttgactcatacaagtgccatgatgaaactgtccttttgcaaatcccacattatcaaccattacttctgtgatgttcttcccctcctcaatctctcctgctccaacacacacctcaatgagcttctactttttatcattgcggggtttaacaccttggtgcccaccctagctgttgctgtctcctatgccttcatcctctacagcatccttcacatccgctcctcagagggccggtccaaagcttttggaacatgcagctctcatctcatggctgtggtgatcttctttgggtccattaccttcatgtatttcaagcccccttcaagtaactccctggaccaggagaaggtgtcctctgtgttctacaccacggtgatccccatgctgaaccctttaatatacagtctgaggaataaggatgtgaagaaagcattaaggaaggtcttagtaggaaaatga
SEQ ID NO:17-蛋白质
MTMENYSMAAQFVLDGLTQQAELQLPLFLLFLGIYVVTVVGNLGMILLIAVSPLLHTPMYYFLSSLSFVDFCYSSVITPKMLVNFLGKKNTILYSECMVQLFFFVVFVVAEGYLLTAMAYDRYVAICSPLLYNAIMSSWVCSLLVLAAFFLGFLSALTHTSAMMKLSFCKSHIINHYFCDVLPLLNLSCSNTHLNELLLFIIAGFNTLVPTLAVAVSYAFILYSILHIRSSEGRSKAFGTCSSHLMAVVIFFGSITFMYFKPPSSNSLDQEKVSSVFYTTVIPMLNPLIYSLRNKDVKKALRKVLVGK
OR5AN1
SEQ ID NO:18-DNA
atgactgggggaggaaatattacagaaatcacctatttcatcctgctgggattctcagattttcccaggatcataaaagtgctcttcactatattcctggtgatctacattacatctctggcctggaacctctccctcattgttttaataaggatggattcccacctccatacacccatgtatttcttcctcagtaacctgtccttcatagatgtctgctatatcagctccacagtccccaagatgctctccaacctcttacaggaacagcaaactatcacttttgttggttgtattattcagtactttatcttttcaacgatgggactgagtgagtcttgtctcatgacagccatggcttatgatcgttatgctgccatttgtaaccccctgctctattcatccatcatgtcacccaccctctgtgtttggatggtactgggagcctacatgactggcctcactgcttctttattccaaattggtgctttgcttcaactccacttctgtgggtctaatgtcatcagacatttcttctgtgacatgccccaactgttaatcttgtcctgtactgacactttctttgtacaggtcatgactgctatattaaccatgttctttgggatagcaagtgccctagttatcatgatatcctatggctatattggcatctccatcatgaagatcacttcagctaaaggcaggtccaaggcattcaacacctgtgcttctcatctaacagctgtttccctcttctatacatcaggaatctttgtctatttgagttccagctctggaggttcttcaagctttgacagatttgcatctgttttctacactgtggtcattcccatgttaaatcccttgatttacagtttgaggaacaaagaaattaaagatgccttaaagaggttgcaaaagagaaagtgctgctga
SEQ ID NO:19-蛋白质
MTGGGNITEITYFILLGFSDFPRIIKVLFTIFLVIYITSLAWNLSLIVLIRMDSHLHTPMYFFLSNLSFIDVCYISSTVPKMLSNLLQEQQTITFVGCIIQYFIFSTMGLSESCLMTAMAYDRYAAICNPLLYSSIMSPTLCVWMVLGAYMTGLTASLFQIGALLQLHFCGSNVIRHFFCDMPQLLILSCTDTFFVQVMTAILTMFFGIASALVIMISYGYIGISIMKITSAKGRSKAFNTCASHLTAVSLFYTSGIFVYLSSSSGGSSSFDRFASVFYTVVIPMLNPLIYSLRNKEIKDALKRLQKRKCC
OR1N2
SEQ ID NO:20-DNA
atgggaaaaccaggcagagtgaaccaaaccactgtttcagacttcctccttttaggactctctgagcggccagaggagcagcctcttctgtttggcatcttccttggcatgtacctggtcaccatggtggggaacctgctcattatcctggccatcagctctgacccacacctccatactcccatgtacttctttctggccaacctgtcattaactgatgcctgtttcacttctgcctccatccccaaaatgctggccaacattcatacccagagtcagatcatctcctattctgggtgtcttgcacagctatatttcctccttatgtttggtggccttgacaactgcctgctggctgtgatggcatatgaccgctatgtggccatctgccaaccactccattacagcacatctatgagtccccagctctgtgcactaatgctgggtgtgtgctgggtgctaaccaactgtcctgccctgatgcacacactgttgctgacccgcgtggctttctgtgcccagaaagccatccctcatttctactgtgatcccagtgctctcctgaagcttgcctgctcagatacccatgtaaacgagctgatgatcatcaccatgggcttgctgttcctcactgttcccctcctgctgatcgtcttctcctatgtccgcattttctgggctgtgtttggcatctcatctcctggagggagatggaaggccttctctacctgtggttctcatctcacggtggttctgctcttctatgggtctcttatgggtgtgtatttacttcctccatcaacttactctacagagagggaaagtagggctgctgttctctatatggtgattattcccatgctaaacccattcatttatagcttgaggaacagagacatgaaggaggctttgggtaaactttttgtcagtggaaaaacattctttttatga
SEQ ID NO:21-蛋白质
MGKPGRVNQTTVSDFLLLGLSERPEEQPLLFGIFLGMYLVTMVGNLLIILAISSDPHLHTPMYFFLANLSLTDACFTSASIPKMLANIHTQSQIISYSGCLAQLYFLLMFGGLDNCLLAVMAYDRYVAICQPLHYSTSMSPQLCALMLGVCWVLTNCPALMHTLLLTRVAFCAQKAIPHFYCDPSALLKLACSDTHVNELMIITMGLLFLTVPLLLIVFSYVRIFWAVFGISSPGGRWKAFSTCGSHLTVVLLFYGSLMGVYLLPPSTYSTERESRAAVLYMVIIPMLNPFIYSLRNRDMKEALGKLFVSGKTFFL
OR5A1
SEQ ID NO:22-DNA
atgtccataaccaaagcctggaacagctcatcagtgaccatgttcatcctcctgggattcacagaccatccagaactccaggccctcctctttgtgaccttcctgggcatctatcttaccaccctggcctggaacctggccctcatttttctgatcagaggtgacacccatctgcacacacccatgtacttcttcctaagcaacttatctttcattgacatctgctactcttctgctgtggctcccaatatgctcactgacttcttctgggagcagaagaccatatcatttgtgggctgtgctgctcagttttttttctttgtcggcatgggtctgtctgagtgcctcctcctgactgctatggcatacgaccgatatgcagccatctccagcccccttctctaccccactatcatgacccagggcctctgtacacgcatggtggttggggcatatgttggtggcttcctgagctccctgatccaggccagctccatatttaggcttcacttttgcggacccaacatcatcaaccacttcttctgcgacctcccaccagtcctggctctgtcttgctctgacaccttcctcagtcaagtggtgaatttcctcgtggtggtcactgtcggaggaacatcgttcctccaactccttatctcctatggttacatagtgtctgcggtcctgaagatcccttcagcagagggccgatggaaagcctgcaacacgtgtgcctcgcatctgatggtggtgactctgctgtttgggacagcccttttcgtgtacttgcgacccagctccagctacttgctaggcagggacaaggtggtgtctgttttctattcattggtgatccccatgctgaaccctctcatttacagtttgaggaacaaagagatcaaggatgccctgtggaaggtgttggaaaggaagaaagtgttttcttag
SEQ ID NO:23-蛋白质
MSITKAWNSSSVTMFILLGFTDHPELQALLFVTFLGIYLTTLAWNLALIFLIRGDTHLHTPMYFFLSNLSFIDICYSSAVAPNMLTDFFWEQKTISFVGCAAQFFFFVGMGLSECLLLTAMAYDRYAAISSPLLYPTIMTQGLCTRMVVGAYVGGFLSSLIQASSIFRLHFCGPNIINHFFCDLPPVLALSCSDTFLSQVVNFLVVVTVGGTSFLQLLISYGYIVSAVLKIPSAEGRWKACNTCASHLMVVTLLFGTALFVYLRPSSSYLLGRDKVVSVFYSLVIPMLNPLIYSLRNKEIKDALWKVLERKKVFS
OR7A17
SEQ ID NO:24-DNA
atggaaccagagaatgacacagggatttcagaatttgttcttctgggactttctgaggaaccagaattgcagcccttcctctttgggctgtttctgtccatgtacctggtcactgtgctcgggaatctgctcatcatcctggccacaatctcagactcccacctccacacccccatgtacttcttcctctccaacctgtcctttgcagacatctgtttcatctccactacaatcccaaagatgctcattaacatccagacacagagcagagtcatcacctatgcaggctgcatcacccagatgtgcttttttgtactttttggagggttagacagcttactcctggctgtgatggcctatgatcggtttgtggccatctgtcatcctctgcactacacagtcatcatgaaccctcggctctgtggactcctggttctggcatcctggatgattgctgccctgaattccttgtcacaaagcttaatggtattgtggctgtccttctgcacagacttggaaatcccccactttttctgtgaacttaatcaggtcatccaccttgcctgttctgacacctttcttaatgacatggggatgtattttgcagcagggctgctggctggtggtccccttgtggggatcctttgctcttactctaagatagtttcctccatacgtgcaatctcatcagctcaggggaagtacaaggcattttccacctgtgcatcacacctctcagttgtctctttattttgttgtacgggcctaggtgtgtaccttacttctgctgcaacccacaactcacacacaagtgcaacagcctcagtgatgtacactgtggccacccccatgctgaacccctttatctacagtctgaggaataaagacataaagagggctctgaaaatgtccttcagaggaaagcaataa
SEQ ID NO:25-蛋白质
MEPENDTGISEFVLLGLSEEPELQPFLFGLFLSMYLVTVLGNLLIILATISDSHLHTPMYFFLSNLSFADICFISTTIPKMLINIQTQSRVITYAGCITQMCFFVLFGGLDSLLLAVMAYDRFVAICHPLHYTVIMNPRLCGLLVLASWMIAALNSLSQSLMVLWLSFCTDLEIPHFFCELNQVIHLACSDTFLNDMGMYFAAGLLAGGPLVGILCSYSKIVSSIRAISSAQGKYKAFSTCASHLSVVSLFCCTGLGVYLTSAATHNSHTSATASVMYTVATPMLNPFIYSLRNKDIKRALKMSFRGKQ
OR10J5
SEQ ID NO:26-DNA
atgaagagaaagaacttcacagaagtgtcagaattcattttcttgggattttctagctttggaaagcatcagataaccctctttgtggttttcctaactgtctacattttaactctggttgctaacatcatcattgtgactatcatctgcattgaccatcatctccacactcccatgtatttcttcctaagcatgctggctagttcagagacggtgtacacactggtcattgtgccacgaatgcttttgagcctcatttttcataaccaacctatctccttggcaggctgtgctacacaaatgttcttttttgttatcttggccactaataattgcttcctgcttactgcaatggggtatgaccgctatgtggccatctgcagacccctgagatacactgtcatcatgagcaagggactatgtgcccagctggtgtgtgggtcctttggcattggtctgactatggcagttctccatgtgacagccatgttcaatttgccgttctgtggcacagtggtagaccacttcttttgtgacatttacccagtcatgaaactttcttgcattgataccactatcaatgagataataaattatggtgtaagttcatttgtgatttttgtgcccataggcctgatatttatctcctatgtccttgtcatctcttccatccttcaaattgcctcagctgagggccggaagaagacctttgccacctgtgtctcccacctcactgtggttattgtccactgtggctgtgcctccattgcctacctcaagccgaagtcagaaagttcaatagaaaaagaccttgttctctcagtgacgtacaccatcatcactcccttgctgaaccctgttgtttacagtctgagaaacaaggaggtaaaggatgccctatgcagagttgtgggcagaaatatttcttaa
SEQ ID NO:27-蛋白质
MKRKNFTEVSEFIFLGFSSFGKHQITLFVVFLTVYILTLVANIIIVTIICIDHHLHTPMYFFLSMLASSETVYTLVIVPRMLLSLIFHNQPISLAGCATQMFFFVILATNNCFLLTAMGYDRYVAICRPLRYTVIMSKGLCAQLVCGSFGIGLTMAVLHVTAMFNLPFCGTVVDHFFCDIYPVMKLSCIDTTINEIINYGVSSFVIFVPIGLIFISYVLVISSILQIASAEGRKKTFATCVSHLTVVIVHCGCASIAYLKPKSESSIEKDLVLSVTYTIITPLLNPVVYSLRNKEVKDALCRVVGRNIS
OR1C1
SEQ ID NO:28-DNA
atggaaaaaagaaatctaacagttgtcagggaattcgtccttctgggacttcctagctcagcagagcagcagcacctcctgtctgtgctctttctctgtatgtatttagccaccaccttggggaacatgctcatcattgcgacgattggctttgactctcacctccattcccctatgtacttcttccttagtaacttggcctttgttgacatctgctttacgtcgactacagtcccccaaatggtagtgaatatcttgactggcaccaagactatctcttttgcaggctgcctcacccagctcttcttcttcgtttcttttgtgaatatggacagcctccttctgtgtgtgatggcgtatgatagatatgtggcgatttgccaccccttacattacaccgccagaatgaacctgtgcctttgtgtccagctagtggctggactgtggcttgttacttacctccacgccctcctgcatactgtcctaatagcacagctgtccttctgtgcctccaatatcatccatcatttcttctgtgatctcaatcctctcctgcagctctcttgctctgacgtctccttcaatgtaatgatcatttttgcagtaggaggtctattggctctcacgccccttgtctgtatcctcgtatcttatggacttatcttctccactgttctgaagatcacctctactcagggcaagcagagagctgtttccacctgcagctgccacctgtcagtggtggtgttgttttacggcacagccatcgccgtctatttcagcccttcatccccccatatgcctgagagcgacactctgtcaaccatcatgtattcaatggtggctccgatgctgaatcctttcatctataccctaaggaacagggatatgaagaggggacttcagaaaatgcttctcaagtgcacagtctttcagcagcaataa
SEQ ID NO:29-蛋白质
MEKRNLTVVREFVLLGLPSSAEQQHLLSVLFLCMYLATTLGNMLIIATIGFDSHLHSPMYFFLSNLAFVDICFTSTTVPQMVVNILTGTKTISFAGCLTQLFFFVSFVNMDSLLLCVMAYDRYVAICHPLHYTARMNLCLCVQLVAGLWLVTYLHALLHTVLIAQLSFCASNIIHHFFCDLNPLLQLSCSDVSFNVMIIFAVGGLLALTPLVCILVSYGLIFSTVLKITSTQGKQRAVSTCSCHLSVVVLFYGTAIAVYFSPSSPHMPESDTLSTIMYSMVAPMLNPFIYTLRNRDMKRGLQKMLLKCTVFQQQ
OR5B12
SEQ ID NO:30-DNA
atggagaacaacacagaggtgactgaattcatccttgtggggttaactgatgacccagaactgcagatcccactcttcatagtcttccttttcatctacctcatcactctggttgggaacctggggatgattgaattgattctactggactcctgtctccacacccccatgtacttcttcctcagtaacctctccctggtggactttggttattcctcagctgtcactcccaaggtgatggtggggtttctcacaggagacaaattcatattatataatgcttgtgccacacaattcttcttctttgtagcctttatcactgcagaaagtttcctcctggcatcaatggcctatgaccgctatgcagcattgtgtaaacccctgcattacaccaccaccatgacaacaaatgtatgtgcttgcctggccataggctcctacatctgtggtttcctgaatgcatccattcatactgggaacactttcaggctctccttctgtagatccaatgtagttgaacactttttctgtgatgctcctcctctcttgactctctcatgttcagacaactacatcagtgagatggttattttttttgtggtgggattcaatgacctcttttctatcctggtaatcttgatctcctacttatttatatttatcaccatcatgaagatgcgctcacctgaaggacgccagaaggccttttctacttgtgcttcccaccttactgcagtttccatcttttatgggacaggaatctttatgtacttacgacctaactccagccatttcatgggcacagacaaaatggcatctgtgttctatgccatagtcattcccatgttgaatccactggtctacagcctgaggaacaaagaggttaagagtgcctttaaaaagactgtagggaaggcaaaggcctctataggattcatattttaa
SEQ ID NO:31-蛋白质
MENNTEVTEFILVGLTDDPELQIPLFIVFLFIYLITLVGNLGMIELILLDSCLHTPMYFFLSNLSLVDFGYSSAVTPKVMVGFLTGDKFILYNACATQFFFFVAFITAESFLLASMAYDRYAALCKPLHYTTTMTTNVCACLAIGSYICGFLNASIHTGNTFRLSFCRSNVVEHFFCDAPPLLTLSCSDNYISEMVIFFVVGFNDLFSILVILISYLFIFITIMKMRSPEGRQKAFSTCASHLTAVSIFYGTGIFMYLRPNSSHFMGTDKMASVFYAIVIPMLNPLVYSLRNKEVKSAFKKTVGKAKASIGFIF
以下实施例仅是说明性的,并不意味着限制在摘要、说明书或权利要求书中所述的发明范围。
实施例
以下实施例中的调性描述由一位或多位调香师提供。
实施例1:由外围嗅觉系统编码的嗅觉质量
以下呈现的数据总结在图1和图2中,以概念性地捕捉嗅觉调性如何在嗅觉系统的外围编码。在图1中,显示了代表香水香调和调性的香味轮,以及相应嗅觉组之间的关系。在香味轮上表现出特殊嗅觉调性的挥发性化合物已通过它们激活的受体进行了映射。具有相同调性的分子激活相同的OR,而与化学相似性无关。因此,具有几种相同嗅觉调性的分子也会共同激活相同的相应OR。例如,分子1、2和3各自激活两种特征化受体并表现出相应的2种嗅觉调性(如图1所示)。
这在图2中进一步说明。其显示了三种受体——OR5AU1(SEQ ID NO.15)、OR8D1(SEQ ID NO.17)和OR8B3(SEQ ID NO.13)——的感受野,每一种都与一种独特的嗅觉调性——内酯椰子、葫芦巴或香豆——分别相关,其中葫芦巴由语义相关的描述符葫芦巴、枫树和芹菜捕获,而香豆则由香豆素、零陵香豆、干草捕获。相应地,表现出这些调性中仅一种的分子仅激活一种受体。表现出这些描述符组合的分子结果会激活相应受体的组合。两种或多种OR感受野相交处的化合物将引发两种或多种相应的调性(图2)。结果,整体受体激活曲线(即被激活的那组受体)与给定化合物的感官属性直接相关。表1列出了图2所示特征化受体旁边的化合物子集的调性。未由OR活性表示的其他描述表明,其他OR仍有待脱孤化和特征化。值得注意的是,本实施例中提供的数据并非意图详尽无遗。与此香味轮中所代表的相比,还有更多的嗅觉调性,并且有更多的OR-气味对。然而,根据所总结的结果,OR筛选的预测方面变得清晰。
表1:激活多种OR的化合物具有相同的相应调性
实施例2:OR11A1活性捕获了一种常见的感官调性:泥土味。
人类气味受体OR11A1(SEQ ID NO.11)的分子感受范围通过使用包含大约800种化合物的化学和感官多样化的挥发性化合物库进行大规模筛选来测试。使用基于细胞的测定,OR11A1在HEK293T细胞系中进行了测试,其中内源RTP1基因已被激活并且气味受体伴侣已经得到了表达(WO2016/201153A1)。细胞用Flag-Rho标记的受体和典型的嗅觉G蛋白Golf共转染,并暴露于单一浓度的每种测试化合物,单独测试。通过使用基于HTRF(同质时间分辨荧光单位)的试剂盒(CisBio,cAMP dynamic 2试剂盒,62AM4PEJ)测量胞质溶胶中cAMP的增加来检测受体活性。
首先,在纯DMSO中制备798种测试化合物的300mM储备溶液。将每种化合物的储备溶液进一步稀释至300μM的最终测试浓度。DMSO的最终浓度为0.1%,对细胞没有明显的影响。将每种化合物呈递给表达OR11A1嗅觉受体的细胞系。确定了这种高通量筛选(HTS)过程的质量,并通过计算每个板的Z’值来评估窗口可变性和信号可靠性(每个板的平均Z’值为0.72±0.12,完全符合所要求的0.5至1的质量标准)。此单一浓度激活筛选的结果如图3所示,其中点击以浅灰色点突出显示。
在使用上述相同的基于细胞的测定的后续步骤中,通过进行如图4所示的剂量反应实验得到最佳命中子集,确认候选命中是真正的激动剂(激活剂)。来自初始筛选步骤的阴性化合物(2,2,6,6-四甲基-1-环己酮)用作反应特异性的阴性对照,并且没有产生任何明显的剂量反应。从曲线计算灵敏度(效力)和激活强度(功效),分别作为EC50(达到半数最大激活水平所需的浓度)和跨度(基线活性水平和激活饱和平台之间的测定窗口跨度)的量度。根据图5中的效力(X轴)和功效(Y轴),这些值用于表示OR11A1的分子感受范围。相应的化学结构如图6所示。还列出了部分激动剂吐纳麝香(Tonalide)。五种激动剂涵盖不同的香水调性:木香调(广藿香醇)、麝香调(Vulcanolide、Tonalide)和樟脑调(葑醇),表2。综合起来,数据描述了能激活OR11A1的化合物的感官调性和化学结构的多样性,与WO2016/201152A1(麝香)和EP2832347A1(广藿香)中描述的结果一致。然而,OR11A1活性与麝香(WO2016/201152A1)或广藿香(EP2832347A1)的调性没有关联,而是与它们的泥土味细微香调(facet)有关。事实上,这些化合物之间的唯一共同点是泥土调性,在语义上由以下描述符捕获:泥土、腐殖质和泥土-苔藓。这些化合物既不是麝香也不是广藿香,但它们都是泥土味的。相比之下,吐纳麝香(Tonalide)是一种与Vulcanolide结构上相关但仅是OR11A1的弱(部分)激动剂的麝香,尽管与Vulcanolide的化学和整体感官相似(即麝香、粉香),但并未提供强烈的泥土调性,如表2所示。
表2:激活OR11A1的化合物具有相同的嗅觉泥土调性。
实施例3:气味受体编码特定的感官调性
按照与实施例2中描述相同的方法,系统筛选多个Lucy-Flag-Rho标记的人类OR,用于寻找受体活性与它们编码的特定嗅觉调性之间的联系。对OR的分子感受范围的分析表明,激动剂的物理化学性质(例如分子量、挥发性、官能团、三维结构等)和它们的整体感官调性可能会有所不同,但常见的特定嗅觉调性在所有情况下都可以鉴定出。因此,以下受体被归因于特定的嗅觉调性,并被认为是引发对调性感知的基础。
OR8B3,即SEQ ID NO.13被产生香豆调性的化合物激活(图7,表3)。
表3:激活OR8B3的化合物具有相同的嗅觉香豆调性。
OR5AU1,即SEQ ID NO.15被产生内酯椰子调性的化合物激活(图8,表4)。
表4:激活OR5AU1的化合物具有相同的嗅觉内酯椰子调性。
OR8D1,即SEQ ID NO.17被产生葫芦巴调性的化合物激活(图9,表5)。
表5:激活OR8D1的化合物具有相同的嗅觉葫芦巴调性。
OR5AN1,即SEQ ID NO.19被结构上不同的分子如硝基麝香和大环酮激活,产生粉香麝香调性,通常用于香水(图10,表6)。
表6:激活OR5AN1的化合物具有相同的嗅觉粉香麝香调性。
OR1N2,即SEQ ID NO.21被大环化合物(酮和内酯)激活,产生动物麝香调性,通常用于香水(图11,表7)。
表7:激活OR1N2的化合物具有相同的嗅觉动物麝香调性。
OR5A1,即SEQ ID NO.23被产生紫罗兰调性的化合物激活(图12,表8)。
表8:激活OR5A1的化合物具有相同的嗅觉紫罗兰调性。
OR7A17,即SEQ ID NO.25被产生金黄色木质(也描述为奶油木质)调性的化合物激活(图13,表9)。
表9:激活OR7A17的化合物具有相同的嗅觉金黄色木质调性。
OR10J5,即SEQ ID NO.27被产生铃兰调性的化合物激活(图14,表10)。
表10:激活OR10J5的化合物具有相同的嗅觉铃兰调性。
OR1C1,即SEQ ID NO.29被产生芳樟调性的化合物激活(图15,表11)。
表11:激活OR1C1的化合物具有相同的嗅觉芳樟调性。
OR5B12,即SEQ ID NO.31被产生茉莉调性的化合物激活(图16,表12)。
表12:激活OR5B12的化合物具有相同的嗅觉茉莉调性。
实施例4:使用气味受体活性来分析和产生复杂混合物。
气味受体活性作为一个整体用于确定含有多种挥发性分子的组合物的香味。组合物对一组OR的活性反映了组合物在每种OR上实现的最终活性,考虑了OR调节(例如抑制和增强),当OR与多种化合物接触时可能发生这种调节。由此产生的活性谱(profile)用于使用在OR活性与所感知调性之间建立的联系来描述组合物的整体调性。或者,可以推断出目标气味所需的活性谱,并将其用作特征活性来重现,以便在不同条件下重新创建目标气味。类似地,此类特征活性谱可用作质量评估或质量标准测试。
组合物活性也用作指导创建新组合物的标志,该新组合物概括了原组合物的活性。这种新组合物是通过修改原组合物同时保留所激活OR的原始集合而获得的。这种修改可包括去除不相关的化合物、用优选的化合物替换一种化合物、用多种优选的化合物替换一种化合物、用与被替换量的化合物起相同作用的一种化合物替换多种化合物、或用多种不同的化合物替换多种化合物。具有与目标组合物相似或相同活性的新组合物在气味特征上相似。
最后,通过推断获得预期香味所需的化合物来重新创建组合物。例如,使用一组希望的调性来创建组合物。或者,可以设计组合物以去除一种或多种不希望的调性,例如恶臭。也可以同时使用这两种策略来创建组合物。
实施例5:复杂混合物的OR活性可以建模并导致可感知的调性预测
香料调和物(调和物A)包含激活气味受体OR8B3(贡献干草调性)、OR8D1(贡献芹菜调性)和OR5AU1(贡献内酯椰子调性)的成分,以及其中引入了小修改的三种调和物(调和物B至D)。见表12。
为简化起见,将不激活三种目标OR中任一者的成分汇总并描述为“其他成分”。受体筛选数据(如实施例1中所述)用于每种OR以确定可用于替代原始配方中存在的成分的替代激活剂。这种方法允许优先使用受青睐的成分,以优化多种因素,包括降低成本、提高生物降解性或使用具有环保特性的化合物。通过考虑混合物中的成分比例(如表12所示)以及它们对每种受体的个体活性水平(如图17所示),可以使用竞争性结合模型计算调和物针对每种受体的总体活性。活性水平标准化为对毛喉素的最大细胞反应,毛喉素是一种已知的药理学转导级联激活剂,并出于数据比较的目的而作为锚点。将通过模型预测的调和物活性与使用相同调和物产生的基于细胞的数据进行比较(如实施例2中所述的基于细胞的测定)。在模型和体外数据之间观察到一致的活性水平,验证了模型。原始和修改后的调和物之间产生的活性预测用于根据OR活性变化(即更加或更不活跃)和推断相应的调性变化(即更加或更不强烈)进行感官预测。感官预测得到了香料专家感官小组的验证,要求他们对每种调和物的三种感兴趣的调性进行盲评:干草、芹菜和内酯椰子。
在OR8D1活性方面,去除甲基环戊烯醇酮(cyclotone)被并用乙基葫芦巴内酯(maple furanone)替代的组合物的情况通过比较调和物A和B来显示。OR8D1的目标活性水平设置为低于原始水平。图18显示了从模型预测的活性水平与受体的体外验证相比,标准化为100%毛喉素反应。预测到对芹菜调性的感知会相应降低,专家小组成员的评估证实了这一点,如图19所总结。
在OR8B3和OR5AU1活性方面,去除壬内酯并用香豆素代替的组合物的情况通过比较调和物A和C来显示。在这种情况下,OR8B3的目标活性水平被设置为高于原始水平,而OR5AU1为空值。图20显示了从模型预测的活性水平与两种受体的体外验证相比,标准化为100%毛喉素反应。预测到对干草感知的相应增加和对内酯椰子调性的损失,专家小组成员的评估证实了这一点,如图21所总结。
在OR8B3和OR5AU1活性方面,去除壬内酯、用香豆素代替并添加tuberolide的组合物的情况通过比较调和物A、C和D来显示。在这种情况下,OR8B3的目标活性水平设置为与调和物C相比保持不变,对于OR5AU1与原始水平相比恢复了。图20显示了从模型预测的活性水平与两种受体的体外验证相比,标准化为100%毛喉素反应。预测到椰子调性感知的相应恢复,专家小组成员的评估证实了这一点,如图22所总结。
这些香料调和物更改实施例捕获了系统在去除和替换化合物之前和之后仅使用单一化合物输入数据(如实施例1至3中获得的)模拟复杂混合物的受体活性的能力。系统基于受体活性计算来预测感官结果的能力也被证明可以:保持对不同化合物的特定所希望调性的感知;调节混合物中替代化合物的浓度或比例以降低或增加所希望的调性;以及添加化合物以通过恢复在更改过程中丢失的所希望调性来重新平衡组合物。
本文引用的所有专利、出版物和公开的专利申请的内容均通过引用整体并入本文。
序列表
<110> Firmenich SA
<120> 嗅觉调性
<130> 13070 WO
<160> 31
<170> PatentIn version 3.5
<210> 1
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 标签
<400> 1
gattacaagg acgacgacga taag 24
<210> 2
<211> 8
<212> PRT
<213> 人工
<220>
<223> artificail
<400> 2
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 3
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工
<400> 3
atgaacggga ccgagggccc aaacttctac gtgcctttct ccaacaagac gggcgtggtg 60
<210> 4
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> Lucy标签
<400> 4
Met Asn Gly Thr Glu Gly Pro Asn Phe Tyr Val Pro Phe Ser Asn Lys
1 5 10 15
Thr Gly Val Val
20
<210> 5
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工
<400> 5
atgagacccc agatcctgct gctcctggcc ctgctgaccc taggcctggc t 51
<210> 6
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 人工
<400> 6
Met Arg Pro Gln Ile Leu Leu Leu Leu Ala Leu Leu Thr Leu Gly Leu
1 5 10 15
Ala
<210> 7
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 基序
<400> 7
Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys
1 5 10
<210> 8
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 基序-2
<400> 8
Phe Ser Thr Cys Ser Ser His
1 5
<210> 9
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 基序-3
<400> 9
Pro Met Leu Asn Pro Phe Ile Tyr
1 5
<210> 10
<211> 948
<212> DNA
<213> 人(Homo Sapiens)
<400> 10
atggaaattg tctccacagg aaacgaaact attactgaat ttgtcctcct tggcttctat 60
gacatccctg aactgcattt cttgtttttt attgtattca ctgctgtcta tgtcttcatc 120
atcataggga atatgctgat tattgtagca gtggttagct cccagaggct ccacaaaccc 180
atgtatattt tcttggcgaa tctgtccttc ctggatattc tctacacctc cgcagtgatg 240
ccaaaaatgc tggagggctt cctgcaagaa gcaactatct ctgtggctgg ttgcttgctc 300
cagttcttta tcttcggctc tctagccaca gctgaatgct tactgctggc tgtcatggca 360
tatgaccgct acctggcaat ttgctaccca ctccactacc cactcctgat ggggcccaga 420
cggtacatgg ggctggtggt cacaacctgg ctctctggat ttgtggtaga tggactggtt 480
gtggccctgg tggcccagct gaggttctgt ggccccaacc acattgacca gttttactgt 540
gactttatgc ttttcgtggg cctggcttgc tcggatccca gagtggctca ggtgacaact 600
ctcattctgt ctgtgttctg cctcactatt ccttttggac tgattctgac atcttatgcc 660
agaattgtgg tggcagtgct gagagttcct gctggggcaa gcaggagaag ggctttctcc 720
acatgctcct cccacctagc tgtagtgacc acattctatg gaacgctcat gatcttttat 780
gttgcaccct ctgctgtcca ttcccagctc ctctccaagg tcttctccct gctctacact 840
gtggtcaccc ctctcttcaa tcctgtgatc tataccatga ggaacaagga ggtgcatcag 900
gcacttcgga agattctctg tatcaaacaa actgaaacac ttgattga 948
<210> 11
<211> 315
<212> PRT
<213> 人(Homo Sapiens)
<400> 11
Met Glu Ile Val Ser Thr Gly Asn Glu Thr Ile Thr Glu Phe Val Leu
1 5 10 15
Leu Gly Phe Tyr Asp Ile Pro Glu Leu His Phe Leu Phe Phe Ile Val
20 25 30
Phe Thr Ala Val Tyr Val Phe Ile Ile Ile Gly Asn Met Leu Ile Ile
35 40 45
Val Ala Val Val Ser Ser Gln Arg Leu His Lys Pro Met Tyr Ile Phe
50 55 60
Leu Ala Asn Leu Ser Phe Leu Asp Ile Leu Tyr Thr Ser Ala Val Met
65 70 75 80
Pro Lys Met Leu Glu Gly Phe Leu Gln Glu Ala Thr Ile Ser Val Ala
85 90 95
Gly Cys Leu Leu Gln Phe Phe Ile Phe Gly Ser Leu Ala Thr Ala Glu
100 105 110
Cys Leu Leu Leu Ala Val Met Ala Tyr Asp Arg Tyr Leu Ala Ile Cys
115 120 125
Tyr Pro Leu His Tyr Pro Leu Leu Met Gly Pro Arg Arg Tyr Met Gly
130 135 140
Leu Val Val Thr Thr Trp Leu Ser Gly Phe Val Val Asp Gly Leu Val
145 150 155 160
Val Ala Leu Val Ala Gln Leu Arg Phe Cys Gly Pro Asn His Ile Asp
165 170 175
Gln Phe Tyr Cys Asp Phe Met Leu Phe Val Gly Leu Ala Cys Ser Asp
180 185 190
Pro Arg Val Ala Gln Val Thr Thr Leu Ile Leu Ser Val Phe Cys Leu
195 200 205
Thr Ile Pro Phe Gly Leu Ile Leu Thr Ser Tyr Ala Arg Ile Val Val
210 215 220
Ala Val Leu Arg Val Pro Ala Gly Ala Ser Arg Arg Arg Ala Phe Ser
225 230 235 240
Thr Cys Ser Ser His Leu Ala Val Val Thr Thr Phe Tyr Gly Thr Leu
245 250 255
Met Ile Phe Tyr Val Ala Pro Ser Ala Val His Ser Gln Leu Leu Ser
260 265 270
Lys Val Phe Ser Leu Leu Tyr Thr Val Val Thr Pro Leu Phe Asn Pro
275 280 285
Val Ile Tyr Thr Met Arg Asn Lys Glu Val His Gln Ala Leu Arg Lys
290 295 300
Ile Leu Cys Ile Lys Gln Thr Glu Thr Leu Asp
305 310 315
<210> 12
<211> 942
<212> DNA
<213> 人(Homo Sapiens)
<400> 12
atgctggcta gaaacaactc cttagtgact gaatttattc ttgctggatt aacagatcat 60
ccagagttcc agcaacccct ctttttcctg tttctagtgg tctacattgt caccatggta 120
ggcaaccttg gcttgatcat tcttttcggt ctaaattctc acctccacac accaatgtac 180
tatttcctct tcaatctctc cttcattgat ctctgttact cctctgtttt cactcccaaa 240
atgctaatga actttgtatc aaaaaagaat attatctcct atgttgggtg catgactcag 300
ctgtttttct ttctcttttt tgtcatctct gaatgttaca tgttgacctc aatggcatat 360
gatcgctatg tggccatctg taatccattg ctgtataagg tcaccatgtc ccatcaggtc 420
tgttctatgc tcacttttgc tgcttacata atgggattgg ctggagccac ggcccacacc 480
gggtgcatgc ttagactcac cttctgcagt gctaatatca tcaaccatta cttgtgtgac 540
atactccccc tcctccagct ttcctgcacc agcacctatg tcaacgaggt ggttgttctc 600
attgttgtgg gtattaatat catggtaccc agttgtacca tcctcatttc ttatgttttc 660
attgtcacta gcattcttca tatcaaatcc actcaaggaa gatcaaaagc cttcagtact 720
tgtagctctc atgtcattgc tctgtctctg ttttttgggt cagcggcatt catgtatatt 780
aaatattctt ctggatctat ggagcaggga aaagtttctt ctgttttcta cactaatgtg 840
gtgcccatgc tcaatcctct catctacagt ttgaggaaca aggatgtcaa agttgcactg 900
aggaaagctc tgattaaaat tcagagaaga aatatattct aa 942
<210> 13
<211> 313
<212> PRT
<213> 人(Homo Sapiens)
<400> 13
Met Leu Ala Arg Asn Asn Ser Leu Val Thr Glu Phe Ile Leu Ala Gly
1 5 10 15
Leu Thr Asp His Pro Glu Phe Gln Gln Pro Leu Phe Phe Leu Phe Leu
20 25 30
Val Val Tyr Ile Val Thr Met Val Gly Asn Leu Gly Leu Ile Ile Leu
35 40 45
Phe Gly Leu Asn Ser His Leu His Thr Pro Met Tyr Tyr Phe Leu Phe
50 55 60
Asn Leu Ser Phe Ile Asp Leu Cys Tyr Ser Ser Val Phe Thr Pro Lys
65 70 75 80
Met Leu Met Asn Phe Val Ser Lys Lys Asn Ile Ile Ser Tyr Val Gly
85 90 95
Cys Met Thr Gln Leu Phe Phe Phe Leu Phe Phe Val Ile Ser Glu Cys
100 105 110
Tyr Met Leu Thr Ser Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Asn
115 120 125
Pro Leu Leu Tyr Lys Val Thr Met Ser His Gln Val Cys Ser Met Leu
130 135 140
Thr Phe Ala Ala Tyr Ile Met Gly Leu Ala Gly Ala Thr Ala His Thr
145 150 155 160
Gly Cys Met Leu Arg Leu Thr Phe Cys Ser Ala Asn Ile Ile Asn His
165 170 175
Tyr Leu Cys Asp Ile Leu Pro Leu Leu Gln Leu Ser Cys Thr Ser Thr
180 185 190
Tyr Val Asn Glu Val Val Val Leu Ile Val Val Gly Ile Asn Ile Met
195 200 205
Val Pro Ser Cys Thr Ile Leu Ile Ser Tyr Val Phe Ile Val Thr Ser
210 215 220
Ile Leu His Ile Lys Ser Thr Gln Gly Arg Ser Lys Ala Phe Ser Thr
225 230 235 240
Cys Ser Ser His Val Ile Ala Leu Ser Leu Phe Phe Gly Ser Ala Ala
245 250 255
Phe Met Tyr Ile Lys Tyr Ser Ser Gly Ser Met Glu Gln Gly Lys Val
260 265 270
Ser Ser Val Phe Tyr Thr Asn Val Val Pro Met Leu Asn Pro Leu Ile
275 280 285
Tyr Ser Leu Arg Asn Lys Asp Val Lys Val Ala Leu Arg Lys Ala Leu
290 295 300
Ile Lys Ile Gln Arg Arg Asn Ile Phe
305 310
<210> 14
<211> 936
<212> DNA
<213> 人(Homo Sapiens)
<400> 14
atgaaagggg caaacctgag ccaagggatg gagtttgagc tcttgggcct caccactgac 60
ccccagctcc agaggctgct cttcgtggtg ttcctgggca tgtacacagc cactctgctg 120
gggaacctgg tcatgttcct cctgatccat gtgagtgcca ccctgcacac acccatgtac 180
tccctcctga agagcctctc cttcttggat ttctgctact cctccacggt tgtgccccag 240
accctggtga acttcttggc caagaggaaa gtgatctctt attttggctg catgactcag 300
atgttcttct atgcgggttt tgccaccagt gagtgctatc tcatcgctgc catggcctat 360
gaccgctatg ccgctatttg taaccccctg ctctactcaa ccatcatgtc tcctgaggtc 420
tgtgcctcgc tgattgtggg ctcctacagt gcaggattcc tcaattctct tatccacact 480
ggctgtatct ttagtctgaa attctgcggt gctcatgtcg tcactcactt cttctgtgat 540
gggccaccca tcctgtcctt gtcttgtgta gacacctcac tgtgtgagat cctgctcttc 600
atttttgctg gtttcaacct tttgagctgc accctcacca tcttgatctc ctacttctta 660
attctcaaca ccatcctgaa aatgagctcg gcccagggca ggtttaaggc attttccacc 720
tgtgcatccc acctcactgc catctgcctc ttctttggca caacactttt tatgtacctg 780
cgccccaggt ccagctactc cttgacccag gaccgcacag ttgctgtcat ctacacagtg 840
gtgatcccag tgctgaaccc cctcatgtac tctttgagaa acaaggatgt gaagaaagct 900
ttaataaagg tttggggtag gaaaacaatg gaatga 936
<210> 15
<211> 311
<212> PRT
<213> 人(Homo Sapiens)
<400> 15
Met Lys Gly Ala Asn Leu Ser Gln Gly Met Glu Phe Glu Leu Leu Gly
1 5 10 15
Leu Thr Thr Asp Pro Gln Leu Gln Arg Leu Leu Phe Val Val Phe Leu
20 25 30
Gly Met Tyr Thr Ala Thr Leu Leu Gly Asn Leu Val Met Phe Leu Leu
35 40 45
Ile His Val Ser Ala Thr Leu His Thr Pro Met Tyr Ser Leu Leu Lys
50 55 60
Ser Leu Ser Phe Leu Asp Phe Cys Tyr Ser Ser Thr Val Val Pro Gln
65 70 75 80
Thr Leu Val Asn Phe Leu Ala Lys Arg Lys Val Ile Ser Tyr Phe Gly
85 90 95
Cys Met Thr Gln Met Phe Phe Tyr Ala Gly Phe Ala Thr Ser Glu Cys
100 105 110
Tyr Leu Ile Ala Ala Met Ala Tyr Asp Arg Tyr Ala Ala Ile Cys Asn
115 120 125
Pro Leu Leu Tyr Ser Thr Ile Met Ser Pro Glu Val Cys Ala Ser Leu
130 135 140
Ile Val Gly Ser Tyr Ser Ala Gly Phe Leu Asn Ser Leu Ile His Thr
145 150 155 160
Gly Cys Ile Phe Ser Leu Lys Phe Cys Gly Ala His Val Val Thr His
165 170 175
Phe Phe Cys Asp Gly Pro Pro Ile Leu Ser Leu Ser Cys Val Asp Thr
180 185 190
Ser Leu Cys Glu Ile Leu Leu Phe Ile Phe Ala Gly Phe Asn Leu Leu
195 200 205
Ser Cys Thr Leu Thr Ile Leu Ile Ser Tyr Phe Leu Ile Leu Asn Thr
210 215 220
Ile Leu Lys Met Ser Ser Ala Gln Gly Arg Phe Lys Ala Phe Ser Thr
225 230 235 240
Cys Ala Ser His Leu Thr Ala Ile Cys Leu Phe Phe Gly Thr Thr Leu
245 250 255
Phe Met Tyr Leu Arg Pro Arg Ser Ser Tyr Ser Leu Thr Gln Asp Arg
260 265 270
Thr Val Ala Val Ile Tyr Thr Val Val Ile Pro Val Leu Asn Pro Leu
275 280 285
Met Tyr Ser Leu Arg Asn Lys Asp Val Lys Lys Ala Leu Ile Lys Val
290 295 300
Trp Gly Arg Lys Thr Met Glu
305 310
<210> 16
<211> 927
<212> DNA
<213> 人(Homo Sapiens)
<400> 16
atgaccatgg aaaattattc tatggcagct cagtttgtct tagatggttt aacacagcaa 60
gcagagctcc agctgcccct cttcctcctg ttcctgggaa tctatgtggt cacagtagtg 120
ggcaacctgg gcatgattct cctgattgca gtcagccctc tacttcacac ccccatgtac 180
tatttcctca gcagcttgtc cttcgtcgat ttctgctatt cctctgtcat tactcccaaa 240
atgctggtga acttcctagg aaagaagaat acaatccttt actctgagtg catggtccag 300
ctctttttct ttgtggtctt tgtggtggct gagggttacc tcctgactgc catggcatat 360
gatcgctatg ttgccatctg tagcccactg ctttataatg cgatcatgtc ctcatgggtc 420
tgctcactgc tagtgctggc tgccttcttc ttgggctttc tctctgcctt gactcataca 480
agtgccatga tgaaactgtc cttttgcaaa tcccacatta tcaaccatta cttctgtgat 540
gttcttcccc tcctcaatct ctcctgctcc aacacacacc tcaatgagct tctacttttt 600
atcattgcgg ggtttaacac cttggtgccc accctagctg ttgctgtctc ctatgccttc 660
atcctctaca gcatccttca catccgctcc tcagagggcc ggtccaaagc ttttggaaca 720
tgcagctctc atctcatggc tgtggtgatc ttctttgggt ccattacctt catgtatttc 780
aagccccctt caagtaactc cctggaccag gagaaggtgt cctctgtgtt ctacaccacg 840
gtgatcccca tgctgaaccc tttaatatac agtctgagga ataaggatgt gaagaaagca 900
ttaaggaagg tcttagtagg aaaatga 927
<210> 17
<211> 308
<212> PRT
<213> 人(Homo Sapiens)
<400> 17
Met Thr Met Glu Asn Tyr Ser Met Ala Ala Gln Phe Val Leu Asp Gly
1 5 10 15
Leu Thr Gln Gln Ala Glu Leu Gln Leu Pro Leu Phe Leu Leu Phe Leu
20 25 30
Gly Ile Tyr Val Val Thr Val Val Gly Asn Leu Gly Met Ile Leu Leu
35 40 45
Ile Ala Val Ser Pro Leu Leu His Thr Pro Met Tyr Tyr Phe Leu Ser
50 55 60
Ser Leu Ser Phe Val Asp Phe Cys Tyr Ser Ser Val Ile Thr Pro Lys
65 70 75 80
Met Leu Val Asn Phe Leu Gly Lys Lys Asn Thr Ile Leu Tyr Ser Glu
85 90 95
Cys Met Val Gln Leu Phe Phe Phe Val Val Phe Val Val Ala Glu Gly
100 105 110
Tyr Leu Leu Thr Ala Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys Ser
115 120 125
Pro Leu Leu Tyr Asn Ala Ile Met Ser Ser Trp Val Cys Ser Leu Leu
130 135 140
Val Leu Ala Ala Phe Phe Leu Gly Phe Leu Ser Ala Leu Thr His Thr
145 150 155 160
Ser Ala Met Met Lys Leu Ser Phe Cys Lys Ser His Ile Ile Asn His
165 170 175
Tyr Phe Cys Asp Val Leu Pro Leu Leu Asn Leu Ser Cys Ser Asn Thr
180 185 190
His Leu Asn Glu Leu Leu Leu Phe Ile Ile Ala Gly Phe Asn Thr Leu
195 200 205
Val Pro Thr Leu Ala Val Ala Val Ser Tyr Ala Phe Ile Leu Tyr Ser
210 215 220
Ile Leu His Ile Arg Ser Ser Glu Gly Arg Ser Lys Ala Phe Gly Thr
225 230 235 240
Cys Ser Ser His Leu Met Ala Val Val Ile Phe Phe Gly Ser Ile Thr
245 250 255
Phe Met Tyr Phe Lys Pro Pro Ser Ser Asn Ser Leu Asp Gln Glu Lys
260 265 270
Val Ser Ser Val Phe Tyr Thr Thr Val Ile Pro Met Leu Asn Pro Leu
275 280 285
Ile Tyr Ser Leu Arg Asn Lys Asp Val Lys Lys Ala Leu Arg Lys Val
290 295 300
Leu Val Gly Lys
305
<210> 18
<211> 936
<212> DNA
<213> 人(Homo Sapiens)
<400> 18
atgactgggg gaggaaatat tacagaaatc acctatttca tcctgctggg attctcagat 60
tttcccagga tcataaaagt gctcttcact atattcctgg tgatctacat tacatctctg 120
gcctggaacc tctccctcat tgttttaata aggatggatt cccacctcca tacacccatg 180
tatttcttcc tcagtaacct gtccttcata gatgtctgct atatcagctc cacagtcccc 240
aagatgctct ccaacctctt acaggaacag caaactatca cttttgttgg ttgtattatt 300
cagtacttta tcttttcaac gatgggactg agtgagtctt gtctcatgac agccatggct 360
tatgatcgtt atgctgccat ttgtaacccc ctgctctatt catccatcat gtcacccacc 420
ctctgtgttt ggatggtact gggagcctac atgactggcc tcactgcttc tttattccaa 480
attggtgctt tgcttcaact ccacttctgt gggtctaatg tcatcagaca tttcttctgt 540
gacatgcccc aactgttaat cttgtcctgt actgacactt tctttgtaca ggtcatgact 600
gctatattaa ccatgttctt tgggatagca agtgccctag ttatcatgat atcctatggc 660
tatattggca tctccatcat gaagatcact tcagctaaag gcaggtccaa ggcattcaac 720
acctgtgctt ctcatctaac agctgtttcc ctcttctata catcaggaat ctttgtctat 780
ttgagttcca gctctggagg ttcttcaagc tttgacagat ttgcatctgt tttctacact 840
gtggtcattc ccatgttaaa tcccttgatt tacagtttga ggaacaaaga aattaaagat 900
gccttaaaga ggttgcaaaa gagaaagtgc tgctga 936
<210> 19
<211> 311
<212> PRT
<213> 人(Homo Sapiens)
<400> 19
Met Thr Gly Gly Gly Asn Ile Thr Glu Ile Thr Tyr Phe Ile Leu Leu
1 5 10 15
Gly Phe Ser Asp Phe Pro Arg Ile Ile Lys Val Leu Phe Thr Ile Phe
20 25 30
Leu Val Ile Tyr Ile Thr Ser Leu Ala Trp Asn Leu Ser Leu Ile Val
35 40 45
Leu Ile Arg Met Asp Ser His Leu His Thr Pro Met Tyr Phe Phe Leu
50 55 60
Ser Asn Leu Ser Phe Ile Asp Val Cys Tyr Ile Ser Ser Thr Val Pro
65 70 75 80
Lys Met Leu Ser Asn Leu Leu Gln Glu Gln Gln Thr Ile Thr Phe Val
85 90 95
Gly Cys Ile Ile Gln Tyr Phe Ile Phe Ser Thr Met Gly Leu Ser Glu
100 105 110
Ser Cys Leu Met Thr Ala Met Ala Tyr Asp Arg Tyr Ala Ala Ile Cys
115 120 125
Asn Pro Leu Leu Tyr Ser Ser Ile Met Ser Pro Thr Leu Cys Val Trp
130 135 140
Met Val Leu Gly Ala Tyr Met Thr Gly Leu Thr Ala Ser Leu Phe Gln
145 150 155 160
Ile Gly Ala Leu Leu Gln Leu His Phe Cys Gly Ser Asn Val Ile Arg
165 170 175
His Phe Phe Cys Asp Met Pro Gln Leu Leu Ile Leu Ser Cys Thr Asp
180 185 190
Thr Phe Phe Val Gln Val Met Thr Ala Ile Leu Thr Met Phe Phe Gly
195 200 205
Ile Ala Ser Ala Leu Val Ile Met Ile Ser Tyr Gly Tyr Ile Gly Ile
210 215 220
Ser Ile Met Lys Ile Thr Ser Ala Lys Gly Arg Ser Lys Ala Phe Asn
225 230 235 240
Thr Cys Ala Ser His Leu Thr Ala Val Ser Leu Phe Tyr Thr Ser Gly
245 250 255
Ile Phe Val Tyr Leu Ser Ser Ser Ser Gly Gly Ser Ser Ser Phe Asp
260 265 270
Arg Phe Ala Ser Val Phe Tyr Thr Val Val Ile Pro Met Leu Asn Pro
275 280 285
Leu Ile Tyr Ser Leu Arg Asn Lys Glu Ile Lys Asp Ala Leu Lys Arg
290 295 300
Leu Gln Lys Arg Lys Cys Cys
305 310
<210> 20
<211> 951
<212> DNA
<213> 人(Homo Sapiens)
<400> 20
atgggaaaac caggcagagt gaaccaaacc actgtttcag acttcctcct tttaggactc 60
tctgagcggc cagaggagca gcctcttctg tttggcatct tccttggcat gtacctggtc 120
accatggtgg ggaacctgct cattatcctg gccatcagct ctgacccaca cctccatact 180
cccatgtact tctttctggc caacctgtca ttaactgatg cctgtttcac ttctgcctcc 240
atccccaaaa tgctggccaa cattcatacc cagagtcaga tcatctccta ttctgggtgt 300
cttgcacagc tatatttcct ccttatgttt ggtggccttg acaactgcct gctggctgtg 360
atggcatatg accgctatgt ggccatctgc caaccactcc attacagcac atctatgagt 420
ccccagctct gtgcactaat gctgggtgtg tgctgggtgc taaccaactg tcctgccctg 480
atgcacacac tgttgctgac ccgcgtggct ttctgtgccc agaaagccat ccctcatttc 540
tactgtgatc ccagtgctct cctgaagctt gcctgctcag atacccatgt aaacgagctg 600
atgatcatca ccatgggctt gctgttcctc actgttcccc tcctgctgat cgtcttctcc 660
tatgtccgca ttttctgggc tgtgtttggc atctcatctc ctggagggag atggaaggcc 720
ttctctacct gtggttctca tctcacggtg gttctgctct tctatgggtc tcttatgggt 780
gtgtatttac ttcctccatc aacttactct acagagaggg aaagtagggc tgctgttctc 840
tatatggtga ttattcccat gctaaaccca ttcatttata gcttgaggaa cagagacatg 900
aaggaggctt tgggtaaact ttttgtcagt ggaaaaacat tctttttatg a 951
<210> 21
<211> 316
<212> PRT
<213> 人(Homo Sapiens)
<400> 21
Met Gly Lys Pro Gly Arg Val Asn Gln Thr Thr Val Ser Asp Phe Leu
1 5 10 15
Leu Leu Gly Leu Ser Glu Arg Pro Glu Glu Gln Pro Leu Leu Phe Gly
20 25 30
Ile Phe Leu Gly Met Tyr Leu Val Thr Met Val Gly Asn Leu Leu Ile
35 40 45
Ile Leu Ala Ile Ser Ser Asp Pro His Leu His Thr Pro Met Tyr Phe
50 55 60
Phe Leu Ala Asn Leu Ser Leu Thr Asp Ala Cys Phe Thr Ser Ala Ser
65 70 75 80
Ile Pro Lys Met Leu Ala Asn Ile His Thr Gln Ser Gln Ile Ile Ser
85 90 95
Tyr Ser Gly Cys Leu Ala Gln Leu Tyr Phe Leu Leu Met Phe Gly Gly
100 105 110
Leu Asp Asn Cys Leu Leu Ala Val Met Ala Tyr Asp Arg Tyr Val Ala
115 120 125
Ile Cys Gln Pro Leu His Tyr Ser Thr Ser Met Ser Pro Gln Leu Cys
130 135 140
Ala Leu Met Leu Gly Val Cys Trp Val Leu Thr Asn Cys Pro Ala Leu
145 150 155 160
Met His Thr Leu Leu Leu Thr Arg Val Ala Phe Cys Ala Gln Lys Ala
165 170 175
Ile Pro His Phe Tyr Cys Asp Pro Ser Ala Leu Leu Lys Leu Ala Cys
180 185 190
Ser Asp Thr His Val Asn Glu Leu Met Ile Ile Thr Met Gly Leu Leu
195 200 205
Phe Leu Thr Val Pro Leu Leu Leu Ile Val Phe Ser Tyr Val Arg Ile
210 215 220
Phe Trp Ala Val Phe Gly Ile Ser Ser Pro Gly Gly Arg Trp Lys Ala
225 230 235 240
Phe Ser Thr Cys Gly Ser His Leu Thr Val Val Leu Leu Phe Tyr Gly
245 250 255
Ser Leu Met Gly Val Tyr Leu Leu Pro Pro Ser Thr Tyr Ser Thr Glu
260 265 270
Arg Glu Ser Arg Ala Ala Val Leu Tyr Met Val Ile Ile Pro Met Leu
275 280 285
Asn Pro Phe Ile Tyr Ser Leu Arg Asn Arg Asp Met Lys Glu Ala Leu
290 295 300
Gly Lys Leu Phe Val Ser Gly Lys Thr Phe Phe Leu
305 310 315
<210> 22
<211> 948
<212> DNA
<213> 人(Homo Sapiens)
<400> 22
atgtccataa ccaaagcctg gaacagctca tcagtgacca tgttcatcct cctgggattc 60
acagaccatc cagaactcca ggccctcctc tttgtgacct tcctgggcat ctatcttacc 120
accctggcct ggaacctggc cctcattttt ctgatcagag gtgacaccca tctgcacaca 180
cccatgtact tcttcctaag caacttatct ttcattgaca tctgctactc ttctgctgtg 240
gctcccaata tgctcactga cttcttctgg gagcagaaga ccatatcatt tgtgggctgt 300
gctgctcagt tttttttctt tgtcggcatg ggtctgtctg agtgcctcct cctgactgct 360
atggcatacg accgatatgc agccatctcc agcccccttc tctaccccac tatcatgacc 420
cagggcctct gtacacgcat ggtggttggg gcatatgttg gtggcttcct gagctccctg 480
atccaggcca gctccatatt taggcttcac ttttgcggac ccaacatcat caaccacttc 540
ttctgcgacc tcccaccagt cctggctctg tcttgctctg acaccttcct cagtcaagtg 600
gtgaatttcc tcgtggtggt cactgtcgga ggaacatcgt tcctccaact ccttatctcc 660
tatggttaca tagtgtctgc ggtcctgaag atcccttcag cagagggccg atggaaagcc 720
tgcaacacgt gtgcctcgca tctgatggtg gtgactctgc tgtttgggac agcccttttc 780
gtgtacttgc gacccagctc cagctacttg ctaggcaggg acaaggtggt gtctgttttc 840
tattcattgg tgatccccat gctgaaccct ctcatttaca gtttgaggaa caaagagatc 900
aaggatgccc tgtggaaggt gttggaaagg aagaaagtgt tttcttag 948
<210> 23
<211> 315
<212> PRT
<213> 人(Homo Sapiens)
<400> 23
Met Ser Ile Thr Lys Ala Trp Asn Ser Ser Ser Val Thr Met Phe Ile
1 5 10 15
Leu Leu Gly Phe Thr Asp His Pro Glu Leu Gln Ala Leu Leu Phe Val
20 25 30
Thr Phe Leu Gly Ile Tyr Leu Thr Thr Leu Ala Trp Asn Leu Ala Leu
35 40 45
Ile Phe Leu Ile Arg Gly Asp Thr His Leu His Thr Pro Met Tyr Phe
50 55 60
Phe Leu Ser Asn Leu Ser Phe Ile Asp Ile Cys Tyr Ser Ser Ala Val
65 70 75 80
Ala Pro Asn Met Leu Thr Asp Phe Phe Trp Glu Gln Lys Thr Ile Ser
85 90 95
Phe Val Gly Cys Ala Ala Gln Phe Phe Phe Phe Val Gly Met Gly Leu
100 105 110
Ser Glu Cys Leu Leu Leu Thr Ala Met Ala Tyr Asp Arg Tyr Ala Ala
115 120 125
Ile Ser Ser Pro Leu Leu Tyr Pro Thr Ile Met Thr Gln Gly Leu Cys
130 135 140
Thr Arg Met Val Val Gly Ala Tyr Val Gly Gly Phe Leu Ser Ser Leu
145 150 155 160
Ile Gln Ala Ser Ser Ile Phe Arg Leu His Phe Cys Gly Pro Asn Ile
165 170 175
Ile Asn His Phe Phe Cys Asp Leu Pro Pro Val Leu Ala Leu Ser Cys
180 185 190
Ser Asp Thr Phe Leu Ser Gln Val Val Asn Phe Leu Val Val Val Thr
195 200 205
Val Gly Gly Thr Ser Phe Leu Gln Leu Leu Ile Ser Tyr Gly Tyr Ile
210 215 220
Val Ser Ala Val Leu Lys Ile Pro Ser Ala Glu Gly Arg Trp Lys Ala
225 230 235 240
Cys Asn Thr Cys Ala Ser His Leu Met Val Val Thr Leu Leu Phe Gly
245 250 255
Thr Ala Leu Phe Val Tyr Leu Arg Pro Ser Ser Ser Tyr Leu Leu Gly
260 265 270
Arg Asp Lys Val Val Ser Val Phe Tyr Ser Leu Val Ile Pro Met Leu
275 280 285
Asn Pro Leu Ile Tyr Ser Leu Arg Asn Lys Glu Ile Lys Asp Ala Leu
290 295 300
Trp Lys Val Leu Glu Arg Lys Lys Val Phe Ser
305 310 315
<210> 24
<211> 930
<212> DNA
<213> 人(Homo Sapiens)
<400> 24
atggaaccag agaatgacac agggatttca gaatttgttc ttctgggact ttctgaggaa 60
ccagaattgc agcccttcct ctttgggctg tttctgtcca tgtacctggt cactgtgctc 120
gggaatctgc tcatcatcct ggccacaatc tcagactccc acctccacac ccccatgtac 180
ttcttcctct ccaacctgtc ctttgcagac atctgtttca tctccactac aatcccaaag 240
atgctcatta acatccagac acagagcaga gtcatcacct atgcaggctg catcacccag 300
atgtgctttt ttgtactttt tggagggtta gacagcttac tcctggctgt gatggcctat 360
gatcggtttg tggccatctg tcatcctctg cactacacag tcatcatgaa ccctcggctc 420
tgtggactcc tggttctggc atcctggatg attgctgccc tgaattcctt gtcacaaagc 480
ttaatggtat tgtggctgtc cttctgcaca gacttggaaa tcccccactt tttctgtgaa 540
cttaatcagg tcatccacct tgcctgttct gacacctttc ttaatgacat ggggatgtat 600
tttgcagcag ggctgctggc tggtggtccc cttgtgggga tcctttgctc ttactctaag 660
atagtttcct ccatacgtgc aatctcatca gctcagggga agtacaaggc attttccacc 720
tgtgcatcac acctctcagt tgtctcttta ttttgttgta cgggcctagg tgtgtacctt 780
acttctgctg caacccacaa ctcacacaca agtgcaacag cctcagtgat gtacactgtg 840
gccaccccca tgctgaaccc ctttatctac agtctgagga ataaagacat aaagagggct 900
ctgaaaatgt ccttcagagg aaagcaataa 930
<210> 25
<211> 309
<212> PRT
<213> 人(Homo Sapiens)
<400> 25
Met Glu Pro Glu Asn Asp Thr Gly Ile Ser Glu Phe Val Leu Leu Gly
1 5 10 15
Leu Ser Glu Glu Pro Glu Leu Gln Pro Phe Leu Phe Gly Leu Phe Leu
20 25 30
Ser Met Tyr Leu Val Thr Val Leu Gly Asn Leu Leu Ile Ile Leu Ala
35 40 45
Thr Ile Ser Asp Ser His Leu His Thr Pro Met Tyr Phe Phe Leu Ser
50 55 60
Asn Leu Ser Phe Ala Asp Ile Cys Phe Ile Ser Thr Thr Ile Pro Lys
65 70 75 80
Met Leu Ile Asn Ile Gln Thr Gln Ser Arg Val Ile Thr Tyr Ala Gly
85 90 95
Cys Ile Thr Gln Met Cys Phe Phe Val Leu Phe Gly Gly Leu Asp Ser
100 105 110
Leu Leu Leu Ala Val Met Ala Tyr Asp Arg Phe Val Ala Ile Cys His
115 120 125
Pro Leu His Tyr Thr Val Ile Met Asn Pro Arg Leu Cys Gly Leu Leu
130 135 140
Val Leu Ala Ser Trp Met Ile Ala Ala Leu Asn Ser Leu Ser Gln Ser
145 150 155 160
Leu Met Val Leu Trp Leu Ser Phe Cys Thr Asp Leu Glu Ile Pro His
165 170 175
Phe Phe Cys Glu Leu Asn Gln Val Ile His Leu Ala Cys Ser Asp Thr
180 185 190
Phe Leu Asn Asp Met Gly Met Tyr Phe Ala Ala Gly Leu Leu Ala Gly
195 200 205
Gly Pro Leu Val Gly Ile Leu Cys Ser Tyr Ser Lys Ile Val Ser Ser
210 215 220
Ile Arg Ala Ile Ser Ser Ala Gln Gly Lys Tyr Lys Ala Phe Ser Thr
225 230 235 240
Cys Ala Ser His Leu Ser Val Val Ser Leu Phe Cys Cys Thr Gly Leu
245 250 255
Gly Val Tyr Leu Thr Ser Ala Ala Thr His Asn Ser His Thr Ser Ala
260 265 270
Thr Ala Ser Val Met Tyr Thr Val Ala Thr Pro Met Leu Asn Pro Phe
275 280 285
Ile Tyr Ser Leu Arg Asn Lys Asp Ile Lys Arg Ala Leu Lys Met Ser
290 295 300
Phe Arg Gly Lys Gln
305
<210> 26
<211> 930
<212> DNA
<213> 人(Homo Sapiens)
<400> 26
atgaagagaa agaacttcac agaagtgtca gaattcattt tcttgggatt ttctagcttt 60
ggaaagcatc agataaccct ctttgtggtt ttcctaactg tctacatttt aactctggtt 120
gctaacatca tcattgtgac tatcatctgc attgaccatc atctccacac tcccatgtat 180
ttcttcctaa gcatgctggc tagttcagag acggtgtaca cactggtcat tgtgccacga 240
atgcttttga gcctcatttt tcataaccaa cctatctcct tggcaggctg tgctacacaa 300
atgttctttt ttgttatctt ggccactaat aattgcttcc tgcttactgc aatggggtat 360
gaccgctatg tggccatctg cagacccctg agatacactg tcatcatgag caagggacta 420
tgtgcccagc tggtgtgtgg gtcctttggc attggtctga ctatggcagt tctccatgtg 480
acagccatgt tcaatttgcc gttctgtggc acagtggtag accacttctt ttgtgacatt 540
tacccagtca tgaaactttc ttgcattgat accactatca atgagataat aaattatggt 600
gtaagttcat ttgtgatttt tgtgcccata ggcctgatat ttatctccta tgtccttgtc 660
atctcttcca tccttcaaat tgcctcagct gagggccgga agaagacctt tgccacctgt 720
gtctcccacc tcactgtggt tattgtccac tgtggctgtg cctccattgc ctacctcaag 780
ccgaagtcag aaagttcaat agaaaaagac cttgttctct cagtgacgta caccatcatc 840
actcccttgc tgaaccctgt tgtttacagt ctgagaaaca aggaggtaaa ggatgcccta 900
tgcagagttg tgggcagaaa tatttcttaa 930
<210> 27
<211> 309
<212> PRT
<213> 人(Homo Sapiens)
<400> 27
Met Lys Arg Lys Asn Phe Thr Glu Val Ser Glu Phe Ile Phe Leu Gly
1 5 10 15
Phe Ser Ser Phe Gly Lys His Gln Ile Thr Leu Phe Val Val Phe Leu
20 25 30
Thr Val Tyr Ile Leu Thr Leu Val Ala Asn Ile Ile Ile Val Thr Ile
35 40 45
Ile Cys Ile Asp His His Leu His Thr Pro Met Tyr Phe Phe Leu Ser
50 55 60
Met Leu Ala Ser Ser Glu Thr Val Tyr Thr Leu Val Ile Val Pro Arg
65 70 75 80
Met Leu Leu Ser Leu Ile Phe His Asn Gln Pro Ile Ser Leu Ala Gly
85 90 95
Cys Ala Thr Gln Met Phe Phe Phe Val Ile Leu Ala Thr Asn Asn Cys
100 105 110
Phe Leu Leu Thr Ala Met Gly Tyr Asp Arg Tyr Val Ala Ile Cys Arg
115 120 125
Pro Leu Arg Tyr Thr Val Ile Met Ser Lys Gly Leu Cys Ala Gln Leu
130 135 140
Val Cys Gly Ser Phe Gly Ile Gly Leu Thr Met Ala Val Leu His Val
145 150 155 160
Thr Ala Met Phe Asn Leu Pro Phe Cys Gly Thr Val Val Asp His Phe
165 170 175
Phe Cys Asp Ile Tyr Pro Val Met Lys Leu Ser Cys Ile Asp Thr Thr
180 185 190
Ile Asn Glu Ile Ile Asn Tyr Gly Val Ser Ser Phe Val Ile Phe Val
195 200 205
Pro Ile Gly Leu Ile Phe Ile Ser Tyr Val Leu Val Ile Ser Ser Ile
210 215 220
Leu Gln Ile Ala Ser Ala Glu Gly Arg Lys Lys Thr Phe Ala Thr Cys
225 230 235 240
Val Ser His Leu Thr Val Val Ile Val His Cys Gly Cys Ala Ser Ile
245 250 255
Ala Tyr Leu Lys Pro Lys Ser Glu Ser Ser Ile Glu Lys Asp Leu Val
260 265 270
Leu Ser Val Thr Tyr Thr Ile Ile Thr Pro Leu Leu Asn Pro Val Val
275 280 285
Tyr Ser Leu Arg Asn Lys Glu Val Lys Asp Ala Leu Cys Arg Val Val
290 295 300
Gly Arg Asn Ile Ser
305
<210> 28
<211> 945
<212> DNA
<213> 人(Homo Sapiens)
<400> 28
atggaaaaaa gaaatctaac agttgtcagg gaattcgtcc ttctgggact tcctagctca 60
gcagagcagc agcacctcct gtctgtgctc tttctctgta tgtatttagc caccaccttg 120
gggaacatgc tcatcattgc gacgattggc tttgactctc acctccattc ccctatgtac 180
ttcttcctta gtaacttggc ctttgttgac atctgcttta cgtcgactac agtcccccaa 240
atggtagtga atatcttgac tggcaccaag actatctctt ttgcaggctg cctcacccag 300
ctcttcttct tcgtttcttt tgtgaatatg gacagcctcc ttctgtgtgt gatggcgtat 360
gatagatatg tggcgatttg ccacccctta cattacaccg ccagaatgaa cctgtgcctt 420
tgtgtccagc tagtggctgg actgtggctt gttacttacc tccacgccct cctgcatact 480
gtcctaatag cacagctgtc cttctgtgcc tccaatatca tccatcattt cttctgtgat 540
ctcaatcctc tcctgcagct ctcttgctct gacgtctcct tcaatgtaat gatcattttt 600
gcagtaggag gtctattggc tctcacgccc cttgtctgta tcctcgtatc ttatggactt 660
atcttctcca ctgttctgaa gatcacctct actcagggca agcagagagc tgtttccacc 720
tgcagctgcc acctgtcagt ggtggtgttg ttttacggca cagccatcgc cgtctatttc 780
agcccttcat ccccccatat gcctgagagc gacactctgt caaccatcat gtattcaatg 840
gtggctccga tgctgaatcc tttcatctat accctaagga acagggatat gaagagggga 900
cttcagaaaa tgcttctcaa gtgcacagtc tttcagcagc aataa 945
<210> 29
<211> 314
<212> PRT
<213> 人(Homo Sapiens)
<400> 29
Met Glu Lys Arg Asn Leu Thr Val Val Arg Glu Phe Val Leu Leu Gly
1 5 10 15
Leu Pro Ser Ser Ala Glu Gln Gln His Leu Leu Ser Val Leu Phe Leu
20 25 30
Cys Met Tyr Leu Ala Thr Thr Leu Gly Asn Met Leu Ile Ile Ala Thr
35 40 45
Ile Gly Phe Asp Ser His Leu His Ser Pro Met Tyr Phe Phe Leu Ser
50 55 60
Asn Leu Ala Phe Val Asp Ile Cys Phe Thr Ser Thr Thr Val Pro Gln
65 70 75 80
Met Val Val Asn Ile Leu Thr Gly Thr Lys Thr Ile Ser Phe Ala Gly
85 90 95
Cys Leu Thr Gln Leu Phe Phe Phe Val Ser Phe Val Asn Met Asp Ser
100 105 110
Leu Leu Leu Cys Val Met Ala Tyr Asp Arg Tyr Val Ala Ile Cys His
115 120 125
Pro Leu His Tyr Thr Ala Arg Met Asn Leu Cys Leu Cys Val Gln Leu
130 135 140
Val Ala Gly Leu Trp Leu Val Thr Tyr Leu His Ala Leu Leu His Thr
145 150 155 160
Val Leu Ile Ala Gln Leu Ser Phe Cys Ala Ser Asn Ile Ile His His
165 170 175
Phe Phe Cys Asp Leu Asn Pro Leu Leu Gln Leu Ser Cys Ser Asp Val
180 185 190
Ser Phe Asn Val Met Ile Ile Phe Ala Val Gly Gly Leu Leu Ala Leu
195 200 205
Thr Pro Leu Val Cys Ile Leu Val Ser Tyr Gly Leu Ile Phe Ser Thr
210 215 220
Val Leu Lys Ile Thr Ser Thr Gln Gly Lys Gln Arg Ala Val Ser Thr
225 230 235 240
Cys Ser Cys His Leu Ser Val Val Val Leu Phe Tyr Gly Thr Ala Ile
245 250 255
Ala Val Tyr Phe Ser Pro Ser Ser Pro His Met Pro Glu Ser Asp Thr
260 265 270
Leu Ser Thr Ile Met Tyr Ser Met Val Ala Pro Met Leu Asn Pro Phe
275 280 285
Ile Tyr Thr Leu Arg Asn Arg Asp Met Lys Arg Gly Leu Gln Lys Met
290 295 300
Leu Leu Lys Cys Thr Val Phe Gln Gln Gln
305 310
<210> 30
<211> 945
<212> DNA
<213> 人(Homo Sapiens)
<400> 30
atggagaaca acacagaggt gactgaattc atccttgtgg ggttaactga tgacccagaa 60
ctgcagatcc cactcttcat agtcttcctt ttcatctacc tcatcactct ggttgggaac 120
ctggggatga ttgaattgat tctactggac tcctgtctcc acacccccat gtacttcttc 180
ctcagtaacc tctccctggt ggactttggt tattcctcag ctgtcactcc caaggtgatg 240
gtggggtttc tcacaggaga caaattcata ttatataatg cttgtgccac acaattcttc 300
ttctttgtag cctttatcac tgcagaaagt ttcctcctgg catcaatggc ctatgaccgc 360
tatgcagcat tgtgtaaacc cctgcattac accaccacca tgacaacaaa tgtatgtgct 420
tgcctggcca taggctccta catctgtggt ttcctgaatg catccattca tactgggaac 480
actttcaggc tctccttctg tagatccaat gtagttgaac actttttctg tgatgctcct 540
cctctcttga ctctctcatg ttcagacaac tacatcagtg agatggttat tttttttgtg 600
gtgggattca atgacctctt ttctatcctg gtaatcttga tctcctactt atttatattt 660
atcaccatca tgaagatgcg ctcacctgaa ggacgccaga aggccttttc tacttgtgct 720
tcccacctta ctgcagtttc catcttttat gggacaggaa tctttatgta cttacgacct 780
aactccagcc atttcatggg cacagacaaa atggcatctg tgttctatgc catagtcatt 840
cccatgttga atccactggt ctacagcctg aggaacaaag aggttaagag tgcctttaaa 900
aagactgtag ggaaggcaaa ggcctctata ggattcatat tttaa 945
<210> 31
<211> 314
<212> PRT
<213> 人(Homo Sapiens)
<400> 31
Met Glu Asn Asn Thr Glu Val Thr Glu Phe Ile Leu Val Gly Leu Thr
1 5 10 15
Asp Asp Pro Glu Leu Gln Ile Pro Leu Phe Ile Val Phe Leu Phe Ile
20 25 30
Tyr Leu Ile Thr Leu Val Gly Asn Leu Gly Met Ile Glu Leu Ile Leu
35 40 45
Leu Asp Ser Cys Leu His Thr Pro Met Tyr Phe Phe Leu Ser Asn Leu
50 55 60
Ser Leu Val Asp Phe Gly Tyr Ser Ser Ala Val Thr Pro Lys Val Met
65 70 75 80
Val Gly Phe Leu Thr Gly Asp Lys Phe Ile Leu Tyr Asn Ala Cys Ala
85 90 95
Thr Gln Phe Phe Phe Phe Val Ala Phe Ile Thr Ala Glu Ser Phe Leu
100 105 110
Leu Ala Ser Met Ala Tyr Asp Arg Tyr Ala Ala Leu Cys Lys Pro Leu
115 120 125
His Tyr Thr Thr Thr Met Thr Thr Asn Val Cys Ala Cys Leu Ala Ile
130 135 140
Gly Ser Tyr Ile Cys Gly Phe Leu Asn Ala Ser Ile His Thr Gly Asn
145 150 155 160
Thr Phe Arg Leu Ser Phe Cys Arg Ser Asn Val Val Glu His Phe Phe
165 170 175
Cys Asp Ala Pro Pro Leu Leu Thr Leu Ser Cys Ser Asp Asn Tyr Ile
180 185 190
Ser Glu Met Val Ile Phe Phe Val Val Gly Phe Asn Asp Leu Phe Ser
195 200 205
Ile Leu Val Ile Leu Ile Ser Tyr Leu Phe Ile Phe Ile Thr Ile Met
210 215 220
Lys Met Arg Ser Pro Glu Gly Arg Gln Lys Ala Phe Ser Thr Cys Ala
225 230 235 240
Ser His Leu Thr Ala Val Ser Ile Phe Tyr Gly Thr Gly Ile Phe Met
245 250 255
Tyr Leu Arg Pro Asn Ser Ser His Phe Met Gly Thr Asp Lys Met Ala
260 265 270
Ser Val Phe Tyr Ala Ile Val Ile Pro Met Leu Asn Pro Leu Val Tyr
275 280 285
Ser Leu Arg Asn Lys Glu Val Lys Ser Ala Phe Lys Lys Thr Val Gly
290 295 300
Lys Ala Lys Ala Ser Ile Gly Phe Ile Phe
305 310