多维矩阵用于像药型化合物分子设计的应用及像药型化合物分子设计方法

文档序号:6367776阅读:561来源:国知局
专利名称:多维矩阵用于像药型化合物分子设计的应用及像药型化合物分子设计方法
技术领域
本发明属于药物构架化合物分子设计方法领域,尤其涉及多维矩阵用于像药型化合物分子设计的应用及像药型化合物分子设计方法。
背景技术
近100年来,药物研发经历了下述阶段,I)标靶发现;2)标靶验证;3)高通量筛选(High Throughput Screening) ;4)Hit-to-Lead ;5)先导化合物;6)临床研究等,其中,革巴标验证阶段和药物分子设计被公认为药物研发的瓶颈。
上世纪末和本世纪初,基因工程和蛋白质工程取得了长足进步。其中,基因工程发现了大约12000-15000种新型的靶标蛋白质类型,但使用这些新型靶标开发出来的新型药物的预期效果与其实际疗效之间的偏差非常大,导致世界制药和药物研发行业遭遇巨大的损失并深感困惑。目前,世界药物研发行业主要运用的还是被广泛验证过的300-500个生物靶标类型,并有多种药物筛选合成方法被广泛地加以应用。高通量筛选(HTS)是当前药物研发中广泛应用的药物筛选手段。研究大型数据库的结果表明,用于药物研发过程的高通量筛选化合物种类有1500-2000万。尽管高通量筛选可通过自动化设备每天筛选出12万个以上的化合物,但其又受到诸多技术限制1)生物靶标的精确性,需要在微量下具备精确度的可用于自动化过程的生物靶标;2)检测手段的提高,需要高分辨度的检测设备,如高质量基因芯片;3)高质量的化合物收藏,一般包括300-500万种精选的化合物,如具有像药型特性的高质量化合物,药物研发项目相关的化合物等,不仅需要考虑化合物的质量与纯度,还要考虑化合物结构类型可代表的化学空间化合物数量,包括化合物的多样性(Diversity)与像药性(Drug Likeness)等。“像药”型化合物的分子设计和开发将成为世界制药行业的研发重点之一。像药型化合物的可能药物分子数目为1063,该方法所面临的主要困难是如何从中有效寻找具备特定生物功效的化合物结构类型?如何使“像药”型化合物代表的化学空间有效的与蛋白靶标所代表的生物空间紧密地结合,增加新型化合物结构种类和数目?其开发的局限性在于,分子设计的有效性和可利用的药物构架化合物(Building Block)种类的多样性,并成为药物研发的另一个重要瓶颈。Hit-to-Lead成为药物研发的主要手段,并在近几年正式引入药物研发产业链。该方法先通过高通量筛选“像药型”化合物,以确认一组活性化合物(“Hit”),再评估和优化活性化合物以获得先导化合物(“Lead”),并经多次筛选和优化先导化合物结构类型,以有效和准确地在高通量筛选的结果中优化出针对于特定生物靶标具备可成药性的化合物结构。通常,从化合物的合成、筛选、药效药理学、完成化合物的结构优化需要耗费4-6年,并需要开展大量的分子设计和分子结构对比工作,故存在系统性较差,需与分子设计理念相结合等缺陷。目前,先导性化合物的优化又成为药物研发的关键,将优化后的先导性化合物进行分子设计和分子结构对比,以获得核心的化合物结构,再通过结构修饰以实现下述效果I)最大程度增加对于特定靶标的生物活性;2)在保持对特定靶标生物活性的同时,具有选择性;3)增加对特定细胞的功能和活性;4)优化化合物的体内试验效果;5)调节化合物的吸收、分布、代谢、排泄、毒性(ADME/T)等特性;6)配合和满足化合物在制剂、给药方式、输送系统、生物利用度等方面的需求。然而,已有的先导化合物的优化过程比较机械和繁琐,涉及调整先导化合物的取代基、杂原子成分、分子形状等方面的结构修饰,使其具备“像药”性。通常,需针对1-3个具有核心结构的化合物进行结构改造,再研究化合物结构与其生物活性之间的关系(SAR),并结合化合物的药代药理毒副作用等性质来优化化合物结构,多需要合成5000个以上的化合物,化合物分子的设计效率较低,并存在没有有效地利用现有的药物研究数据与药物研究手段等缺陷。“针对”性小型化合物收藏(Focused Library)也是目前用来提高药物筛选效率的方法之一,该方法约包含500-2,000个化合物,主要针对特定的化合物靶标并以靶 标(Target Orientated)、多样性(Diversity Orientated)、天然产物(Natural ProductOrientated)、化合物基本结构单元(Fragment Orientated)等为基础进行化合物的设计。但这些设计均以药物生物活性相关的单一因素为基础,很少考虑因素之间的关联性,也没有考虑与其它影响化合物像药性的结构进行相对量化的综合对比和评估,更没有充分利用已有的经验数据。因此,该收藏中的化合物分子设计趋于单一,严重影响化合物结构的设计效率。从广义上讲,“像药”型化合物可能成为药物,对特定的生物靶标具有强的亲和性和特定的选择性,还具有可以接受的吸收,分布,新陈代谢,排除和毒性(ADME/T)等性质。“像药”型化合物的性质大多来自于对已知药物的研究和总结,但已知药物并不代表所有“像药”型化合物的种类和特点,已知药物的结构种类也仅仅涵盖了 “像药”型化合物的很少的一部分(Walters WP, Stahl MT, and Murcko MA. Virtual Screening An overview.Drug Discovery Today 1998 ;3 :160-78 ;Walters WP, Murcko A,Murcko MA. RecognizingMolecules with drug-like properties. Curr Opin Chem Biol 1999;3:384-7)。“像药”型化合物所占有的化学空间可谓是一个天文数字。如何使化合物代表的化学空间有效的和蛋白靶标所代表的生物空间紧密地结合是药物开发的关键,也是增加新型化合物种类和数目的关键。Lipinski认为“像药”型化合物应该具有充足的,可以接受的ADME/T(吸收,分布,新陈代谢,排除和毒性)性质,并且要通过一期临床试验。Lipinski指出“像药”型化合物分布在一个极其广泛的化学空间之中,其中大约包含1040到10100个“像药”型化合物,并且相对于可能的生物靶标,发现一个活性化合物的几率小于1/1014。“像药”化合物的物理性质将在很大的方面将决定化合物是否可能成为活性化合物(C.A. Lipinski ;F. Lombardo ;B. W. Dominy and P.J. Feeney (1997)·" Experimental and computationalapproaches to estimate solubility and permeability in drug discovery anddevelopment settings" . Adv Drug Del Rev 23 :3-25. ;Lipinski CAiLombardo FiDominyBW, Feeney PJ. Experimental and computational approaches to estimate solubilityand permeability in drug discovery and development settings. Adv Drug Deliv Rev2001 ;46 :3-26)。
天然产物普遍被认为是“像药”型化合物。传统而言,绝大部分药物来自于天然产物或其衍生物。1983年-1994年期间,共有520种药物通过审查而被批准上市,其中39%来自于天然产物或其衍生物。目前,药物研发的重点之一就是在天然产物中寻找独特的,合成上可行的结构。比对研究已知药物数据库(14,000个化合物)和天然产物数据库(26,000个小分子天然产物提取物)发现,已知药物和天然产物的物理性质很相似,但结构上有着很大差异,主要不同点包括1)相对已知药物而言,天然产物的结构趋于复杂,天然药物中的多环和桥键结构要比已知药物多得多;2)已知药物含有较多的氮原子,而天然产物则含有较多的氧原子;3)天然产物的分子相对较大。目前兴起的化学信息学可用于判断化合物的“像药”性,世界制药行业也希望利用分析和鉴定已知药物、处于临床试验阶段候选药物和天然产物等所生成的“像药”性参数来确定“像药”性化合物,以尽快地发现有活性的化合物(Hit)和先导化合物(Lead)。
“像药型”化合物是寻求具备先导化合物特质的有效化合物结构的重要手段。如何有效地将化合物代表的化学空间与蛋白靶标所代表的生物空间紧密结合是设计成功的关键,也是增加新型化合物种类和数目的关键。而如何设计用于高通量筛选的化合物收藏,使之具备高效益、高质量、高效率则成为一个非常重要的研究课题。据统计,评价1900年-2000年间美国批准的5,120个药物发现仅有52种所谓的“核心结构”,该结果表明了制药行业化合物收藏的局限性。在设计“像药型”化合物时采用的方式主要是利用“碎片”(Fragment)、“连接”(Linker)、天然产物结构和空间形状等。任何化合物均由“碎片”组成,药物化学的“碎片”更多的偏向于杂环化合物。通过对已知药物数据库的统计发现,在12,383个已知药物化合物中,共有7521个已知药物化合物包含杂环化合物结构,共包含117种杂环类型;在对28,710个天然产物单体研究中发现,共有21,372个化合物包含杂环化合物结构。“连接”和“碎片”的概念之间有时会模糊,可以认为“连接”就是“碎片”的一部分,但是在形成化合物时,“碎片”之间需要“连接”而形成化合物。在对12,000有生物活性的化合物的研究表明,60%以上的化合物通过“连接”结合成“碎片”而被合成出来。统计研究6808种中药提取物单体的结果表明,有200多种为含有杂环的简单化合物,进一步的改造和修饰这些化合物结构,就会开发出几倍的药物构架化合物。应该说,找出核心结构是天然产物的药物构架化合物开发的重点。空间形状直接影响到化合物是否可以和生物靶标有效地作用,如生物选择性。大量的研究使用三维结构分析来确定化合物的空间结构,但二维结构(矩阵式)分析可以更直观、更简单地用于设计药物构架化合物。用不同的药物构架化合物来调节化合物空间结构是一个极有效的筛选活性化合物方式,也是先导化合物优化极其常用的手段。可能成为药物的化合物不仅要对特定的生物靶标具有强的亲和性,还要具有特定的选择性及可接受的ADME/T (吸收,分布,新陈代谢,排除和毒性)等,这些性质与其药代药理毒副作用相关。药物分子设计的关键在于保持甚至提高化合物的生物活性和选择性的同时,使化合物具备可接受的ADME/T性质及临床特性。如何将影响化合物结构与特性的诸多因素进行综合分析与评估,达到分子设计的有效状态是当前药物研发急需解决的技术问题,而达到有效药物分子设计的起源于“像药”化合物的结构设计和种类。尽管世界药物研发领域投入大量的人力物力开发了很多新技术,旨在提高药物的研发效率,但是,如何提高药物设计的有效性、针对性与设计效率,使之更加有效、实用与便利,如何合理地进行化合物结构对比,如何在分子设计时综合利用和考虑影响药物分子生物活性和理化性质的多种因素及其关联性等,如何将影响化合物结构与特性的诸多因素进行综合分析与评估,显著提高药物分子的设计效率,仍是药物研发领域急待解决的技术问题。

发明内容
为了加快药物研发的进程,尤其是加速国内药物研发和世界接轨的进程,显著提高候选药物的设计效率,发明人研究获得了多维矩阵用于像药型化合物分子设计的方法和技术平台。该平台首次将数学的矩阵优化理念使用在药物及其相关的分子 设计领域,并通过将药物研发过程中需要考虑的大量因素按照一定的特性进行归类和对比,从而使用少量的变数来代表数量巨大的变数,以提高像药型化合物分子的设计效率及其合成效益。多维矩阵分子设计的理念在于,任何药物分子都是由所谓的化合物基本结构单元组合而成的,通过对300万种高价值的“像药’型化合物按照28000种化合物基本结构单元进行化合物结构分类,然后进行结构分析,结果表明化合物基本结构单元组成药物分子的方式呈现矩阵和多维矩阵的排列、组合方式。同时,天然产物和中药有效成分单体化合物的结构分析结果表明,合成化合物与天然产物的基本结构单元及其组合方式极具相似性。因此,在药物分子设计时,将新型候选药物分子结构与已知化合物结构的各种经验型数据进行结构对比,可以大大提高药物分子设计的针对性和有效性。多维矩阵分子设计平台为药物及其相关的分子设计提供了一个系统化的矩阵模式的结构对比和结构优化的方法。该方法采用多维矩阵排列分析化合物的结构因素的相应变量和可变因素的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型,以显著地减少需要合成的化合物数量,并快速获得所需的具有生物学活性或特定药物活性的候选药物,从而显著提高化合物分子的设计效率和效益。本发明的采用多维矩阵并参照目标化合物结构优化候选药物结构和完成候选药物分子设计的方法可用于Me-Too类新型药物、药物构架化合物、“像药”型化合物、Hit-To-Lead、先导化合物优化等方面,可以最少变量和最少数量的化合物合成来获得最佳的候选药物,具有很强的设计针对性,显著地提高药物的设计效率和研发效益,并显著缩减研发时间和研发费用。为了实现本发明的发明目的,本发明提供如下技术方案一种像药型化合物结构的设计方法,其特征在于,所述方法包括如下步骤(I)将目标化合物按照基本结构单元进行结构分区,分别以大写字母A,B, C,
D.. . Y或Z代表相应的结构区域,所述基本结构单元包括饱和与不饱和单环、双环、多环等环状化合物结构,取代基,官能团或元素;(2)参照经验型数据,确定影响目标化合物靶标生物活性/细胞活性的结构部分,将其作为核心结构区域;(3)参照经验型数据,选择影响目标化合物其它性质的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. . .bn,所述c的变量选自cl、c2、c3. ..cn,所述的变量d选自dl, d2, d3. . . dn,所述y的变量选自yl、y2、y3. . . yn,所述z的变量选自ζ1、ζ2、ζ3· · · ζη,其中,η为自然数;(4)采用 多维矩阵排列分析步骤(2)所述的核心结构和步骤(3)生成的可变因素,生成“像药”型化合物结构类型,优选参照经验型数据,采用多维矩阵比对分析步骤(2)所述的核心结构和步骤(3)生成的可变因素,根据结构比对分析结果,生成“像药”型化合物结构类型。本发明的优选技术方案中,所述的多环结构单元为环数不小于3的环状化合物结构。本发明的优选技术方案中,所述可变因素可以作为连接(Linker)区域或碎片(Fragment)区域。本发明的优选技术方案中,所述碎片是指在目标化合物结构中最接近于化合物基本结构单元的化合物结构类型,可以根据目标化合物的结构确定碎片的结构类型,优选碎片为化合物基本结构单元。本发明的优选技术方案中,通过如下方式确定碎片的结构类型a)生成最接近于基本化合物结构单元类型的碎片;b)将步骤a)生成的碎片结构类型与经验型数据进行化合物结构对比,优选采用多维矩阵将步骤a)生成的碎片结构类型与经验型数据进行化合物结构对比;c)根据步骤b)所得的结构对比结果,生成碎片式药物构架化合物结构类型。本发明的优选技术方案中,所述连接(Linker)是指在目标化合物结构中连接核心结构和碎片或者连接碎片的结构部分,所述连接选自官能团、取代基、基本结构单元的任一种或其组合。根据目标化合物的结构,确定连接结构类型。本发明的优选技术方案中,通过如下方式确定连接的结构类型a)生成连接(连结)结构类型;b)将步骤a)生成的连接结构类型与经验型数据进行化合物结构对比,优选采用多维矩阵将步骤a)生成的连接结构类型与经验型数据进行化合物结构对比;c)根据步骤b)所得的结构对比结果,生成连接式药物构架化合物结构类型。本发明的优选技术方案中,对新生成的药物构架化合物结构类型进行合成和市场分析,确定新型药物构架化合物结构类型。任选地,根据像药型化合物的设计需要,采用多维矩阵重复进行上述步骤中的部分或全部步骤,以进行像药型化合物的结构分析、结构确认、结构优化,直至获得所需的像药型药物结构类型。本发明的优选技术方案,参照经验型数据,对生成的“像药”型化合物进行结构优化和比对分析,并通过化学信息学计算,确定新型“像药“型化合物结构类型。本发明的优选技术方案中,参照靶标信息和/或同类化合物的已知结构来确定目标化合物的核心结构。本发明的优选技术方案,参照下述方式确定目标化合物的核心结构a)采用多维矩阵方式进行化合物的结构构成和合成可行性的优化分析;b)根据优化分析的结果,产生出可以用于构造和/或合成核心结构的药物构架化合物的结构类型;c)采用多维矩阵将步骤b)生成的可以用于构造和/或合成核心结构的药物构架化合物的结构类型与经验型数据进行化合物结构对比;d)根据步骤c)所得的结构对比结果,生成可以构成和/或合成与前述核心结构不完全相同的核心结构的药物构架化合物结构类型;e)对于新生成的药物构架化合物结构类型进行合成可行性分析,确定新型核心结构类型。本发明的优选技术方案中,所述基本结构单元包括分子结构中的任一结构单元,选自饱和或不饱和的单环结构单元、双环结构单元、多环结构单元、取代基、官能团、元素的任一种或其组合。本发明的优选技术方案中,所述的单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合。本发明的优选技术方案中,所述的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合。本发明的优选技术方案中,所述的多环结构单元选自芳香多环、非芳香多环、取代的芳香多环、取代的非芳多单环的任一种或其组合,其中,所述的多环为环数大于3的环状化合物结构。本发明的优选技术方案中,所述官能团选自酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其组合。本发明的优选技术方案中,所述取代基是任何化合物的结构残基,选自烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。本发明的另一目的在于提供多维矩阵在像药型化合物分子设计中的应用,其特征在于,通过目标化合物的结构区域与经验型数据确定多维矩阵。优选地,采用多维矩阵组合生成的核心结构与生成的连接和/或碎片。更优选地,采用前述任一种像药型化合物分子设计方法进行化合物分子设计。优选地,所述应用还包括进行像药性的合成计算和市场分析,生成新型“像药“型化合物结构类型。更优选,参照经验型数据组合生成的核心结构与生成的连接和/或碎片。本发明所述的“化合物结构类型的分析、确定和优化”是指采用多维矩阵排列分析影响候选药物可成药性因素的任一种或其组合,实现以最少数目的考虑因素来有效地设计药物分子,得到优化的先导型化合物或者像药型化合物结构的目的。根据本发明的技术方案,优选多维矩阵分子设计的第一个步骤是根据已知化合物的结构类型,按照分子结构基本单元进行结构划分,再与经验数据进行结构分析和结构对t匕,从而寻求出最少的可变区域,提高像药型化合物的设计效率。为了清楚表述本发明的保护范围,本发明对术语进行如下解释和说明。本发明所述的基本结构单元包括分子结构中的任一结构单元,选自饱和或不饱和的单环、双环、多环等环状结构单元、取代基、官能团的任一种或其组合;所述单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合;所述 的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合;所述的多环结构单元选自芳香多环,非芳香多环,取代的芳香多环,取代的非芳多单环的任一种或其组合,其中,所述多环结构单元的环数不少于3 ;本发明所述的官能团包括酮、醛、脂、胺、酰胺、单键、双键、三键、齒素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其;所述取代基是任何化合物的结构残基,包括烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。目前,药物研发领域拥有的基本结构类型、官能团和元素有30000多种。本发明通过多维矩阵排列可将这些基本结构类型确定在约500种,将常用官能团确定在30-50种。本发明所述的“ADME/T”是指化合物在吸收、分布、代谢、排泄、毒性等方面所具有的性质。
本发明所述的靶标是指对一定适应症具备功效的生物蛋白质,可以按照其生物功效、适应症(如抗癌,心脏病,中枢神经疾病等)、靶标类型(如GPCR、离子通道等)分类。同时,任何生物靶标或者蛋白质都具有一些靶点,相同的靶标对应不同的靶点也对应不同的生物活性或适应症而起到不同的作用,而同一靶点仅对一个生物靶标或适应症具备特别有效的活性。本发明所述的“目标化合物”又称“参考化合物”、“药物设计目标”或“参照物”,优选为对于特定生物靶标和靶点具备一定的生物活性的已知化合物结构类型。本发明所述的“已知化合物结构类型”是指已被专利文献或科技文献公开的针对特定生物靶标具有生物活性的化合物结构类型,包括上市药物、处于政府部门申报阶段或临床阶段的候选药物、处于临床前研究阶段的化合物等。发明的优选技术方案中,选择目标化合物的途径包括适应症、适应症对应的靶标、被验证的靶标或被广泛接受的靶标或机理明确的靶标、靶标类型或蛋白组(如GPCR、离子通道等)、靶标蛋白质的结构类型、专利文献或科技文献所公开的化合物结构类型。本发明的优选技术方案中,所述的目标化合物选自已知的具有特定生物活性的化合物结构、按照靶标代码数据库查询到的化合物结构或对特定靶标有效的化合物结构类型、已知药物或者候选药物等化合物结构类型,包括上市药物、处于临床阶段的候选药物、处于临床前研究的候选药物、先导化合物、具备生物活性的天然产物、中药单体化合物、中药有效成分、被验证的具备生物活性的像药性化合物、计算机辅助药物分子设计(CADD设计化合物)、高通量筛选化合物、已知靶标蛋白质空间立体结构及其靶点区域的空间立体结构的任一种或其组合。参照目标化合物进行像药型化合物分子设计是新型药物的主要研发方向,该方法将针对靶标设计的化合物结构类型采用多维矩阵指导化合物结构的分析、设计、改造和优化,以得到新的化合物结构类型、先导型化合物结构类型或像药型化合物结构类型,还可用于验证生物IE标,以及寻找或设计药物化合物新结构(如Me-Too类药物)等。本发明所述的化合物结构类型是指对于特定生物靶标具备生物活性和结构相似性的系列化合物。本发明所述的候选药物是指有可能成为上市药物的新化合物结构(new chemicalentity, NCE)。本发明所述的靶标生物活性是指化合物对特定生物靶标所具有的生物活性或细胞活性。本发明所述的靶标生物选择性是指化合物对生物靶标不同靶点的生物活性所具有的选择性。本发明所述的细胞活性是指化合物对特定细胞的生物活性。
本发明所述的毒副作用是指化合物所具有的毒性和/或副作用。本发明所述的可合成性是指化合物具备可被合成出来的可行性。本发明所述的“先导型化合物优化”是指将一个具有特定生物活性的化合物进行结构和性质的优化,以获得具备所需生物活性或细胞活性的先导型化合物、像药型化合物或候选药物。现有的商业化合物数据库包括下述几种I)综合药物化学数据库---Comprehensive Medicinal Chemistry (CMC);
2)世界药物数据库---World Drug Index (WDI);3) MDDR 数据库;4)调查类药物数据库---Investigational Drug Database (IDDB);5)商业化合物数据库---Available Compound Databse (ACD/SCD);6)化学导向数据库---ChemNavigator7)生物活性天然产物数据库---Biologically Active Natural Products (BDNP)本领域技术人员可从现有的商业化合物数据库检索获得本发明所述的目标化合物。在本发明的优选技术方案中,所述的目标化合物为已知药物结构,优选为市场上广泛使用的已知药物,如抗糖尿病药物、心血管药物、消化道药物等。本发明采用在临床上被广泛验证过的药物化合物结构,针对新型靶标进行结构优化和改造,设计出新颖的针对特定适应症具有功效的药物化合物结构类型,包括先导型化合物类型、像药型化合物结构类型等。本发明所述的“经验型数据”又称“经验型参数”或“实验型参数”,是指在药物研发历史上积累下来的实验验证过的数据,所述经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性或药代药理参数等与化合物的结构密切关联的结构和性能参数,因此,经验型数据的对比过程包含化合物的结构对比和结构优化
等方面。本发明的优选技术方案中,所述经验型数据包括与化合物结构相关的靶标生物活性、靶标生物选择性、毒副作用、细胞活性、ADME性质、像药性、可合成性的任一种或其组合。本发明的优选技术方案中,所述的经验型数据选自下述数据库的任一种或其组合I)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库;或2)世界药物研发常用蛋白质靶标相对应的化合物结构类型数据库;或3)药物研发核心结构数据库;或4)药物分子构架化合物类型数据库;或5)被验证的具有生物活性的化合物结构类型数据库;或6)可查询上市药物数据库;或7)生物等效型数据库;或8)新陈代谢化合物类型数据库;或9)毒性化合物结构类型数据库;或
10)中药有效成分化合物类型数据库;或11)天然产物单体化合物结构数据库;或12)药物治疗数据库;或13)医疗关键词数据库等。本领域技术人员可从这些已知数据库中获取所需的经验型数据。现将这些已知数据库例举如下处于临床阶段的化合物数据库用于寻求处于临床阶段的化合物相关的信息,以及与结构相关的蛋白质靶标信息,包括靶标的发现,被验证的靶标,蛋白质结构及其与其相关的化合物结构类型,其代表型的数据库包括 http://thomsonscientific. jp/products/iddb/index, shtml http://www. cancer, gov /cancertopics /factsheet/Therapy/investigational-drug-acces s http://science, thomsonreuters. com/support/faq/sddb/ ;http://www. centerwatch. com/drug-information/pipeline/ http://www. pharmaproiects. com/research development ahalysis/tools,htm ;http://www.pipelinereview.com/store/product info, php products id =2741 ;http://www. bioportfolio, com/store/product/7781/R-d-DruR-PipeIine-Database-2-months_Subscription. html ;http : // thomsonreuters.com/products services/science/scienceproducts/a-z/pipeli ne data integrator/ ;http://www.ovid. com/site/catalog/DataBase/1244, jsp ;http://www. imshealth. com/portal/site/imshealth ;http://www.pjbpubs.com/ ;http://www. fda. rov/qADME数据库用于研究、总结与化合物的吸收、分布、代谢与排泄等性质相关的结构信息,其代表型数据库包括http://www.pharmainformatic.com/html/adme tox predictions, html ;http://www. aureus-sciences. com/aureus/web/Ruest/adme-overview ;http://ip. fujitsu. com/Rroup/kyushu/services/1 ifescience/english/asp/admedb/ ;https ://www.cloeRateway. com/services/cloe knowledRe/paRes/servicefrontpage, php ;http://www.siritech. com/Cheminformatics. htm ;http: //modem, ucsd. edu/adme/databases/databases extend, htm ;http://www.pubpk.org/index.php title = Main Page ;http://www.pubpk.org/index.php title = Main Page ;http://www. hmdb.ca/ ;http://www. nuRo. org/metabolomics/36124 ;
http : //www. genome, jp/kegg/pathway, html http : //kanaya. naist. ip/
KNAnSAcKZ;http://accelrys. com/products/databases/bioactivity/metabolite, html 和http://metlin. scripps. edu/0蛋白质靶标数据库用于寻求和疾病相关的蛋白质靶标的信息,包括靶标的发现,被验证的靶标,蛋白质结构及其与其相关的化合物结构类型,具有代表型的数据库如下http: //targetdb. pdb. org/http://www. dddc. ac. cn/pdtd/http: //www. rcsb. org/pdb/home/home. dohttp: //bidd. nus. edu. Sg/group/CJTTD/TTD. asphttp://www. sciclips. com/sciclips/drug-targets~main.dohttp://www. ncbi. nlm. nih. gov/genbank/http://www. ebi. ac. uk/Databases/structure, html化合物合成方法数据库用于寻求化合物的合成方法及其可行性,具有代表性的数据库如下;https://scifinder, cas. org http://accelrys. com/products/databases/synthesis/ 和 http://www.thieme-chemistry. com/en/products/journals/synfacts.html o天然产物与中药数据库用于寻求天然产物及其中药化合物的结构数据,具有代表性的数据库如下http://naturaldatabase.therapeuticresearch.com/home.aspx cs = &s =ND ;http://www. ponderfodder, com/node/113 ;http://www. ncbi. nlm. nih. Rov/pmc/articles/PMC1347494/ ;http://dnp. chemnetbase. com/intro/index, jsp ; isessionid = 80C9568C977F47200197BE48213AC5IA ;http://www. heterocycles, ip/structure/structure, php ;http: //www. chemnetbase. com/ ;http://www. Rfmer. ch/TMCAM/TNCAM database system, htm ;http://www. rmhiherbal. org/ai/pharintro, html ;http://tcm. emu, edu. tw/aboutOl. php menuid = I :和http: //tcm. cz3. nus. edu. sr/Rroup/TCMsite/Default. aspx“像药”型化合物、具有生物活性化合物数据库用于寻求“像药”型化合物和具有生物活性的化合物的信息,具有代表性的数据库如下http://accelrys. com/products/databases/bioactivity/mddr. html ;http://accelrys. com/products/databases/bioactivity/comprehensive-medicinal-chemistry. html ;http://www. chemnaviRator. com/ 和http : / / accelrys. com/products / databases / sourcing/screeninR-compounds-directory. html。药物毒副作用数据库用于寻求化合物的毒性、副作用等特性的数据库,其代表性数据库包括http: //databases, biomedcentral. corm/browsesub iect/ sub id =、1013 ;http: //www. drugs, com/ http: / / si deeffect s. embl.de/ http://www. pdrhealth. com/drugs/drugs~index. aspx http://www. drugs, com/drug interactions, html
http://www. pdrhealth. com/home/home, aspx http: //www. rphworld. com/link-350. html http: //toxnet. nlm. nih. gov/ http: //bioinf. xmu. edu. cn/databases/ADR/index, html http: //ctd. mdibl.orR/ 和http://accelrys. com/products/databases/bioactivity/toxicity, html。已知药物数据库可以提供相关药物的基本信息,包括蛋白质靶标机理、药物分子结构、药代药理性质、毒副作用、药物相互作用等信息,其代表性数据库包括http: //www. drugbank. ca/ http://www. nlm. nih. gov/medlineplus/druginformation. html http: //chrom. tutms. tut, ac. jp/.TINNO/DRUGDATA/OOdatabase. html http://www. rxlist. com/script/main/hp. asp http://www. accessdata. fda. gov/scripts/cder/drugsatfda/ http://www. fda. gov/Drugs/Information0nDrugs/ucml42438. htm http: //www. ncbi. nlm. nih. gov/pubmed/ http: //www. webmd. com/ http: //www. 3dchem. com/atoz. asp http: //www. drugs, com/ 和http://www. pdrhealth. com/home/home, aspx。本发明所述的已知数据库提供了本领域大量的目标化合物及其可供参考的经验型数据。作用于生物靶标的化合物结构类型多具备特定的结构母核,该结构母核体现了化合物针对特定靶标的生物活性,其中,化合物结构母核的空间结构应与靶标蛋白质的立体结构相匹配,二者的匹配程度也是决定化合物生物活性的主要因素;结构母核上的杂原子分布与化合物的生物选择性相关;结构母核的官能团分布与其生物活性和选择性相关,而任何杂原子和官能团在化合物结构的分布均有可能影响化合物的药代、药理和毒副作用等性能。另外,不同的母核结构类型对某一特定生物靶标具有生物活性,其决定因素是化合物的空间立体分子结构和蛋白质空间立体结构。因此,化合物的结构设计过程需进行分子结构对比,可参照化学基因工程的技术扩大化合物结构对比的范围,并增加考虑因素,以进一步验证生物IE标,并寻找新的先导型化合物结构类型。在设计药物分子时,需要考虑众多因素,所述考虑因素包括适应症、生物活性、可合成性、理化性质、稳定性、新陈代谢、药代、药理、毒副反应的任一种或其组合。如何有效地评价和分析相关影响因素是药物设计的主要工作,并且,设计不同的参照物需要考虑的影响因素或其顺序存在不同,有时需反复考虑一些影响因素。当以目标化合物为基础设计候选药物时,应尽量不改变甚至增加其生物活性和选择性,并通过合理的结构修饰以改善甚至提高其药代药理性质,降低其毒副作用,其中,设计需要考虑因素包括
A.蛋白质靶标(又称“生物靶标”);或B.靶标的验证状态;或C.作用于特定靶标的化合物结构类型;或D.被验证的具备生物活性的“像药“型化合物结构类型;或E.已知药物的化合物结构类型;或 F.处于临床研究阶段的候选药物的化合物结构类型;或G.处于临床前研究阶段的候选药物的化合物结构类型;或H.天然产物的化合物结构类型;或I.中药有效成分的化合物结构类型;或J.生物等效性化合物结构类型;或K.新陈代谢物结构类型;或L.药代药理分子结构类型;或M.毒性化合物结构类型;或N.基本化合物结构单元类型;或O.基本化合物官能团结构类型;或P.合成方式的任一种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的生物活性和选择性时,需要考虑的因素选自A、B、C、D、E、F、G、H、I、K、P的任一种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的空间结构时,需要考虑的因素选自A、D、E、H、I、N、O、P的任一种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的新陈代谢时,考虑的因素选自E、F、H、I、K、N、O、P的任一种或其组合。在本发明的优选技术方案中,当需要保持甚至改善化合物的药代药理性质时,考虑的因素选自D、E、F、G、H、I、L、P的任一种或其组合。在本发明的优选技术方案中,当需要降低化合物的毒副作用时,考虑的因素选自
E、F、G、H、I、L、Μ、P的任一种或其组合。采用多维矩阵设计化合物的分子结构时,可单独考虑因素A-P的任一种或其组合,其目的是有效地组合不同的因素,从而确定目标化合物的结构类型,并可采用多维矩阵法来分析化合物结构。本发明的优选技术方案中,所述靶标为12000-15000种,其源自Genebank,TargetDB, Threapuetic Target DB, DART, PDTD, TRMP、其他相关数据库等,包括被验证的革巴标、被广泛使用的靶标等,以确定靶标对应的化合物结构,并设计出新颖的药物化合物结构类型、先导型化合物类型、像药型化合物结构类型等。在本发明的优选技术方案中,所述目标化合物选自来自天然产物或中药有效成分的化合物结构类型,可以结合其传统药物的特性,将其与靶标蛋白质结构进行结构对比,并通过针对性的结构修饰以进行结构优化,寻找出有效的新化合物结构类型或先导型化合物结构类型,其中,所述的天然产物源自The Directory of Natural Product, TradionalChinese Medicine Databas, Natural Product Database 等数据库。本发明的优选技术方案中,将有效的化合物结构类型与生物靶标进行结构分析和对比,以寻求对该生物靶标具备活性的新化合物结构类型,其中,所述有效的化合物为经过验证的具备一定生物活性的化合物结构类型,并在化学空间内代表最大数目的化合物结构,包括天然产物,以及已知的、可查询到的、来源于文献和相关数据库(包括PubMed,CMC,MDDR, IDDB, Scif inder, Chemnivagator 等)的化合物结构等。与现有技术相比,本发明的有益效果包括I、本发明创造性地采用多维矩阵来指导像药型化合物的设计,并系统总结了像药型化合物的结构分析、结构确认、结构改造和结构优化的方法及其考虑因素,显著提高了设“像药”型化合物的药物筛选质量和高通量筛选的效益,为Hit-To-Lead和先导性化合物优化过程打下更加坚实的基础。2、本发明参照药物研发经验型数据,进行有效的像药型化合物的结构分析、结构确认、结构改造和结构优化结构设计和结构对比,显著提高了“像药”型化合物对于生物靶标的验证功效,解决靶标验证的问题,提高药物研发的效益,并极大丰富像药型化合物收藏。3、本发明使用药物研发历史经验型数据,系统地总结化合物结构在“像药”型化合物分子设计的功效,并创造性地采用多维矩阵排列分析化合物结构类型与可变因素之间的关系,以显著提高化合物设计、结构对比、结构改造、结构优化等过程的针对性、有效性、全面性和系统性,以最少量的化合物分子结构类型来达到寻求出最佳Hit和先导性化合物结构。


图I为本发明像药型化合物分子设计的流程图。该流程图将本发明优选的设计方法以目标化合物起始进行了详细说明,包括下述内容(I)将目标化合物按照基本结构单元进行结构分区,分别以大写字母A,B, C,D. . . Y或Z代表相应的结构区域,所述基本结构单元包括饱和与不饱和单环、双环、多环等环状化合物结构,取代基或官能团;(2)参照经验型数据,确定影响目标化合物靶标生物活性/细胞活性的结构部分,将其作为核心结构(Core Structure)区域,,根据如下方式确定核心结构a)采用多维矩阵方式进行化合物的结构构成和合成可行性的优化分析;b)根据优化分析的结果,产生出可以用于构造和/或合成核心结构的药物构架化合物的结构类型;c)采用多维矩阵将步骤b)生成的可以用于构造和/或合成核心结构的药物构架化合物的结构类型与经验型数据进行化合物结构对比;d)根据步骤c)所得的结构对比结果,生成可以构成和/或合成与前述核心结构不完全相同的核心结构的药物构架化合物结构类型;e)对于新生成的药物构架化合物结构类型进行合成可行性分析,确定新型核心结构类型;
(3)参照经验型数据,选择影响目标化合物分子其它性质(如生物选择性、ADME性质、毒副作用、像药性、可合成性等)的可变因素及其变量,将所述可变因素和变量分别作为连接和碎片区域,其中,通过如下方式确定碎片的结构类型a)生成最接近于基本化合物结构单元类型的碎片;b)将步骤a)生成的碎片结构类型与经验型数据进行化合物结构对比,优选采用 多维矩阵将步骤a)生成的碎片结构类型与经验型数据进行化合物结构对比;c)根据步骤b)所得的结构对比结果,生成碎片式药物构架化合物结构类型其中,通过如下方式确定连接的结构类型a)生成连接(连结)结构类型;b)将步骤a)生成的连接结构类型与经验型数据进行化合物结构对比,优选采用多维矩阵将步骤a)生成的连接结构类型与经验型数据进行化合物结构对比;c)根据步骤b)所得的结构对比结果,生成连接式药物构架化合物结构类型;(4)采用多维矩阵组合步骤(2)生成的核心结构和步骤(3)生成的连接和/或碎片,并进行像药性的合成计算和市场分析,生成新型“像药“型化合物结构类型,优选参照经验型数据组合步骤(2)生成的核心结构和步骤(3)生成的连接和/或碎片。
具体实施例方式以下结合实施例对本发明做进一步描述。需要说明的是,下述实施例不能作为对本发明保护范围的限制,任何在本发明基础上作出的改进都不违背本发明的精神。需要说明的是,下述所有化合物中,化学键不完整的基团均表明与氢相连。实施例I以波力维为目标化合物的像药型化合物分子设计
D C
B
Plavix以波力维(Plavix)为目标化合物的像药型化合物分子设计方法,包括如下步骤(I)将波力维按照基本结构单元进行结构分区,分为A,B, C,D四个区域(此处可根据具体情况,分为多于4个或者少于4个区域);(2)参照经验型数据,结合蛋白质靶标信息和治疗相同疾病的药物化合物结构发展历程,确定A区域对生物活性和选择性具有决定作用,将其确定为核心结构(CoreStructure)区域;(3)根据经验型数据的对比分析结果,选择影响目标化合物分子其它性质的碎片或连接就B区域而言,进行取代替换设计形成的化合物结构类型举例如下
(a)采用 多维矩阵方式进行结构构成和合成可行性的优化分析,并根据优化分析的结果,产生出可以用于构造和合成核心结构的药物构架化合物的结构类型举例如下;
权利要求
1.一种像药型化合物结构的设计方法,其特征在于,所述方法包括如下步骤 (1)将目标化合物按照基本结构单元进行结构分区,分别以大写字母A,B,C,D.. . Y或Z代表相应的结构区域,所述基本结构单元包括饱和或不饱和单环、双环、多环环状化合物结构,取代基或官能团; (2)参照经验型数据,确定影响目标化合物靶标生物活性/细胞活性的结构部分,将其作为核心结构区域; (3)参照经验型数据,选择影响目标化合物其它性质的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d. . . y或z加以表示,所述a的变量选自al、a2、a3. . . an,所述b的变量选自bl、b2、b3. ..bn,所述c的变量选自cl、c2、c3. . . cn,所述的变量d选自dl,d2, d3. . . dn,所述y的变量选自yl、y2、y3. . . yn,所述z的变量选自zl、z2、z3. . . ζη,其中,η为自然数; (4)采用多维矩阵排列分析步骤(2)所述的核心结构和步骤(3)生成的可变因素,生成“像药”型化合物结构类型,优选参照经验型数据,采用多维矩阵比对分析步骤(2)所述的核心结构和步骤(3)生成的可变因素,根据结构比对分析结果,生成“像药”型化合物结构类型。
2.根据权利要求I的方法,其特征在于,所述经验型数据选自靶标生物活性、靶标生物选择性、毒副作用、细胞活性、ADME性质、像药性、可合成性的任一种或其组合。
3.根据权利要求I或2的方法,其特征在于,所述可变因素为连接区域或碎片区域。
4.根据权利要求3的方法,其特征在于,通过如下任一或全部方式确定所述碎片的结构类型 a)生成最接近于基本化合物结构单元类型的碎片; b)将步骤a)生成的碎片结构类型与经验型数据进行化合物结构对比,优选采用多维矩阵将步骤a)生成的碎片结构类型与经验型数据进行化合物结构对比; c)根据步骤b)所得的结构对比结果,生成碎片式药物构架化合物结构类型。
5.根据权利要求3的方法,其特征在于,通过如下任一或全部方式确定连接的结构类型 a)生成连接(连结)结构类型; b)将步骤a)生成的连接结构类型与经验型数据进行化合物结构对比,优选采用多维矩阵将步骤a)生成的连接结构类型与经验型数据进行化合物结构对比; c)根据步骤b)所得的结构对比结果,生成连接式药物构架化合物结构类型。
6.根据权利要求1-5任一项的方法,其特征在于,根据如下任一或全部方式确定核心结构区域 a)采用多维矩阵方式进行化合物的结构构成和合成可行性的优化分析; b)根据优化分析的结果,产生出可以用于构造和/或合成核心结构的药物构架化合物的结构类型; c)采用多维矩阵将步骤b)生成的可以用于构造和/或合成核心结构的药物构架化合物的结构类型与经验型数据进行化合物结构对比; d)根据步骤c)所得的结构对比结果,生成可以构成和/或合成与前述核心结构不完全相同的核心结构的药物构架化合物结构类型;e)对于新生成的药物构架化合物结构类型进行合成可行性分析,确定新型核心结构类型。
7.根据权利要求1-6任一项的方法,其特征在于,采用多维矩阵重新组合“像药”型化合物的组成部分,得出结构对比和结构优化的新型“像药”型化合物结构类型,优选所述的组成部分选自碎片或连接的任一种或组合,更优选参照经验型数据重新组合“像药”型化合物的组成部分。
8.根据权利要求1-7任一项的方法,其特征在于,参照靶标信息和/或同类化合物的已知结构来确定目标化合物的核心结构。
9.根据权利要求1-8任一项的方法,所述的目标化合物选自上市药物、处于临床阶段的候选药物、处于临床前研究的候选药物、先导化合物、具备生物活性的天然产物、中药单体化合物、中药有效成分、被验证的具备生物活性的像药性化合物、计算机辅助药物分子设计(CADD设计化合物)、高通量筛选化合物、已知靶标蛋白质空间立体结构及其靶点区域的空间立体结构的任一种或其组合。
10.多维矩阵在像药型化合物分子设计中的应用,其特征在于,通过目标化合物的结构区域与经验型数据确定多维矩阵。
全文摘要
本发明涉及多维矩阵用于像药型化合物设计的应用及像药型化合物设计方法,该方法首次将数学的矩阵优化理念应用于像药型化合物及其相关的分子设计领域,并采用多维矩阵排列分析目标化合物的核心结构与可变因素及其变量,生成“像药”型化合物结构类型。该方法可以显著提高像药型化合物设计的全面性、系统性、针对性、有效性和设计效率,并显著提高合成效率,丰富像药型化合物的收藏。
文档编号G06F19/10GK102646171SQ201210100888
公开日2012年8月22日 申请日期2012年4月9日 优先权日2011年4月11日
发明者闫京波, 霍秀敏 申请人:闫京波, 霍秀敏
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1