使用液相色谱测试的机器学习药物评估的制作方法

文档序号:36792307发布日期:2024-01-23 12:12阅读:16来源:国知局
使用液相色谱测试的机器学习药物评估的制作方法

本发明涉及计算化学,并且更具体地涉及用于预测分子的物理化学特性的机器学习技术。


背景技术:

1、机器学习已用于从大量原始数据中获得有用的见解。最近,其已被应用于化合物,特别是用于分析如新药等生物医学应用的化合物。物理化学特性的评估在药物发现研究中发挥关键作用。

2、从基本理念到最终产物的药物开发是一个复杂且昂贵的过程。在早期阶段,必须筛选大量化学分子以识别表现出某种化学活性的潜在化合物。然而,通过传统方法在这些潜在化合物中寻找药物候选物是不可行的。多年来,将单一药物从最初的筛选带到临床试验的成本平均为数亿美元;因此,需要用于识别最好候选药物分子的改进技术。本发明解决了此需要。


技术实现思路

1、亲油性logp、辛醇-水分配系数是评估目标分子作为药物使用的指标之一,因为其指示目标分子作为药物的吸收、分布、代谢、排泄、毒性和效力。本发明旨在准确预测分子的亲油性和其它物理化学特性,以便识别候选药物以进行进一步测试。

2、一方面,本发明提供了一种用于预测药物的候选小分子的亲油性的机器学习系统。构建了机器学习模型,所述机器学习模型从包含已知亲油性和液相色谱柱中的已知保留时间的小分子物理化学特性的数据库进行训练,以创建亲油性与液相色谱保留时间之间的学习关联。

3、将未知亲油性和未知保留时间的候选小分子施加到液相色谱柱。测量所述候选小分子在所述液相色谱柱中的保留时间。

4、将测得的所述液相色谱柱中的保留时间应用于所述机器学习模型以获得所述候选小分子的亲油性。从所述机器学习模型中选择一个或多个具有大约1到大约3的亲油性值的候选小分子。对识别的候选小分子进行药物活性测试。

5、另一方面,所述机器学习系统使用小分子物理化学特性的数据库,所述小分子物理化学特性包含酸解离常数(pka)、细胞渗透性和极性表面积。

6、另一方面,所述机器学习模型包括随机森林回归算法。

7、另一方面,所述机器学习模型包括梯度提升算法。

8、另一方面,所述机器学习模型包括支持向量机算法。

9、另一方面,本文的机器学习模型包括深度神经网络算法。

10、另一方面,所述机器学习模型进一步通过候选小分子的计算的分子描述符的一个或多个指标来训练。

11、另一方面,计算的分子描述符的指标包含质量、偶极矩、原子组成、摩根指纹(morgan fingerprint)、谷本相似度(tanimoto similarity)的一个或多个计算的参数。

12、另一方面,所述机器学习模型进一步从质谱或离子迁移率的一个或多个指标训练。

13、另一方面,所述质谱或离子迁移率的指标是质荷比(m/z)或碰撞截面(collisioncross-section,ccs)。

14、另一方面,使用液相色谱溶剂系统或柱子固定相材料的指标进一步训练所述机器学习模型。



技术特征:

1.一种用于预测药物的候选小分子的物理化学特性的机器学习系统,其特征在于,包括:

2.根据权利要求1所述的机器学习系统,其特征在于,所述小分子物理化学特性的数据库是小分子保留时间(smrt)数据集,所述小分子保留时间数据集包含国际化合物标识(inchi)代码,并且提取的数据被转换为简化分子线性输入规范(smiles)符号以提取物理化学特性作为对chembl数据库的查询。

3.根据权利要求1所述的机器学习系统,其特征在于,所述物理化学特性为亲油性。

4.根据权利要求3所述的机器学习系统,其特征在于,所述目标亲油性在大约1与大约3之间。

5.根据权利要求1所述的机器学习系统,其特征在于,所述小分子物理化学特性的数据库包含酸解离常数(pka)和极性表面积。

6.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型包括随机森林回归算法。

7.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型包括梯度提升算法。

8.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型包括支持向量机算法。

9.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型包括深度神经网络算法。

10.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型进一步通过所述候选小分子的计算的分子描述符的一个或多个指标来训练。

11.根据权利要求10所述的机器学习系统,其特征在于,所述计算的分子描述符的指标包含质量、偶极矩、原子组成、摩根指纹、谷本相似度的一个或多个计算的参数。

12.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型在没有实验测量的所述液相色谱柱中的保留时间描述符的情况下进行训练以预测亲油性。

13.根据权利要求1所述的机器学习系统,其特征在于,所述机器学习模型在有实验测量的所述液相色谱柱中的保留时间描述符的情况下进行训练以预测亲油性。


技术总结
一种机器学习系统用于预测药物的候选小分子的物理化学特性(例如,亲油性)。构建了机器学习模型,所述机器学习模型从包含已知亲油性和液相色谱柱中的已知保留时间的小分子物理化学特性的数据库进行训练,以创建亲油性与液相色谱保留时间之间的学习关联。将具有未知亲油性和未知保留时间的候选小分子施加到液相色谱柱。测量所述候选小分子在所述液相色谱柱中的保留时间。将测得的所述液相色谱柱中的保留时间应用于所述机器学习模型以获得所述候选小分子的亲油性。从所述机器学习模型中选择一个或多个具有大约1到大约3的亲油性值的候选小分子。对识别的候选小分子进行药物活性测试。

技术研发人员:梅奥·温·扎乌,威廉·斯科特·霍普金,张铭恩
受保护的技术使用者:眼视觉研究中心有限公司
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1