一种基于深度学习的不对称催化反应对映选择性预测方法

文档序号：26538519发布日期：2021-09-07 20:45阅读：来源：国知局

技术特征：
1.一种基于深度学习的不对称催化反应对映选择性预测方法，其特征在于：该方法通过计算待预测反应涉及化合物的分子描述符，并将其与待预测反应的其余反应条件汇总为一组特征向量输入训练好的不对称催化反应对映选择性预测模型，获得预测的对映选择性。其中不对称催化反应对映选择性预测模型通过如下步骤构建和训练：(1)获取并整理异氰基乙酸酯参与的不对称催化反应数据，构建自主数据库。反应数据包括反应涉及的化合物结构、其余反应条件及主要非对映异构体产物的对映体过量值(ee值)，并将每个反应的ee值换算成过渡态自由能(δδg
≠
)，其中，反应涉及的化合物结构具体为反应物的结构、催化剂的结构和溶剂的结构等，其余反应条件包括催化剂的当量、反应温度、反应浓度等；(2)计算反应数据中反应涉及化合物的分子描述符及不同分子描述符的方差，将方差大于零的分子描述符与其余反应条件汇总成一组特征向量；(3)构建神经网络回归预测模型，其中模型的输入为相关分子描述符及其余反应条件组成的特征向量，输出为反应的δδg
≠
，从而预测不对称催化反应的对映选择性。基于自主数据库中的数据，采用真实值和预测值之间的平均相对误差作为损失函数对模型进行反向传播训练，直至损失函数收敛，获得训练完成的不对称催化反应对映选择性预测模型。2.根据权利要求1所述的一种基于深度学习的不对称催化反应对映选择性预测方法，其特征在于：基于不同催化体系，分别设计模型训练集进行训练；催化体系包括协同催化体系和有机催化体系。3.根据权利要求1或2所述的一种基于深度学习的不对称催化反应对映选择性预测方法，其特征在于：所述步骤1中，异氰基乙酸酯参与的不对称催化反应数据具体包括：异氰基乙酸酯结构、反应底物结构、有机催化剂或金属/手性配体的结构及其当量、溶剂结构、反应温度、反应浓度、ee值等。对于协同催化反应，反应催化剂为金属催化剂和手性配体/有机催化剂；对于有机催化反应，反应催化剂为有机催化剂。4.根据权利要求3所述的一种基于深度学习的不对称催化反应对映选择性预测方法，其特征在于：所述步骤1中，还包括根据每个反应变量的分类和分布情况，选择分布相对均匀、数据相对丰富的类别作为模型训练集，具体为：选择数量较多的三类底物，分别为烯烃类、亚胺类和酮类；对于协同催化反应，选择数量最多的银盐催化剂，且每种银盐催化剂在训练集中的数据量不少于5条；选择数量最多的金鸡纳碱类手性配体/有机催化剂，且每种手性配体/有机催化剂在训练集中的数据量不少于5条；选择在训练集中数据量不少于5条的溶剂；将筛选后的反应数据作为模型训练集。5.根据权利要求3所述的一种基于深度学习的不对称催化反应对映选择性预测方法，其特征在于：所述步骤2具体为：利用chemdes网站计算训练集中异氰基乙酸酯、底物、催化剂和溶剂的分子描述符。分别计算各反应组分下不同分子描述符的方差，选择其中方差大于零的分子描述符组成对应组分的分子描述符特征集。6.根据权利要求1所述的一种基于深度学习的不对称催化反应对映选择性预测方法，其特征在于：所述神经网络回归预测模型使用的网络为卷积神经网络。

技术总结
本发明公开了一种基于深度学习的不对称催化反应对映选择性预测方法。该方法首先获取并整理异氰基乙酸酯参与的不对称催化反应数据，并设计模型训练集与样本外测试集；计算并处理反应涉及化合物的分子描述符，将其与反应条件汇总为一组特征向量输入模型；基于训练集分别构建深度神经网络和卷积神经网络回归模型并优化其超参数，进而获得能准确预测训练集反应对映选择性的模型；利用最佳神经网络模型预测样本外反应的对映选择性，检验模型的可迁移性。结果表明，该模型能够较准确地预测样本外反应的对映选择性，进一步验证了模型的稳健性与可迁移性。性与可迁移性。性与可迁移性。

技术研发人员：廖佳宇严泽伊苗晓晔刘悦吴洋洋钱玲慧邵瑾宁
受保护的技术使用者：浙江大学
技术研发日：2021.06.08
技术公布日：2021/9/6

完整全部详细技术资料下载

当前第2页1 2