属性模型的训练方法、装置、设备、存储介质及程序产品与流程

文档序号:36006265发布日期:2023-11-16 21:39阅读:38来源:国知局
属性模型的训练方法、装置、设备、存储介质及程序产品与流程

本技术涉及人工智能技术,尤其涉及一种分子属性模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品。


背景技术:

1、人工智能(artificial intelligence,ai)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

2、分子属性预测任务对于计算化学领域和制药领域有着极为重要的意义。相关技术中通常是基于模版匹配的方法确定出分子表示,但分子种类繁多,分子模板难以覆盖巨大的分子搜索空间,相关技术中也利用数据驱动获取分子表示,但受限于带标签的分子数据非常稀少,从而分子属性模型的训练效果较差,导致分子属性模型的属性预测准确度低。


技术实现思路

1、本技术实施例提供一种分子属性模型的训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提高分子属性模型的训练效果,从而提升分子属性模型的预测准确度。

2、本技术实施例的技术方案是这样实现的:

3、本技术实施例提供一种分子属性模型的训练方法,包括:

4、获取与多个化学反应一一对应的多个第一样本数据,其中,每个所述第一样本数据包括化学反应涉及的多个第一分子数据、以及所述化学反应的指标数据;

5、将所述多个第一样本数据的多个第一分子数据在第一编码网络中进行正向传播,得到每个所述第一分子数据的第一编码特征;

6、基于所述多个第一样本数据的多个第一分子数据的第一编码特征以及每个所述化学反应的指标数据,确定不确定性损失,其中,所述不确定性损失用于拟合所述化学反应成立的不确定性;

7、将所述不确定性损失在所述第一编码网络中进行反向传播处理,得到经过更新的第一编码网络;

8、基于经过更新的第一编码网络对分子属性模型进行训练处理,得到经过训练的分子属性模型,所述分子属性模型用于确定目标分子的属性。

9、本技术实施例提供一种分子属性模型的训练装置,包括:

10、获取模块,用于获取与多个化学反应一一对应的多个第一样本数据,其中,每个所述第一样本数据包括化学反应涉及的多个第一分子数据、以及所述化学反应的指标数据;

11、正向模块,用于将所述多个第一样本数据的多个第一分子数据在第一编码网络中进行正向传播,得到每个所述第一分子数据的第一编码特征;

12、损失模块,用于基于所述多个第一样本数据的多个第一分子数据的第一编码特征以及每个所述化学反应的指标数据,确定不确定性损失,其中,所述不确定性损失用于拟合所述化学反应成立的不确定性;

13、反向模块,用于将所述不确定性损失在所述第一编码网络中进行反向传播处理,得到经过更新的第一编码网络;

14、训练模块,用于基于经过更新的第一编码网络对分子属性模型进行训练处理,得到经过训练的分子属性模型,所述分子属性模型用于确定目标分子的属性。

15、在上述方案中,所述第一分子数据包括反应物分子数据以及生成物分子数据,所述正向模块,还用于:针对每个所述第一样本数据执行以下处理:通过所述第一编码网络对所述第一样本数据的化学反应涉及的至少一个反应物分子数据进行第一编码处理,得到每个所述反应物分子数据的第一编码特征;通过所述第一编码网络对所述第一样本数据的化学反应涉及的至少一个生成物分子数据进行第一编码处理,得到每个所述生成物分子数据的第一编码特征。

16、在上述方案中,所述第一编码处理是通过图神经网络实现的,所述图神经网络包括n个级联的网络层;所述正向模块,还用于:针对每个所述反应物分子数据执行以下处理:获取所述反应物分子数据的初始特征;通过n个级联的网络层中的第n网络层,对所述第n网络层的输入进行特征提取处理,得到第n特征提取结果,将所述第n特征提取结果传输到第n+1网络层以继续进行特征提取处理;其中,n的取值范围满足2≤n,n为取值从1开始递增的整数,且n的取值范围满足1≤n≤n-1;当n取值为1时,所述第n网络层的输入为所述反应物分子数据的初始特征,当n取值为n-1时,所述第n+1网络层输出的第n+1特征提取结果为所述反应物分子数据的第一编码特征。

17、在上述方案中,所述正向模块,还用于:获取对应所述分子图的邻接矩阵以及对应所述分子图的度矩阵;对所述度矩阵进行逆变换处理,并对求逆结果进行矩阵开方处理,得到所述度矩阵的变换矩阵;对所述变换矩阵与所述邻接矩阵进行相乘处理,并对第一相乘结果与所述变换矩阵进行相乘处理,得到归一化邻接矩阵;基于所述第n网络层的图滤波器尺寸以及所述归一化邻接矩阵,确定所述第n网络层的图转移矩阵;将所述图转移矩阵与第n-1特征提取结果进行相乘处理,得到所述第n特征提取结果。

18、在上述方案中,所述第一分子数据包括反应物分子数据以及生成物分子数据,所述损失模块,还用于:针对每个所述第一样本数据执行以下处理:基于所述第一样本数据中每个所述反应物分子数据的第一编码特征,获取所述第一样本数据的第一反应物编码特征;基于所述第一样本数据中每个所述生成物分子数据的第一编码特征,获取所述第一样本数据的第一生成物编码特征;获取所述多个第一样本数据中除所述第一样本数据之外的其他第一样本数据,并获取每个所述其他第一样本数据的第一生成物编码特征;基于所述第一样本数据的第一反应物编码特征、所述第一样本数据的第一生成物编码特征、每个所述其他第一样本数据的第一生成物编码特征、以及所述第一样本数据对应的化学反应的指标数据,确定对应所述第一样本数据的子损失;将多个所述第一样本数据分别对应的子损失融合为所述不确定性损失。

19、在上述方案中,所述损失模块,还用于:当所述反应物分子数据为多个时,对多个所述反应物分子数据的第一编码特征进行融合处理,得到所述第一样本数据的第一反应物编码特征;当所述反应物分子数据为一个时,将所述反应物分子数据的第一编码特征作为所述第一样本数据的第一反应物编码特征;当所述生成物分子数据为多个时,对多个所述生成物分子数据的第一编码特征进行融合处理,得到所述第一样本数据的第一生成物编码特征;当所述生成物分子数据为一个时,将所述生成物分子数据的第一编码特征作为所述第一样本数据的第一生成物编码特征。

20、在上述方案中,所述损失模块,还用于:针对每个所述其他第一样本数据执行以下处理:获取所述其他第一样本数据所涉及到的至少一个其他生成物分子数据,并获取每个所述其他生成物分子数据的第一编码特征;基于每个所述其他生成物分子数据的第一编码特征,确定所述其他第一样本数据的第一生成物编码特征。

21、在上述方案中,所述损失模块,还用于:确定所述第一样本数据的第一反应物编码特征与所述第一样本数据的第一生成物编码特征之间的第一特征距离;确定所述第一样本数据的第一反应物编码特征与每个所述其他第一样本数据的第一生成物编码特征之间的第二特征距离;确定与所述第一样本数据对应的化学反应的指标数据正相关的不确定性指标;针对每个所述其他第一样本数据执行以下处理:基于所述第一特征距离、对应所述其他第一样本数据的第二特征距离、以及所述不确定性指标,确定对应所述其他第一样本数据的损失值;基于对应每个所述其他第一样本数据的损失值,确定对应所述第一样本数据的子损失。

22、在上述方案中,所述损失模块,还用于:对所述第一特征距离和对应所述其他第一样本数据的第二特征距离进行相减处理,得到对应所述其他第一样本数据的第一相减结果;对所述不确定性指标和对应所述其他第一样本数据的第一相减结果进行相加处理,得到第一相加结果;当所述第一相加结果大于零时,将所述第一相加结果作为对应所述其他第一样本数据的损失值;当所述第一相加结果不大于零时,将零作为对应所述其他第一样本数据的损失值。

23、在上述方案中,所述损失模块,还用于:当所述其他第一样本数据的数目为一时,将对应所述其他第一样本数据的损失值,确定为对应所述第一样本数据的子损失;当所述其他第一样本数据的数目为多个时,将对应多个所述其他第一样本数据的损失值进行求平均处理,得到对应所述第一样本数据的子损失。

24、在上述方案中,所述分子属性模型包括第二编码网络以及全连接网络;所述训练模块,还用于:获取至少一个第二样本数据,其中,所述第二样本数据为第二分子数据;将所述至少一个第二分子数据在经过更新的第一编码网络中进行正向传播,得到每个所述第二分子数据的第一编码特征;通过所述第二编码网络对所述至少一个第二分子数据进行第二编码处理,得到每个所述第二分子数据的第二编码特征;通过所述全连接网络将每个所述第二分子数据的第二编码特征分别映射为每个所述第二分子数据具有标签属性的概率;基于每个所述第二分子数据具有标签属性的概率、每个所述第二分子数据的第二编码特征以及每个所述第二分子数据的第一编码特征,确定所述分子属性模型的综合损失;将所述综合损失在所述分子属性模型中进行反向传播处理,得到所述综合损失取得最小值时所述分子属性模型的参数变化值,并基于所述参数变化值更新所述分子属性模型。

25、在上述方案中,所述训练模块,还用于:对每个所述第二分子数据的第二编码特征、以及每个所述第二分子数据的第一编码特征进行维度统一处理,得到每个所述第二分子数据的第一标准化编码特征、以及每个所述第二分子数据的第二标准化编码特征;针对每个所述第二分子数据执行以下处理:获取所述第二分子数据的第二标准化编码特征与所述第二分子数据的第一标准化编码特征之间的第三特征距离,以及所述第二分子数据的第二标准化编码特征与每个其他第二分子数据的第一标准化编码特征之间的第四特征距离;基于所述第三特征距离以及对应每个所述其他第二分子数据的第四特征距离,确定对应所述第二分子数据的知识蒸馏损失,并基于所述第二分子数据具有所述标签属性的概率、以及所述标签属性对应的标签值,确定对应所述第二分子数据的交叉熵损失;将对应所述第二分子数据的知识蒸馏损失以及对应所述第二分子数据的交叉熵损失融合为对应所述第二分子数据的综合损失,并将对应多个所述第二分子数据的综合损失融合为所述分子属性模型的综合损失。

26、本技术实施例提供一种电子设备,包括:

27、存储器,用于存储可执行指令;

28、处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的分子属性模型的训练方法。

29、本技术实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本技术实施例提供的分子属性模型的训练方法。

30、本技术实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现本技术实施例提供的分子属性模型的训练方法。

31、本技术实施例具有以下有益效果:

32、本技术实施例首先对第一编码网络进行预训练,再基于预训练得到的第一编码网络对分子属性模型进行训练,在预训练过程中基于化学反应关系以及化学反应的指标数据监督预训练过程,利用化学反应的指标数据建模化学反应成立的不确定性,从而可以有效提升第一编码网络的分子表示能力,因此基于第一编码网络对分子属性模型进行训练,可以有效提高分子属性模型的训练效果,从而提升分子属性模型的预测准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1