基于机器学习的配方生成方法和装置与流程

文档序号：37674879发布日期：2024-04-18 20:47阅读：10来源：国知局

本发明涉及人工智能，具体涉及一种基于机器学习的配方生成方法和装置。

背景技术：

1、以涂料配方研究为例，配方设计是一个复杂的过程，需要综合考虑各种因素，不同的原料、工艺和条件等因素都会对最终产品的质量和属性产生影响。已有技术中，可以使用统计方法对配方进行设计和优化，利用先验模型预测的信息来指导实验，通过不断迭代和探索观察结果来寻找最佳的组分组合，从而更加高效地研究合理的组分搭配策略。

2、但是，配方的实验因素种类与因素水平取值的数量的大小会影响实验配方的样本空间，存在样本配方成分组合爆炸的情况；同时，配方大多需要进行多目标变量的优化，导致真实样本量有限，无法实现较为合理的配方预测。

3、因此，提供一种基于机器学习的配方生成方法和装置，以期在实验样本量不足、样本空间巨大的情况下，提高配方预测的合理性和高效性，是本领域技术人员亟待解决的问题。

技术实现思路

1、为此，本发明实施例提供一种基于机器学习的配方生成方法和装置，以期在实验样本量不足、样本空间巨大的情况下，提高配方预测的合理性和高效性。

2、为了实现上述目的，本发明实施例提供如下技术方案：

3、一种基于机器学习的配方生成方法，所述方法包括：

4、构建原始数据集，所述原始数据集包括待预测配方的目标产品的多个历史配方，以及所述目标产品的目标性能；

5、针对每个所述历史配方，分别计算所述历史配方中每个组分对各所述目标性能的特征影响系数；

6、针对每个所述目标性能，提取特征影响系数大于阈值的组分作为高影响组分，提取所述特征影响系数小于阈值的组分作为低影响组分；

7、计算各高影响组分的百分含量的总和，并根据百分含量的分配策略，确定每个高影响组分的百分含量的备选集；

8、基于各高影响组分的类别、高影响组分的百分含量和各低影响组分的类别，生成至少包括所有高影响组分及对应百分含量的配方预测结果。

9、在一些实施例中，所述目标产品为涂料，所述目标性能至少包括抗冲击性能、耐磨性能和电性能。

10、在一些实施例中，利用以下表达式，计算所述历史配方中每个组分对各所述目标性能的特征影响系数：

11、；

12、其中，表示基准系数，表示第个样本，表示第个样本的第个目标性能对应的特征。

13、在一些实施例中，构建原始数据集，之后还包括：

14、对各组分进行归一化处理，以得到每个组分在对应历史配方中的百分含量。

15、在一些实施例中，针对每个所述目标性能，提取特征影响系数大于阈值的组分作为高影响组分，提取所述特征影响系数小于阈值的组分作为低影响组分，具体包括：

16、构建包含所述目标产品的所有目标性能的shap图；

17、结合所述shap图和所述表达式，提取所述高影响组分和所述低影响组分。

18、在一些实施例中，计算各高影响组分的百分含量的总和，具体包括：

19、计算各所述低影响组分的百分含量的总和s1；

20、以单位1与s1的差值作为各高影响组分的百分含量的总和。

21、在一些实施例中，基于各高影响组分的类别、高影响组分的百分含量和各低影响组分的类别，生成至少包括所有高影响组分及对应百分含量的配方预测结果，具体包括：

22、设定各高影响组分的百分含量的水平取值序列，计算各低影响组分的百分含量的均值；

23、根据笛卡尔积排列原则，生成包含所有高影响组分的配方预测结果。

24、本发明还提供了一种基于机器学习的配方生成装置，所述装置包括：

25、数据集构建单元，用于构建原始数据集，所述原始数据集包括待预测配方的目标产品的多个历史配方，以及所述目标产品的目标性能；

26、特征影响系数计算单元，用于针对每个所述历史配方，分别计算所述历史配方中每个组分对各所述目标性能的特征影响系数；

27、影响组分提取单元，用于针对每个所述目标性能，提取特征影响系数大于阈值的组分作为高影响组分，提取所述特征影响系数小于阈值的组分作为低影响组分；

28、高影响组分计算单元，用于计算各高影响组分的百分含量的总和，并根据百分含量的分配策略，确定每个高影响组分的百分含量的备选集；

29、结果生成单元，用于基于各高影响组分的类别、高影响组分的百分含量和各低影响组分的类别，生成至少包括所有高影响组分及对应百分含量的配方预测结果。

30、本发明还提供了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述方法的步骤。

31、本发明还提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述方法的步骤。

32、本发明所提供的基于机器学习的配方生成方法和装置，通过构建原始数据集，所述原始数据集包括待预测配方的目标产品的多个历史配方，以及所述目标产品的目标性能；针对每个所述历史配方，分别计算所述历史配方中每个组分对各所述目标性能的特征影响系数；针对每个所述目标性能，提取特征影响系数大于阈值的组分作为高影响组分，提取所述特征影响系数小于阈值的组分作为低影响组分；计算各高影响组分的百分含量的总和，并根据百分含量的分配策略，确定每个高影响组分的百分含量的备选集；基于各高影响组分的类别、高影响组分的百分含量和各低影响组分的类别，生成至少包括所有高影响组分及对应百分含量的配方预测结果。

33、相较于传统的正向设计的方法，需要大量的样本点建立正向模型，然后通过构建虚拟的样本点，利用正向模型预测虚拟样本点设计配方的方式，基于特征启发分析的方法能够通过计算特征变量shap值的方式筛选出相对重要的实验因素，让配方设计焦点集中在这些影响配方效果的重要因素上，这样在很大程度上减少了需要优化搜索的空间；从而使得该方法能够在实验样本量不足、样本空间巨大的情况下，为实验工作人员设计出高效且合理的多目标变量的配方，从而提高了配方预测的合理性和高效性。

技术特征：

1.一种基于机器学习的配方生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于机器学习的配方生成方法，其特征在于，所述目标产品为涂料，所述目标性能至少包括抗冲击性能、耐磨性能和电性能。

3.根据权利要求1所述的基于机器学习的配方生成方法，其特征在于，利用以下表达式，计算所述历史配方中每个组分对各所述目标性能的特征影响系数：

4.根据权利要求1所述的基于机器学习的配方生成方法，其特征在于，构建原始数据集，之后还包括：

5.根据权利要求3所述的基于机器学习的配方生成方法，其特征在于，针对每个所述目标性能，提取特征影响系数大于阈值的组分作为高影响组分，提取所述特征影响系数小于阈值的组分作为低影响组分，具体包括：

6.根据权利要求5所述的基于机器学习的配方生成方法，其特征在于，计算各高影响组分的百分含量的总和，具体包括：

7.根据权利要求5所述的基于机器学习的配方生成方法，其特征在于，基于各高影响组分的类别、高影响组分的百分含量和各低影响组分的类别，生成至少包括所有高影响组分及对应百分含量的配方预测结果，具体包括：

8.一种基于机器学习的配方生成装置，用于实施如权利要求1-7任一项所述的方法，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-7任一项所述方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-7任一项所述方法的步骤。

技术总结
本发明公开了一种基于机器学习的配方生成方法和装置，所述方法包括：构建原始数据集，所述原始数据集包括待预测配方的目标产品的多个历史配方，以及所述目标产品的目标性能；针对每个所述历史配方，分别计算所述历史配方中每个组分对各所述目标性能的特征影响系数；针对每个所述目标性能，提取特征影响系数大于阈值的组分作为高影响组分，提取所述特征影响系数小于阈值的组分作为低影响组分；基于各高影响组分的类别、高影响组分的百分含量和各低影响组分的类别，生成至少包括所有高影响组分及对应百分含量的配方预测结果。能够在实验样本量不足、样本空间巨大的情况下，高效生成合理的配方。

技术研发人员：李龙
受保护的技术使用者：苏州创腾软件有限公司
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李龙
技术所有人：苏州创腾软件有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。