一种过冷度预测模型的生成方法及装置

文档序号:28214734发布日期:2021-12-28 21:47阅读:123来源:国知局
一种过冷度预测模型的生成方法及装置

1.本发明涉及合金材料技术领域,尤其涉及一种过冷度预测模型的生成方法及装置。


背景技术:

2.从产量和应用规模来看,铁和铝是世界上使用最多的金属之一。铁和铝在各种行业中都有应用,如机械工程和航运。铸造因其成本较低、加工适应性广等优点,是铁、铝材料制备的主要方法之一。铸造过程中始终伴随着形核过程,形核过程在金属凝固过程中起着重要作用,而过冷度对铸态材料的形核有很大的影响,同时也控制着铸态材料的相组成、组织、性能和质量。于是在铸态材料的形核研究中,过冷度是必不可少的重要参数。
3.目前,大多数研究人员对过冷度仅有规律性的认识,无法对过冷度进行预测,阻碍了铸态材料的形核研究,所以需要通过机器学习模型实现对过冷度的预测,具体为:根据过冷度相关因素作为特征值来建立过冷度预测模型后,通过过冷度预测模型实现对过冷度的预测。
4.但是,现有的建立过冷度预测模型的方法中往往直接使用金属自身性质作为训练特征值来训练机器学习模型,而金属自身性质里面包含了很多金属元素含量,会导致机器学习模型的训练特征值的维度太高,使机器学习模型无法达到很好的泛化能力并出现过拟合现象,导致最终生成的过冷度预测模型的精度不高。


技术实现要素:

5.本发明实施例提供一种冷度预测模型的生成方法及装置,提高了过冷度预测模型的精度。
6.本技术实施例的第一方面提供了一种冷度预测模型的生成方法,包括:
7.获取过冷度的特征值;
8.将过冷度的特征值按照预设条件分成多个训练特征值组合后,将多个训练特征值组合作为第一机器学习模型的训练集,以使第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数;其中,评价参数用于评价第一机器学习模型的训练效果;
9.根据多个评价参数,结合过冷度的特征值,获得最佳训练特征值;
10.将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值进行训练后生成过冷度预测模型。
11.在第一方面的一种可能的实现方式中,将过冷度的特征值按照预设条件分成多个训练特征值组合,具体为:
12.将过冷度的特征值按照种类随机分成多个训练特征值组合;其中,每个训练特征值组合包括n个不同种类的过冷度的特征值,n为大于2的正整数。
13.在第一方面的一种可能的实现方式中,第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数,具体为:
14.评价参数包括:决定系数和平均绝对误差;
15.分别将多个训练特征值组合输入至第一机器学习模型中,以使第一机器学习模型分别根据每个训练特征值组合进行训练,且在基于每个训练特征值组合的训练的次数等于第一预设数值时,计算决定系数和平均绝对误差。
16.在第一方面的一种可能的实现方式中,获取过冷度的特征值,具体为:
17.获取初始数据集,对初始数据集进行预处理,得到第一数据集;
18.计算第一数据集中数据之间的相关性后,根据相关性获取过冷度的特征值。
19.在第一方面的一种可能的实现方式中,计算第一数据集中数据之间的相关性后,根据相关性获取过冷度的特征值,具体为:
20.计算皮尔逊相关系数后使用皮尔逊相关系数表示第一数据集中每两个数据之间的相关性;
21.当皮尔逊相关系数的绝对值大于第二预设数值时,表示两个数据之间的相关性不合格,将相关性不合格的每两个数据之间的其中一个删除,得到剩余数据;当皮尔逊相关系数的绝对值小于等于第二预设数值时,表示两个数据之间的相关性合格,得到合格数据;
22.将剩余数据和合格数据集合便形成过冷度的特征值。
23.在第一方面的一种可能的实现方式中,过冷度的特征值包括:冷却速率、平均共价原子半径、晶格数、错配度、平均门捷列夫数和形核面。
24.本技术实施例的第二方面提供了一种过冷度预测模型的生成装置,包括:第一获取模块、训练模块、第二获取模块和生成模块;
25.其中,第一获取模块用于获取过冷度的特征值;
26.训练模块用于将过冷度的特征值按照预设条件分成多个训练特征值组合后,将多个训练特征值组合作为第一机器学习模型的训练集,以使第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数;其中,评价参数用于评价第一机器学习模型的训练效果;
27.第二获取模块用于根据多个评价参数,结合过冷度的特征值,获得最佳训练特征值;
28.生成模块用于将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值进行训练后生成过冷度预测模型。
29.在第二方面的一种可能的实现方式中,将过冷度的特征值按照预设条件分成多个训练特征值组合,具体为:
30.将过冷度的特征值按照种类随机分成多个训练特征值组合;其中,每个训练特征值组合包括n个不同种类的过冷度的特征值,n为大于2的正整数。
31.在第二方面的一种可能的实现方式中,第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数,具体为:
32.评价参数包括:决定系数和平均绝对误差;
33.分别将多个训练特征值组合输入至第一机器学习模型中,以使第一机器学习模型分别根据每个训练特征值组合进行训练,且在基于每个训练特征值组合的训练的次数等于第一预设数值时,计算决定系数和平均绝对误差。
34.在第二方面的一种可能的实现方式中,获取过冷度的特征值,具体为:
35.获取初始数据集,对初始数据集进行预处理,得到第一数据集;
36.计算第一数据集中数据之间的相关性后,根据相关性获取过冷度的特征值。
37.相比于现有技术,本发明实施例提供的一种过冷度预测模型的生成方法及装置,所述方法包括:获取过冷度的特征值;将过冷度的特征值按照预设条件分成多个训练特征值组合后,将多个训练特征值组合作为第一机器学习模型的训练集,以使第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数;其中,评价参数用于评价第一机器学习模型的训练效果。根据多个评价参数,结合过冷度的特征值,获得最佳训练特征值;将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值进行训练后生成过冷度预测模型。
38.其有益效果在于:本发明实施例通过将过冷度的特征值在分成多个组合后作为第一机器学习模型的训练集,以使第一机器学习模型根据组合进行训练并得到多个评价参数;再基于评价参数从过冷度特征值中选取最佳训练特征值后,将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值训练并生成过冷度预测模型。本发明基于评价参数从过冷度特征值中选取最佳训练特征值后作为建模的训练集,且由于评价参数用于评价所述第一机器学习模型的训练效果,所以能够从过冷度特征值中选取出对过冷度预测效果最好的特征值作为最佳训练特征值,从而使基于最佳训练特征值生成的过冷度预测模型的精度进一步提高,最终能够提高基于过冷度预测模型的过冷度预测结果的准确性。
附图说明
39.图1是本发明一实施例提供的一种过冷度预测模型的生成方法的流程示意图;
40.图2是本发明一实施例提供的过冷度的特征值之间相关性示意图;
41.图3是本发明一实施例提供的过冷度的特征值的基尼系数图;
42.图4是本发明一实施例提供的不同训练特征值组合评价参数示意图;
43.图5是本发明一实施例提供的一种过冷度预测模型的生成装置的结构示意图。
具体实施方式
44.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.参照图1,是本发明一实施例提供的一种过冷度预测模型的生成方法的流程示意图,包括s101

s104:
46.s101:获取过冷度的特征值。
47.在本实施例中,所述获取过冷度的特征值,具体为:
48.获取初始数据集,对所述初始数据集进行预处理,得到第一数据集;
49.计算所述第一数据集中数据之间的相关性后,根据所述相关性获取所述过冷度的特征值。
50.具体地,所述初始数据集根据过冷度相关文献获取。查阅文献中关于过冷度的材
料知识,选出了金属自身性质、基底相、形核相等特征作为初始数据集,其中,将过冷度的值作为目标变量,即预测值。
51.在一具体实施例中,所述计算所述第一数据集中数据之间的相关性后,根据所述相关性获取所述过冷度的特征值,具体为:
52.计算皮尔逊相关系数后使用所述皮尔逊相关系数表示所述第一数据集中每两个数据之间的相关性;
53.当所述皮尔逊相关系数的绝对值大于第二预设数值时,表示两个数据之间的相关性不合格,将相关性不合格的每两个数据之间的其中一个删除,得到剩余数据;当所述皮尔逊相关系数的绝对值小于等于所述第二预设数值时,表示两个数据之间的相关性合格,得到合格数据;
54.将所述剩余数据和所述合格数据集合便形成所述过冷度的特征值。
55.具体地,使用所述皮尔逊相关系数表示所述第一数据集中每两个数据之间的相关性,当所述皮尔逊相关系数的绝对值等于零时,表示两个数据之间不相关;当所述皮尔逊相关系数的绝对值等于一时,表示两个数据之间线性相关拟合。由于在机器学习算法中应保证数据之间无很高的相关性,所以将所述第二预设数值设置为0.95,当所述皮尔逊相关系数的绝对值大于第二预设数值时,表示两个数据之间的相关性较高,即相关性不合格,应当将相关性不合格的每两个数据之间的其中一个删除,保留未被删除的数据并作为所述剩余数据,以降低数据之间的相关性;当所述皮尔逊相关系数的绝对值小于等于第二预设数值时,表示两个数据之间的相关性低,即相关性合格,应当将相关性合格的两个数据均保留,并作为合格数据。上述剩余数据和合格数据均满足相关性合格的条件,于是将上述剩余数据和合格数据集合便形成所述过冷度的特征值。
56.在一具体实施例中,所述过冷度的特征值包括:冷却速率(cr)、平均共价原子半径(mar)、晶格数(number of lattice,nl)、错配度(mm)、平均门捷列夫数(mean mendeleev number,mmn)和形核面(nucleation and substrate plane,nsp)。
57.具体地,所述过冷度的特征值根据过冷度相关文献获取。其中,平均共价原子半径mar的值为形核相与基底相的平均原子共价半径的均值,表示了形核相与基底相的本身性质;晶格数nl的值为基底相与形核相的晶格常数的乘积,对于密排六方结构的晶格数nl为a/c(a、c均为晶格常数)的值;平均门捷列夫数mmn为形核相与基底相的门捷列夫数的均值,表示其形核相与基底相的化学性能;形核面nsp为形核相与基底相所选的计算错配度两者的晶面表示,揭示了晶面取向不同对过冷度的影响作用。
58.根据形核相所选晶面和基底相所选晶面获取形核面nsp的值,例如:若形核相所选晶面为111,基底相所选晶面为100,则形核面nsp的值为111100;若形核相所选晶面为

100,基底相晶面为110,则nsp的值为

110011。
59.s102:将过冷度的特征值按照预设条件分成多个训练特征值组合后,将多个训练特征值组合作为第一机器学习模型的训练集,以使第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数。
60.其中,第一机器学习模型为随机森林(randomforest,rf)机器学习模型。
61.在本实施例中,所述将所述过冷度的特征值按照预设条件分成多个训练特征值组合,具体为:
62.将所述过冷度的特征值按照种类随机分成多个所述训练特征值组合;其中,每个所述训练特征值组合包括n个不同种类的过冷度的特征值,n为大于2的正整数。
63.在本实施例中,所述第一机器学习模型根据多个所述训练特征值组合进行训练后得到多个评价参数,具体为:
64.所述评价参数包括:决定系数和平均绝对误差;
65.分别将所述多个所述训练特征值组合输入至所述第一机器学习模型中,以使第一机器学习模型分别根据每个所述训练特征值组合进行训练,且在基于每个所述训练特征值组合的训练的次数等于第一预设数值时,计算所述决定系数和所述平均绝对误差。
66.具体地,由于过冷度的特征值有六种,所以将过冷度的特征值按照种类随机生成多个训练特征值组合,每个训练特征值组合包括2个至6个不同种类的过冷度的特征值。
67.具体地,第一预设数值为100。每将一个训练特征值组合输入到第一机器学习模型中进行训练,且训练次数达到100次时,获取100次训练中得到的100个初始决定系数,对初始决定系数进行求均值处理,计算得到基于每个训练特征值组合进行训练时得到的第一机器学习模型的决定系数。同理,通过上述方法便能够得到基于每个训练特征值组合进行训练时得到的第一机器学习模型的平均绝对误差。
68.s103:根据多个评价参数,结合过冷度的特征值,获得最佳训练特征值。
69.其中,所述评价参数用于评价所述第一机器学习模型的训练效果;具体为:评价参数包括:决定系数r2和平均绝对误差(mean absolute error,mae)。而r2用来作为泛化性能评估,查看机器学习模型的拟合程度,r2取值越接近1表明模型拟合程度越好;mae用于反映实际预测误差,mae越小,代表模型预测能力越强。
70.s104:将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值进行训练后生成过冷度预测模型。
71.为了进一步说明过冷度的特征值之间的相关性,请参照图2,图2是本发明一实施例提供的过冷度的特征值之间相关性示意图。
72.其中,r代表皮尔逊相关系数,横纵坐标均包括以下参数:冷却速率cr、平均共价原子半径mar、晶格数nl、错配度mm、平均门捷列夫数mmn、形核面nsp和过冷度ur。相关性越高,皮尔逊相关系数的绝对值越接近1,颜色越浅;相关性越低,皮尔逊相关系数的绝对值越接近0,颜色越深。
73.由图2可得,过冷度的特征值之间的相关性较低,即:冷却速率cr、平均共价原子半径mar、晶格数nl、错配度mm、平均门捷列夫数mmn和形核面nsp中,每两个过冷度的特征值之间的相关性都比较低、相交的方块颜色都比较深,所以过冷度的特征值之间的相关性都合格。
74.此外,还可以通过图2得到过冷度的特征值与过冷度ur之间的相关性,从而作为判定过冷度特征值对过冷度的影响程度的依据。由图2可得,除了两个相同的过冷度的特征值的相关性较高、相交的方块颜色最浅之外(比如mm与mm、cr与cr等),只有ur与cr之间的相交的方块颜色同样是最浅,表明了在所有过冷度的特征值之中,ur与cr之间的相关性较高,cr对ur的影响程度最大。
75.在一具体实施例中,为了得到六种过冷度的特征值对于建立过冷度预测模型的重要性并作为建模的参考数据,通过使用scikit

learn中的随机森林(randomforest,rf)机
器学习模型依据六种过冷度的特征值进行训练,通过算法下的features_importance函数对特征重要性之间进行分析后,生成图3,图3是本发明一实施例提供的过冷度的特征值的基尼系数图。其中,图3中的横坐标代表六种过冷度的特征值,即冷却速率cr、平均共价原子半径mar、晶格数nl、错配度mm、平均门捷列夫数mmn和形核面nsp;图3中的纵坐标代表六种过冷度的特征值分别对应的基尼系数;基尼系数越大说明特征重要性越大,而特征重要性越大意味着对模型建立影响越大。则由图3可得,六种过冷度的特征值按照特征重要性从高到低排序为:cr、mar、mm、mmn、nl、nsp。
76.由上述可得,冷却速率cr对于过冷度的预测而言,重要性最大。
77.为了进一步说明最佳训练特征值的选择过程,请参照图4,图4是本发明一实施例提供的不同训练特征值组合评价参数示意图。
78.其中,由于根据六种过冷度的按照种类特征值随机组生成不同组合的数量众多且不便于比较,于是从包括多个2种过冷度的特征值的训练特征值组合种选出效果最好的一个作为2种特征值组合;同理,分别从多个3/4/5/6种过冷度的特征值的训练特征值组合种选出效果最好的一个作为3/4/5/6种特征值组合。
79.则图4中的横坐标代表不同的最佳训练特征值组合,分别是:2种特征值组合、3种特征值组合、4种特征值组合、5种特征值组合和6种特征值组合。图4中的纵坐标代表着不同训练特征值组合对应的评价参数,即不同的最佳训练特征值组合对应的决定系数r2和平均绝对误差(mean absolute error,mae)。
80.r2取值越接近1表明模型拟合程度越好;mae越小,代表模型预测能力越强。由图4可得,第一机器学习模型根据“2种特征值组合”进行训练,训练效果最好,训练完毕后生成的模型预测能力最强。此外,由于不同的最佳训练特征值组合都包含了cr和mar,所以判定对cr和mar过冷度的影响程度最大,且应将cr和mar作为最佳训练特征值。
81.为了进一步说明过冷度预测模型的生成装置,请参照图5,图5是本发明一实施例提供的一种过冷度预测模型的生成装置的结构示意图,包括:第一获取模块501、训练模块502、第二获取模块503和生成模块504;
82.其中,所述第一获取模块501用于获取过冷度的特征值。
83.在本实施例中,所述获取过冷度的特征值,具体为:
84.获取初始数据集,对所述初始数据集进行预处理,得到第一数据集;
85.计算所述第一数据集中数据之间的相关性后,根据所述相关性获取所述过冷度的特征值。
86.所述训练模块502用于将所述过冷度的特征值按照预设条件分成多个训练特征值组合后,将多个所述训练特征值组合作为第一机器学习模型的训练集,以使所述第一机器学习模型根据多个所述训练特征值组合进行训练后得到多个评价参数。其中,所述评价参数用于评价所述第一机器学习模型的训练效果。
87.在本实施例中,所述将所述过冷度的特征值按照预设条件分成多个训练特征值组合,具体为:
88.将所述过冷度的特征值按照种类随机分成多个所述训练特征值组合;其中,每个所述训练特征值组合包括n个不同种类的过冷度的特征值,n为大于2的正整数。
89.在本实施例种,所述第一机器学习模型根据多个所述训练特征值组合进行训练后
得到多个评价参数,具体为:
90.所述评价参数包括:决定系数和平均绝对误差;
91.分别将所述多个所述训练特征值组合输入至所述第一机器学习模型中,以使第一机器学习模型分别根据每个所述训练特征值组合进行训练,且在基于每个所述训练特征值组合的训练的次数等于第一预设数值时,计算所述决定系数和所述平均绝对误差。
92.所述第二获取模块503用于根据多个所述评价参数,结合所述过冷度的特征值,获得最佳训练特征值。
93.所述生成模块504用于将所述最佳训练特征值作为第二机器学习模型的训练集,以使所述第二机器学习模型根据所述最佳训练特征值进行训练后生成过冷度预测模型。
94.本发明实施例先通过第一获取模块501获取过冷度的特征值;再通过训练模块502将过冷度的特征值按照预设条件分成多个训练特征值组合后,将多个训练特征值组合作为第一机器学习模型的训练集,以使第一机器学习模型根据多个训练特征值组合进行训练后得到多个评价参数;其中,评价参数用于评价第一机器学习模型的训练效果。接着通过第二获取模块503根据多个评价参数,结合过冷度的特征值,获得最佳训练特征值;最后通过生成模块504将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值进行训练后生成过冷度预测模型。
95.本发明实施例通过将过冷度的特征值在分成多个组合后作为第一机器学习模型的训练集,以使第一机器学习模型根据组合进行训练并得到多个评价参数;再基于评价参数从过冷度特征值中选取最佳训练特征值后,将最佳训练特征值作为第二机器学习模型的训练集,以使第二机器学习模型根据最佳训练特征值训练并生成过冷度预测模型。本发明基于评价参数从过冷度特征值中选取最佳训练特征值后作为建模的训练集,且由于评价参数用于评价所述第一机器学习模型的训练效果,所以能够从过冷度特征值中选取出对过冷度预测效果最好的特征值作为最佳训练特征值,从而使基于最佳训练特征值生成的过冷度预测模型的精度进一步提高,最终能够提高基于过冷度预测模型的过冷度预测结果的准确性。
96.以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1