一种基于反事实解释的流程工业工艺参数推荐方法

文档序号:39421093发布日期:2024-09-20 22:09阅读:52来源:国知局
一种基于反事实解释的流程工业工艺参数推荐方法

本发明涉及工艺参数推荐,具体为一种基于反事实解释的流程工业工艺参数推荐方法。


背景技术:

1、当下流程工业控制系统日渐复杂化、综合化、动态化、智能化,流程工业制造过程中存在生产状态波动大、工艺复杂、过程质量控制约束多、机理融合困难等问题,如流程工业中橡胶轮胎生产需要经过炼胶、压延压出、裁断成型、硫化及检验等工序,以其中混炼工艺为例,混炼工艺需要根据不同胶料要求以及配方特点来确定不同的混炼工艺,过程中对温度、时间、功率的参数的有效精确控制都会影响混炼胶的质量。面向复杂的市场需求,在正式生产前都会经历一个工艺设定与优化的过程。因而,面对流程工业中普遍存在的多品种、多规格、多工序等特征,如何对产品质量进行管控,优化工艺参数是一个具有挑战的问题。

2、近年来,产品质量预测相关研究得到广泛开展,旨在从生产数据中发现工艺参数和质量参数之间的相关性,通过易于测量的工艺参数建立预测模型,预测难以测量的质量参数和生产过程中可能出现的问题,以便提前采取措施进行干预和调整。li等人于2020年使用卷积神经网络实现对热轧带钢抗拉强度的预测,通过将一维数据转换为二维数据来表征影响因素之间的复杂交互。lee等人于2020年将卷积神经网络和递归神经网络相结合来处理空间和时间序列信息,结合生产过程中瞬态和稳态特征,实现对炼钢连铸过程温度分布的预测。feng等人于2021年提出一种基于双注意力的编码器-解码器方法,通过在lstm中嵌入双注意力机制捕获不同时间点工艺参数对质量参数的影响,实现细粒度的质量预测。

3、目前基于机器学习的质量预测模型能达到较高性能,但机器学习模型依赖于对数据的计算表示,最终预测由表示特征决定。随着模型复杂度不断上升,导致专家无法理解模型做出预测的行为(尤其是与专家判断不一致时),难以直接采用模型进行生产决策。机器学习模型的可解释性受到关注,出现了一系列可解释人工智能方法,通过解释模型预测的行为,提高模型的透明度与可靠性,并获取隐含在数据中的语义信息。可解释人工智能作为知识驱动模型的替代,可以发现生产过程中的模式、异常等,做出专家可以理解的解释,促进模型与专家之间的交互,帮助专家了解模型做出判断的原因、影响因素以及潜在的局限性。janne等人于2022年通过梯度增强树建立钢板表面缺陷的预测模型,并使用shap方法寻找工艺参数与表面缺陷之间的潜在关联,以特征贡献大小的形式给出模型预测行为的局部解释。gim等人于2024年通过人工神经网络对工艺参数与注塑成型模内条件之间的关系以及模内条件和质量参数之间的关系进行建模,并使用特征归因方法shap解释不同特征对预测的影响,将具有高影响力的特征按比例加权优化工艺参数。klein等人于2023年在钙钛矿半导体薄膜加工领域中通过神经网络对不同模式(如图像、时序数据、表格数据等)的数据进行建模,并部署多种反事实解释模型提取数据中不同的模式呈现为人类可理解的概念。这些概念可以由材料科学家转化为可操作的结论,以降低质量的显著波动。barraza等人于2023年针对天然气胺处理领域中的故障诊断问题,提出一种结合特征选择的稀疏反事实生成网络,该网络包含两个分支,分别实现特征选择和反事实生成,生成的反事实样本用于评估每一个特征的必要性。

4、综上,可以看出可解释人工智能方法在流程质量管控等领域被广泛使用,帮助专家理解模型内部机制,并优化模型以及生产过程。如shap等基于特征归因的方法可以为生产中的质量缺陷或者故障诊断寻找关键工艺参数,并以特征重要性等形式给出不同特征对模型输出的贡献。但无法捕捉特征之间的交互作用,也无法揭示特征变化时对其他特征以及模型输出的影响。基于反事实的方法可以在特征空间合理的范围内试探不同工艺参数组合对质量的影响,为生产中质量波动的潜在原因提供新的见解。但很多研究人员没有全面的考虑到反事实解释存在的四个规范:有效性、邻近性、数据流形接近性和稀疏性。

5、有效性。有效的反事实样本是指与模型的实际预测相反的情况,即当模型做出了某种预测,但在实际情况下,如果某些输入特征发生了变化,模型应该做出与原来预测相反的预测。在这种情况下,分析反事实样本可以更深入地理解模型的决策过程和模型对输入特征的依赖程度。

6、邻近性。给定输入x,其反事实解释xcf是在最小干预下生成的,两个数据点在特征空间中邻近,并且输出向预设目标移动。

7、数据流形接近性。反事实样本产生的特征组合可能不存在于训练数据中,从而产生信任问题。反事实样本可能是不现实的,或者在真实数据中被判别为异常点。因此除了满足数据邻近外,引入数据流形约束,使反事实样本接近真实数据在低维流形空间的分布。

8、稀疏性。理想情况下,改变特征较少的反事实样本更易于理解和解释,因此稀疏性也是一个重要因素。


技术实现思路

1、鉴于上述存在的问题,提出了本发明。

2、因此,本发明解决的技术问题是:对流程工业中的产品质量进行预测,并对存在质量缺陷的生产批次进行工艺参数推荐。

3、为解决上述技术问题,本发明提供如下技术方案:一种基于反事实解释的流程工业工艺参数推荐方法,包括:

4、获取产品质量数据集,并对数据集进行预处理操作;将数据预处理后的数据集划分为训练集和测试集;基于cross&resnet构建产品质量预测模型,利用训练集对cross&resnet模型进行训练,得到最优的质量预测模型;基于wgan-gp和cross&resnet构建反事实生成模型,利用训练集对wgan-gp中的生成器和判别器进行训练,得到最优的生成器;通过生成器获取反事实样本,并从有效性、特征邻近性、特征稀疏性和特征数据流形接近性,对生成的反事实样本进行评估和筛选,得到反事实样本,辅助专家分析关键工艺参数的调整方向或者范围。

5、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述获取产品质量数据集包括通过dbscan聚类算法计算数据样本之间的欧式距离,并剔除离群的异常数据;

6、通过均值法补充数据集中缺失的数据;

7、针对质量预测模型,采用min-max归一化方法将数据映射到[0,1]之间,消除参数量纲对预测结果的影响;

8、针对wgan-gp,连续特征分别使用bgmm估计隐含的模式数量并标准化,离散特征分别使用独热编码。

9、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述划分为训练集和测试集;包括数据预处理操作后的产品质量数据集80%作为训练集、20%作为测试集。

10、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述构建产品质量预测模型包括选择生产过程中重要工艺参数作为cross&resnet模型中cross部分输入特征,通过交叉网络学习有限阶数下有效的特征交叉;

11、其余工艺参数作为cross&resnet模型中resnet部分输入特征,其中离散工艺参数使用embeddinglayer学习低维度的嵌入向量,学习输入数据更高层特征;

12、通过网格搜索法确定超参数;

13、通过粒子群算法确定神经网络各层隐藏层神经元个数;

14、基于cross&resnet构建质量预测模型,按照设置的超参数在训练集中训练模型,运用梯度下降法最小化均方误差损失函数,表示为:

15、

16、其中,ypred表示预测的质量参数,yreal表示实际的质量参数;完成训练后,得到最优的质量预测模型。

17、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述构建反事实生成模型包括通过具有残差连接的全连接网络构建生成器,将工艺参数x、质量参数的制造标准ystd和质量预测模型的预测结果ypred作为条件引入随机噪声z,并使用tanh和gumbel softmax作为激活函数;

18、生成器训练过程中,为使生成的数据满足反事实的特性引入有效性损失项lv和稀疏性损失项ls,表示为:

19、

20、其中,ycf表示质量预测模型对生成器生成数据xcf的预测结果,使用rmse度量ycf和ystd之间的差距,通过l1范数和l0范数计算稀疏性,其中c表示连续特征子集,d表示离散特征子集,|·|表示集合中元素的个数;

21、生成器的目标函数,表示为:

22、

23、其中,λv和λs分别表示有效性损失项和稀疏性损失项的权重k;

24、通过全连接网络构建判别器,引入梯度惩罚项来约束判别器的梯度,判别器的目标函数,表示为:

25、

26、其中,pdata和pg分别表示真实数据和生成器生成数据的分布,pf是对pdata和pg两个分布进行随机插值模拟后产生的随机分布,λg表示梯度惩罚项的权重;

27、设置超参数;

28、基于wgan-gp和cross&resnet构建反事实生成模型,按照设置的超参数在训练集中训练模型,在最小化生成器和判别器损失的同时,使两者损失值趋于稳定;在完成训练后,得到最优的反事实生成模型。

29、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述通过生成器获取反事实样本包括将实际生产过程中的工艺参数输入反事实生成模型,通过反复迭代生成反事实样本候选集;

30、计算每个样本的有效性、邻近性和数据流形接近性三个指标,并剔除无效的候选项;

31、通过双重排序选择方法对样本进行排序,双重排序选择的两个指标分别为有效性和等权重聚合的邻近性与数据流形接近性;

32、通过贪心算法进行事后稀疏增强操作,将邻近的连续特征贪婪的恢复到原先的值,直到预测的质量参数产生明显波动,得到最优的反事实解释,并通过反事实样本辅助专家分析导致质量缺陷的关键工艺参数,并给出推荐的调整方向或者调整范围。

33、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述计算有效性指标表示反事实样本在质量预测模型中的预测结果相对于真实数据的提升程度,模型鼓励反事实样本的预测结果接近预设的目标值,表示为:

34、

35、其中,||·||2表示两个特征之间的欧氏距离,质量参数越接近目标值指标越小;同时如果指标大于1,表明反事实样本的质量参数比真实数据更加偏离目标,则不被采纳;

36、计算特征邻近性指标,特征邻近性用于衡量反事实样本与真实数据xi之间的高氏距离表示为:

37、

38、其中,median(·)表示中值计算,madk表示特征k的中值绝对偏差,m(·表示使用中值绝对偏差的倒数加权的曼哈顿距离,g(·)分别计算不同特征维度的距离,并对不同维度特征的距离求和。

39、作为本发明所述的基于反事实解释的流程工业工艺参数推荐方法的一种优选方案,其中:所述计算特征数据流形接近性指标,数据流形表征了数据在高维空间中的分布特征,若本位于数据流形上,则与真实数据中的样本更加相似,表示为:

40、

41、其中,表示距离反事实样本最近的k个来自真实数据的样本。

42、一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述基于反事实解释的流程工业工艺参数推荐方法的步骤。

43、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述基于反事实解释的流程工业工艺参数推荐方法的步骤。

44、本发明的有益效果:本发明提供的基于反事实解释的流程工业工艺参数推荐方法通过反事实解释在工艺参数特征空间中寻找最优工艺参数组合,辅助专家分析关键工艺参数的调整方向或者范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1