本发明涉及一种基于异构因果图注意力网络的大规模定制质量预测方法,属于软测量领域。
背景技术:
1、随着生产力的发展,市场竞争越发激烈,为了满足消费者日益增长的个性化需要,越来越多的企业开始采用或考虑采用大规模定制生产模式(mc),大规模定制作为一种集应用技术、管理、标准等为一体的综合生产模式,使企业有能力以大批量生产的低成本向市场高质量、高效的提供多样化、定制化的产品。mc的关键思路是利用模块化等方法将相似的产品族零部件和结构标准化,以降低产品的内部多样性,然后在通用件的基础上利用定制化装配等策略来增加产品的外部多样性。
2、大规模定制(mc)因为兼顾消费者需求和企业效益的优势,被应用于汽车、服饰、家具、电子产品等多个生产领域。因此引起了广泛学者的关注。但由于大规模定制是一个包括生产、组装、管理和运输等的在综合性生产模式,大部分过往研究的目的更倾向于在保证产品多样性以及成本控制。
3、质量控制,作为制造业的重要问题之一,在大规模定制生产中的研究相对较少,而目前,基于预测的质量控制方法更加准确和可靠,而这种方法严重依赖于质量预测的准确性。因此本发明主要针对大规模定制生产中的质量预测问题
4、目前的质量预测的方法一般可以分为基于机理模型的方法,基于专家知识以及基于数据驱动的方法。其中,机理模型的性能依赖于是否能准确建立反应过程机理的数学模型,对于复杂和大规模化的现代工业而言,机理建模遇到了极大的阻碍。另外,迫于先验知识的难以积累,专家知识模型也缺乏通用性,多为辅助使用。数据驱动的质量预测方法因其使用难度低、使用范围广、预测精度高等优势被广泛应用于工业过程中。包括pca等多元统计方法,svm等机器学习方法以及lstm等深度学习方法都在质量预测中有所应用。深度学习方法由于其更好的预测效果,以及可以应对复杂工业系统中的高维数据的优势具有更好的潜力。但是现有深度学习方法在大规模定制生产的质量预测应用将会面临以下几个问题。
5、首先是配件间关系对于最终产品质量预测有重要影响,一般用图神经网络来利用系统内各变量之间的相关性,但是一般的图结构都是考虑变量间相关性,而由于大规模定制生产中配件间功能依赖或协作的关系,配件间存在因果关联需要挖掘。如果不对变量间因果关系进行发掘和利用,会影响最终的预测效果。
6、同时,多尺度问题也是大规模定制产品质量预测中面临的难题,在定制化产品生产中,每种产品中存在的模块配件种类各不相同,配件的数量也不完全一致,这导致了采集到的数据的变量维度不统一,而传统的预测模型由于映射等要求,必须保证变量维度一致。
7、综上所述,针对上述问题,需要开发适合大规模定制的质量预测模型。
技术实现思路
1、本发明针对现有技术存在的不足以及大规模定制的特点,基于异构因果图注意力网络设计了一种质量预测方法,相比于常用的预测方法,异构因果图注意力网络不仅可以通过因果图去利用变量间关联关系,同时其利用了多尺度信息来保证最终的预测效果。
2、本发明首先提出了一种pcam因果发现算法,利用机理和数据联合构建因果骨架,基于加性噪声模型并引入了评分机制获得可靠的因果图结构;然后基于因果图结构,针对多尺度问题,设计了异构因果图注意力网络hcgat,利用不同的权重参数矩阵,将不同维度的节点特征映射到相同维度上,再通过图注意力网络进行训练。最后,针对大规模定制生产定制化产品的特点,提出了一种适合于大规模定制生产的质量预测框架,通过定制化组装信息设计了定制化编码,并基于此构建了筛选器和判断器对数据进行分类和处理,再利用hcgat作为子模型对不同种类产品数据进行质量预测。
3、本发明的技术方案如下:
4、首先,本专利根据大规模定制生产模式的特点,对于大规模定制生产模式制造过程和采集的数据进行了定义,其制造过程大致可以分为模块化设计、定制化组装以及产品生产及测试三个步骤,在此过程中定义相应的采集的数据,包括配件的质量数据、定制化组装数据以及产品质量数据。
5、其中,针对大规模定制中的定制化生产和柔性共线生产特点,即不同种类和数量的配件组装成不同种类的产品,同时多种产品可能会在同一条生产线进行生产,这导致了最终采集到的数据中可能包含多种产品信息。因此依据大规模定制中产品的定制化组装信息设计一种定制化组装数据,表示组装产品使用到的配件种类和数量,编码为n维向量α=(a1,a2,…an),其中n代表了所有产品中使用到的配件类别的总数。若a=0代表了该产品组装时没有运用到该类配件,a=n代表了该产品组装时运用到n个该类配件。
6、本发明的质量预测可以分为离线训练和在线测试两个环节,在离线训练中,首先通过设计的定制化组装述构建筛选器用于判断数据中的产品类别。在每条数据中加入定制化编码的数据头,比较编码是否一致来判断数据是否属于同一种产品,将相同的产品的数据分类至一起,并记录下该产品的定制化编码,用于后续测试数据中构建判断器。
7、然后,在不同产品类型的数据中,分别进行因果发现,构建相应的因果图结构。因为不同配件的选配可能会影响配件间的因果关系,因此单独构建因果图可以保证更好的可解释性和准确性。
8、设计了一种pcam因果发现方法。该流程总共可以分为三部分内容,第一部分是因果骨架构建,第二部分是因果方向确定,第三部分是整体结构优化。通过这三个步骤确定最终的因果图用于后续的训练和预测。
9、首先通过先验知识和数据联合构建因果骨架,将准确的先验知识包括是否存在因果关系甚至因果方向信息等先行确定,然后利用数据对剩余的相关变量之间进行hsic独立性检验判断因果关系,构建骨架图。这样可以提高因果骨架准确性。当没有先验知识时,也可以仅通过数据构建骨架图。
10、
11、其中n是样本数量,tr是矩阵的迹,kx和ky是核函数计算,这里采用高斯核函数,j=i-1/n,,是n阶单位矩阵。
12、
13、然后,在确定的因果骨架上,对每一对存在因果关系的变量间,利用加性噪声模型anm方法判断因果方向。在生产过程中,由于工人的操作熟练度和组装环境等外部因素会对组装环节造成干扰,在这种情况下,系统间关系可以视作近似符合加性噪声模型,且外部噪声与配件本身质量参数是独立的,因此可以利用加性噪声模型构建正向和反向的函数,并利用其不对称性判断因果方向。
14、其判断原理是因为作为一个独立加性噪声,它不会对原因变量产生影响,而由于结果变量是原因变量和噪声变量共同作用得到的,因此结果变量和噪声变量之间不独立。因此我们构建正向函数f和反向函数g,用于拟合变量x和变量y之间的关系,并判断噪声nx和ny与输入变量之间的独立性关系。
15、
16、
17、如果函数满足公式1,不满足公式2,那么说明,变量x是变量y的原因变量。
18、本发明通过mlp对两个变量之间的关系作正向拟合,利用两层隐藏层和非线性的激活函数leakyrelu用于非线性拟合,mlp作为深度学习算法,通过控制loss和循环次数可以对于所有的非线性函数都可以获得较好的拟合效果。
19、leaky relu=max(0,z)+α·min(0,r),0<α<<1
20、如果ny与x是否独立,即表示该方向与数据生成机制一致,则认为正向假设正确,即变量x是变量y的原因,如果不是,则拒绝这个假设;同样,对反方向也进行假设和拟合,即x=g(y)+nx,利用相同方法判断独立性,如果两个方向都独立,则选取独立分数更高的那边。如果两个方向都不独立,则说明该方法失效。
21、但是,这种方法也存在缺陷,即anm一般用于一对一的因果发现,当存在多对一因果关系时,其判断效果会变差,因此,本发明引入评分机制,对于因果骨架构建不准确的问题以及多对一因果效果不准确的问题进行进一步的优化。
22、这里引入贝叶斯准则作评分函数,当存在独立性判断模糊和anm失效的情况,即anm构建正反向差异小和两边均独立无法判断因果方向时。通过增删新的边和改变因果方向,去判断最终的整体得分是否得到改进,因此确定最终的因果图结果。
23、bic=k·ln(n)-2ln(l)
24、基于得到的因果图,利用异构因果图注意力网络hcgat进行多尺度信息的提取,并用于质量预测。hcgat设置了不同节点的权重参数矩阵,将不同维度的节点特征映射到相同维度上,再通过图注意力网络进行质量预测。
25、首先通过不同的权重参数矩阵来进行特征的映射和嵌入。其具体公式如下:
26、hii=wi·hi
27、其中,hi是不同节点的特征,wi是针对该节点特征维度和所要映射的特征维度构建的权重参数矩阵,通过不同的w,将所有的节点特征h映射到相同维度上,此时就可以利用同构图模型对其进行处理和训练。
28、此时,就可以利用注意力机制进行节点更新,具体公式如下:
29、
30、其中σ是激活函数,αij是节点间的注意力系数表示,w是注意力机制中的权重矩阵,这里的w是同构图中的,针对于上述映射到相同维度后的节点特征。
31、选用adam算法作为优化算法。adam是一种可以替代传统随机梯度下降过程的一阶优化算法,它能基于训练数据迭代地更新神经网络权重。并选用所有标签节点上的均方误差作为损失函数。
32、
33、使用每一种产品数据训练对应的子模型
34、训练完成后,进入测试阶段,针对测试数据,利用判断器中的分类信息,根据定制化编码进行数据的分类,将测试数据划分成不同的产品种类,根据产品种类选择对应的训练好的子模型,进行质量预测。
35、最终输出公式可表示为:
36、yi=hcgat(xi,ai)
37、本发明的有益效果主要体现在:
38、本发明对大规模定制生产模式的相关特点和问题进行了分析;针对其数据混杂的特点,通过设计定制化编码构建筛选器和判断器进行数据的分类。利用机理和数据联合构建因果图,并用评分机制改善了因果图的整体结构,保证了最终因果图的准确性和可解释性。利用异构因果图注意力网络进行预测。本发明提出的基于异构因果图注意力网络的大规模定制质量预测方法可以解决大规模定制中的多尺度、数据混杂、因果关系复杂等问题,并利用变量间的关联关系,以及提取多尺度数据中的信息获取更好的预测效果。