基于多尺度注意力机制的材料去除状态预测方法

文档序号:31128670发布日期:2022-08-13 04:38阅读:112来源:国知局
基于多尺度注意力机制的材料去除状态预测方法

1.本发明涉及材料去除状态领域,具体涉及一种基于多尺度注意力机制的材料去除状态预测方法。


背景技术:

2.在实际加工过程中,由于砂带磨损、加工误差等因素的影响,很难确定材料的去除状态,而磨削生产中工件材料的准确去除决定了工件的最终加工质量,因此工件的材料去除检测尤为重要。
3.目前,材料去除状态的检测分为直接检测和间接检测。直接检测的主要方法是通过专用仪器测量去除量,测量程序往往十分繁琐,大大增加了时间和经济成本,并影响了加工效率。间接检测可分为机制模型预测和学习模型预测,其中,机制模型预测对加工工件的材料去除状态的研究有限,影响去除率的因素较多,使得通过建立数据模型或仿真模型来预测材料去除状态非常困难。学习模型预测使用的是人工智能算法,得益于智能算法的快速发展,通过对采集到的信号数据进行模型分析可以有效建立传感器信号与目标之间复杂的非线性映射关系,但此类模型只适用于工业中复杂条件下的目标预测,且存在处理效率低以及预测精度差的问题。


技术实现要素:

4.有鉴于此,本发明的目的是克服现有技术中的缺陷,提供基于多尺度注意力机制的材料去除状态预测方法,能够提升数据特征提取的准确性和网络模型的预测精度,实现对材料去除状态的有效预测。
5.本发明的基于多尺度注意力机制的材料去除状态预测方法,包括如下步骤:
6.s1.采集加工材料的位移数据,并确定加工材料的去除状态;
7.s2.对加工材料的位移数据进行预处理,得到处理后的位移数据;所述预处理依次包括一阶差分处理、标准化处理以及数据扩增处理;
8.s3.构建基于多尺度注意力机制的神经网络模型;
9.s4.设置网络训练参数,并使用处理后的位移数据对所述神经网络模型进行网络训练,得到训练后的网络模型;
10.s5.将待测加工材料的位移数据输入到训练后的网络模型,输出所述待测加工材料的去除状态。
11.进一步,根据如下公式对加工材料的位移数据进行一阶差分处理:
[0012][0013]
其中,yi′
为时间序列上第i个位移数据点,yi′
+1
为时间序列上第i+1个位移数据点,yi为相邻时间序列上位移数据点之间的差值,n=len(y

)-1,所述len(y

)为位移数据y

在时间序列上的位移数据点总数,y为一阶差分处理后的位移数据。
[0014]
进一步,根据如下公式对加工材料的位移数据进行标准化处理:
[0015][0016]
其中,μ为所述数据yi的均值,σ为所述数据yi的标准差,xi为所述数据yi的标准化值,x为标准化值的集合。
[0017]
进一步,采用滑动窗口的方式对标准化后的位移数据进行数据扩增处理,得到扩增后的位移数据。
[0018]
进一步,所述神经网络模型包括依次连接的去噪层、多尺度特征提取层、注意力层以及分类层;
[0019]
所述去噪层用于对处理后的位移数据进行降噪和特征预提取,得到去噪后的位移数据;
[0020]
所述多尺度特征提取层用于对去噪后的位移数据进行多尺度特征提取,得到特征提取后的位移数据;
[0021]
所述注意力层用于对特征提取后的位移数据进行特征加权处理,得到特征加权后的位移数据;
[0022]
所述分类层用于对特征加权后的位移数据进行分类,得到位移数据的分类结果。
[0023]
进一步,所述去噪层包括一维cnn网络;所述cnn网络包括卷积层以及平均池化层。
[0024]
进一步,所述多尺度特征提取层包括一维卷积层以及三个平行的一维卷积层。
[0025]
进一步,所述注意力层包括一维cnn网络以及一个senet网络。
[0026]
进一步,所述分类层包括一个全连接神经网络层。
[0027]
进一步,通过k折交叉验证的方式将处理后的位移数据划分为训练集与测试集,并将所述训练集与测试集输入到神经网络模型进行网络训练。
[0028]
本发明的有益效果是:本发明公开的一种基于多尺度注意力机制的材料去除状态预测方法,通过使用差分预处理位移数据,消除数据中所包含的随机性趋势,减轻数据之间的不规律波动,使其数据趋于平稳,便于进一步地分析。对差分化后的数据进行数据增强来扩充位移数据量,降低了收集大量数据的难度并解决了模型数据需求大的问题,该方法所需的数据量相对较小。结合多尺度卷积神经网络与注意力机制,避免了局部特征信息提取的缺陷,在不同尺度上捕捉信息,专注于权重高的特征信息,解决了信息过载问题,提高了处理的效率和准确性且适用范围广,并提升了数据特征提取的准确性和模型的预测精度,实现了对材料去除状态的有效预测。
附图说明
[0029]
下面结合附图和实施例对本发明作进一步描述:
[0030]
图1为本发明的方法流程示意图;
[0031]
图2为本发明的数据扩增原理示意图;
[0032]
图3为本发明的去噪层结构示意图;
[0033]
图4为本发明的多尺度特征提取层结构示意图;
[0034]
图5为本发明的注意力层结构示意图;
[0035]
图6为本发明的分类层结构示意图。
具体实施方式
[0036]
以下结合说明书附图对本发明做出进一步的说明,如图所示:
[0037]
本发明的基于多尺度注意力机制的材料去除状态预测方法,包括如下步骤:
[0038]
s1.采集加工材料的位移数据,并确定加工材料的去除状态;
[0039]
s2.对加工材料的位移数据进行预处理,得到处理后的位移数据;所述预处理依次包括一阶差分处理、标准化处理以及数据扩增处理;
[0040]
s3.构建基于多尺度注意力机制的神经网络模型;
[0041]
s4.设置网络训练参数,并使用处理后的位移数据对所述神经网络模型进行网络训练,得到训练后的网络模型;
[0042]
s5.将待测加工材料的位移数据输入到训练后的网络模型,输出所述待测加工材料的去除状态。
[0043]
本实施例中,步骤s1中,使用涡流位移传感器和配套的ni-crio数据采集系统采集加工材料在加工过程中产生的位移信号,位移信号来自于加工过程中被加工材料或工件的位移数据,所述位移数据实际为位移变化数据,所述位移变化数据为加工材料所处的实际加工状态与正式加工前原始状态之间的位移变化值。所述ni-crio数据采集系统采用现有技术,在此不再赘述。并将位移数据

d小于0.5mm的工件视为不合格工件,否则视为合格工件,也即是,通过对采集的位移数据进行临界值界定,确定加工材料的去除状态为合格或不合格。一般地,按照时间的先后顺序,采集加工材料的位移数据,进而形成了时间序列上的位移数据点。
[0044]
本实施例中,步骤s2中,使用位移传感器采集到的位移数据通常存在噪声、误差等干扰因素,直接对位移数据进行分析,势必得不到理想的结果,因此需要先对数据进行预处理,通过对数据进行一阶差分、标准化和数据扩增处理,是数据能够用于深度学习预测的前提。
[0045]
为了消除误差的影响,本发明将位移数据作为分析对象,在一个加工周期内,虽然不同位置的位移数据不同,但位移的变化趋势是相似的。对位移数据进行一阶差分处理,一阶差分是将时间序列位移数据的下一数据依次减去前一数据,形成新的位移变化数据。其计算公式如下:
[0046][0047]
其中,y
′i为时间序列上第i个位移数据点,y

i+1
为时间序列上第i+1个位移数据点,yi为相邻时间序列上位移数据点之间的差值,n=len(y

)-1,所述len(y

)为位移数据y

在时间序列上的位移数据点总数,y为一阶差分处理后的位移数据。
[0048]
差分预处理在噪声控制方面有一定的局限性,如果直接对差分数据进行分析,网络模型会考虑数据中包含的局部噪声特征,从而产生干扰。为了避免提取的样本数据局部特征过于明显,在数据扩增或增强之前对数据进行标准化处理。而标准化处理不仅可以加快模型的收敛速度,而且可以提高模型的精度。
[0049]
标准化处理计算公式如下:
[0050][0051]
其中,μ为所述数据yi的均值,σ为所述数据yi的标准差,xi为所述数据yi的标准化值,x为标准化值的集合。
[0052]
完成位移数据的差分预处理和标准化后,对其进行数据扩增。使用采样和滑动窗口增强扩大数据集,数据扩增方法如图2所示。采用这种数据扩充方法,可以将小样本的源数据集扩充到足以进行神经网络模型训练的容量大小。
[0053]
本实施例中,在位移数据处理的基础上,提出了一种多尺度注意力卷积神经网络(macnn),用于加工材料去除状态的预测。神经网络中的注意力机制是在计算能力有限的情况下,将计算资源分配给更重要的任务,同时解决信息超载问题的一种资源分配方案。
[0054]
在神经网络学习中,一般模型的参数越多则模型的表达能力越强,模型所存储的信息量也越大,但这会带来信息过载的问题。通过引入注意力机制,在众多的输入信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注度,甚至过滤掉无关信息,就可以解决信息过载问题,并提高任务处理的效率和准确性。多尺度特征提取则有效避免了由于采用固定尺寸的卷积核只能提取局部的特性信息的缺陷,能够在不同尺度上捕捉信息,对于分类任务有明显的提升。所述神经网络模型包括依次连接的去噪层、多尺度特征提取层、注意力层以及分类层;
[0055]
采用去噪层对预处理后的位移数据进行降噪和特征预提取。去噪层是一维cnn网络,所述cnn由卷积层和平均池化层组成,结构如图3所示。
[0056]
cnn具有很好的特征提取能力,可以提取信号数据中的关键特征。cnn网络可以自由组合来构建模型并具有更好的性能。在本发明中通过不同长度的卷积检查来对位移数据进行滑动窗口卷积运算,提取数据中的关键特征。
[0057]
计算公式如下:
[0058]yl
=k
l
*y
l-1
+b
l
ꢀꢀꢀ
(1)
[0059][0060]
其中,y
l-1
是卷积层第l-1层的输出,第l-1层是第l卷积层的输入。y
l
为卷积计算的结果,k
l
为卷积核的大小,b
l
为偏置,f为参数整流线性单元(prelu)的激活函数,a为固定值;y
l

为经过激活函数计算得到的值。
[0061]
为降低模型的学习难度,提升网络的训练速度和防止过拟合,在卷积运算之后,需要进行batchnorm(bn)处理,保持网络各层的输入(即式1中的y
l
)分布不变。通过对提取的特征进行采样,在保证不丢失特征的前提下,大大降低了计算复杂度。池化层分为平均池和最大池,计算公式如下:
[0062][0063][0064]
其中,l+1表示第l+1层。和分别是平均池和最大池的输出。k是池化层的
核心,y

l,i
为池化计算的输入。
[0065]
宽核卷积核的使用可以有效地消除干扰的数据,平均池化处理可以有效地平滑和降噪数据,减少噪声的影响,预处理后的数据经过去噪层处理,既可以减少数据的干扰因素,又可以将数据映射到多维的特征空间,方便后续网络进一步提取特征。
[0066]
多尺度特征提取(multi-scale feature extraction,msfe)层由单独的一维卷积层和三个平行的一维卷积层组成。
[0067]
本发明采用滑动窗口数据增强的处理方式来降低采集的数据信号的复杂性,由于简单固定的单尺度卷积处理无法提取多复杂度的特征,本发明采用了三种多尺度并行卷积网络,可以提取多种有效的特征层,每个卷积层后面是bn、prelu和max pooling。其网络结构如图4所示。
[0068]
在多尺度特征提取层设计中,使用单独的一维卷积层来减少降噪层中的通道数量,并进一步对特征进行滤波,去除最初不重要的常见特征。然后采用不同卷积核的三个并行卷积层对不同尺度的特征进行滤波,提取不同频带的特征,bn层和prelu在每个卷积层之后依次连接。最后利用三个并行池化层来突出提取的多尺度特征。
[0069]
多尺度网络可以提取不同层次的特征,但也带来了特征的多样性和复杂性。这些特征的重要性是不同的,因此本发明构建了一个注意力网络层来识别这些重要特征。
[0070]
注意力层由一个单层输出的一维cnn和一个senet组成,注意力层的结构如图5所示。由于提取的特征比较复杂,首先使用一层卷积神经网络进行初始注意力提取,然后使用senet网络提取最后注意力。senet是一个功能性的子网络,可以与其他网络相结合以达到更好的效果。senet的主要目的是学习不同特征下的权值,并根据损失值自动实现赋予不同的重要性。
[0071]
将senet与cnn结合,应用于多尺度特征提取层,然后是分类的全连接层(fully connected,fc)。由senet计算卷积神经网络集成的多尺度层提取的特征和特征重要性的加权结果,最终实现提取特征值。
[0072]
分类层实际上是一个fc神经网络层,分类层的结构如图6所示。上面提到的各层主要功能是提取目标的相应特征,而分类层的功能是采用单层神经网络将这些特征进行分类,也即是将材料去除状态分为合格和不合格两大类。
[0073]
通过去噪层、多尺度特征提取层和注意力层,将单输入的批量数据点提取出一定量的关键特征。同样,为了保证每批数据的输出特征服从相同的分布,特征数据在连接到fc神经网络之前也需经过bn处理。处理后的特征数据作为fc神经网络的输入,最终得到预测的分类结果。
[0074]
本实施例中,通过k折交叉验证的方式将处理后的位移数据划分为训练集与测试集,并将所述训练集与测试集输入到神经网络模型进行网络训练。其中,k折交叉验证划分数据集的方法不同于传统数据划分,它可以避免固定划分数据集的局限性,并广泛应用于模型建立。
[0075]
本发明构建了一种以一阶差分和数据增强处理的数据为输入的多尺度注意力卷积神经网络模型。通过对位移数据进行一阶差分和标准化处理,结合处理的周期特性,通过重叠滑动窗口来增强数据,扩充了数据量,降低了收集大量数据的难度并解决了对模型数据需求大的难题,为模型的预测奠定了技术基础。
[0076]
而多尺度卷积神经网络与注意力机制的实际结合,利用不同大小的并行卷积层可以提取数据的不同频段的特征数据,并结合注意力网络对特征赋予不同的权重,实现重要特征的准确提取,极大程度地提高了模型的预测精度实现了对材料去除状态的准确预测。
[0077]
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1