一种用于工程机械的故障诊断方法及系统与流程

文档序号:32660741发布日期:2022-12-23 23:27阅读:27来源:国知局
一种用于工程机械的故障诊断方法及系统与流程

1.本技术涉及工程机械故障诊断技术领域,尤其涉及一种用于工程机械的故障诊断方法及系统。


背景技术:

2.随着现代科学技术的发展,设备的集成度越来越高,越来越复杂,既增加了设备发生故障的可能性,也加大了设备维修难度。
3.工程机械服务过程会产生大量的客户关系管理(customer relationship management,crm)数据,而其中“故障描述”、“故障现象”、“故障检查过程、步骤”、“故障发生原因、分析”等字段信息蕴含着产生故障现象的原因,用户可以基于这些故障原因有针对性地进行设计改进,从而改进零部件的质量、降低产品故障数。但这些字段记录的数据是文本数据,不能直接进行批量统计分析,需要逐条地分析故障原因,并统计出发生这种现象的原因类别,以及每个类别的占比。这种方式工作量大,人为主观因素大,效率低,很难系统地全面地了解发生故障现象的本质原因;目前服务工程师需要先在现场查看故障现象、分析原因与诊断结果,并将其记录下来上传到crm系统,之后通过专家来对crm数据中的信息人为的做出判断。
4.因此,急需一种用于工程机械的故障诊断方法及系统,用于克服目前工程机械的故障诊断中存在的技术问题。


技术实现要素:

5.为了针对现有技术中存在的问题,本技术的目的是提供一种用于工程机械的故障诊断方法及系统,用于通过数据分析诊断的方法,优化设备来减少故障发生的可能,大大降低设备维修的难度。
6.为了实现上述技术目的,本技术提供了一种用于工程机械的故障诊断方法,包括以下步骤:
7.编码阶段:采集通过对工程机械进行故障诊断获取的crm数据,根据crm数据的第一数据字段之间的上下文的语义关系进行特征编码;
8.推理阶段:通过获取特征编码后的第二数据字段,根据神经网络模型,构建用于工程机械故障诊断的预测模型;
9.诊断阶段:采集工程机械的第二数据字段和/或第一数据字段,通过预测模型进行故障诊断。
10.优选地,在编码阶段,根据crm数据的数据类型,设置不同的字段长度,其中,crm数据包括故障现象、故障检查过程与步骤、故障发生原因;
11.基于字段长度,获取不同数据类型之间的语义关系;
12.根据字段长度和语义关系,进行特征编码。
13.优选地,在编码阶段,根据bert模型和electra模型,获取crm数据的第一数据字段
之间的语义关系,并根据字段长度,进行特征编码。
14.优选地,在推理阶段,神经网络模型包括gnn图神经网络、rnn循环神经网络中的一种。
15.优选地,在推理阶段,基于gnn图神经网络,根据第一数据字段、字段长度以及语义关系,生成消息传播机制;
16.基于消息传播机制,通过获取第二数据字段,对gnn图神经网络进行训练,构建预测模型。
17.优选地,在生成消息传播机制的过程中,根据第一数据字段和字段长度,定义字段节点;
18.根据语义关系,定义字段节点之间的表达;
19.根据字段节点以及字段节点之间的表达,生成消息传播机制。
20.优选地,在推理阶段,消息传播机制表示为:
[0021][0022]r′n=(1-ηn)mn+η
nrn
[0023]
其中,a为a节点,n为n节点,n
pn
代表与n最接近的p个节点,e
an
为节点a与节点n之间的权重参数,ra为节点a的表达权重参数,mn为中间参数,r
n’为节点传播更新后的表达权重参数,rn为节点n传播之前的表达,ηn为超参数。
[0024]
优选地,在诊断阶段,采集第一数据字段,根据字段长度,对第一数据字段进行特征编码,生成第二数据字段,通过预测模型进行故障诊断。
[0025]
优选地,在诊断阶段,根据字段长度,采集第二数据字段,通过预测模型进行故障诊断。
[0026]
本技术公开了一种用于工程机械的故障诊断系统,包括:
[0027]
编码模块,用于采集通过对工程机械进行故障诊断获取的crm数据,根据crm数据的第一数据字段之间的上下文的语义关系进行特征编码;
[0028]
推理模块,用于获取特征编码后的第二数据字段,作为输入数据对神经网络模型进行训练,构建用于工程机械故障诊断的预测模型;
[0029]
诊断模块,用于采集工程机械的第二数据字段和/或第一数据字段,通过预测模型进行故障诊断。
[0030]
本技术公开了以下技术效果:
[0031]
本技术对crm系统里面记录的大量故障现象、发生原因等数据,进行统计分析并针对高频问题制定解决方案,优化设备来减少故障发生的可能,大大降低设备维修的难度。
附图说明
[0032]
为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0033]
图1为本技术所述的故障分类示意图;
[0034]
图2为本技术所述的系统故障诊断模型的流程示意图;
[0035]
图3为本技术所述的bert预训练模型的基本网络架构及分解图;
[0036]
图4为本技术所述的消息传播机制示意图;
[0037]
图5为本技术所述的方法流程图。
具体实施方式
[0038]
下为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0039]
如图1-5所示,本技术提供了一种用于工程机械的故障诊断方法,包括以下步骤:
[0040]
s10:编码阶段:采集通过对工程机械进行故障诊断获取的crm数据,根据crm数据的第一数据字段之间的上下文的语义关系进行特征编码;
[0041]
s20:推理阶段:通过获取特征编码后的第二数据字段,根据神经网络模型,构建用于工程机械故障诊断的预测模型;
[0042]
s30:诊断阶段:采集工程机械的第二数据字段和/或第一数据字段,通过预测模型进行故障诊断。
[0043]
进一步优选地,本技术在编码阶段,根据crm数据的数据类型,设置不同的字段长度,其中,crm数据包括故障现象、故障检查过程与步骤、故障发生原因;
[0044]
基于字段长度,获取不同数据类型之间的语义关系;
[0045]
根据字段长度和语义关系,进行特征编码。
[0046]
本技术在上述进行特征编码的过程中,根据不同数据代表的不同含义,以及该数据在其特征表述时的字段分布区间,通过将特征数据的字段长度固定后,使得字段长度可以作为特征数据识别的一种特征;即在识别中,通过不同的字段长度,可以迅速识别不同的特征数据类型,并根据字段长度之间的关系进行下一步识别。
[0047]
进一步优选地,本技术在编码阶段,根据bert模型和electra模型,获取crm数据的第一数据字段之间的语义关系,并根据字段长度,进行特征编码。
[0048]
本技术在特征编码时,使用了bert模型和electra模型的组合模型的方式,当然,也可以单独使用bert模型进行识别编码,而electra模型的作用主要是用于在对抗训练中减少数据风险。在通过bert模型进行编码的过程中,需要将字段长度、数据类型、语义关系联系起来,形成一种识别机制,目的是为了在后续的神经网络识别时,增加识别效率。
[0049]
进一步优选地,本技术在推理阶段,神经网络模型包括gnn图神经网络、rnn循环神经网络中的一种。
[0050]
进一步优选地,本技术在推理阶段,基于gnn图神经网络,根据第一数据字段、字段长度以及语义关系,生成消息传播机制;
[0051]
基于消息传播机制,通过获取第二数据字段,对gnn图神经网络进行训练,构建预
测模型。
[0052]
示例性地,在通过预训练模型对文本进行特征编码后,在利用gnn(图神经网络)或者rnn(循环神经网络)来推测故障现象、故障检查过程-步骤和故障发生原因-分析这三维数据之间的关系,从而构建预测模型。
[0053]
进一步优选地,本技术在生成消息传播机制的过程中,根据第一数据字段和字段长度,定义字段节点;
[0054]
根据语义关系,定义字段节点之间的表达;
[0055]
根据字段节点以及字段节点之间的表达,生成消息传播机制。
[0056]
示例性地,因为需要利用gnn来建立节点(对应字段)与边(对应字段之间的)之间的消息传播机制,对于文本图中每一个字段节点,消息传播机制首先基于节点之间的表示(语义特征编码)以及从该节点的邻接节点收集的信息来更新该节点的表示。
[0057]
进一步优选地,本技术在推理阶段,消息传播机制表示为:
[0058][0059]r′n=(1-ηn)mn+η
nrn
[0060]
其中,a为a节点,n为n节点,n
pn
代表与n最接近的p个节点,e
an
为节点a与节点n之间的权重参数,ra为节点a的表达权重参数,mn为中间参数,r
n’为节点传播更新后的表达权重参数,rn为节点n传播之前的表达,ηn为超参数。
[0061]
示例性地,mn∈rd是节点n从它邻接节点a获取的信息,既每个邻接节点a的表示乘以他们之间的权重e
an
∈r1,再按维度取最大值,得到一个新的d维的特征。其中r为实数集,rd表示e为一个d维的向量,e为学习的权重参数,通过学习训练,不断迭代更新。由于ra是d维的,因此,mn是d维的实数向量,e
an
是1维的实数向量。n
pn
代表与n最接近的p个节点(在这个场景下就是这三个字段),a∈n
pn
表示对于任何一个n节点都有个p个最接近的a节点。如式(1)所示,rn是节点n之前的表示,r
n’表示节点更新后的表示,即节点的表达通过这种传播的方式更新值。ηn为取值为0-1之间的超参数。其中,消息传播机制通过邻接节点的表示优化生成当前的节点表示,意味着表示前后字段之间的信息。
[0062]
可选地,通过gnn更新后的三个特征向量用来作为分类的特征,三个特征向量拼接(concat)在一起后,通过一个全连接的softmax来找到对应n个分类标签的分布。
[0063]
进一步优选地,本技术在诊断阶段,采集第一数据字段,根据字段长度,对第一数据字段进行特征编码,生成第二数据字段,通过预测模型进行故障诊断。
[0064]
预测模型通过模拟现场工程师的工作思路,一步步定位故障发生的具体原因,最终定位至特定的分类标签。
[0065]
进一步优选地,本技术在诊断阶段,根据字段长度,采集第二数据字段,通过预测模型进行故障诊断。
[0066]
考虑到三个数据字段中有较长的文本,所以需要把上下文信息充分的融合到文本特征中。示例性地,可以利用现在常用的bert(强大的上下文特征抽取能力)、electra(对抗训练减少数据风险)等预训练模型将三个维度的文本分别进行初步的特征编码。
[0067]
本技术在上述诊断过程中,可以包括两个过程,一种是针对最初是的数据类型进行特征检索,根据数据编码以及数据推理阶段的逻辑过程,进行特征识别,该技术过程,适
用于新的工程机械的故障识别,对于已知型号的工程机械,可以直接根据字段长度采集crm数据中的数据字段,进而直接进行故障诊断,当然,在对新的工程机械的故障识别时,会产生新的语义特征和消息传播机制,这时,故障诊断模型会根据上述新的语义、传播机制进行自我学习,从而将上述机制应用于已知型号的工程机械识别当中,由于导致同一种故障结果的情况有可能会涉及多种情况的组合,因此,虽然属于不同型号的工程机械,但是其消息传播机制对于故障预测来讲,是具备借鉴意义的,进而,上述的故障诊断的技术设计,更加有利于故障诊断,提高了诊断的准确率。
[0068]
本技术公开了一种用于工程机械的故障诊断系统,包括:
[0069]
编码模块,用于采集通过对工程机械进行故障诊断获取的crm数据,根据crm数据的第一数据字段之间的上下文的语义关系进行特征编码;
[0070]
推理模块,用于获取特征编码后的第二数据字段,作为输入数据对神经网络模型进行训练,构建用于工程机械故障诊断的预测模型;
[0071]
诊断模块,用于采集工程机械的第二数据字段和/或第一数据字段,通过预测模型进行故障诊断。
[0072]
在工程机械故障诊断的这个场景中,原始的数据往往有着很强的关联关系,比如服务工程师在现场服务时会将发现的故障现象、故障排查的步骤和分析故障的原因上传到crm系统中,如图1所示,以这三个字段举例说明:三段信息分开来文本分类,可能存在信息不足或者不明确,比如类似的故障通过不同排查结果发现不同的故障原因而最终导致不同的分类,而单独使用故障现象可能导致分类错误,如图1所示,每一条路径都有可能导致最终不同的故障分类。
[0073]
服务工程师在现场一般会先发现故障现象,然后一步一步排查问题,最终分析故障发生的可能原因,所以这三个字段本身也具有很强的关联性;所以通过图的结构可能很好的传递(表示)故障诊断的过程。通过收集大量的crm数据和之前通过专家来对crm数据中的信息人为的做出的分类,形成训练用的图和子图,而子图作为系统故障诊断分类的依据。
[0074]
如图2所示,模型的数据输入输出为:故障现象、故障检查过程-步骤和故障发生原因-分析这三列数据,模型经过编码层和gnn推理层最终输出为具体的分类标签。
[0075]
本技术提到的系统流程与说明:
[0076]
编码阶段:考虑到三个数据字段中有较长的文本,所以需要把上下文信息充分的融合到文本特征中。利用现在常用的bert(强大的上下文特征抽取能力)、electra(对抗训练减少数据风险)等预训练模型将三个维度的文本分别进行初步的特征编码。
[0077]
推理阶段:在通过预训练模型对文本进行特征编码后,在利用gnn(图神经网络)或者rnn(循环神经网络)来推测故障现象、故障检查过程-步骤和故障发生原因-分析这三维数据之间的关系,模拟现场工程师如何一步步定位故障发生的具体原因,最终找到分类标签。
[0078]
gnn中的消息传播机制:因为需要利用gnn来建立节点(对应字段)与边(对应字段之间的)之间的消息传播机制,对于文本图中每一个字段节点,消息传播机制首先基于节点之间的表示(语义特征编码)以及从该节点的邻接节点收集的信息来更新该节点的表示,定义如下:
[0079][0080]
其中,a为a节点,n为n节点,n
pn
代表与n最接近的p个节点,e
an
为节点a与节点n之间的权重参数,ra为节点a的表达权重参数,mn为中间参数,r
n’为节点传播更新后的表达权重参数,rn为节点n传播之前的表达,ηn为超参数。
[0081]mn
∈rd是节点n从它邻接节点a获取的信息,既每个邻接节点a的表示乘以他们之间的权重e
an
∈r1,再按维度取最大值,得到一个新的d维的特征。其中r为实数集,rd表示e为一个d维的向量,e为学习的权重参数,通过学习训练,不断迭代更新。由于ra是d维的,因此,mn是d维的实数向量,e
an
是1维的实数向量。n
pn
代表与n最接近的p个节点(在这个场景下就是这三个字段),a∈n
pn
表示对于任何一个n节点都有个p个最接近的a节点。如式(1)所示,rn是节点n之前的表示,r
n’表示节点更新后的表示,即节点的表达通过这种传播的方式更新值。ηn为取值为0-1之间的超参数。其中,消息传播机制通过邻接节点的表示优化生成当前的节点表示,意味着表示前后字段之间的信息。
[0082]
通过gnn更新后的三个特征向量用来作为分类的特征,三个特征向量拼接(concat)在一起后,通过一个全连接的softmax来找到对应n个分类标签的分布。
[0083]
本技术设计的故障诊断方法及系统,通过对工程机械的crm数据进行统计分析,并针对高频问题制定了针对性的解决方案,不仅优化设备并减少故障发生的可能性,而且还大大降低了设备维修的难度。
[0084]
尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
[0085]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1