自动确定技术系统的与机器学习模型的输出相关的根本原因指示器的制作方法

文档序号:37499119发布日期:2024-04-01 14:06阅读:11来源:国知局
自动确定技术系统的与机器学习模型的输出相关的根本原因指示器的制作方法

本公开涉及一种用于自动确定技术系统的与机器学习模型的输出相关的根本原因指示器的辅助装置和计算机实现的方法,该机器学习模型被训练成基于测量描述了技术系统的参数(尤其是物理参数)的不同传感器的传感器数据来分析技术系统。


背景技术:

1、如今,在工业制造中,操作监测和质量监测是通过基于机器学习模型的数据驱动应用(如异常检测或质量分类)来执行的。传感器在各种重型机械和装备中无处不在。传感器不仅要被理解为测量参数,而且还要被理解为取得视觉信息,例如取得制造过程中的工件的例如照片或视频。传感器的另一重要应用领域是监测重型机械(诸如泵、涡轮、压铸机、轧机等)的功能性。为此,传感器被安装在这些设备和机器上,并且随时间测量不同的物理参数,诸如电流、温度、压力,这使得能够监测整个系统的状态。如果机械受到不同的损坏,则传感器数据值通常示出数据中的不寻常的、可疑模式和异常,这允许训练机器学习模型来检测这些异常。

2、然而,存在与从传感器数据检测机器的异常和后续故障相关的多个问题。由于机器的状态常常取决于各种物理参数,并且尤其取决于具体参数的组合,因此机器学习模型具有复杂的结构,这是因为它必须在考虑表示所有各种参数的传感器数据的若干时间序列的情况下被训练。这种经学习的机器学习(ml)模型被称为黑盒模型,并且是所提供结果背后的“逻辑”,该逻辑通常极其难以解释,并且甚至数据科学家和ai专家可能也难以理解。这意味着不可能全局地理解机器学习模型是如何处理传感器数据的,并且不可能局部地理解机器学习模型如何作出行为,例如机器学习模型如何做出基于具体输入的某个预测。

3、在生产性使用中,这是主要的问题。常常至关重要的是,获得对ml模型检测到的异常的潜在物理根本原因的人类可理解的解释,以便能够在机器处采取应对措施或决定如何对这种异常做出反应。然而,在构建和训练该模型时,该信息很多时候是无法获得的,因为并非导致故障的物理行为的所有可能状态都被包括在训练数据集中,并且这些状态只有当在现场采用后才变得明显。因此,到目前为止,根本原因调查是一项劳动密集型的手动工作,该工作在其中出现异常的每个情况下都需要反复进行。这不仅是对于异常检测所需要的,而且也是对于机器学习模型的任何其他输出所需要的,与基于分类模型还是回归模型无关,该机器学习模型被训练成评估机器或其他技术系统。

4、来自可解释机器学习(iml)和可解释人工智能(xai)的模型不可知方法是已知的,所述方法取决于输入传感器数据来提供关于机器学习模型的决策路径的一些信息。然而,它们只提供对于数据科学家或机器学习工程师——其可以解释xai或iml方法——来说可理解的有限且抽象的信息,但是缺乏关于物理根本原因的信息和知识。

5、steenwinckel bram等人的“flags:a methodology for adaptive anomalydetection and root cause analysis on sensor data streams by fusing expertknowledge with machine learning”,future generation computer systems,elsevierscience publishers.amsterdam,nl,vol.116,19october 2020(202010-19),pages 30-48,xp086401633,issn:0167-739x,doi:10.1016/j.future.2020.10.015公开了一种融合ai的可解释异常生成系统,该系统将语义知识并入在机器学习技术中以增强表达性。

6、lucas costa brito等人的“an explainable artificial intelligenceapproach for unsupervised fault detection and diagnosis in rotatingmachinery”,arxiv.org,cornell university library,201olin library cornelluniversity ithaca,ny 14853,23february 2021(2021-02-23),xp081891018公开了一种用于无监督故障检测的可解释人工智能方法。在第一部分中,提取时域和频域中的振动特征。其次,在故障检测中,基于异常检测算法以无监督的方式验证故障的存在。最后,将沙普利加性解释(shap)(一种解释黑盒模型的技术)用于故障诊断中。


技术实现思路

1、因此,本技术的目的是提供一种辅助装置和方法,该装置和方法提供针对用于评估和监测机器或设备的机器学习模型的异常或其他输出的物理原因,即,所谓的根本原因。另外的目的是提供一种与潜在异常、或一般地ml模型一致的解决方案,该解决方案可针对异常的新根本原因来定制,适用于在线设置,其中由ml模型基于当前测量的传感器数据来连续地监测机器或设备,并且针对该ml模型的输出顺序地(sequentially)要求解释。

2、该目的由独立权利要求的特征来解决。从属权利要求包含本发明的进一步发展。

3、第一方面涉及一种用于自动确定技术系统的与机器学习模型的输出相关的根本原因指示器的计算机实现的方法,机器学习模型被训练成基于测量技术系统的参数的不同传感器的传感器数据来分析技术系统,所述方法包括:

4、-接收技术系统的所测量传感器数据以及机器学习模型(f)针对接收到的所测量传感器数据的输出作为输入,其中机器学习模型用于评估技术系统,

5、-确定针对机器学习模型的输出的解释信息,该解释信息包括特征值集合,该特征值集合针对技术系统的传感器数据的每个单个组分和/或技术系统的传感器数据的组分的每个组合具有一个特征值,该特征值集合指示特征对机器学习模型的输出的影响,

6、-基于指派给机器学习模型的输出的根本原因标签来训练根本原因模型,以将解释信息的特征值映射到根本原因指示器上,

7、-通过将新的特征值集合输入到根本原因模型中来确定根本原因标签中的一个,该新的特征值集合是针对由于输入新的所测量传感器数据而得到的机器学习模型的输出来确定的,以及

8、-将所确定的根本原因标签作为根本原因指示器输出到用户接口。

9、接收到的传感器数据可以是在技术系统处检测到的任何种类的数据。所测量传感器数据可以以各种格式中的一种来结构化,例如作为表格数据、若干个传感器数据的时间序列(即,多变量时间序列)、图像等等。因此,它适用于广泛的评估任务和广泛的待评估的技术系统。机器学习模型是利用表示技术系统的技术参数的传感器数据来训练的。所提出的解决方案是非常通用的,并且不限于将机器学习模型用于异常检测,而是一般还适用于用于基于所测量传感器数据来评估技术系统(例如质量评估)的机器学习模型。根本原因模型被训练成将解释信息的特征值映射到根本原因指示器上。这提供了在处理要求方面的效率,这是由于解释信息及其特征值常常与所测量传感器数据一样具有较低的维数或者至少是稀疏的。此外,已经突出显示并提取了机器学习模型的相关信息。经训练的根本原因模型可以被应用于新的所测量传感器数据的输出,并且可以与技术系统一起在线操作。

10、根据本发明,根本原因指示器指示技术系统中的机器学习模型的输出的物理根本原因和/或要应用到技术系统上的措施。技术系统是工业制造或重型机械中的设备或机器。

11、这使得该方法能够被应用于技术系统的广泛评估场景以及技术系统本身。它允许对机器学习模型的具体输出的即时反应,例如对所报告异常的即时反应,并且因此减少技术系统的损坏或停机时间。

12、在该方法的实施例中,机器学习模型是有监督分类模型或回归模型或者无监督分类模型或回归模型中的任何一个。

13、所提出的解决方案是非常通用的,并且不限于具体类型的机器学习模型。它可以被应用于广泛的机器学习应用。

14、在该方法的实施例中,解释信息通过可解释的人工智能模型来确定。

15、来自可解释ai(xai)或可解释机器学习(iml)的工具集的现有解释人工模型可以被重用,这减少了设置该方法的开发工作量。进一步的可用解释信息模型被优化以解释不同的机器学习模型,这允许该方法容易地针对不同的机器学习模型被优化。

16、在该方法的实施例中,可解释人工智能模型被配置成使得特征值针对不同的传感器数据而变化。

17、不同传感器数据的不同特征值确保了可解释人工智能模型在所测量传感器数据的不同实例之间提供足够的区分。

18、在该方法的实施例中,指派给机器学习模型的输出的根本原因标签基于针对机器学习模型的输出所确定的解释信息的特征值集合。

19、这确保了通用性,这是由于只需要找到针对解释信息的特征值的根本原因模型,而不需要找到针对原始数据(即,所测量传感器数据)的根本原因模型。进一步地,这确保了与评估技术系统的机器学习模型的一致性,这是由于导致了解释的伪造(spurious)模式是直接从机器学习模型经由解释信息获得的。

20、在该方法的实施例中,具体根本原因标签由技术系统的领域专家来指派。

21、这提供了该方法、并且尤其是根本原因标签对不同类型的技术系统、由所测量传感器数据表示的不同物理参数、以及用于技术系统的不同评估应用的灵活适配。领域专家(例如技术系统的设计工程师或操作者)具有对技术系统及其物理参数的深刻知识。因此,技术专家可以提供最适当的标签以及最适当的待执行措施,以分辨机器学习算法的异常或其他输出的原因。进一步地,领域专家对具体根本原因标签的指派确保了根本原因模型与机器学习模型一致,该机器学习模型提供了在训练阶段被加标签的输出。

22、在该方法的实施例中,在训练根本原因模型期间定义具体根本原因标签的至少最小数量。

23、根本原因的最小数量控制了在根本原因模型被应用于生产性操作之前为了训练根本原因模型而执行的迭代次数,根本原因模型被应用于生产性操作即评估当前的所测量传感器数据并且输出评估结果,该评估结果可以是“正常”或“异常”或者可以是处于具体状态的概率或得分或者类似物。因此,根本原因模型的训练可以被适配成覆盖可以适用于所评估的技术系统的至少最小数量的具体根本原因。它允许控制所需的时间和训练所需的所测量传感器数据的数量。在根本原因模型的训练期间,具体根本原因标签被指派给机器学习模型在处理接收到的所测量传感器数据时的输出。根本原因标签由领域专家来指派。

24、在该方法的实施例中,具体根本原因标签的集合是预定义的,并且具体根本原因标签中的一个被指派给接收到的所测量传感器数据的机器学习模型的输出。

25、根本原因模型的训练可以被适配成覆盖适用于所评估的技术系统的所有已知或潜在的根本原因,并且因此确保了具体根本原因的至少这些集合将被标识。

26、在该方法的实施例中,指示未知根本原因的“未知”根本原因标签被指派给其中没有其他根本原因标签被指派的机器学习模型的这种输出。

27、“未知”根本原因标签确保了根本原因模型针对每个输入输出一标签。

28、在该方法的实施例中,针对新的所测量传感器数据,如果根本原因模型确定具体根本原因标签中的一个并且所确定的根本原因标签的概率低于预定义阈值和/或所确定的根本原因标签是“未知”根本原因标签,则“未知”根本原因作为根本原因指示器被输出到用户接口。

29、这确保了机器学习模型的每个输出将得到根本原因标签,如果没有足够的证据表明给定具体根本原因标签符合以解释信息的特征值集合编码的解释模式,则该根本原因标签可以是“未知”。否则,它将类似的解释模式(即,特征值集合)分类到同一类别中。

30、在该方法的实施例中,根本原因模型的准确度通过将机器学习模型的接收到的输出分离成用于训练根本原因模型的训练集和用于确定根本原因模型的准确度的测试集来评估。

31、更详细地,针对机器学习模型的每个输出创建元组,该元组由针对该输出确定的特征值集合和对应的所指派根本原因标签组成。在下文中,使用表达“解释模式”作为“特征值集合”的同义词,以便于阅读。针对机器学习模型的所有接收到的输出的全部或至少子集的元组被分离成训练元组子集和测试元组子集。训练元组被用于训练根本原因模型。为了测试根本原因模型,测试元组中的每个测试元组的解释模式被输入到经训练的根本原因模型中。准确度度量通过将根本原因模型的对应输出(即,所输出的根本原因标签)与元组的根本原因标签进行比较来确定。准确度度量提供了指示,例如根本原因模型的输出与元组的根本原因标签有多接近的概率。

32、在该方法的实施例中,根本原因模型利用指派给新的所测量传感器数据的机器学习模型的输出的附加根本原因标签来重新训练。

33、这确保了经训练的根本原因模型的持续改进以及经训练的根本原因模型对新出现的错误类型或所确定的根本原因的适配。

34、第二方面涉及一种用于自动确定技术系统的与机器学习模型的输出相关的根本原因指示器的辅助装置,机器学习模型被训练成基于测量技术系统的参数的不同传感器的传感器数据来分析技术系统,该辅助装置包括至少一个处理器,该至少一个处理器被配置成:

35、-接收技术系统的所测量传感器数据以及机器学习模型针对接收到的所测量传感器数据的输出作为输入,其中机器学习模型用于评估技术系统,

36、-确定针对机器学习模型的输出的解释信息,该解释信息包括特征值集合,该特征值集合针对技术系统的传感器数据的每个单个组分和/或技术系统的传感器数据的组分的每个组合具有一个特征值,该特征值集合指示特征对机器学习模型的输出的影响,

37、-基于指派给机器学习模型(f)的输出的根本原因标签来训练根本原因模型(q),以将解释信息的特征值(θ)映射到根本原因指示器(l)上,

38、-通过将新的特征值(θ)集合输入到根本原因模型(q)中来确定根本原因标签中的一个,该新的特征值(θ)集合是针对由于输入新的所测量传感器数据而得到的机器学习方法的输出来确定的,以及

39、-将所确定的根本原因标签作为根本原因指示器输出到用户接口,其中根本原因指示器指示技术系统中的机器学习模型的输出的物理根本原因和/或要应用到技术系统上的措施,并且其中技术系统是工业制造或重型机械中的设备或机器。

40、该辅助装置提供了在通过应用任何可解释ai(xai/iml)方法确定的任何合适的解释信息的输出上学习被编码为标签的物理解释的能力,从而利用这些方法的信息压缩。该辅助装置被配置成使得根本原因模型被训练成将解释信息的每个特征值集合映射到根本原因标签上。这提供了在处理要求方面的效率,这是由于解释信息和特征值集合(即,解释模式)常常与所测量传感器数据一样具有较低的维数或者至少是稀疏的。此外,解释模式已经突出显示并提取了机器学习模型的相关信息。该辅助装置需要减少的处理能力。

41、第三方面涉及一种可直接加载到数字计算机的内部存储器中的计算机程序产品,所述计算机程序产品包括软件代码部分,当所述产品在所述数字计算机上运行时,所述软件代码部分用于执行前面描述的步骤。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1