预测影响物理系统的事件的制作方法

文档序号：18108595发布日期：2019-07-06 11:50阅读：184来源：国知局

本发明涉及计算机程序和系统领域，并且更具体地涉及用于预测物理系统的事件的新发生的方法、系统和程序。

背景技术：

预测用于工程中的决策制定。预测用于识别事件的可能原因和结果，并且响应于事件而计划高效行动。例如，在正在进行的卫星发射中，需要预测事故以避免新发生事故。应用领域包括例如帮助支持几乎所有行业领域(汽车、航空航天、工业设备等)中的产品和资产的维护。它也适用于设计和制造中的质量的经验回报，例如：计算机辅助设计(cad)系统可以为设备的设计提供建议，从而最小化所设计的设备的故障风险。

“变量重要度”的问题涉及找到其知识对于确定特定目标变量的值很重要的变量，例如，找到对于确定事件的成本或事件发生概率(成本和概率是目标变量)最重要的变量。例如，切割机的使用持续时间、其上已被用于切割的材料的平均强度以及平均室温可能在确定机器损坏概率的最重要因素之中。基本上，可以争辩，最佳表征观测的变量是最佳确定观测发生概率(其是变量)的变量，因此变量重要度问题比表征观测的问题更为普遍。然而，以这种方式使用变量重要度来表征观测存在两个问题。首先，要求每个观测发生的概率是已知的。其次，变量重要度返回一般性地与观测的发生概率最佳相关的变量，而不是特别地与观测的发生概率最佳相关的变量，即，它返回表征整个观测集合的变量集合，而不是表征关于其他的观测的变量集合。

因此，识别最佳表征物理系统(例如，工厂)的特定事件的变量(例如，最佳解释物理系统事件的正常运行与物理系统的给定故障之间的差异的变量)很重要。这些变量的值可能在事件的原因之中(如果数据预先存在事件)或在其结果之中(如果数据是在事件发生后产生的)。

在此上下文中，仍然需要对物理系统的事件的新发生的改进预测。

技术实现要素：

因此，提供了一种用于预测物理系统的事件的新发生的计算机实现的方法。该方法包括：提供物理系统的过去事件的第一集合，每个过去事件包括若干属性，针对第一集合中的每个过去事件提供签名，提供包括若干属性的新事件，计算新事件的签名，在新事件的签名与第一集合中的每个过去事件的每个签名之间计算相似性测量，根据相似性测量来确定最接近新事件的过去事件从而形成过去事件的第二集合，针对第二集合的每个属性计算相关性得分，通过选择具有更高相关性得分的属性来提供属性集合。

该方法可以包括以下操作中的一个或多个：

-相关性得分针对其被计算的第二集合的属性存在于第一集合和第二集合两者中；

-属性的相关性得分是通过将属性的值在第二集合上的分布概率与属性的值在第一集合上的分布概率进行比较来计算的；

-针对第一集合中的每个过去事件并且针对新事件提供签名包括针对第一集合中的每个过去事件并且针对新事件提供数字矢量；

-提供签名包括：-利用过去事件的第三集合来训练机器学习模型，-对第一集合中的每个过去事件并且对新事件应用机器学习模型；

-所训练的模型是上下文敏感的自动编码器；

-用于确定最接近新事件的过去事件的相似性度量是以下中的一个：-余弦相似度，-欧几里德距离，-逆欧几里德距离；

-属性包括至少一个结构化属性；

-属性还包括至少一个非结构化属性；

-相关性得分是仅利用结构化属性的值来计算的；

-在形成过去事件的第二集合之后，计算第二集合中的过去事件的至少一个子集；并且其中，计算相关性得分还包括针对第二集合中的过去事件的所述至少一个子集中的每个属性计算相关性得分；

-第一集合中的过去事件和新事件是由相同属性描述的；

-新事件和新事件的签名与过去事件和过去事件的签名一起被存储，从而变成过去事件。

还提供了一种计算机程序，包括用于执行该方法的指令。

还提供了一种计算机可读存储介质，其上记录有计算机程序。

还提供了一种系统，包括耦合到存储器的处理器，该存储器上记录有计算机程序。

附图说明

现在将通过非限制性示例并参考附图来描述本发明的实施例，其中：

-图1示出了该方法的示例的流程图；

-图2至图5示出了该方法的示例；以及

-图6示出了用于执行该方法的系统的示例。

具体实施方式

参考图1的流程图，提出了一种用于预测物理系统的事件的新发生的计算机实现的方法。物理系统典型地是设备或构造工具。该方法包括提供物理系统的过去事件的第一集合。每个过去的事件包含若干属性。该方法还包括针对第一集合中的每个过去事件提供签名。然后，提供包括若干属性的新事件。在新事件的签名与第一集合中的每个过去事件的每个签名之间计算相似性测量。该方法还包括根据相似性测量来确定最接近新事件的一个或多个过去事件；这些一个或多个过去事件从而形成过去事件的第二集合。该方法还包括针对第二集合中的每个属性计算相关性得分，以及通过选择具有更高相关性得分的属性来提供属性集合。

这种方法改进了对物理系统中的事件的新发生的预测。实际上，该方法使用类似于要表征的观测的观测集合，并且这些多个观测允许进行对属性的统计分析。然后，计算可用于描述类似观测的属性的概率分布与相同属性在较大观测集合上的概率分布。为此，对于每个属性，在经验分布之间使用相似性或相异性测量。利用相关性得分来计算相似性或相异性测量。相似性或相异性测量是针对相似观测的集合和较大集合中的每个的属性的值计算的。然后使用相似性或相异性来对属性的重要度进行评分。因此，与变量重要度技术和降维技术相反，本发明提供了个体事件的表征，其提供了一组观测的表征，典型地是所有可用的观测。在根据本发明选择的属性可能展现包含事件的起源或后果的元素的值的意义上，本发明提供的表征与事件的原因和结果有关。例如，对于降维技术而言并非如此，其不旨在识别特定事件的原因和结果：实际上，降维技术减少了数据的大小，同时保留了数据中包含的一些信息，但由降维技术保留的维度可能是输入变量的复杂组合，并且可能不允许容易地追溯每个输入变量的作用；此外，保持方差或邻域或距离并不能保证保留的维度将表征特定的观测。可以以特定方式使用变量重要度计算技术，以便识别与事件的发生相关的变量以及用于展现事件的原因或结果的良好候选者。这可以例如通过计算变量在预测特定的一组事件是否将发生的任务中的重要度来完成。但是这些技术要求知道每个事件发生的概率，对分类或回归任务进行监督训练，特别是先验地将事件分组到类中，因此将分析限制于先前定义的事件组，这些不是本发明的要求。本发明提供的表征是对可用于描述观测的那些属性之中的个体属性的简单、可读识别，与典型地通过组合属性来构建维度的降维技术相反。

该方法是计算机实现的。这表示该方法的步骤(或大体上所有步骤)由至少一个计算机或任何相似的系统来执行。因此，该方法的步骤由计算机可能全自动或半自动地执行。在示例中，可以通过用户-计算机交互来执行该方法的步骤中的至少一些步骤的触发。所需要的用户-计算机交互水平可能取决于预见的自动化水平，并且与实现用户的意愿的需求保持平衡。在示例中，该水平可以是用户定义的和/或预定义的。

例如，可以根据用户动作来执行提供事件、事件集合的步骤，其中用户在事件列表中选择事件，或者输入事件。

方法的计算机实现方式的典型示例是利用适用于该目的的系统来执行该方法。该系统可以包括耦合到存储器和图形用户接口(gui)的处理器，存储器上记录有计算机程序，计算机程序包括用于执行该方法的指令。存储器还可以存储数据库。存储器是适用于这种存储的任何硬件，可能包括若干物理不同的部分(例如，一部分用于程序，并且可能一部分用于数据库)。

该方法通常操纵物理系统的事件。物理系统典型地是允许或有助于制造现实世界的产品的设备。物理系统可以是各种且不受限制的工业领域中的任何设备，包括但不限于：航空航天、建筑、建造、消费品、高科技设备、工业装备、运输、船舶、和/或海上石油/天然气生产或运输。因此，物理系统可以是工业产品或设备，其可以是任何机械零件，例如，陆地交通工具的一部分(包括例如汽车和轻型卡车装备、赛车、摩托车、卡车和电机装备、卡车和公共汽车、火车)、航空交通工具的一部分(包括例如机身装备、航空航天装备、推进装备、国防产品、飞机装备、空间装备)、航海交通工具的一部分(包括航海装备、商船、近海装备、游艇和工作船、船舶装备)、一般机械零件(包括例如工业制造机械、重型移动机械或装备、安装装备、工业装备产品、制造金属产品、轮胎制品等)、机电或电子零件(包括例如消费电子、安全和/或控制和/或仪表化产品、计算和通信装备、半导体、医疗设备和装备)、消费品(包括例如家具、家居和园艺产品、休闲用品、时尚产品、硬商品零售商的产品、软商品零售商的产品)、包装(包括例如食品和饮料和烟草、美容和个人护理、家用产品包装)。

图6示出了系统的示例，其中该系统是诸如用户的工作站之类的客户端计算机系统。

示例的客户端计算机包括连接到内部通信总线1000的中央处理单元(cpu)1010，和同样连接到总线的随机存取存储器(ram)1070。客户端计算机进一步设置有图形处理单元(gpu)1110，图形处理单元(gpu)1110与连接到总线的视频随机存取存储器1100相关联。在本领域中视频ram1100也被称为帧缓冲器。大容量存储设备控制器1020管理对诸如硬盘驱动器1030之类的大容量存储设备的访问。适于有形地体现计算机程序指令和数据的大容量存储设备包括所有形式的非易失性存储器，举例来说包括诸如eprom、eeprom以及闪存设备之类的半导体存储设备；诸如内部硬盘和可移除盘之类的磁盘；磁光盘；以及cd-rom盘1040。前述任一项可以由特别设计的asic(专用集成电路)进行补充或并入其中。网络适配器1050管理对网络1060的访问。客户端计算机还可以包括触觉设备1090，例如，光标控制设备、键盘等。在客户端计算机中光标控制设备用于允许用户选择性地将光标定位在显示器1080上的任何期望的位置。另外，光标控制设备允许用户选择各种命令并输入控制信号。光标控制设备包括用于向系统输入控制信号的若干信号生成设备。典型地，光标控制设备可以是鼠标，鼠标的按键用于生成信号。可替代地或另外，客户端计算机系统可以包括触敏板和/或触敏屏。

计算机程序可以包括可由计算机执行的指令，该指令包括用于使得上述系统执行该方法的模块。程序可记录在包括系统的存储器的任何数据存储介质上。例如，可以以数字电子电路，或者以计算机硬件、固件、软件或以其组合来实现程序。程序可以被实现为装置(例如，有形地体现在机器可读存储设备中的产品)，以用于由可编程处理器执行。方法步骤可以由执行指令的程序的可编程处理器来执行，以通过对输入数据进行操作并生成输出来执行该方法的功能。因此，处理器可以是可编程且耦合的，以从数据存储系统的至少一个输入设备接收数据和指令，并向数据存储系统的至少一个输出设备传送数据和指令。可以以高级过程语言或面向对象的编程语言来实现应用程序，或者如果需要则以汇编语言或机器语言来实现应用程序。在任何情况下，语言都可以是编译语言或解释语言。程序可以是完全安装程序或更新程序。在任何情况下将程序应用于系统都会产生用于执行该方法的指令。

返回参考图1，在步骤s10处，提供物理系统的过去事件的第一集合。事件也可以称为观测。事件(或观测)是属性集合；事件可能只包含一个属性。实际上，事件包含若干属性。属性是与数据相关联的符号。符号表征物理系统的参数。例如，物理系统是工厂，并且属性是温度、压力、距离、工厂中的位置……。与属性相关联的数据可以由分散在工厂中的探针提供，例如，探针提供测量值作为变量的数据。集合中的事件优选地具有相同的属性。

属性可以是结构化属性。结构化属性是与结构化数据相关联的属性，结构化数据是以预定格式表示或存储的数据。结构化数据包括但不限于数字、类别(即，从值、日期、一天中的时间等的有限列表中取得的值)。

属性可以是非结构化的。非结构化属性是与非结构化数据相关联的属性，非结构化数据是在不以预定格式表示或存储的数据。非结构化属性包括但不限于纯文本。

接下来，在步骤s20处，为包括在第一集合中的每个过去事件提供签名。事件签名的签名是事件的特定表示，其允许在另一事件之中表征该事件。每个签名可以是唯一的，也可以不是唯一地；通常，事件的每个签名都是唯一的，因为事件通常是唯一的，至少因为事件是被标注日期的和带有时间戳的。

有趣的是，本发明可以应用于作为未标注日期的事件的观测。多个观测可以指代同一事件。在事件分析的情况下，本发明用于找出事件的可能原因和结果。可能的原因在早于事件的特性属性中找到，并且可能的结果在事件之后的特性属性中找到。对于未标注日期的事件，特性变量也可能是事件本来的可能原因或结果。

可以根据与事件相关联的所有属性或根据这些属性的集合来计算(即，提供)所提供的事件的签名。

在示例中，事件的签名被描述为可能具有不同类型的多个属性，例如文本、数字、类别、日期……。由于在开始时已知的观测的属性并不总是数字，因此可以首先将属性转换成只取数值的新的属性集合。每个事件都变换为数值的集合。实际上，签名可以是数字矢量。

事件的签名可以用数字矢量表示，如图2所示。相同的模型适用于本方法中使用的所有事件，例如，适用于事件的第一集合，适用于将在方法的后一步处进行分析的事件……。事件的签名的矢量化或计算将每个事件的原始数据变换为每个事件的n个数值的中间高维朴素表示矢量，其中n是正整数。为了清楚起见，矢量化可能不是对签名的全部计算。这可能是提供朴素签名的第一步；然后可以通过应用例如给出签名的降维技术来改进朴素签名。

在第一示例中，矢量化将采用自由文本形式的属性(例如，专家对事故的描述)转换为(可能大的)数量的数字属性。例如，每个属性可以对应于文本中特定单词的出现次数。在示例中，基于tf-idf(术语频率-逆文档频率)的方法涉及计算文本中单词出现次数与其中单词在相同属性中出现的观测的数量的比率。

在第二示例中，取分类值的属性(例如，汽车制造商或型号)可以转换为与针对初始属性的可能值一样多的布尔属性。然后将布尔值“真(true)”和“假(false)”转换为1或0(反之亦然)以获得数值。可替代地，可以使用散列方法，例如，scikitlearn提供的散列矢量化器。在第三示例中，数字属性可以保持不被修改。在该第三示例中，有效问题可以是如何将数字属性上的数据的缺失表示为数字。在多个解决方案之中，一个解决方案由以下构成：按照用于该过程的已知技术中的一种已知技术输入数据，并且添加分类变量，该分类变量告知对于该属性而言数据是否可用。应理解，可以组合这些第一示例、第二示例和第三示例。

当用数字矢量表示事件的签名时，该表示可能不会直接用于比较事件，因为签名可能引入偏差。首先，当用朴素表示的多个维度隐含地传达一条信息时，它将相比在测量观测之间的相似性时在属性之间不被复制的其他条信息而给予更高的重要度。例如，如果一个属性是外部空气温度而另一个属性是gps坐标，并且观测发生在每个纬度，则存在对与温度相关的信息的一些复制，因为高纬度与低温相关。这是不期望的，因为这些维度直接起因于初始属性的选择，初始属性可以是任意的。例如，无论出于何种原因，可能希望复制属性，这不应该影响观测之间的比较。其次，当两个维度上的值具有不同的定义区段时，这将影响值在相似性中的重要度。具有较高方差的维度将相比具有较小方差的维度被给予跟高的重要度。这是不期望的，因为初始属性的方差是任意的。例如，单位的选择是任意的。选择米而不是千米作为给定属性的单位不应影响观测之间的比较。

将朴素表示(每个事件的n个数值的中间高维朴素表示矢量)转换为减轻由数字签名引入的偏差的表示——任意选择输入变量来描述事件。在示例中，提供事件的签名还可以包括用过去事件的第三集合来训练机器学习模型。可以在不同的事件集合上训练机器学习模型。在示例中，机器学习模型在事件的集合a上训练，然后将模型应用于事件的集合b，并且稍后将集合b中的事件与新事件进行比较。事件的集合a可以等于事件的集合b，但事件的集合a也可以与集合b不同。集合a和集合b两者都是过去事件的集合。在示例中，每六个月在所有过去事件上对模型进行训练，并且模型每天应用于所有新的传入事件。例如，该模型每年1月1日和6月1日进行训练；因此，在2月15日，事件的集合a包括直到1月1日的所有过去事件，并且事件的集合b包括直到2月15日的所有过去事件。集合a包含在集合b中，但相反的情况不是如此。集合a和集合b不同。在示例中，第一集合和第三集合是相同的。

深度学习为实现此步骤提供了一些有趣的选项。例如，训练的模型是上下文敏感的自动编码器(或堆叠的上下文敏感的自动编码器)，其是一类神经网络，并且神经网络是一类机器学习模型。自动编码器或堆叠的自动编码器由多层人工神经元构成，一个中心层的大小典型地小于输入层，并且最后一层具有与第一层相同的大小。训练神经网络以再现输入，并且中心层的输出用作输入的表示。因此，输入的表示是输入的压缩(即，中间层具有比输入层和输出层小的大小)，其尽可能多地包含再现输入必要的信息。为了使神经网络对于小的表示表现良好，它将倾向于以对于重构输入最佳的方式在表示中分发相关信息。将针对最小化损失函数(输出和输入之间的差的函数)的维度找到最佳表示。这种最佳表示应该提供像现有技术的网络拓扑所允许的一样无偏差的表示。

在训练神经网络之后，事件再次运行通过网络的第一层(而不改变训练的网络)以获得其表示(在中间层的输出处)。机器学习模型应用于过去事件的集合，例如，过去事件的第一集合。

当事件集合中的事件包括文本数据时，作为模型的输入提供的数字矢量由词汇表的每个单词在文本中出现的次数构成。可以通过选择文本集合的单词来获得词汇表。选择可以基于这些文本中的单词的tf-idf；例如，词汇表是这些文本中具有最高平均tf-idf的单词集合。可替代地，使用doc2vec或类似的文档嵌入技术来获得与每个事件相关的文本数据。

在示例中，神经网络用于基于与事件相关的数据来产生事件的签名。神经网络可以是深度神经网络。如所讨论的，神经网络可以是上下文敏感的自动编码器。神经网络可以是堆叠的上下文敏感的自动编码器。上下文敏感的自动编码器很简单，并且其训练和执行比深度神经网络的训练和执行快。另外，与堆叠的上下文敏感的自动编码器相比，上下文敏感的自动编码器具有更低的存储器打印。然而，后者更好地捕获信息。当神经网络是上下文敏感的自动编码器或堆叠的上下文敏感的自动编码器时，两者都将源自非文本变量的数据作为上下文，其与输入的其余部分不同地对待。事实上，可以更好地理解上下文和其他数据的作用，并且从上下文被预先矢量化的那一刻起，上下文也可以从非结构化数据中导出。主数据包含要表示的信息，并且上下文包含可以用于解释主数据的上下文信息。例如，主数据可以来自描述事件的自由文本，并且上下文数据可以来自相关联的结构化数据。

图3示出了针对过去事件的第一集合计算签名的示例。将事件变换为维度为n的朴素表示，其进而在训练的模型的输入中提供并且变换为维度为n<n的较低维表示。

回到图1，在步骤s30处，提供包括若干属性的新事件。该事件包括一个或多个属性，并且至少一个属性类似于第一集合中的事件的属性。实际上，新事件具有与第一集合中的事件相同的属性，即，新事件和第一集合中的过去事件由相同属性描述。

接下来，在步骤s40处，计算新事件的签名。如参考步骤s20讨论的那样计算签名。

图5示出了要分析的新观测如何运行通过过去事件的相同步骤，如图3所示并参考步骤s20讨论的。首先将新事件矢量化，即将其转换为第一数字矢量，然后第一数字矢量运行通过训练模型以提供最终表示。

新事件和新事件的签名可以与过去事件和过去事件的签名一起存储，从而变成过去事件。这改进了用于识别事件的相关变量的事件的一致性。

然后，在步骤s50处，在新事件的签名与第一集合中的每个过去事件的每个签名之间计算相似性测量。可以使用相似性度量来每两个地比较在步骤s20和s30处产生的矢量。应该理解，可以使用不相似性度量。所使用的相似性或不相似性度量可以是但不限于余弦相似度、欧几里德距离、逆欧几里德距离……。良好的矢量表示是这样的矢量表示，其中类似的事件具有类似的矢量表示。事件的良好矢量表示将验证事件a的矢量与作为不同事件的事件c相比更类似于事件b的矢量，事件b是同一事件的不同发生。如果a、d和e是不同事件的发生并且d更类似于a而不是e，则事件a的矢量与事件e的矢量相比也将更类似于事件d的矢量。

一旦计算出新事件与第一集合中的事件的签名之间的所有组合的所有相似性测量，就计算(s60)过去事件的第二集合，其包括已经确定为是新事件的最接近的过去事件的、第一集合中的过去事件。关于最接近的过去事件，应当理解，基于与每个事件相关联的相似性(或不相似性)测量来创建第一集合中的事件的排名，并且选择具有最高排名(例如，具有最高相似性测量)的多个事件来形成事件的第二集合。因此，第二集合由与在步骤s30处提供的新事件最相似的事件形成。

被选择用于形成第二集合的第一集合中的事件的数量可以由用户选择，或者自动选择或预定义。当由用户选择时，他/她可以定义相似度阈值，其中只有具有高于阈值的相似度值的事件将形成事件的第二集合。可替代地，用户可以定义具有最高相似度值的多个事件，这些事件将形成事件的第二集合。有趣的是，这允许用户定制可以由本发明显示的结果，例如，最佳表征物理系统的特定事件的所识别的属性。形成第二集合的事件的数量可以自动定制；对于步骤s60至s80的每次重复，阈值增加，并且对其而言最佳表征特定事件的所识别属性的数量最高的阈值保持作为用于该方法的下一次重复的阈值。

然后，在步骤s70处，针对第二集合的每个属性计算相关性得分。相关性得分是属性在对特定事件的表征中的影响(或重要度)的测量。

可以通过计算第二集合中的每个属性的值的分布与第一集合中的每个属性的值的分布之间的分离度来计算每个属性的相关性得分。分离度的计算旨在提供类似于所提供的新事件的事件与不类似于所提供的新事件的事件之间的差异。为此目的，通过将属性的值在第二集合上的分布概率与属性的值在第一集合上的分布概率进行比较来计算属性的相关性得分。如果由于比较而获得属性的分布差异，则该属性是相关的；相反，如果由于比较没有获得分布差异，则该属性对于所提供的新事件不相关。

优选地，针对其来计算相关性得分的第二集合的属性存在于第一集合和第二集合两者中。例如，当第一集合中的所有事件具有相同属性时是这样的情况，如先前讨论的。这确保了可以针对第二集合中的每个事件的每个属性计算有意义的相关性得分。因此改进了对新事件的表征中的相关属性的识别，从而改进了对相关物理系统的新事件的新发生的预测。

可以针对新事件的所有属性来计算相关性得分，或者仅针对特定类型的属性来计算相关性得分。在示例中，仅针对结构化属性计算相关性得分。使用结构化属性仅允许对这些属性进行汇总，例如，以其分布的统计分析的形式(直方图、平均值、标准差等)。

在示例中，过去事件的第二集合可以被细分为过去事件的子集。第二集合的细分可以基于一个或多个属性的相似性。例如，属性具有相同相关性得分值或接近值(例如，属于给定值范围的值)的事件将形成第二集合中的过去事件的子集。因此，在形成过去事件的第二集合之后，形成(或计算)第二集合中的过去事件的至少一个子集。应当理解，在形成一个子集的情况下，剩余的过去事件(不属于该一个子集的事件)隐含地形成第二集合中的过去事件的另一子集。第二集合的这种细分改进了对表征事件的一个或多个属性的选择。

然后，通过选择具有最高相关性得分的属性来提供(即，识别)属性集合。这些一个或多个最相关的属性是最佳表征步骤s30的新事件的属性。有趣的是，现在通过关键词进行查询或对属性引入约束是可能的，导致限制第一集合和第二集合，这可以导致修改属性的相关性得分。

图5示出了该方法的示例。在此示例中，使用观测来代替事件。如已经解释的，观测是未标注日期的事件。观测的矢量表示(s20)用于检索与提交给系统的观测类似的观测(s10)，对于观测的每个初始属性，值被分组以描述在过滤类似观测之前和之后的概率分布，对如此描述的概率分布的比较用于测量每个属性的相关性，并且该测量用于决定是否选择属性作为输入中给出的观测的特性。

使用相似性度量(s50)来比较矢量表示，例如，余弦相似性。仅保留具有与系统的输入中提交的矢量表示(s30)最相似的矢量表示(s60)的观测。可以设置相似性阈值，或者结果的最大数量，或两者(s60)。可以显示结果摘要以帮助调整结果的阈值或最大数量。在该示例中，s1是在检索最相似的观测之前的观测集合，并且s2是从集合s1形成的过去事件的集合。s2的观测包含在s1中。

最初可用于描述s1和s2中的事件的属性被收集。这些属性不是在朴素矢量表示或最终矢量表示中找到的值，因为这些值的含义典型地是不直观的。这些是在系统输入中找到的属性及其值，因为它们典型地对用户而言有意义。

这些属性可能是数字类型，也可能不是。只要存在一种方法来比较其类型的变量的概率分布，就可以该点处使用任何类型的属性。

例如，对于数字变量，双样本kolmogorovsmirnov测试提供了经验分布之间的相似性测量。在这里，分布被称为经验分布，因为它们是通过对其值进行采样而不是通过其概率分布的理论模型的参数来定义的。它由测量概率密度函数之间的绝对差的积分或者每个离散值上的概率之间的绝对差之和构成。kolmogorovsmirnov测试实际上提供了相异性而不是相似性。其任何严格递减的函数都可以用作相似性。保留在s1和s2上具有最相似(或最少不相似)分布的属性。

在示例中，该方法允许在计算机辅助设计(cad)系统上设计物理系统的模型。首先，提供物理系统的模型。物理系统与过去事件的第一集合相关联，每个过去事件包括若干属性。然后，针对第一集合中的每个过去事件，提供属性集合，其中在过去事件的属性之中选择属性。这如参考图1所讨论的那样执行。然后，提供所述每个过去事件作为新事件。根据用户动作对所提供的物理系统模型的属性执行选择。由于选择，执行或运行本发明的计算机化系统确定所选择的属性是否属于该属性集合，并且如果所选择的属性属于该属性集合，则触发对用户的警报。因此改进了对要制造的物理系统的在cad系统上的设计。为了说明起见，现在讨论cad系统。

cad系统另外表示至少适用于在建模对象的图形表示的基础上来设计建模对象的任何系统，例如，catia。在这种情况下，定义建模对象的数据包括允许建模对象的表示的数据。例如，cad系统可以使用边或线(在某些情况下使用表面或面)来提供cad建模对象的表示。可以以诸如非均匀有理b样条(nurbs)的各种方式来表示线、边、或面。特别地，cad文件包含规格，根据规格可以生成几何结构，这进而允许生成表示。建模对象的规格可以存储在单个cad文件或多个cad文件中。表示cad系统中的建模对象的文件的典型大小在每个零件一兆字节的范围内。并且建模对象典型地可以是成千上万个零件构成的组装件。

在cad的上下文中，建模对象典型地可以是3d建模对象，例如，表示诸如零件或零件构成的组装件的产品，或者可能是产品构成的组装件。“3d建模对象”表示由允许其3d表示的数据建模的任何对象。3d表示允许从所有角度来查看该零件。例如，当对3d建模对象进行3d表示时，可以围绕其轴中的任一个轴或围绕显示该表示的屏幕中的任何轴来对3d建模对象进行处理并转动。这显著地排除了非3d建模的2d图标。3d表示的显示有助于进行设计(即，提高了设计人员统计地完成其任务的速度)。因为产品的设计是制造过程的一部分，所以这加速了工业中的制造过程。

3d建模对象可以表示以下产品的几何结构，该产品在利用例如cad软件解决方案或cad系统完成其虚拟设计之后将在现实世界中进行制造：例如，(例如，机械的)零件或零件构成的组装件(或者等同地，零件构成的组装件，因为零件构成的组装件从该方法的观点可以看作零件本身，或者该方法可以独立地应用于组装件中的每个零件)，或者更一般地任何刚性体组装件(例如，移动机构)。cad软件解决方案允许对各种且不受限制的工业领域中的产品进行设计，包括：航空航天、建筑、建造、消费品、高科技设备、工业装备、运输、船舶、和/或海上石油/天然气生产或运输。因此，通过该方法设计的3d建模对象可以表示可以是任何机械零件的工业产品，例如，陆地交通工具的一部分(包括例如汽车和轻型卡车装备、赛车、摩托车、卡车和电机装备、卡车和公共汽车、火车)、航空交通工具的一部分(包括例如机身装备、航空航天装备、推进装备、国防产品、飞机装备、空间装备)、航海交通工具的一部分(包括航海装备、商船、近海装备、游艇和工作船、船舶装备)、一般机械零件(包括例如工业制造机械、重型移动机械或装备、安装装备、工业装备产品、制造金属产品、轮胎制品等)、机电或电子零件(包括例如消费电子、安全和/或控制和/或仪表化产品、计算和通信装备、半导体、医疗设备和装备)、消费品(包括例如家具、家居和园艺产品、休闲用品、时尚产品、硬商品零售商的产品、软商品零售商的产品)、包装(包括例如食品和饮料和烟草、美容和个人护理、家用产品包装)。

在设计物理系统的模型时，设计中进行的选择会影响产品的寿命中的缺陷。例如，零件材料的选择可能改变从长远来看零件的性质以及零件可能表现不正常的条件。在调查特定事故时可以使用本发明，以识别与事故发生相关的这种设计选择。在识别出这样的相关设计选择之后，可以散布通知(例如，在产品生命周期管理系统上)以防止这种选择在产品的未来版本中再次发生或立即发生。这种通知在计算机辅助设计应用中可以是自动化的。例如，可以将新任务自动添加到计算机辅助设计软件中的待办事项列表中。点击任务可以切换计算机辅助设计软件的上下文，以允许设计者进行相关更改。识别在类似情况下发生的过去事故的数量(例如，对于共享相似特性的产品)可以揭示使事件发生的几率最小化的变量的值。例如，当选择材料a、b或c时比较缺陷产品的比率将有助于在三个选项之间进行选择。对于根据本发明识别为大量事故或特别严重事故的特性的每个变量，可以在设计应用中自动触发警报。因此，可以在设计者针对该变量选择值之前提供警报，以通知设计者他们将要采取的决策是至关重要的，并且允许他们检查过去该决策对产品的影响，或者在设计者针对该变量选择值之后提供警报，以通知设计者他们已经做出的决策可能在将来会导致事故，因为该决策在过去的类似情况下确实导致事故(具有类似其他特性的产品，并且针对其选择相同的值)。因此，本发明减少了开发和执行计算机辅助设计软件所必要的开销，以便通过现场数据分析对其进行增强，而不是不知道哪个设计决策重要的解决方案，即，分析现场数据对设计决策很重要。有趣的是，本发明对开发的影响非常有限，因为仅需要有限数量的对cad软件的修改来将使用上下文链接到事故数据中的变量。这些修改仅需要在与设置被识别为重要的变量的值相关联的使用上下文中进行。这些修改成本很高，特别是随着软件的发展和使用上下文的改变，需要相应地改变将上下文映射到重要变量的规则。另外，本发明对执行影响很小，因为作为结果将仅执行有限数量的分析，即，仅针对链接到重要变量的使用上下文触发分析，从而限制对设计者的扰乱。跳过不重要的分析可以在完成设计动作时以及在继续进行下一动作之前导致更低的延迟，因此为设计者提供更流畅的体验。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：X·格勒昂
技术所有人：达索系统公司
我是此专利的发明人

上一篇：斗式提升机用尾轮的制作方法
上一篇：一种安全可靠的燃气监测仪质量检测设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。