基于单类对比学习时序异常检测方法及相关装置

文档序号:30299359发布日期:2022-06-04 21:23阅读:296来源:国知局
基于单类对比学习时序异常检测方法及相关装置

1.本技术涉及故障诊断领域,具体而言,涉及一种基于单类对比学习时序异常检测方法及相关装置。


背景技术:

2.随着传感技术与物联网的快速发展,工业设备可采集到大量无健康状态标签的时序数据,而基于时序数据无监督深度学习实现工业设备的异常检测逐渐受到越来越多的关注。其中,相关技术中提出了基于正态表征的异常检测方法。
3.所谓基于正态表征的异常检测方法,建立在时序数据满足正太假设的基础上,相关方法包括自编码器、生成对抗网络、单类(one-class)方法以及对比学习(contrastive learning)。一些研究发现,将上述基于正态性假设方法进行组合可以从数据中学习更具表现力的表征,从而能够提升异常检测的准确率;但目前的结合方式多采用两阶段方式,该方式缺乏方法之间的结合深度,难以克服方法之间的冲突,并且未对时序数据的时序依赖信息进行分析。


技术实现要素:

4.为了克服现有技术中的至少一个不足,本技术提供一种基于单类对比学习时序异常检测方法及相关装置,用于在异常检测时考虑了时序数据的时序依赖信息的同时,并增强基于正态性假设方法之间的结合深度,从而提升对设备进行异常检测时的精度。
5.第一方面,本实施例提供一种基于单类对比学习时序异常检测方法,所述方法包括:获取目标设备的待检测序列,其中,所述待检测序列通过对所述目标设备的目标状态信息进行采样获得;将所述待检测序列采用不同的方式进行增强处理,获得第一序列以及第二序列;根据所述第一序列以及所述第二序列,获得至少一组特征对,其中,每组特征对包括第一特征向量以及第二特征向量,所述第一特征向量提取自所述第一序列中的第一序列片段,所述第二特征向量提取自所述第二序列中的第二序列片段,所述第一序列片段与所述第二序列片段分别截取自相同的片段位置;针对每组所述特征对,将所述特征对中的第一特征向量以及第二特征向量分别输入故障检测模型的第一自编码器以及第二自编码器,获得所述第一特征向量的第一重构向量以及所述第二特征向量的第二重构向量,其中,所述故障检测模型基于对比学习原理构建;根据所述第一特征向量、所述第二特征向量、所述第一重构向量以及所述第二重构向量与单类中心之间的相似度,获得所述特征对的目标异常得分;若全部所述特征对的目标异常得分满足预设异常条件,则确定所述目标设备发生异常。
6.第二方面,本实施例提供一种基于单类对比学习时序异常检测装置,所述基于单类对比学习时序异常检测装置包括:特征提取模块,用于获取目标设备的待检测序列,其中,所述待检测序列通过对所述目标设备的目标状态信息进行采样获得;所述特征提取模块,还用于将所述待检测序列采用不同的方式进行增强处理,获得第一序列以及第二序列;所述特征提取模块,还用于根据所述第一序列以及所述第二序列,获得至少一组特征对,其中,每组特征对包括第一特征向量以及第二特征向量,所述第一特征向量提取自所述第一序列中的第一序列片段,所述第二特征向量提取自所述第二序列中的第二序列片段,所述第一序列片段与所述第二序列片段分别截取自相同的片段位置;所述特征提取模块,还用于针对每组所述特征对,将所述特征对中的第一特征向量以及第二特征向量分别输入故障检测模型的第一自编码器以及第二自编码器,获得所述第一特征向量的第一重构向量以及所述第二特征向量的第二重构向量,其中,所述故障检测模型基于对比学习原理构建;异常检测模块,用于根据所述第一特征向量、所述第二特征向量、所述第一重构向量以及所述第二重构向量与单类中心之间的相似度,获得所述特征对的目标异常得分;所述异常检测模块,还用于若全部所述特征对的目标异常得分满足预设异常条件,则确定所述目标设备发生异常。
7.第三方面,本实施提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现所述的基于单类对比学习时序异常检测方法。
8.第四方面,本实施例还提供一种电子设备,所述电子设备包括处理器以及存储器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述的基于单类对比学习时序异常检测方法。
9.第五方面,本实施例提供一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现所述的基于单类对比学习时序异常检测方法。
10.相对于现有技术而言,本技术具有以下有益效果:本实施例提供的一种基于单类对比学习时序异常检测方法及相关装置中,通过将目标设备的待检测序列以对比学习的方式经第一自编码以及第二自编码器进行处理;然后,根据第一自编码器以及第二自编码器输入以及输出的特征向量计算与单类中心之间的相似度;最后,根据计算出的相似度获得相应的目标异常得分,用于判断目标设备是否发生异常。由此,不仅增强了单类方法与对比学习之间的结合深度,而且通过自编码器提取了待检序列中的时序依赖信息,从而提升对目标设备进行异常检测时的精度。
附图说明
11.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
12.图1为本技术实施例提供的对比学习原理示意图;图2为本技术实施例提供的单类方法原理示意图;图3为本技术实施例提供的电子设备结构示意图;图4为本技术实施例提供的基于单类对比学习时序异常检测方法流程示意图;图5为本技术实施例提供的异常检测模型结构示意图;图6为本技术实施例提供的待训练模型训练原理示意图;图7为本技术实施例提供的损失函数构造原理示意图;图8为本技术实施例提供的基于单类对比学习时序异常检测装置结构示意图。
13.图标:120-存储器;130-处理器;140-通信单元;201-特征提取模块;202-异常检测模块。
具体实施方式
14.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
15.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
16.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
17.在本技术的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。此外,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
18.研究发现,将基于正态性假设方法进行组合可以从数据中学习更具表现力的表征;相关方法包括自编码器、生成对抗网络、单类(one-class)方法以及对比学习(contrastive learning)。其中,在以上4中方法在进行异常检测时,分别依据以下正态性假设:自编码器:方法假设正常样本的重构效果好于异常样本。
19.生成对抗网络:假设正常样本更易于从生成器中生成。
20.单类方法:假设全部的正常样本来源于同一个抽象类。
21.对比学习:假设正常样本的增强样本之间具有最大的互信息。
22.然而,目前的结合方式多是采用两阶段方式进行结合,存在方法之间结合程度较低的问题,从而难以克服方法之间所存在的冲突。下面以对比学习与单类方法为例,对两阶段方式进行示例性说明:
采用两阶段方法将两者进行结合时,首先基于对比学习获得时序数据的特征向量,再利用单类方法对时序数据的特征向量做进一步的分类。然而,该结合方式中,仅仅是将对比学习方法的输出结果作为单类方法的输入,两者之间并未进行有深度的融合,难以克服两者之间天然存在的冲突。应理解的是,两者之间天然存在冲突由两者算法原理的性质决定,具体表现为两者对特征向量的处理方式不同:对比学习:对比学习具有两个关键特性,分别是对齐性以及均匀性:1、对齐性,相似样本具有相似的特征向量,映射到超球面上表现为将代表正样本的点尽可能拉近。
23.2、均匀性,规整后的特征向量尽可能地保持更多的信息,表现为超球面上的特征向量均匀分布,即推远负样本。
24.如图1所示,假定样本空间包括小猫、小狗以及人脸三种分类对象,通过对比学习的方式,将所有小猫的特征向量在超球面尽可能拉近,同理,将所有小狗的特征向量在超平面尽可能的拉近以及将所有人脸的特征向量在超平面上尽可能的拉近。若将所有小猫的特征向量在超球面上的分布区域视为一个点、所有小狗的特征向量在超球面上的分布区域视为一个点,以及将所有人脸的特征向量在超球面上的分布区域视为一个点,该对比学习所具有的均匀性会将这3个点均匀的分布在超求面上。其中,该示例中的小狗、小猫以及人脸的分布效果可以参见图1。
25.单类方法:该方法主要面向样本类别不平衡的场景,即绝大多数样本为正样本的情况,通过建立超球体去尽量包含全部样本,并以该超球面为边界划分异常。
26.如图2所示,假定将所有正样本表示为实心点,负样本表示为空心点,其中,正样本的数量远远大于负样本的数量;并且,为便于描述,假定所有正样本以及负样本均分布在平面空间。通过单类方法需要确定出一条边界线,使得尽可能让所有的正样本落在该边界线以内;在进行异常检测时,若特征向量的对应的特征点未落在边界以内,则认为存在异常。
27.由此可见,单类方法需要建立超球体去尽量包含正样本的特点显然与对比学习的均匀性特性之间存在冲突,因此,两阶段的结合方法组合得到的结果还有具有一定的优化空间。
28.基于上述技术问题的发现,发明人经过创造性劳动提出下述技术方案以解决或者改善上述问题。需要注意的是,以上现有技术中的方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本技术实施例针对上述问题所提出的解决方案,都应该是发明人在发明创造过程中对本技术做出的贡献,而不应当理解为本领域技术人员所公知的技术内容。
29.因此,本实施例提供一种应用于异常检测设备的基于单类对比学习时序异常检测方法。该方法中,通过将目标设备的待检测序列以对比学习的方式经第一自编码以及第二自编码器进行处理;然后,根据第一自编码器以及第二自编码器输入以及输出的特征向量计算与单类中心之间的相似度;最后,根据计算出的相似度获得相应的目标异常得分,用于判断目标设备是否发生异常。由此,不仅增强了单类方法与对比学习之间的结合深度,而且通过自编码器提取了待检序列中的时序依赖信息,从而提升对目标设备进行异常检测时的
精度。
30.其中,该目标设备的类型可以包括工业设备、家电设备、医用设备等;例如,工业机器人、洗衣机、电冰箱、ct机等。相应的目标状态信息则可以包括目标设备工作时的电流、电压、电机转速等。
31.另外,在一些实施方式中,该异常检测设备与用于训练异常检测模型的训练设备可以是相同的电子设备;其他实施方式中,则可以是不同的电子设备。例如,该异常检测设备可以是该服务器或者用户终端;该模型训练设备同样可以是服务器或者用户终端,只要能够在模型训练期间提供足够的算力即可。
32.其中,该服务器可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器可以是分布式系统)。在一些实施例中,服务器相对于用户终端,可以是本地的、也可以是远程的。在一些实施例中,服务器可以在云平台上实现;仅作为示例,云平台可以包括私有云、公有云、混合云、社区云(community cloud)、分布式云、跨云(inter-cloud)、多云(multi-cloud)等,或者它们的任意组合。在一些实施例中,服务器可以在具有一个或多个组件的电子设备上实现。
33.该用户终端可以是,但不限于,移动终端、台式计算机、平板计算机、膝上型计算机等,或其任意组合。在一些实施例中,移动终端可以包括智能家居设备、智能移动设备等,或其任意组合。在一些实施例中,智能家居设备可以包括智能照明设备、智能电器设备的控制设备、智能监控设备、智能电视、智能摄像机等,或其任意组合。在一些实施例中,智能移动设备可以包括智能手机、个人数字助理(personal digital assistant,pda)等,或其任意组合。
34.为使本技术实施例的目的、技术方案和优点更加清楚,请参照图3,本实施例还提供一种电子设备的结构示意图,其中,该电子设备可以是异常检测设备还可以是模型训练设备。如图3所示,该电子设备可以包括存储器120、处理器130、通信单元140。该存储器120、处理器130以及通信单元140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
35.其中,该存储器120可以是基于任何电子、磁性、光学或其它物理原理的信息记录装置,用于记录执行指令、数据等。在一些实施方式中,该存储器120可以是,但不限于,易失存储器、非易失性存储器、存储驱动器等。
36.在一些实施方式中,该易失存储器可以是随机存取存储器(random access memory,ram);在一些实施方式中,该非易失性存储器可以是只读存储器(read only memory,rom)、可编程只读存储器(programmable read-only memory,prom)、可擦除只读存储器(erasable programmable read-only memory,eprom)、电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)、闪存等;在一些实施方式中,该存储驱动器可以是磁盘驱动器、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合等。
37.该通信单元140用于通过网络收发数据。在一些实施方式中,该网络可以包括有线网络、无线网络、光纤网络、远程通信网络、内联网、因特网、局域网(local area network,lan)、广域网(wide area network,wan)、无线局域网(wireless local area networks,wlan)、城域网(metropolitan area network,man)、广域网(wide area network,wan)、公
共电话交换网(public switched telephone network,pstn)、蓝牙网络、zigbee网络、或近场通信(near field communication,nfc)网络等,或其任意组合。在一些实施例中,网络可以包括一个或多个网络接入点。例如,网络可以包括有线或无线网络接入点,例如基站和/或网络交换节点,服务请求处理系统的一个或多个组件可以通过该接入点连接到网络以交换数据和/或信息。
38.该处理器130可能是一种集成电路芯片,具有信号的处理能力,并且,该处理器可以包括一个或多个处理核(例如,单核处理器或多核处理器)。仅作为举例,上述处理器可以包括中央处理单元(central processing unit,cpu)、专用集成电路(application specific integrated circuit,asic)、专用指令集处理器(application specific instruction-set processor,asip)、图形处理单元(graphics processing unit,gpu)、物理处理单元(physics processing unit,ppu)、数字信号处理器 (digital signal processor,dsp)、现场可编程门阵列(field programmable gate array,fpga)、可编程逻辑器件(programmable logic device,pld)、控制器、微控制器单元、简化指令集计算机(reduced instruction set computing,risc)、或微处理器等,或其任意组合。
39.基于以上相关介绍,下面结合图4对本实施例提供的时序数据检测方法的各步骤进行详细阐述。但应该理解的是,本实施例中流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本技术内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。如图4所示,该方法包括:s104,获取目标设备的待检测序列。
40.其中,待检测序列通过对目标设备的目标状态信息进行采样获得。例如,该待检测序列可以是工业机器人工作期间周期性采集的电流序列、电压序列或者电机转速序列。
41.s105,将待检测序列采用不同的方式进行增强处理,获得第一序列以及第二序列。
42.由于本实施例需要将对比学习与单类学习进行结合,而在对待检测序列进行特征处理时采用了对比学习的方式。而应理解的是,在对比学习中,需要将同一待检测数据分别采用不同的方式进行增强处理,获得两份源自于同一待检测数据的增强数据;然后,两份增强数据分别输入两条具有相同网络结构的分支进行处理,将处理后的输出结果进行比较;因此,本实施例中,需要将待检测序列采用不同的方式进行增强处理,获得增强后的第一序列以及第二序列。
43.其中,用于增强处理方式可以包括缩放、抖动、卷积、反转和合并等方式,相关技术人员可以根据实际实施场景的需要进行适应性选择,本实施例不做具体的限定。
44.s106,根据第一序列以及第二序列,获得至少一组特征对。
45.其中,每组特征对包括第一特征向量以及第二特征向量,第一特征向量提取自第一序列中的第一序列片段,第二特征向量提取自第二序列中的第二序列片段,第一序列片段与第二序列片段分别截取自相同的片段位置。
46.可选地实施方式中,该异常检测模型还包括第一特征提取层以及第二特征提取层,用于生成对应的第一特征向量以及第二特征向量。具体实施方式中,异常检测设备可以根据第一序列以及第二序列,从中截取至少一组片段对,其中,每组片段对包括截取自相同片段位置的第一序列片段以及第二序列片段。
47.然后,该异常检测设备将至少一组片段对中的全部的第一序列片段以及全部的第二序列片段分别输入第一特征提取层以及第二特征提取层,获得每个第一序列片段的第一特征向量以及每个第二序列片段的第二特征向量;最后,将每组片段对相对应的第一特征向量以及第二特征向量,作为一组特征对。
48.示例性的,假定第一序列以及第二序列分别是工业机器人工作期间周期性采集的电流序列,经增强处理得到的第一电流序列以及第二电流序列。该异常检测设备可以分别采用相同的滑动窗口对第一电流序列以及第二电流序列进行截取。若第一电流序列截取出10个第一序列片段,第二电流序列同样截取出10个第二序列片段;分别将10个第一序列片段以及10个第二序列片段按照截取片段时的先后顺序进行排序,则第1个第一序列片段与第1个第二序列片段可以组成一个片段对,第2个第一序列片段与第2个第二序列片段可以组成一个片段都,以此类推可以获得10个片段对。
49.然后,该异常检测设备将10个第一序列片段输入到第一特征提取层,获得10个第一序列片段各自对应的第一特征向量;将10个第二序列片段输入到第二特征提取层,获得10个第二序列片段各自对应的第二特征向量然后,按照片段对中序列片段之间的对应关系,将特征向量进行组合可以获得10组特征对。
50.s107,将至少一组特征对中全部的第一特征向量以及全部的第二特征向量分别输入故障检测模型的第一自编码器以及第二自编码器,获得每个第一特征向量的第一重构向量以及每个第二特征向量的第二重构向量。
51.其中,由于该故障检测模型基于对比学习原理构建,因此,该故障检测模型包括两条具有相同网络结构的对比分支;并且,本实施例中为了捕获待检测序列中的上下文信息,该故障检测模型的两条分支分别采用了自编码器结构。应理解的是,自编码器是一类在半监督学习和非监督学习中使用的人工神经网络(artificial neural networks, anns),包括编码器(encoder)和解码器(decoder)两部分,其功能是通过将输入信息作为学习目标,对输入信息进行重构。
52.s108,分别根据每组特征对的第一特征向量、第二特征向量、第一重构向量以及第二重构向量与单类中心之间的相似度,获得每组特征对的目标异常得分。
53.为了在计算目标异常得分时,在自编码器的基础上将第一自编码器与第二自编码器这两条分支的输出结果进行相互对比,步骤s105可以包括以下实施方式:s108-1,针对每组特征对,根据特征对的第一特征向量、第一重构向量以及第二特征向量与单类中心之间的相似度,获得特征对的第一异常得分。
54.其中,该相似度可以是余弦相似度,因此,第一异常得分的计算方式为:s108-2,根据特征对的第二特征向量、第二重构向量以及第一特征向量与单类中心之间的相似度,获得特征对的第二异常得分。
55.与第一异常得分相似,第二异常得分的计算方式为:
以上两表达式中,表示第一特征向量,表示第一重构向量,表示第二特征向量,表示经样本序列确定出的单类中心,具体为模型训练过程中所有样本特征向量的均值, 表示第二特征向量,表示第二重构向量,表示第一特征向量,表示进行余弦相似度计算。
56.另外,在进行余弦相似度计算时,为便于衡量特征向量与单类中心之间的相似程度,可以将每组特征对的第一特征向量、第二特征向量、第一重构向量以及第二重构向量进行归一化处理,全部映射到单位超求面上。
57.本实施例中,还可以将第一特征向量的归一化结果表示为,将第二特征向量的归一化结果表示为,将第一重构向量的归一化结果表示为,将第二重构向量的归一化结果表示为;将单类中心的归一化结果表示为。因此,第一异常得分的计算方式为则可以表示为:第二异常得分的计算方式则可以表示为:s108-3,从第一异常得分以及第二异常得分中选取最大的异常得分,作为特征对的目标异常得分。
58.s109,若全部特征对的目标异常得分满足预设异常条件,则确定目标设备发生异常。
59.一些实施实施方式中,若全部特征对的目标异常得分均大于得分阈值,则确定目标设备发生异常。
60.示例性的,继续以第一电流序列以及第二电流序列的10个特征对为例,通过以上实施方式可以获得10个特征对的目标异常得分;若这10个目标异常得分均大于得分阈值,则确定该目标设备发生了异常。
61.其他实施方式中,考虑到待检测序列可以是电流序列、电压序列或者转速序列,因此,存在量纲不一致的问题。并且,即便是相同的电流序列,但对于不同的目标设备而言,电流值的大小同样存在差异。因此,为了克服异常差可能引入的干扰,该异常检测设备根据全部特征对的目标异常得分,计算相应的均值以及标准差;然后,基于目标异常得分的均值以及标准差,通过以下计算方式将每组特征对的目标异常得分转换为标准异常得分:
式中,表示一目标异常得分,表示该目标异常得分对应的标准异常得分。
62.然后,该异常检测设备将每个标准异常得分与基于标准异常得分所确定的得分阈值进行比较,若全部的标准异常得分均大于该得分阈值,则确定目标设备发生异常。
63.为了使得本领域技术人员能够使用本技术内容,结合特定结构的异常检测模型,给出以下实施方式。对于本领域技术人员来说,在不脱离本技术的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。
64.如图5所示,将长度为的电流序列表示为,进行数据增强处理得到第一电流序列表示为和;然后,将两组电流序列的一组序列片段输入非线性的第一特征提取层,将其映射为多个第一特征向量;将另外一组序列片段输入第二特征提取层,将其映射为多个第二特征向量。本示例中,可以将多个第一特征向量表示为,将多个第二特征向量表示为,其中,表示一组特征对,表示另外一组特征对,以此类推可以获得其他特征对。
65.继续参见图5,该异常检测模型包括第一自编码器以及第二自编码器,用于作为对比学习中的两条对比分支;其中,第一自编码器用于对多个第一特征向量之间的时序依赖信息进行发掘,第二自编码器用于对多个第二特征向量之间的时序依赖信息进行发掘。因此,如图5所示,异常检测设备将多个第一特征向量输入到第一自编码器,获得全部第一特征向量的第一重构向量,其中,第一特征向量的第一重构向量为,表示第一自编码器的中间处理结果;将多个第二特征向量输入到第二自编码器,获得全部第二特征向量的第二重构向量,其中,第一特征向量的第一重构向量为,表示第二自编码器的中间处理结果。
66.最后,异常检测设备分别根据每组特征对的第一特征向量、第二特征向量、第一重构向量以及第二重构向量,按照以上实施例中异常得分的计算方式获得每组特征对的第一异常得分以及第二异常得分,从中选取最大的异常得分作为目标异常得分。
67.因此,通过以上实施方式,不仅增强了单类方法与对比学习之间的结合深度,而且通过自编码器提取了待检序列中的时序依赖信息,从而提升对目标设备进行异常检测时的精度。
68.由以上实施方式可知,本实施例需要将待检测序列的目标异常得分与得分阈值进行比较,才能确定目标设备是否发生异常,因此,得分阈值的选取对于异常检测检测的精度尤为重要。该基于单类对比学习时序异常检测方法还包括以下实施方式,用于确定该得分
阈值:s101,获取目标设备的基准序列。
69.其中,基准序列通过对目标设备在未发生异常时的目标状态信息进行采样获得。
70.s102,通过与获取待检测序列对应目标异常得分相同的方式,获得基准序列的多个基准得分。
71.s103,根据多个基准得分,从中确定出得分阈值。
72.其中,小于得分阈值的基准得分在多个基准得分中的数量占比与占比阈值最为接近。
73.示例性的,继续以图5所示的异常检测模型为例,该异常检测设备将目标设备在正常工作期间所采集的个电流序列,作为基准序列;并将该基准序列依次经增强处理、特征提取层、自编码器三个环节进行处理后,按照以上实施方式中异常得分的计算公式获得基准序列的多个基准得分。
74.发明人经过大量的统计发现,目标设备在正常工作期间所采集的个电流序列中,发生异常的概率为,因此,可以将作为筛选得分阈值的基准。
75.一些实施方式中,假定,异常检测设备从多个基准得分中选取一个未统计过的基准得分作为测试得分,然后,统计小于该测试得分的基准得分在多个基准得分中的数量占比;重复以上步骤可以得到多个比值。最后,该异常检测设备从多个比值中确定出与最为接近的目标比值,将目标比值对应基准得分作为得分阈值。
76.其他实施方式中,若考虑待检测序列可以是电流序列、电压序列或者转速序列,存在量纲不一致的问题;以及即便是相同的电流序列,但对于不同的目标设备而言,电流值的大小同样存在差异等问题。在确定得分阈值时,同样可以先计算多个基准得分的均值以及方差,然后,通过以下计算方式将每个基准得分转换为标准基准得分:式中,表示基准得分的均值,表示基准得分的标准差,表示基准得分,表示标准基准得分。
77.同样假定,异常检测设备从多个标准基准得分中选取一个未统计过的标准基准得分作为测试得分,然后,统计小于该测试得分的标准基准得分在多个标准基准得分中的数量占比;重复以上步骤可以得到多个比值。最后,该异常检测设备从多个比值中确定出与最为接近的目标比值,将目标比值对应的标准基准得分作为得分阈值。
78.另外,由于本案中的异常检测模型通过人工神经网络构建,因此,需要经过训练之后,才能用于对时序数据进行异常检测。因此,该基于单类对比学习时序异常检测方法还包括相应的模型训练方法,用于将待训练模型训练成异常检测模型,其中,该待训练模型与异常检测模型具有相同的模型结构。
79.如图6所示,模型训练设备获取样本序列;并采用不同的增强方式对样本序列进行
增强处理,转换为第一样本序列以及第二样本序列;然后,从第一样本序列以及第二样本序列中截取出多个样本序列对,其中,每个样本序列对中包括位于相同片段位置的第一样本序列片段以及第二样本序列片段。
80.进一步地,该异常检测设备将多个样本序列对中全部的第一样本序列片段输入待训练模型的第一特征提取层,获得为多个第一样本特征向量;以及将多个样本序列对中全部的第二样本序列片段输入待训练模型的第二特征提取层,获得多个第二样本特征向量。
81.继续参见图6,为了便于描述,本实施例将多个第一样本特征向量表示为,将多个第二样本特征向量表示为,其中,与组成一组样本特征对。
82.进一步地,该模型训练设备将多个第一样本特征向量输入到待训练模型的第一自编码器,获得各第一样本特征向量的第一样本重构向量;将多个第二样本特征向量输入到待训练模型的第二自编码器,获得各第二样本特征向量的第二样本重构向量。
83.继续参加图6,为了便于描述,本实施例将多个第一样本重构向量表示为,将多个第二样本重构向量表示为;其中,表示的重构向量;表示的重构向量,表示待训练模型的第一自编码器输出的中间处理结果;表示待训练模型的第二自编码器输出的中间处理结果。
84.针对每组样本特征对,该样本特征对的第一样本特征向量、第二样本特征向量、第一样本重构向量以及第二样本重构向量之间的关系如图7所示。图中,表示的归一化结果,表示的归一化结果;表示的归一化结果,表示的归一化结果;本实施例通过对第一样本特征向量、第二样本特征向量、第一样本重构向量以及第二样本重构向量进行归一化处理,将其映射到单位超球面上,其中,表示单位超球面的中心。
85.继续参见图7,将第一样本特征向量和第二样本特征向量之间的欧氏距离表示为,代表两者之间的对比学习误差,根据对比学习的正态假设,应当尽量缩短这一距离。
86.将与之间的欧式距离表示为,代表第一自编码器的重构误差;将与之间的欧式距离表示为,代表第二自编码器的重构误差。以为例,从图7可以看出正比于重构前后向量与之间的角度,根据自编码器的正态假设,
应当尽量缩短这一距离。
87.继续参见图7,将样本序列的单类中心经归一化之后的结果表示为,标记的圆圈表示以为中心的边界;将到之间的距离表示为,将到之间的距离表示为,根据单类方法的正态假设,应尽量缩短这一距离。
88.因此,通过以上分析,本实施例提供以下损失函数,用于计算待训练模型在训练期间的所产生的训练误差,并根据训练误差调整待训练模型的模型参数:待训练模型的模型参数:待训练模型的模型参数:式中,表示样本序列的数量,表示样本时间窗的数量,表示正则化参数,用于防止过拟合,表示模型的参数。
89.重复异常步骤对待训练模型的模型参数进行迭代调整,直到待训练模型的训练损失满足终止条件,则获得训练完成的异常检测模型。
90.基于与本实施例所提供基于单类对比学习时序异常检测方法相同的发明构思,本实施例还提供一种基于单类对比学习时序异常检测装置,基于单类对比学习时序异常检测装置包括至少一个可以软件形式存储于存储器120或固化在异常检测设备的操作系统(operating system,简称os)中的软件功能模块。异常检测设备中的处理器130用于执行存储器120中存储的可执行模块,例如基于单类对比学习时序异常检测装置所包括的软件功能模块及计算机程序等。请参照图8,从功能上划分,基于单类对比学习时序异常检测装置可以包括:特征提取模块201,用于获取目标设备的待检测序列,其中,待检测序列通过对目标设备的目标状态信息进行采样获得;特征提取模块201,还用于将待检测序列采用不同的方式进行增强处理,获得第一序列以及第二序列;特征提取模块201,还用于根据第一序列以及第二序列,获得至少一组特征对,其中,每组特征对包括第一特征向量以及第二特征向量,第一特征向量提取自第一序列中的第一序列片段,第二特征向量提取自第二序列中的第二序列片段,第一序列片段与第二序列片段分别截取自相同的片段位置;特征提取模块201,还用于将至少一组特征对中全部的第一特征向量以及全部的第二特征向量分别输入故障检测模型的第一自编码器以及第二自编码器,获得每个第一特征向量的第一重构向量以及每个第二特征向量的第二重构向量,其中,故障检测模型基于对比学习原理构建。
91.本实施例中,该特征提取模块201用于实现图4中的步骤s104-s107,关于该特征提取模块201的详细描述可以参见步骤s104-s107的详细描述。
92.异常检测模块202,用于分别根据每组特征对的第一特征向量、第二特征向量、第一重构向量以及第二重构向量与单类中心之间的相似度,获得每组特征对的目标异常得分;异常检测模块202,还用于若全部特征对的目标异常得分满足预设异常条件,则确定目标设备发生异常。
93.本实施例中,该异常检测模块202用于实现图4中的步骤s108-s109,关于该异常检测模块202的详细描述可以参见步骤s108-s109的详细描述。
94.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
95.还应理解的是,以上实施方式如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。
96.因此,本实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时,实现本实施例提供的基于单类对比学习时序异常检测方法。其中,该计算机可读存储介质可以是u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
97.本实施例提供的一种电子设备,该电子设备包括处理器130及存储器120。处理器130与存储器120可经由系统总线通信。并且,存储器120存储有计算机程序,处理器通过读取并执行存储器120中与以上实施方式对应的计算机程序,实现本实施例所提供的基于单类对比学习时序异常检测方法。
98.应该理解到的是,在上述实施方式中所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
99.以上所述,仅为本技术的各种实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1