本申请涉及通信,尤其涉及一种异常检测方法、设备及计算机可读存储介质。
背景技术:
1、目前,智能运维的异常检测方法一般可以分为三种,分别为有监督、无监督和半监督,其中半监督异常检测方法只需要对样本进行部分标记,可以利用分类器为没有标签的样本赋予伪标签,其准确度高于无监督方法,需要的标注量少于有监督方法,但是,在半监督异常检测方法中,当初始的标定量较少时,训练得到的初始模型性能较差,可能生成大量错误的伪标签,出现恶性循环,导致检测结果的准确率较低。
技术实现思路
1、本申请的目的在于至少解决现有技术中存在的技术问题之一,提供一种异常检测方法、设备及计算机可读存储介质,能够降低分类器在自训练过程中进行错误迭代的风险,在标定量较少的情况下,也能够达到较高的准确率。
2、第一方面,本申请实施例提供一种异常检测方法,所述方法包括:每隔预设时间间隔采集运行数据,得到原始时间序列,并获取历史运行数据,基于所述原始时间序列和所述历史运行数据,构建样本集,所述样本集中的样本具有n个维度;对所述样本进行特征提取,得到包括n个维度特征的样本特征,并按照预设比例对所述样本特征进行标记;基于已标记的所述样本特征生成m个分类器并基于未标记的所述样本特征训练所述分类器;集成m个完成训练的所述分类器,得到异常检测模型以进行异常检测;其中n,m均为正整数且n>1,m>1。
3、第二方面,本申请实施例提供一种设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行本申请第一方面实施例提供的异常检测方法。
4、第三方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行本申请第一方面实施例提供的异常检测方法。
5、本申请提供的实施例包括:异常检测方法、设备和计算机可读存储介质,根据本申请实施例提供的方案,对于按照一定的周期规律运行的设备或者系统,可以采集运行数据得到原始时间序列,基于原始时间序列和历史运行数据构建样本集,样本集中的样本具有n个维度,对样本进行特征提取,得到样本特征,每个样本特征包括n个维度特征,按照预设比例对样本特征进行标记,基于已标记的所述样本特征生成m个分类器并基于未标记的所述样本特征训练所述分类器,集成m个完成训练的分类器,得到异常检测模型,基于该异常检测模型,进行异常检测,其中n,m均为正整数且n>1,m>1;样本有多个维度,能够在一定程度上减少未标记的样本被赋予错误的伪标签的可能,从而降低分类器在自训练过程中进行错误迭代的风险,在初始的标定量较少的情况下,也能够保证异常检测模型的性能,达到较高的异常检测的准确率。
1.一种异常检测方法,所述方法包括:
2.根据权利要求1所述的异常检测方法,其特征在于,所述基于所述原始时间序列和所述历史运行数据,构建样本集,包括:
3.根据权利要求2所述的异常检测方法,其特征在于,预设有时间窗口,所述对所述原始时间序列和n个所述偏移序列进行样本构建操作,得到所述样本集,包括:
4.根据权利要求3所述的异常检测方法,其特征在于,所述对所述样本进行特征提取,得到包括n个维度特征的样本特征,包括:
5.根据权利要求1所述的异常检测方法,其特征在于,所述基于已标记的所述样本特征生成m个分类器并基于未标记的所述样本特征训练所述分类器,包括:
6.根据权利要求5所述的异常检测方法,其特征在于,所述根据所述分类结果更新所述分类器的训练集,包括:
7.根据权利要求6所述的异常检测方法,其特征在于,所述分类结果包括正标签和负标签;所述根据所述样本特征对应的n*m个分类结果,对所述样本特征进行伪标记,得到所述样本特征的伪标签,包括:
8.根据权利要求7所述的异常检测方法,其特征在于,所述根据所述样本特征对应的n*m个分类结果,对所述样本特征进行伪标记,得到所述样本特征的伪标签,还包括:
9.根据权利要求3所述的异常检测方法,其特征在于,所述方法还包括:
10.根据权利要求4所述的异常检测方法,其特征在于,所述第一特征包括第一统计域特征、谱域特征和时域特征;所述第二特征包括第二统计域特征和差异特征。
11.一种设备,其特征在于,包括至少一个控制处理器和用于与至少一个所述控制处理器通信连接的存储器;所述存储器存储有可被至少一个所述控制处理器执行的指令,指令被至少一个所述控制处理器执行,以使至少一个所述控制处理器能够执行如权利要求1至10任一项所述的异常检测方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至10任一项所述的异常检测方法。