基于伪标签的无监督重构网络异常检测方法及系统与流程

文档序号:38062691发布日期:2024-05-20 11:49阅读:18来源:国知局
基于伪标签的无监督重构网络异常检测方法及系统与流程

本发明属于基于重构方法的异常检测,具体涉及基于伪标签的无监督重构网络异常检测方法及系统。


背景技术:

1、异常检测在数据分析中具有重要意义,它有助于识别在大量数据中不寻常的模式,对于保障系统的安全性和性能至关重要。然而,传统的异常检测方法通常需要大量标记的正常样本和异常样本,这需要消耗大量的人力和时间成本。为解决这一问题,基于重构的异常检测方法应运而生。相较于其他异常检测方法,基于重构的异常检测方法仅通过学习正常样本的表征,然后通过重构效果来检测异常。因此基于传统的重构异常检测方法只需要正常样本,不需要异常样本数据,这大大节省了标定样本所需的成本,能够更好地面对现实场景中异常样本稀缺的条件。

2、然而,这种方法在实际应用中面临一些挑战,主要表现为仅利用正常样本数据训练的重构异常检测方法在真实测试情景下很难判断是否存在异常情况,出现这种问题的原因是出现的异常情况中存在着大量的正常特征,仅通过正常样本训练的重构网络也能很好的对异常情况中的正常部分进行重构,进而最终混淆异常检测的结果。并且在真实场景中,异常样本的表现可能十分多样且复杂,难以通过简单的重构过程准确捕捉。这导致基于重构的异常检测方法在实际应用中可能产生误报或漏报,降低了其在复杂环境下的可靠性。

3、对此,为了提高基于重构异常检测方法的性能,最新的基于重构异常检测方法在训练中混入了无标签异常样本。但是无监督训练情景下基于重构的异常检测方法很难区分没有标签的正常样本和异常样本,往往重构网络也会学习对异常样本的重构,降低最终的异常检测性能。

4、因此,设计一种能够在真实复杂的无监督训练情景下通过距离熵约束提供伪标签,令后续的重构网络利用伪标签对正常特征和异常特征进行不同反馈的重构,进而让基于重构的异常检测网络对二者正常特征和异常特征分别进行不同效果的学习,从而让重构网络能够良好的区分正常特征与异常特征,最终提高异常检测准确率的基于特征聚类的批量二次规划交通异常检测方法及系统,就显得十分重要。


技术实现思路

1、本发明是为了克服现有技术中,现有交通异常检测模型,因为异常数据稀疏且随机导致分类边界模糊不清,进而降低了模型交通异常检测精度的问题,提供了一种能够更好地适应交通数据的特殊性,缓解因为异常数据稀疏且随机导致的分类边界模糊不清的问题,提高交通异常检测的检测精度和鲁棒性的基于伪标签的无监督重构网络异常检测方法及系统。

2、为了达到上述发明目的,本发明采用以下技术方案:

3、基于伪标签的无监督重构网络异常检测方法,包括如下步骤;

4、s1,将交通异常视频数据转换为当前场景下的有标签图像数据;

5、s2,将有标签图像数据,按设定的混合比例制作成无标签的交通异常图像数据集,同时将无标签的交通异常图像数据集划分为训练集和测试集;

6、s3,构建深度学习网络,并利用骨干网络对无标签的输入图像进行特征提取,得到样本特征;

7、s4,通过距离约束对样本特征进行分类,根据分类结果赋予输入样本区分正常异常的伪标签;

8、s5,根据伪标签对图像特征进行基于vae网络的双反馈特征重构:

9、s6,计算图像特征重构的峰值信噪比psnr,并作为异常检测分数,实现图像级的异常检测;

10、s7,利用损失函数进行深度学习网络训练;

11、s8,利用测试集对深度学习网络模型性能进行测试并保留最优训练权重。

12、作为优选,步骤s1包括如下步骤:

13、s11,将现有场景下的交通异常视频中发生异常的视频片段裁剪出来作为异常序列时段,剩余的视频片段作为正常序列片段;

14、s12,对两个视频片段进行逐帧采样,并对截取的图像按照设定的比例进行缩放,将视频流数据采样成为图像数据集;所述图像数据集包括异常图像数据集和正常图像数据集。

15、作为优选,步骤s2包括如下步骤:

16、s21,将得到的有标签图像数据按照正常比异常10:1的比例混合得到最终的无标签总图像数据集;

17、s22,根据固定比例将总图像数据集分成训练数据集和测试数据集;其中,训练数据集中和测试数据集中正常样本和异常样本的比例是相同的。

18、作为优选,步骤s3中,所述深度学习网络的骨干网络部分由resnet18网络组成,用于对输入图像进行卷积特征提取操作,获得高层抽象语义特征;所述深度学习网络的头部网络部分包括一个距离约束伪标签判定结构和一个vae重构网络,用于对骨干网络提取的无标签特征向量,通过基于距离约束的分类功能将所述无标签特征向量打上伪标签,再通过vae重构网络分别对伪正常样本进行正反馈重构和对伪异常样本进行负反馈重构。

19、作为优选,步骤s4包括如下步骤:

20、s41,对骨干网络输出的样本特征进行基于距离的伪标签分类;假设特征分布在以c为球心,r为半径的超球体内,得到球心迭代更新的公式如下:

21、;

22、其中,是旧球心,是根据当前训练批次样本分布更新的新球心;i是每次迭代训练的样本总数,i是训练样本在当前训练批次的索引,a是球心迭代更新系数;球心迭代更新系数a随着深度学习网络学习轮数的增加有着不同的取值策略;

23、s42,对样本特征分布进行约束,具体公式如下所示:

24、;

25、;

26、其中,为设置的批次样本最大约束距离;为设定伪正常样本约束距离;为批次样本数据的平均距离;和均为损失系数,在实际应用中数值设置为1;表示距离约束;

27、s43,计算每一个输入的样本特征距离球心的距离r:

28、;

29、通过距离,对样本特征赋予伪标签,判决依据如下:

30、若,则对样本特征赋予正常伪标签,构成伪正常样本;代表着距离判决阈值,;

31、若,则对样本特征赋予异常伪标签,构成伪异常样本。

32、作为优选,步骤s5包括如下步骤:

33、s51,让所有样本特征x通过一个编码器得到中间隐变量z,隐变量z满足正态高斯分布:

34、;

35、和分别是描述隐变量z正态高斯分布的均值和方差;

36、s52,对隐变量z进行l次采样,通过辅助向量,对隐变量z进行线性变化,使得到的隐变量z在通过重参数技巧在深度学习网络中进行反向传播,具体公式如下:

37、;

38、其中,表示利用l个辅助向量对隐变量z进行l次采样的结果;表示点乘操作;

39、s53,用vae网络中的解码器对采样后的隐变量进行解码,完成对输入样本特征x的重构,得到重构样本特征,具体公式如下:

40、。

41、作为优选,步骤s6包括如下步骤:

42、s61,利用重构的峰值信噪比psnr作为重构异常检测分数,具体公式如下:

43、;

44、其中,为一张重构图像的像素总数,是每张重构图像像素的最大值,p是峰值信噪比;是每张重构图像像素的最大值,p是峰值信噪比;

45、s62,对测试视频中所有帧的峰值信噪比进行最小-最大归一化,即归一化到 [0,1] 范围内,具体如下所示:

46、;

47、q表示归一化之后的峰值信噪比数值;最终重构异常评分 为:

48、;

49、当越大,说明重构网络对特征重构的效果越差,异常可能性越大;最终设定异常判定策略如下:

50、若,则最终模型检测对应样本为正常图像,没有发生异常情况;

51、若,则说明对应样本重构效果差,发生了异常情况。

52、作为优选,步骤s7中,在不同步骤下设置不同的损失函数对深度学习网络的学习过程进行约束,从而进行训练,具体为:

53、在构建距离约束伪标签的环境中设置了基于分布的熵约束,所述熵约束损失函数为:

54、;

55、其中,为设定的熵函数值;表示训练每批次样本特征点离超球中心距离的信息熵;

56、对基于vae的重构网络进行了重构约束,设定重构网络目标损失函数为:

57、;

58、设定对标定为伪正常样本的mse重构损失为:

59、;

60、其中,表示伪正常样本的重构样本,表示伪正常样本;t、c、h、w 分别为输入检测序列的批次数、通道数、图片高大小、图片宽大小;

61、设定对标定为异常样本的mse重构损失为:

62、;

63、其中,表示伪异常重构的类;表示异常伪标签样本;

64、最终得到总的mse重构损失有和两部分构成,即:

65、;

66、设定总体损失函数为:

67、;

68、其中,,表示通过kl散度约束vae重构网络输入分布与重构分布的差异;j为隐变量z的维度,和分别为vae重构网络中隐变量z正态高斯分布的均值和方差。

69、本发明还提供了基于伪标签的无监督重构网络异常检测系统,包括:

70、数据转换模块,用于将交通异常视频数据转换为当前场景下的有标签图像数据;

71、数据制作模块,用于将有标签图像数据,按设定的混合比例制作成无标签的交通异常图像数据集,同时将无标签的交通异常图像数据集划分为训练集和测试集;

72、网络构建模块,用于构建深度学习网络,并利用骨干网络对无标签的输入图像进行特征提取,得到样本特征;

73、分类模块,用于通过距离约束对样本特征进行分类,根据分类结果赋予输入样本区分正常异常的伪标签;

74、特征重构模块,用于根据伪标签对图像特征进行基于vae网络的双反馈特征重构:

75、峰值信噪比计算模块,用于计算图像特征重构的峰值信噪比psnr,并作为异常检测分数,实现图像级的异常检测;

76、网络训练模块,用于利用损失函数进行深度学习网络训练;

77、测试模块,用于利用测试集对深度学习网络模型性能进行测试并保留最优训练权重。

78、本发明与现有技术相比,有益效果是:(1)本发明能够利用无标签的数据集进行无监督重构网络训练,利用最终的重构异常检测分数对测试的样本进行异常检测,无需繁琐的大量数据收集以及标注工作,能够快速适应新场景的检测工作;(2)与传统的无标签重构网络不同,本发明通过构建距离约束将图像特征限制在目标超球体范围内,并且依据距离约束后的样本分布对无标签数据打上伪标签,辅助后续的重构网络更好的区分正常特征和异常特征;(3)本发明利用一个双反馈重构网络,将伪标签判定正常的图像特征采取正反馈重构,让模型可以更好地重构正常的样本特征,对伪标签判定异常的图像特征本发明采取了负反馈重构,弱化模型对异常样本特征的重构效果;因此最终本发明采用重构峰值信噪比对图像异常点进行检测,可以实现对异常特征点的检测工作,利用上述操作提高最终异常检测的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1