式特征,将数据序列映射到Ξ维特征空间,Ξ种模式特征的定义如下:
[0076] 设fi是压缩序列Y-个ETE0模式,定义fi模式的特征长度以、斜率Ki和均值Mi为:
[0077]
^6)
[007引进一步,为了获得fi模式的特征值序列C(f ) = ki,C2,···,(3丫},其中Ci=(li,ki,mi) 表示模式fi的特征。由于fi模式特征的长度、斜率、均值值域不同,将Ξ种特征值采用极差归 一化方法线性映射到区间[0,1 ],进行规范化处理公式分别为:
[0079]
[0080] 利用模式特征Cl和欧氏距离来度量两个不同模式之间的距离,定义C(f)中任意两 个模式Ci和Cj的模式距离disUci,Cj)为:
[0081 ]
(8)
[0082] 给定k£N+(正整数集),定义模式fi的本地可到达密度Irdk(fi)为:
[0083]
(9)
[0084] 其中,Nk(fi)表示与模式fi的距离不大于k_dist(fi)的所有模式集合,称为模式fi 的k距离最近邻,|Nk(fi) I表示集合中的模式个数,对任模式fi的k距离定义为离fi最近邻的 第k个模式的距离,其计算公式为:
[00 化]k_dist(fi) = dist(^ci, Cj) (10)
[0086]由于可能有多个模式与模式fi的距离等于k_dist(fi),因此k_dist(fi)应同时满 足W下条件:
[0087] 1)至少有k个模式fj,且j辛i,满足disUci,Cj) <k_dist(fi);
[008 引 2)至多有 k-1 个模式 fj,且 j辛 i,满足 disUci,Cj)<k_dist(fi);
[0089] rd(ci,cj)称为模式Cl相对于C北勺可到达距离,其计算公式为:
[0090] rd(Ci,Cj)=max(k_dist(Cj) ,dist(ci,cj)) (11)
[0091] 本地可到达密度Irdk化读达了模式fi的邻域密度分布,给定kEN%定义模式fi的 本地异常因子LOFk(fi)为: 目
(12)
[0093] fi模式的本地异常因子LOFk(fi)表示了模式异常程度,异常因子越大,该模式越偏 离模式聚簇中屯、,与其他模式差异越大,当异常因子超过某一给定值时,认为该模式异常, 无线传感网判定该模式对应的序列区间存在异常事件。
[0094] 采用局部异常因子LOFk(fi)进行异常检测的计算量由Ξ部分构成:(1)计算模式距 离为〇( 丫 2),(2)计算模式局部可达密度Irdk(fi)为〇( 丫 k),其中k为邻域内的模式个数且k < 丫,(3)计算局部异常因子LOFk(fi)也为〇( 丫 k),则异常检测的总计算量近似为〇( 丫 2)。由 于丫 < <m< <n,因此,该方法极大地减小无线传感网异常检测的计算复杂度。
[00M]根据W上相关定义和理论分析,本发明提出一种基于二次混合压缩的无线传感网 监控异常事件的快速检测方法。该方法首先利用压缩感知技术将无线传感网采集的原始数 据进行降维,再利用分段线性拟合方法对降维后的序列进行第二次压缩,获得分段线性拟 合误差最小的分段点,用运些分段点的直线段来线性拟合序列,再采用局部异常因子进行 异常检测,W模式的本地异常因子来表征二次混合压缩数据序列的异常程度,而不是直接 在原始数据序列上对单个数据点进行异常检测。
[0096] 在本发明的另一个实施例中,输入为设置无线传感网节点检测滑动窗口长度,输 出为无线传感网报告监测区域是否有异常事件,该方法的具体步骤为:
[0097] 步骤一:利用压缩感知技术对滑动窗口内采集的原始数据序列XERD进行第一次 压缩,获得压缩序列γ= ΦφΤχ,(Yer);
[0098] 步骤二:利用分段线性拟合方法对压缩序列Υ进行第二次压缩,计算Υ中每个数据 点扩展时态边缘算子ΕΤΕ0( t,W) i;
[0099] 步骤Ξ:计算压缩序列Υ中每个数据点边缘幅度ei和边缘强度Ri;
[0100] 步骤四:选择检测窗口W内的边缘强度Ri的极值点作为边缘点,加入到边缘点序列 Cy;
[0101] 步骤五:在边缘点序列Cy中选取插值误差较小N个边缘点,构成新的边缘点序列 矿
[0102] 步骤六:利用边缘点序列Cf将压缩序列Y分段线性表示为化,由化中所有fi组成模 式集;
[0103] 步骤屯:计算模式集中fi模式的特征长度、斜率和均值,并进行规范化处理,获得 特征值序列:c(f) = ki,C2,···,Cy };
[0104] 步骤八:计算C(f)中任意两个模式Cl和Cj的模式距离disUci,Cj);
[0105] 步骤九:计算模式fi的本地可到达密度Irdk(fi);
[0106] 步骤十:计算模式fi的本地异常因子LOFk(fi);
[0107] 步骤十一:无线传感网节点根据二次混合压缩后的本地异常因子大小在对应的时 间序列区间进行事件检测。
[0108] 通过实验验证,实验中采用公开的合成数据集Ma_Da化由W下过程产生:
[0112] 其中,t=l,2,…,n,n=1200,n(t)是均值为0,标准差为0.1加性高斯噪声,ei(t)、 e2(t)是两个异常事件,ei(t)定义如下:
[0113]
[0114] ni(t)符合正态分布N(0,0.5),e2(t)定义如下:
[0115]
[0116] 由W上定义可知,数据序列Xi(t)是周期为60的正常序列,X2(t)是在Xi(t)中添加 了异常ei(t),X3(t)是在X2(t)中添加了异常e2(t),在区间[600,620]、[820,870]改变了序 列的性质,运两个区间存在异常事件。
[0117] 如图2和图3所示,为了评价本发明的性能进行对比实验,图2只采用分段线性拟合 压缩方法检测X3(t)的本地异常因子,图3采用压缩感知与分段线性拟合二次混合压缩方法 检测X3(t)的本地异常因子。
[0118] 在图2和图3中,上半部分曲线表示Ma_Data数据集上的序列X3(t),下半部分曲线 表示对应数据序列的异常因子。图2中区间[600,620]之间的异常因子明显高于其他区间, 准确检测出异常事件ei(t);区间[800,870]的异常因子也较大,同时也准确发现异常事件Θ2 (t)。
[0119] 图3中X3(t)首先经过压缩感知技术进行第一次压缩,滑动窗口长度设为30,获得 压缩序列Y长度为10,再利用分段线性拟合进行第二次压缩后,图3序列区间长度与图2相比 缩小3倍,局部异常因子在数据点200和275附近区间都比其它区间大,与图2相比不仅准确 发现异常事件ei(t),同时也准确发现异常事件e2(t),并且检测出异常事件e2(t)的局部异 常因子相比图2对比更加明显。实验结果证明经过二次混合压缩后,极大地减小了捜索异常 数据的空间范围,聚焦并突出了异常数据的位置。
[0120] 综上所述,本发明提出了一种基于二次混合压缩的无线传感网监控异常事件的快 速检测方法。该方法首先利用压缩感知技术将无线传感网采集的原始数据进行降维,再利 用分段线性拟合方法对降维后的序列进行第二次压缩,获得分段线性拟合误差最小的分段 点,用运些分段点的直线段来线性拟合序列,再采用局部异常因子进行异常检测,将异常检 测的计算量从〇(n2))减小到0( 丫 2),提高了节点捜索效率和准确定位异常数据的能力。实验 结果表明,与直接在原始数据空间进行异常检测相比,更能够高效快速的发现异常事件。
[0121] 如图4