基于二次混合压缩的无线传感网异常事件检测方法及系统的制作方法
【技术领域】
[0001] 本发明设及物联网技术领域,尤其设及一种基于二次混合压缩的无线传感网异常 事件检测方法及系统。
【背景技术】
[0002] 无线传感网(Wireless Sensor Networks,简称WSN)是未来网络发展的主流形式, 并已成为本世纪一个新科学研究领域。在基础理论和工程技术两个层面提出了许多急需解 决的问题。无线传感网成本低廉、低功耗、大规模自组网;传感器节点体积小巧、电池供电、 部署灵活;W及能够适应监测人力难W到达的恶劣环境;运些特点使得无线传感网极大地 提升了灾害预防的监控能力。为了及时监测各种可能发生的突发事件(如山体滑坡、大气污 染、森林火灾等),必须关注传感器节点采集到的异常测量值。因此,实时准确地检出异常数 据,并预警特定事件,具有十分重要的意义。
[0003] 无线传感网的异常事件检测技术概括起来主要分为两类:1)点异常检测方法。点 异常即如果传感数据超过设置的某个阔值,则认为事件发生。运种方法只适合小规模、短期 的单一事件监测任务。2)模式异常检测方法。在一些长期渐变环境监测中,突发性的复杂事 件往往很难由指定属性阔值的超限进行报警,不能用简单的阔值来描述,但可W看做一种 模式(事件模式),因可采用模式识别技术进行异常检测。目前,大部分模式异常检测方法都 是在原始采集数据空间上进行,即不对传感器节点采集的数据进行任何变换,虽然运种方 法的有一定检测精度。但算法计算量大、容错性差,节能效果有限。能否在经过压缩处理后 的数据空间上进行异常检测。并且,无线传感网中异常事件检测技术还要面临两个主要挑 战:1)检测精度。由于受环境噪声和网络中各种故障的影响,传感器节点经常给出错误的监 测值,运势必会影响到异常事件检测的可靠性。因此,检测方法必须具有容错性。2)能量有 效性。传感器节点具有非常有限的能量储备,无线传感网事件监测的网络生命期取决于节 点能耗,因而检测方法必须具有节能性。
[0004] 大规模长期部署无线传感网中成千上万的传感器节点产生海量的高维时序数据, 运些数据中包含了大量的冗余并隐藏了重要关系的相关性,若在运些原始数据空间上直接 进行异常检测,其能量和通讯带宽的巨大开销将会缩短网络生命周期,甚至使无线传感网 不能够完成监测任务。因此,在数据被传送到网关之前进行压缩(或降维)是非常必要的。在 事件监测型WSN应用系统中,从网络的监测数据中快速识别异常事件是其首要目标,其重要 性甚至超过监测数据本身。通过数据压缩方法挖掘节点之间的时空相关性,最大限度的消 除数据之间的冗余度,在保证大幅度降低数据传输量的同时,仍然能够保持高精度的事件 监测性能,并从海量流数据中抽取出潜在的有用信息、模式和趋势。
[0005] 简洁、灵活、自适应地表示信号一直是信息处理领域最基础、最前沿的研究问题。 随着人们对携带信息的信号带宽需求不断增长,W传统信号采样定理为基础对硬件A/D采 样和处理速度也越来越快,因而对宽带信号处理难W为继。例如,高精度多光谱的环境资源 勘探,其海量数据传输和处理就是一个难题。然而,"奈奎斯特"采样速率必须达到信号带宽 的两倍W上只是精确地重构原始信号的充分而非必要条件。近年来,DonohoXandes和化ο 等人提出的压缩感知理论打破了经典"Shannon/Nyquist"采样定理的束缚,压缩感知理论 的信息处理框架表明只要信号具有稀疏性(或可压缩性),就可W用远低于奈奎斯特速率去 采样信号,并可W从少量的采样值中W极高的概率完美地恢复原始信号,无需考虑信号的 具体物理测度(如频率、带宽)的限制。因此,该理论为无线传感网数据压缩方法的设计提供 了新途径。结合无线传感网相关特点,通过压缩感知方法挖掘节点之间的数据相关性,最大 限度的消除数据之间的冗余度,在保证大幅度降低数据传输量的同时,仍然能够保持高精 度的事件监测性能,并从海量流数据中抽取出潜在的有用信息、模式和趋势。
【发明内容】
[0006] 本发明要解决的技术问题在于针对现有技术中对大量传感器节点产生的海量高 缔时序数据,难W直接进行异常检测的缺陷,提供一种对原始数据进行压缩和降维,减小通 讯带宽的基于二次混合压缩的无线传感网异常事件检测方法及系统。
[0007] 本发明解决其技术问题所采用的技术方案是:
[0008] 本发明提供一种基于二次混合压缩的无线传感网异常事件检测方法,包括W下步 骤:
[0009] S1、设置滑动检测窗口,通过压缩感知方法对滑动窗口内采集的原始数据序列X进 行第一次压缩,得到压缩序列Y;并通过分段线性拟合方法对压缩序列Y进行第二次压缩,得 到压缩序列中每个数据点的扩展时态边缘算子;
[0010] S2、根据扩展时态边缘算子计算压缩序列Y中每个数据点边缘幅度ei和边缘强度 Ri,选择检测窗口 W内的边缘强度Ri的极值点作为边缘点,加入到边缘点序列Cy,并在边缘点 序列Cy中选取插值误差较小N个边缘点,构成新的边缘点序列皆;
[00川 S3、根据边缘点序列姆将压缩序列Y分段线性表示为Yl,由化中所有fi组成模式 集;并计算模式集中fi模式的特征长度、斜率和均值,并进行规范化处理,获得特征值序列: C(f) = kl,C2,··· ,Cy};
[001^ S4、计算C(f)中任意两个模式Ci和Cj的模式距离dist(Ci,Cj),计算模式fi的本地可 到达密度lrdk(fi)W及模式fi的本地异常因子LOFk(fi);
[0013] S5、根据混合压缩后的本地异常因子大小在对应的时间序列区间进行事件检测。
[0014] 进一步地,本发明的步骤S1中对原始数据序列X进行第一次压缩得到压缩序列Y的 公式为:
[0015]
[0016] 其中,原始序列XERn,压缩序列YEr,Y的维数Π 1<<η,φηχη为信号的稀疏矩阵,护Xn 为感知矩阵,且稀疏矩阵与感知矩阵满足RIP性质,根据原始序列X的时间波动特征,选择相 应的稀疏矩阵φηΧη。
[0017] 进一步地,本发明的步骤S1中计算压缩序列Υ的扩展时态边缘算子ETE0(t,w)i的 公式为:
[001 引 ETE0(t,w)i= (yi+t-yi)
[0019] 其中,1 y如,-w含t含w,i是扩展时态边缘算子检巧幡口长度为w的中屯、点。
[0020]进一步地,本发明的步骤S2中计算压缩序列Υ中每个数据点边缘幅度ei和边缘强 度Ri的公式分别为:
[0023] 其中,*表示离散卷积,公式中P化)定义如下:
[0024]
[0025] 节点采用扩展时态边缘算子与压缩序列Y进行卷积运算,获得每个数据点yi的边 缘幅度边缘幅度ei和边缘强度Ri。
[0026] 进一步地,本发明的步骤S3中计算模式集化中fi模式的特征长度以、斜率Ki和均值 Mi的公式分别为:U = tw-ti+l,
[0027] 进一步地,本发明的步骤S3中将fi模式特征的长度、斜率、均值进行归一化处理的 公式分别为:
[0031] 其中,li、ki和ΠΗ分别表示归一化处理后的长度、斜率和均值。
[0032] 进一步地,本发明的步骤S4中计算C(f)中任意两个模式Ci和Cj的模式距离dist (Ci,Cj)公式为:
[0033] 进一步地,本发明的步骤S4中计算模式fi的本地可到达密度Irdk(fi)公式为:
[0034]
[00对其中,给定keN+,Nk(fi)表示与模式fi的距离不大于k_disUfi)的所有模式集合, 称为模式fi的k距离最近邻,|Nk(fi) I表示集合中的模式个数;
[0036] rd(Ci,Cj)表示模式Ci相对于Cj的可