基于邻域样本特征对比学习的时序数据异常点监测方法与流程

文档序号:31329661发布日期:2022-08-31 06:39阅读:153来源:国知局
基于邻域样本特征对比学习的时序数据异常点监测方法与流程

1.本发明涉及时序数据异常识别技术领域,尤其涉及一种基于邻域样本特征对比学习的时序数据异常点监测方法。


背景技术:

2.目前的桥梁结构健康监测工作中,传感器采集的时序数据维度较少,且伴有缺失、噪声和异常等特点。桥梁结构健康监测传感器数据异常识别任务中,需要的人工标注成本较高。针对时序数据进行样本的特征学习,并实现基于机器学习的异常数据识别,对于提升桥梁结构的安全诊断具有重要的意义。
3.桥梁结构健康监测时序数据中,样本点的离差、近邻等信息可以丰富样本的初始特征。样本点的异常监测需要考虑到相似样本的类别信息,基于相似样本的特征来增强样本点的特征,有助于提升样本异常识别的精准性。


技术实现要素:

4.为解决现有技术存在的局限和缺陷,本发明提供一种基于邻域样本特征对比学习的时序数据异常点监测方法,包括:
5.步骤s1,对输入的样本进行特征组合;
6.步骤s2,学习样本x的非线性特征;
7.所述步骤s2包括:获取样本x,根据多层感知器学习所述样本x的非线性特征h
x
=tanh(w1x');
8.步骤s3,获取正样本x
+
的嵌入表示线性特征;
9.步骤s4,获取负样本x-的嵌入表示线性特征;
10.步骤s5,学习所述正样本x
+
与所述负样本x-对比中的特征参数;
11.步骤s6,计算新样本s的类别标签分类概率
12.步骤s7,根据所述类别标签分类概率标注所述新样本s是否为异常样本;
13.步骤s8,若所述类别标签分类概率大于或等于0.5,标注所述新样本s为正常样本;若所述类别标签分类概率小于0.5,标注所述新样本s为异常样本。
14.可选的,所述步骤s1包括:
15.设定样本特征x;
16.对所述样本特征x进行[0,1]区间归一化;
[0017]
归一化后的样本特征为
[0018]
根据所述样本特征x与均值μ计算离差|x-μ|;
[0019]
将作为样本x的输入特征。
[0020]
可选的,所述步骤s3包括:
[0021]
初始化向量查询表w2,随机初始化每个样本的向量表示,其中w2为可学习的参数矩
阵;
[0022]
对所述样本x的δ邻域窗口区间[x-δ,x+δ]内的相似样本x1,x2,...,xn的样本特征x
′1,x'2,...,x'n进行求和平均,生成正样本x
+
,其中δ=0.001;
[0023]
对于正样本x
+
,根据所述向量查询表w2,获取所述正样本x
+
的嵌入表示线性特征
[0024]
可选的,所述步骤s4包括:
[0025]
根据负样本集nb进行采样获得负样本x-,所述负样本集nb不在所述δ邻域窗口区间[x-δ,x+δ]内;
[0026]
根据初始化后的向量查询表w2,获取所述负样本x-的嵌入表示线性特征
[0027]
可选的,所述步骤s5包括:
[0028]
根据初始化后的向量查询表w2,获取所述样本x的嵌入表示线性特征v
x
,将所述样本x的嵌入表示线性特征v
x
与所述样本x的非线性特征h
x
拼接成为特征v

x

[0029]
基于预测样本的类别标签,通过损失函数优化权重参数q和权重参数b;
[0030]
通过损失函数最小化所述样本x与所述正样本x
+
之间的特征距离,而且最大化所述样本x与所述负样本x-之间的特征距离,其中f函数为余弦相似度函数;
[0031]
通过多任务联合损失函数l1+l2,学习特征参数。
[0032]
可选的,所述步骤s6包括:
[0033]
对于新样本s,根据学习到的权重参数w1、权重参数q和权重参数w2,基于计算所述新样本s的类别标签分类概率
[0034]
本发明具有下述有益效果:
[0035]
本发明提供一种基于邻域样本特征对比学习的时序数据异常点监测方法,基于输入样本建立样本的特征组合,通过初始化查询表学习输入样本的线性特征;利用输入样本的近邻区域相似样本,计算正样本,学习正样本的线性特征,在非近邻区域的不相似样本集中采样负样本,学习负样本的线性特征;根据输入样本的非线性特征预测类别标签,通过对比学习最小化输入样本与正样本之间的线性特征距离,最大化输入样本与负样本之间的线性特征距离;基于学习的参数预测新样本的类别标签分类概率,标注是否为异常样本。本发明从样本的近邻区域相似样本特征识别样本是否异常,在桥梁结构健康监测时序数据异常识别方面具有重要应用价值。
附图说明
[0036]
图1为本发明实施例一提供的基于邻域样本特征对比学习的时序数据异常点监测方法的流程图。
具体实施方式
[0037]
为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的基于邻域样本特征对比学习的时序数据异常点监测方法进行详细描述。
[0038]
实施例一
[0039]
本实施例提供一种基于邻域样本特征对比学习的时序数据异常点监测方法,通过对比学习策略最小化与正样本之间的特征距离,最大化与负样本之间的特征距离,学习的特征可以精准识别桥梁结构健康监测数据中的异常值。本实施例从样本的特征以及相似正样本的特征预测样本的异常概率,实现异常数据点的识别,在桥梁结构健康监测传感器异常数据方面识别方面具有重要应用价值。
[0040]
图1为本发明实施例一提供的基于邻域样本特征对比学习的时序数据异常点监测方法的流程图。如图1所示,本实施例提供的基于邻域样本特征对比学习的时序数据异常点监测方法包括:
[0041]
步骤s1,输入的样本进行特征组合;
[0042]
设样本特征x,对样本特征x进行[0,1]区间归一化,归一化后的特征为对样本特征x与均值μ计算离差|x-μ|,将作为样本x的输入特征。
[0043]
步骤s2,学习样本x的非线性特征;
[0044]
对于样本x,根据多层感知器,学习其非线性特征h
x
=tanh(w1x')。
[0045]
步骤s3,获取正样本x
+
的嵌入表示线性特征;
[0046]
首先初始化向量查询表w2,为每一个样本随机初始化其向量表示。
[0047]
对样本x的δ邻域窗口区间[x-δ,x+δ](可取δ=0.001)内的相似样本x1,x2,...,xn的样本特征x
′1,x'2,...,x'n进行求和平均,生成正样本x
+

[0048]
对于正样本x
+
,根据向量查询表w2,获取其嵌入表示线性特征其中w2为可学习的参数矩阵。
[0049]
步骤s4,获取负样本x-的嵌入表示线性特征;
[0050]
根据不在[x-δ,x+δ]区间内的负样本集nb进行采样x-,根据初始化权重查询表w2,获取其嵌入表示线性特征
[0051]
步骤s5,学习正样本与负样本对比中的特征参数;
[0052]
通过初始化查询表w2获取样本x的嵌入表示线性特征v
x
,将v
x
与h
x
拼接作为特征v

x

[0053]
基于预测样本的类别标签,通过损失函数优化权重q、b。
[0054]
通过损失函数最小化样本x与正样本x
+
之间的特征距离,最大化与负样本x-之间的特征距离,其中f函数为余弦相似度函数。
[0055]
通过多任务联合损失函数l1+l2,学习权重参数。
[0056]
步骤s6,计算新样本s的类别标签分类概率;
[0057]
对于新样本s,根据学习到的权重参数w1,q以及w2,通过步骤s5,计算新样本的类别标签分类概率
[0058]
步骤s7,依据类别标签分类概率标注是否为异常样本。
[0059]
基于新样本的类别标签分类概率如果大于等于0.5,属于正常样本,否则属于
异常样本。
[0060]
本实施例提出了一种基于邻域样本特征对比学习的异常点监测方法,通过样本点的离差、均值等信息学习了样本的非线性特征,通过相似样本的特征增强了样本点的线性特征,基于对比学习最小化与正样本之间的特征距离,最大化与负样本之间的特征距离,学习的特征可以精准识别桥梁结构健康监测数据中的异常值。本实施例从样本的离差、均值等相关特征以及相似正样本的邻域特征预测了样本的异常概率,实现了异常数据点的识别,在桥梁结构健康监测传感器异常数据方面识别方面具有重要应用价值。
[0061]
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1