一维数据目标检测方法及装置

文档序号:33127736发布日期:2023-02-01 06:04阅读:34来源:国知局
一维数据目标检测方法及装置

1.本技术涉及目标检测技术领域,具体地,涉及一种一维数据目标检测方法及装置。


背景技术:

2.一维数据是一种较为常见的数据形式,例如基于wifi的csi(channel state information,信道状态信息)信号、语音信号和心电信号等,而如何高效地处理一维数据是机器学习中一项重要研究。一般对于一维数据的处理通常是先获取数据中有意义的片段后再进行后续处理,以基于wifi的csi信号的活动识别为例,先检测并提取出信号中包含活动的片段后再进行识别处理,所以检测出信号中包含活动的片段的准确与否影响着后续识别分类等任务的性能。
3.现有的一维数据目标检测方法大多是基于阈值的检测,除此之外还有基于深度学习的检测方法。基于阈值的检测方法的原理是由于数据中发生活动片段的信号波动范围远大于无活动发生的波动范围,所以提前设置一个阈值,如果数据波动的范围超过了阈值,则说明发生了活动。在这类方法中,阈值的大小会直接影响划分的结果,然而,此类方法中的阈值往往是由人根据主观观察或者以往经验来确定的,正因如此,系统可能会因为人工经验的参与而出现性能下降的问题。基于深度学习的检测方法中包含一种是利用状态推理模型来实现一维数据的活动检测,具体步骤是首先将一维数据离散为大小相同的容器,即对一维数据进行周期分割,然后利用状态推理模型来推断每个周期的状态,最后根据状态标签确定检测活动的起点和终点,同时利用后续活动分类的结果来优化模型反馈,从而提高状态推理的准确性。由于系统包含多种网络架构,所以系统有较强的鲁棒性,但也正因为如此,它有着结构复杂的问题,这导致了系统的实时性和可迁移性不强。除此之外,一维数据分割周期的大小,会影响划分数据的边界是否精确,周期过大,会导致整个活动落入周期中从而无法进行状态推理,周期过小系统则会把一些噪声数据判断为具有活动意义的数据,所以周期大小的选择也在影响着检测方法的性能。


技术实现要素:

4.为了克服现有技术中的至少一个不足,本技术实施例提供一种一维数据目标检测方法及装置。
5.第一方面,提供一种标签预测网络模型的训练方法,包括:
6.确定一维训练数据的多个目标框,目标框为一维训练数据中的有意义数据片段;
7.针对每个目标框中的每个数据点,计算数据点与目标框的起点之间的距离,记为左偏移量,计算数据点与目标框的终点之间的距离,记为右偏移量,计算数据点位于目标框中间位置的概率,记为前景概率,左偏移量、右偏移量和前景概率形成三线标签;
8.将一维训练数据和每个目标框的每个数据点对应的三线标签,输入到标签预测网络模型中进行训练,得到训练后的标签预测网络模型。
9.在一个实施例中,标签预测网络模型包括缩放卷积层、特征变换块和反缩放卷积
层;
10.缩放卷积层用于对一维训练数据和每个目标框的每个数据点对应的三线标签进行特征提取,得到二维张量形式的特征提取结果;
11.特征变换块用于对二维张量形式的特征提取结果进行处理,得到左偏移量、右偏移量和前景概率分别对应的类频谱图;
12.反缩放卷积层用于对左偏移量、右偏移量和前景概率分别对应的类频谱图进行处理,得到每个目标框的每个数据点对应的标签预测结果,标签预测结果包括左偏移量、右偏移量和前景概率的预测值。
13.在一个实施例中,方法还包括:
14.对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
15.根据目标框的起点和终点的预测值以及目标框的起点和终点的实际值,对训练得到的标签预测网络模型进行评价,得到评价结果;评价结果用于调整标签预测网络模型的参数以训练标签预测网络模型。
16.在一个实施例中,对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,包括:
17.将当前正在处理的目标框记为当前目标框,确定当前目标框中数据点对应的标签预测结果中前景概率的预测值的最大值;
18.判断前景概率的预测值的最大值是否大于设定阈值;
19.若前景概率的预测值的最大值大于设定阈值,则根据前景概率的预测值的最大值对应的数据点的位置、左偏移量的预测值和右偏移量的预测值,确定当前目标框的目标检测结果;
20.若前景概率的最大值小于设定阈值,则处理下一个目标框。
21.第二方面,提供一种一维数据目标检测方法,包括:
22.将待检测一维数据输入到标签预测网络模型中,输出每个目标框的每个数据点对应的标签预测结果;
23.对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
24.标签预测网络模型为根据上述的标签预测网络模型的训练方法得到的。
25.在一个实施例中,对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,包括:
26.将当前正在处理的目标框记为当前目标框,确定当前目标框中数据点对应的标签预测结果中前景概率的预测值的最大值;
27.判断前景概率的预测值的最大值是否大于设定阈值;
28.若前景概率的预测值的最大值大于设定阈值,则根据前景概率的预测值的最大值对应的数据点的位置、左偏移量的预测值和右偏移量的预测值,确定当前目标框的目标检测结果;
29.若前景概率的最大值小于设定阈值,则处理下一个目标框。
30.第三方面,提供一种标签预测网络模型的训练装置,包括:
31.目标框确定模块,用于确定一维训练数据的多个目标框,目标框为一维训练数据中的有意义数据片段;
32.三线标签计算模块,用于针对每个目标框中的每个数据点,计算数据点与目标框的起点之间的距离,记为左偏移量,计算数据点与目标框的终点之间的距离,记为右偏移量,计算数据点位于目标框中间位置的概率,记为前景概率,左偏移量、右偏移量和前景概率形成三线标签;
33.模型训练模块,用于将一维训练数据和每个目标框的每个数据点对应的三线标签,输入到标签预测网络模型中进行训练,得到训练后的标签预测网络模型。
34.在一个实施例中,还包括:
35.解码模块,用于对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
36.评价模块,用于根据目标框的起点和终点的预测值以及目标框的起点和终点的实际值,对训练得到的标签预测网络模型进行评价,得到评价结果;评价结果用于调整标签预测网络模型的参数以训练标签预测网络模型。
37.第四方面,提供一种一维数据目标检测装置,包括:
38.标签结果预测模块,用于将待检测一维数据输入到标签预测网络模型中,输出每个目标框的每个数据点对应的标签预测结果;
39.解码模块,用于对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
40.标签预测网络模型为根据上述的标签预测网络模型的训练装置得到的。
41.在一个实施例中,所述解码模块还用于:
42.将当前正在处理的目标框记为当前目标框,确定当前目标框中数据点对应的标签预测结果中前景概率的预测值的最大值;
43.判断前景概率的预测值的最大值是否大于设定阈值;
44.若前景概率的预测值的最大值大于设定阈值,则根据前景概率的预测值的最大值对应的数据点的位置、左偏移量的预测值和右偏移量的预测值,确定当前目标框的目标检测结果;
45.若前景概率的最大值小于设定阈值,则处理下一个目标框。
46.相对于现有技术而言,本技术具有以下有益效果:
47.(1)本技术通过神经网络对数据进行处理,可以完成纯数据驱动的特征分析,克服了基于阈值的检测方法中由于外界变化导致人工经验设定的阈值出现偏差造成可能的性能下降问题;
48.(2)本技术通过使用缩放卷积层,全卷积网络以及反缩放卷积层的纯卷积结构,可以对不同长度的信号片段进行处理,不用关注数据的具体长度,克服了现有检测方法中需要对信号进行周期划分而导致性能下降的问题;
49.(3)本技术属于单阶段无锚点目标检测方法,不需要进行繁杂的特征工程,是一种端到端的方法,实现了较好的实时性和可迁移性;
50.(4)本技术能有效的提高在信号中检测到感兴趣片段的精准度和查全率,可以有效改善后续任务的处理性能,在基于wifi csi信号的活动识别中为后续识别任务的分类器
更好地提供包含活动的感兴趣片段。
51.综上,本技术的一维数据目标检测方法不需要人工经验参与、能应对信号长度变化、结构简单、实时性强、可迁移性好。
附图说明
52.本技术可以通过参考下文中结合附图所给出的描述而得到更好的理解,附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。在附图中:
53.图1示出了根据本技术实施例的标签预测网络模型的训练方法的流程框图;
54.图2示出了根据本技术实施例的一维数据目标检测方法的流程框图;
55.图3示出了根据本技术实施例的标签预测网络模型的训练装置的结构框图;
56.图4示出了根据本技术实施例的一维数据目标检测装置的结构框图。
具体实施方式
57.在下文中将结合附图对本技术的示例性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施例的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中可以做出很多特定于实施例的决定,以便实现开发人员的具体目标,并且这些决定可能会随着实施例的不同而有所改变。
58.在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本技术,在附图中仅仅示出了与根据本技术的方案密切相关的装置结构,而省略了与本技术关系不大的其他细节。
59.应理解的是,本技术并不会由于如下参照附图的描述而只限于所描述的实施形式。在本文中,在可行的情况下,实施例可以相互组合、不同实施例之间的特征替换或借用、在一个实施例中省略一个或多个特征。
60.本技术实施例针对现有一维数据目标检测过程中,需要人工参与、周期分割、实时性差和难以迁移等问题,利用三线标签编解码技术,训练神经网络模型,将待检测的一维数据输入训练得到的神经网络模型中,输出目标检测结果。本技术的目标检测方法无需关注数据长度、能够综合多种类频谱图信息进行自动特征提取,实时性强、速度快。
61.图1示出了根据本技术实施例的标签预测网络模型的训练方法的流程框图,方法包括:步骤s110,确定一维训练数据的多个目标框,目标框为一维训练数据中的有意义数据片段;
62.该步骤中,一维训练数据可以是csi数据,首先可以对一维训练数据进行预处理,具体预处理过程包括对一维训练数据进行去噪及归一化,例如可以采用巴特沃斯滤波器去除背景环境噪声,采用z-score方法消除数据中的基线和奇异样本数据。该步骤中,目标框为一维训练数据中的有意义数据片段,即活动数据片段,有意义数据片段包括起点和终点,可以对目标框内的数据点进行标记。
63.然后,在步骤s120,针对每个目标框中的每个数据点,计算数据点与目标框的起点之间的距离,记为左偏移量,计算数据点与目标框的终点之间的距离,记为右偏移量,计算数据点位于目标框中间位置的概率,记为前景概率,左偏移量、右偏移量和前景概率形成三线标签;
64.该步骤中,目标框的起点位置记为s,终点位置记为e,数据点位置i与起点位置s之间的距离,记为左偏移量l,l=i-s;数据点位置i与终点位置e之间的距离,记为右偏移量r,r=e-i;数据点位于目标框中间位置的概率,记为前景概率,可以采用高斯概率的计算公式得到,或者其他现有的计算概率的公式,此处不作具体限定。
65.然后,在步骤s130,将一维训练数据和每个目标框的每个数据点对应的三线标签,输入到标签预测网络模型中进行训练,得到训练后的标签预测网络模型。
66.该实施例中,利用三线标签编解码技术,训练神经网络模型,无需关注数据长度、能够综合多种类频谱图信息进行自动特征提取,实时性强、速度快。
67.在一个实施例中,标签预测网络模型包括缩放卷积层、特征变换块和反缩放卷积层;
68.缩放卷积层用于对一维训练数据和每个目标框的每个数据点对应的三线标签进行特征提取,得到二维张量形式的特征提取结果;
69.特征变换块用于对二维张量形式的特征提取结果进行处理,得到左偏移量、右偏移量和前景概率分别对应的类频谱图;
70.反缩放卷积层用于对左偏移量、右偏移量和前景概率分别对应的类频谱图进行处理,得到每个目标框的每个数据点对应的标签预测结果,标签预测结果包括左偏移量、右偏移量和前景概率的预测值。
71.该实施例中,特征变换块包括全卷积层、批归一化层和relu激活函数,能够输出左偏移量、右偏移量和前景概率分别对应的三个类频率特征图;反缩放卷积层包括3个子反缩放卷积层,分别对三个类频率特征图进行处理。这里,标签预测网络模型的具体处理过程可参考申请号为cn202110417190.7的专利公开文献中的相关内容。
72.该实施例中,通过使用缩放卷积层,全卷积网络以及反缩放卷积层的纯卷积结构,可以对不同长度的信号片段进行处理,不用关注数据的具体长度,克服了现有检测方法中需要对信号进行周期划分而导致性能下降的问题。
73.在一个实施例中,标签预测网络模型的训练方法还包括对训练得到的标签预测网络模型进行评价,具体包括:
74.对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
75.根据目标框的起点和终点的预测值以及目标框的起点和终点的实际值,对训练得到的标签预测网络模型进行评价,得到评价结果;评价结果用于调整标签预测网络模型的参数以训练标签预测网络模型。
76.在一个实施例中,对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,包括:
77.将当前正在处理的目标框记为当前目标框,确定当前目标框中数据点对应的标签预测结果中前景概率的预测值的最大值;
78.判断前景概率的预测值的最大值是否大于设定阈值;若前景概率的预测值的最大值大于设定阈值,则根据前景概率的预测值的最大值对应的数据点的位置、左偏移量的预测值和右偏移量的预测值,确定当前目标框的目标检测结果;若前景概率的预测值的最大值小于设定阈值,则处理下一个目标框。这里设定阈值根据实际情况选取,此处不作具体限
定。
79.该实施例中,当前目标框的起点的预测值s

=i-l

,其中,i为前景概率的预测值的最大值对应的数据点的位置,l

为前景概率的预测值的最大值对应的数据点的左偏移量的预测值,当前目标框的终点的预测值e

=i+r

,其中,r

为前景概率的预测值的最大值对应的数据点的右偏移量的预测值。
80.在其他实施例中,每个目标框的每个数据点对应的标签预测结果进行解码,得到的目标框的目标检测结果会出现多个,为了避免上述情况,可以对多个目标检测结果进行非极大值抑制处理,得到最终的目标检测结果。
81.图2示出了个根据本技术实施例的一维数据目标检测方法的流程框图,方法包括:步骤s210,将待检测一维数据输入到标签预测网络模型中,输出每个目标框的每个数据点对应的标签预测结果;该步骤中,标签预测网络模型为根据上述的标签预测网络模型的训练方法得到的;该步骤中,首先可以对一维训练数据进行预处理,具体预处理过程包括对一维训练数据进行去噪及归一化,例如可以采用巴特沃斯滤波器去除背景环境噪声,采用z-score方法消除数据中的基线和奇异样本数据。
82.然后,在步骤s220,对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
83.该实施例中,通过神经网络对数据进行处理,可以完成纯数据驱动的特征分析,克服了基于阈值的检测方法中由于外界变化导致人工经验设定的阈值出现偏差造成可能的性能下降问题;属于单阶段无锚点目标检测方法,不需要进行繁杂的特征工程,是一种端到端的方法,实现了较好的实时性和可迁移性。
84.在一个实施例中,对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,包括:
85.将当前正在处理的目标框记为当前目标框,确定当前目标框中数据点对应的标签预测结果中前景概率的预测值的最大值;
86.判断前景概率的预测值的最大值是否大于设定阈值;若前景概率的预测值的最大值大于设定阈值,则根据前景概率的预测值的最大值对应的数据点的位置、左偏移量的预测值和右偏移量的预测值,确定当前目标框的目标检测结果;若前景概率的预测值的最大值小于设定阈值,则处理下一个目标框。
87.该实施例中,当前目标框的起点的预测值s

=i-l

,其中,i为前景概率的预测值的最大值对应的数据点的位置,l

为前景概率的预测值的最大值对应的数据点的左偏移量的预测值,当前目标框的终点的预测值e

=i+r

,其中,r

为前景概率的预测值的最大值对应的数据点的右偏移量的预测值。
88.基于与本技术实施例提供的标签预测网络模型的训练方法相同的发明构思,本技术还提供与之对应的标签预测网络模型的训练装置,图3示出了根据本技术实施例的标签预测网络模型的训练装置的结构框图,装置包括:
89.目标框确定模块310,用于确定一维训练数据的多个目标框,目标框为一维训练数据中的有意义数据片段;
90.三线标签计算模块320,用于针对每个目标框中的每个数据点,计算数据点与目标框的起点之间的距离,记为左偏移量,计算数据点与目标框的终点之间的距离,记为右偏移
量,计算数据点位于目标框中间位置的概率,记为前景概率,左偏移量、右偏移量和前景概率形成三线标签;
91.模型训练模块330,用于将一维训练数据和每个目标框的每个数据点对应的三线标签,输入到标签预测网络模型中进行训练,得到训练后的标签预测网络模型。
92.该实施例中,利用三线标签编解码技术,训练神经网络模型,无需关注数据长度、能够综合多种类频谱图信息进行自动特征提取,实时性强、速度快。
93.在一个实施例中,装置还包括:
94.解码模块,用于对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值;
95.评价模块,用于根据目标框的起点和终点的预测值以及目标框的起点和终点的实际值,对训练得到的标签预测网络模型进行评价,得到评价结果;评价结果用于调整标签预测网络模型的参数以训练标签预测网络模型。
96.基于与本技术实施例提供的一维数据目标检测方法相同的发明构思,本技术还提供与之对应的一维数据目标检测装置,图4示出了根据本技术实施例的一维数据目标检测装置的结构框图,装置包括:
97.标签结果预测模块410,用于将待检测一维数据输入到标签预测网络模型中,输出每个目标框的每个数据点对应的标签预测结果;标签预测网络模型为根据上述的标签预测网络模型的训练装置得到的;
98.解码模块420,用于对每个目标框的每个数据点对应的标签预测结果进行解码,确定每个目标框的目标检测结果,目标检测结果包括目标框的起点和终点的预测值。
99.该实施例中,通过神经网络对数据进行处理,可以完成纯数据驱动的特征分析,克服了基于阈值的检测方法中由于外界变化导致人工经验设定的阈值出现偏差造成可能的性能下降问题;属于单阶段无锚点目标检测方法,不需要进行繁杂的特征工程,是一种端到端的方法,实现了较好的实时性和可迁移性。
100.在一个实施例中,解码模块420还用于:
101.将当前正在处理的目标框记为当前目标框,确定当前目标框中数据点对应的标签预测结果中前景概率的预测值的最大值;
102.判断前景概率的预测值的最大值是否大于设定阈值;
103.若前景概率的预测值的最大值大于设定阈值,则根据前景概率的预测值的最大值对应的数据点的位置、左偏移量的预测值和右偏移量的预测值,确定当前目标框的目标检测结果;
104.若前景概率的最大值小于设定阈值,则处理下一个目标框。
105.综上,本技术在一维数据目标检测过程中,不需要人工经验参与、能应对信号长度变化、结构简单、实时性强、可迁移性好。
106.为了对本技术的一维数据目标检测方法的可行性进行论证,采用取自主采集的数据进行实验分析,自主采集的数据包含1200个检测的不同行为片段的csi数据,含有手势、行走和跑步数据等,共计12种不同的行为。模型训练时选取数据的80%作为训练集,20%作为测试集。
107.通过实验分析,本技术明提出的方法对若干长序列信号数据中的事件可以完成正
确的检测,得到多个事件的起止位置;通过人工标记而适应不同类型的信号数据,达到良好的检测效果。在此次实验所采集的数据中,本技术提出的方法在不同行为活动的长序列csi信号上的召回率为99.6%,比以往的方法提高了3.4%;iou(intersection over union)为86.2%,比以往的方法提高了2.3%,其中召回率为真正的目标中被预测出来的比例,iou为预测范围和实际范围的交并集之比。
108.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
109.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
110.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
111.以上所述,仅为本技术的各种实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1