一种基于生成对抗网络的无线电数据增扩与分类方法

文档序号:29423496发布日期:2022-03-26 14:40阅读:273来源:国知局
一种基于生成对抗网络的无线电数据增扩与分类方法

1.本发明涉及无线电技术领域,尤其涉及一种基于生成对抗网络的无线电数据增扩与分类方法。


背景技术:

2.在无线通信领域,稀缺且即将耗尽的频谱资源以及已分配但未充分利用的频谱资源使用现状推动了人们在认知无线电领域的研究。无线电调制数据识别作为认知无线电领域不可或缺的重要组成部分,其可以正确识别无线调制数据的调制类别,为数据解调、内容提取等后续工作提供保障,进而提高无线信道利用率,使数据在无线信道的传输更加可靠与稳定。因此,如何提高无线电调制数据分类准确率,吸引了众多研究学者的目光。
3.从传统依靠专业通信人员的经验识别无线电数据调制方式[1],到使用简单的特征参数与多特征融合的调制方式自动识别,人们已经在调制方式自动识别领域取得了良好的成绩。但这些算法往往包含复杂的无线电数据多特征提取与多特征融合,并且在信噪比较低情况下不能获得较理想的调制分类识别率[2]。
[0004]
随着深度学习在自然语言处理、图像识别等领域的广泛应用。近年来,诸多学者热衷于将深度学习技术引入到无线电调制数据的识别领域。相比于传统的无线电调制数据识别,基于深度学习的调制识别算法在数据特征提取方面具有学习能力强、覆盖范围广及适应性好的特点,可以通过优化参数获取更好的模型性能。关于无线电调制数据的分类算法研究,诸多研究学者简单地将卷积神经网络(convolutional neural networks,cnn)与长短期记忆网络(long short-term memory,lstm)等深度学习模型引入到调制数据分类识别算法中,这样可以提高无线电调制数据分类的性能。然而其未充分综合考虑无线电数据采样特点,无法实现同时对无线电调制数据空域特征与时序特征的捕获,且此类方法需要大量的无线电调制样本数据,这极大的限制了调制数据分类模型的性能。
[0005]
虽然基于深度学习的方法可以有效提高无线电调制数据分类的性能,但它需要大量的无线电调制样本数据,此外无线电调制数据的质量也会影响调制分类模型的性能。在实践中,收集大量可靠的无线电调制样本数据有时是昂贵和困难的,这吸引了众多学者将目光投向无线电调制数据领域的增扩。关于无线电调制数据的增扩,研究学者主要通过以下两种方式完成。

将传统的图片数据、文本数据等内容数据的增扩方式迁移至无线电调制数据增扩领域;

充分利用变分自编码器、生成对抗网络及其变种等方式实现无线电调制数据的增扩。但多种类别调制数据的特征分布差异给提高这类模型的性能带来了挑战。


技术实现要素:

[0006]
本发明的目的是要提供一种基于生成对抗网络的无线电数据增扩与分类方法。生成与原始数据分布特征相同的“伪造”数据,达到对原始数据集增扩的目的;此外,基于无线电数据采样特点,提出了深刻捕获无线电数据空域特征与时域特征的调制分类模型amcst,提高无线电调制数据分类准确率。
[0007]
为达到上述目的,本发明是按照以下技术方案实施的:
[0008]
(1)调制数据增扩模型
[0009]
设原始数据集中信噪比snr为snr与无线电调制类型c为c的情况下无线电调制数据为其中k表示无线电调制数据的通道数量,|v|表示无线电调制数据的采样次数。数据增扩是利用生成对抗网络生成伪造数据f
(snr,c)
,将伪造数据f
(snr,c)
与真实数据m
(snr,c)
混合实现对本类别调制数据的增扩,其中此处的|
·
|运算表示获取输入数据集的数量。调整信噪比snr与调制类型c的值,将选择的无线电调制数据放入数据增扩模型,实现选择数据的增扩,最终得到所有调制类别数据的增扩,即x={m,f}表示原始数据集与增扩数据集的聚合。
[0010]
(2)调制数据分类模型amcst
[0011]
无线电信号调制分类问题可以被看作是从无线电调制数据到不同调制类别的映射。通过选择分类结果中概率最大的输出,可以得到待估计样本数据的调制类别。
[0012]
本发明的无线电调制分类模型amcst,以增扩数据x∈x为输入,经调制分类模型ψ得到分类结果ψ(x)∈r
|c|
,其中|c|表示无线电调制数据的类别数。从ψ(x)中选择出最大数值所对应的调制类别即为调制分类模型ψ对输入数据x的预测调制类别。
[0013]
本发明的有益效果是:
[0014]
本发明是一种基于生成对抗网络的无线电数据增扩与分类方法,与现有技术相比,本发明具有如下技术效果:
[0015]
(1)基于无线电调制数据的特点,依托gan模型在数据增强方面的能力,设计了能深刻捕获无线电数据分布特征的生成器与辨识器,生成无线电调制数据,实现无线电调制数据的增扩,为无线电调制数据识别分类做好铺垫。
[0016]
(2)分析与研究了无线电数据采样特点与无线电数据传统增强方式,设计了能深刻捕获无线电数据空域特征与时序特征的无线电数据分类模型amcst。
[0017]
(3)利用公共数据集,验证了该数据增扩方法在生成无线电调制数据方面的有效性,提高了无线电调制信号的分类精度,为频谱异常检测、发射机识别与频谱感知等领域的研究打下基础。
附图说明
[0018]
图1是本发明的模型结构图;
[0019]
图2是本发明的调制数据增扩的生成对抗网络结构图;
[0020]
图3是本发明的调制数据增扩模型;
[0021]
图3中:(a)生成器模型图;(b)辨识器模型图;
[0022]
图4是本发明的调制分类模型amcst;
[0023]
图5是本发明信噪比snr为-8db,增扩规模为20%与100%的分类混淆矩阵;
[0024]
图5中:(a)增扩规模为20%;(b)增扩规模为100%;
[0025]
图6是本发明增扩规模为100%,模型训练损失图;
[0026]
图6中:(a)基于cnn与lstm的调制分类模型;(b)基于cnn的调制分类模型;
[0027]
图7是本发明增扩规模为100%,信噪比为10db与-10db的分类混淆矩阵;
[0028]
图7中:(a)信噪比为1-db;(b)信噪比为-10db。
具体实施方式
[0029]
下面结合附图以及具体实施例对本发明作进一步描述,在此发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
[0030]
数据增扩是指基于给定的原始无线电调制数据m,设计生成对抗网络模型深刻捕获数据分布特征,生成“伪造”数据f,并按照指定的增扩规模s完成对原始数据集m的增扩,获取增扩数据集x={m,f}。
[0031]
无线电调制分类是为获取从无线电调制数据x∈x到不同调制类别c的映射ψ。通过选择分类结果ψ(x)中最大数值所对应的类别,得到待估计样本数据x的调制类别。
[0032]
为实现对原始无线电调制数据集的增强扩充,设计了基于生成对抗网络的调制数据增扩模型;为深刻捕获无线电增扩数据空域特征与时序特征,提出了无线电调制数据分类模型amcst。
[0033]
(1)调制数据增扩模型
[0034]
设原始数据集中信噪比snr为snr与无线电调制类型c为c的情况下无线电调制数据为其中k表示无线电调制数据的通道数量,|v|表示无线电调制数据的采样次数。数据增扩是利用生成对抗网络生成伪造数据f
(snr,c)
,将伪造数据f
(snr,c)
与真实数据m
(snr,c)
混合实现对本类别调制数据的增扩,其中此处的|
·
|运算表示获取输入数据集的数量。调整信噪比snr与调制类型c的值,将选择的无线电调制数据放入数据增扩模型,实现选择数据的增扩,最终得到所有调制类别数据的增扩,即x={m,f}表示原始数据集与增扩数据集的聚合。
[0035]
(2)调制数据分类模型amcst
[0036]
无线电信号调制分类问题可以被看作是从无线电调制数据到不同调制类别的映射。通过选择分类结果中概率最大的输出,可以得到待估计样本数据的调制类别。
[0037]
本发明的无线电调制分类模型amcst,以增扩数据x∈x为输入,经调制分类模型ψ得到分类结果ψ(x)∈r
|c|
,其中|c|表示无线电调制数据的类别数。从ψ(x)中选择出最大数值所对应的调制类别即为调制分类模型ψ对输入数据x的预测调制类别。
[0038]
基于生成对抗网络的无线电数据增扩与分类模型整体结构如图1所示。整个模型包括两大部分,第一部分是调制数据增扩,出于无线电调制数据样本数量与质量影响基于深度学习的调制数据分类模型性能的客观事实,提出了一种基于生成对抗网络的无线电调制数据增扩方法;第二部分是调制数据分类,基于无线电数据采样特点,为充分捕获无线电调制数据空域特征与时序特征,设计了由cnn与lstm构建的无线电调制数据分类模型amcst。
[0039]
调制数据增扩模型:
[0040]
以随机噪声与某类别调制数据为输入,生成对抗网络的生成器捕获此类别数据分布特征,生成辨识器难以区分的“伪造”数据,且尽可能保证其与本类别数据分布特征相同,
达到对原始无线电调制数据集增扩的目的;
[0041]
调制数据增扩的生成对抗网络结构如图2所示,其由生成器g和辨识器d两部分组成,整体目标函数表达式v(d,g)如下公式(1)所示:
[0042][0043]
该结构包括两个神经网络模型:一个是生成器g,其通常以服从随机分布pz的数据z作为输入来生成“伪造”数据g(z),并且尽可能保证g(z)服从于真实数据分布p
data
;另一个是辨识器d,其通常以真实数据m与生成的“伪造”数据g(z)为输入,用来估计输入数据来自真实数据m而不是生成器生成的“伪造”数据g(z)的概率。
[0044]
生成器g的目标是使自己生成的“伪造”数据g(z)在辨识器d上的判别结果d(g(z))和真实数据m在辨识器d上的判别结果d(m)尽可能一致,这两个模型相互对抗,辨识器d辨识数据来源的性能不断提升,生成器g为了成功欺骗辨识器,其生成数据的质量也逐渐趋近于真实数据分布p
data
,最终生成器g可以学到真实数据的分布。此时,将随机噪声输入生成器g便可以生成近似于真实数据分布p
data
的“伪造”数据,实现对无线电调制数据的增扩。
[0045]
针对无线电调制数据特点,本发明设计的生成器模型如图3(a)所示。其由六个全连接层组成,依次分别为128个神经元的全连接层1个、256个神经元的全连接层3个、512个神经元的全连接层1个。其中leaky relu函数与batch normalization函数作为各全连接层的激活函数与归一化处理函数。设计的辨识器模型如图3(b)所示。其同样由六个全连接层组成,前五个全连接层每层有512个神经元,最后一层仅包含一个神经元用来确定输入无线电调制数据的真假(为真表示输入数据来源于原始调制数据集,为假表示输入数据来源于生成器生成的“伪造”调制数据),最后一层全连接层的激活函数使用sigmoid函数。
[0046]
调制数据分类模型amcst:
[0047]
无线电调制数据来源于每个仿真源输出流的随机采样时间段,其具备时序特性。为综合考虑无线电数据空域特征与时序特征,本发明使用cnn与lstm构建调制分类模型amcst,如图4所示。amcst模型包括三部分:cnn子结构、lstm子结构和子结构混合。其中cnn子结构用于捕获无线电调制数据空域特征信息,lstm子结构用于捕获无线电调制数据时序特征信息,子结构混合模块将前述两个子模块结果汇合,综合度量空域特征信息与时序特征信息得到输入样本数据的预测调制分类结果。
[0048]
设调制信号数据为x∈x,x的第j个元素是xj。
[0049]
(1)无线电数据空域特征提取—cnn子结构
[0050]
cnn与传统多层感知机(multilayer perceptron,mlp)相比,cnn中卷积层的权值共享机制使网络中可训练的参数变少,降低了整个模型复杂度,防止模型过拟合,使模型在新鲜样本上具有更好的泛化性能。cnn可以更好的挖掘存在于数据中强烈的局部空间相关性,因此,使用cnn捕获无线电调制数据的空域特征。
[0051]
cnn的前向计算方式定义为:首先令h0=x,即设置第0层的特征图为无线电调制数据x。之后利用公式(2)卷积计算公式进行卷积操作。
[0052]
[0053]
其中hi表示第i层的特征图;wi表示卷积神经网络第i层的卷积核;bi表示特征图hi的偏置量;表示卷积操作。
[0054]
经过上述卷积神经网络,提取到无线电调制数据的空域信息h
raw_cnn
,之后经过两层全连接层进一步提取特征信息得到cnn子结构最终的特征提取信息h
cnn

[0055][0056]
其中表示第l层全连接层的输出空域特征提取结果,表示第l层全连接层的参数权重矩阵,表示第l-1层全连接层的空域特征提取结果,被初始化为h
raw_cnn
,表示第l层全连接层的偏置量。
[0057]
(2)无线电数据时序特征提取—lstm子结构
[0058]
lstm是循环神经网络(recurrent neural network,rnn)的变种,它能够有效克服rnn中存在的梯度消失问题,其在长距离依赖的任务中的表现更加稳定优秀,可以更为精确的捕获数据中的短期或者长期依赖。lstm可以很好得挖掘时序序列中每个节点数据的隐藏时序信息,因此使用lstm捕获无线电调制数据的时序特征。lstm的前向计算方法定义为:
[0059]
ij=σ(wi·
[h
j-1
,xj]+bi)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0060]fj
=σ(wf·
[h
j-1
,xj]+bf)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0061]cj
=tanh(wc·
[h
j-1
,xj]+bc)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0062]
oj=σ(wo·
[h
j-1
,xj]+bo)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0063][0064]hj
=cj⊙
tanh(cj)
ꢀꢀ
(9)
[0065]
其中wi,wf,wc,wo为lstm门控单元的权重矩阵,bi,bf,bc,bo表示偏置向量,tanh(
·
)表示双曲正切函数,

表示逐项乘积操作。隐藏状态向量h
j-1
表示前一个lstm单元输出的状态信息,其聚合了无线电调制数据x中1~j-1范围的数据特征。c
j-1
表示前一个lstm单元的记忆门信息。
[0066]
经过多层lstm结构获取时序网络对无线电调制数据时序信息的提取h
raw_lstm
,之后经过双层全连接网络进一步提取特征信息,并获取lstm子结构的最终特征信息抽取h
lstm

[0067][0068]
其中表示第l层全连接层的输出时序特征提取结果,表示第l层全连接层的参数权重矩阵,表示第l-1层全连接层的时序征提取结果,被初始化为h
raw_lstm
,表示第l层全连接层的偏置量。
[0069]
(3)综合空域特征与时序特征—子结构汇合
[0070]
对输入的无线电调制数据,分别经过上述的cnn子结构与lstm子结构,可以得到h
cnn
与h
lstm
。h
cnn
主要保存了卷积神经网络对调制数据空域特征的提取,h
lstm
主要保存了长短期记忆网络对调制数据时序特征的提取。为保证分类模型对时序特征与空域特征的综合度量,本发明此处将h
cnn
与h
lstm
进行聚合,进行拼接操作:
[0071]hconcat
=h
cnn
||h
lstm
ꢀꢀ
(12)
[0072]
其中||表示拼接操作,h
concat
表示两个向量拼接之后结果。
[0073]
将拼接向量h
concat
经过两层全连接神经网络,
[0074]
进一步提取无线电调制数据时序特征与空域特征,得到最终的分类结果h
final

[0075][0076]
其中表示第l层全连接层的输出的特征提取结果,表示第l层全连接层的参数权重矩阵,表示第l-1层全连接层的时序征提取结果,表示第l层全连接层的偏置量。
[0077]
调制分类模型具体优化的目标函数如公式(14)所示:
[0078][0079]
其中|c|表示调制类别的类别数,yn表示调制数据x的真实调制类别,表示数据经过上述调制分类模型的预测结果类别。
[0080]
数据集:
[0081]
数据集radioml2016.10a是一个专门的无线电调制数据集。其考虑了采样率偏移、中心频率偏移、多径衰落和加性高斯白噪声等因素对无线电调制数据的影响,总共包含22万条无线电调制数据,共有20个不同的信噪比,信噪比数值范围从-20db到18db,步长为2db;共包含11种调制类别,分别是二进制相移键控(bpsk)、正交相移键控(qpsk)、8移相键控(8psk)、连续相位频移键控(cpfsk)、高斯频移键控(gfsk)、4阶脉冲幅度调制(pam4)、正交幅度调制(qam16)、相正交振幅调制(qam64)、双边带调幅(am-dsb)、单边带调幅(am-ssb)和宽带调频(wb-fm)。此外,每条无线电调制数据由128个连续调制的同相位(i)信号和正交相位(q)信号组成。
[0082]
基线模型:
[0083]
将基于cnn与基于lstm调制分类模型与本发明提出的amcst进行比较,以验证所提出数据增强方法与调制分类模型的有效性:
[0084]
基于cnn的调制分类模型:该模型包含两层卷积层与两层全连接层,其中卷积层卷积核数量分别为64与16,第一层全连接层包含128个神经元,第二层全连接层包含11个神经元。
[0085]
基于lstm的调制分类模型:该模型包含两层长短期记忆网络与两层全连接层,其中两层长短期记忆网络各包含128个lstm单元,两层全连接层分别包含128个神经元与11个神经元。
[0086]
其中,无线电调制分类模型训练集与测试集的划分比例为80%与20%,调制数据增扩模型与调制分类模型amcst的优化器均使用adam。
[0087]
模型结果分析:
[0088]
针对不同的调制数据增扩规模,分别测验调制分类模型amcst、基于cnn的调制分类模型与基于lstm的调制分类模型。测试了三个分类模型在原始无线电调制数据集、增扩规模为10%、20%、50%与100%情况下调制数据的分类准确率,其分类准确率具体如表1所示。
[0089]
从表1中可以出,信噪比相同的情况下,随着数据增扩规模的扩大,调制样本数据分类准确率也不断的提高。这表明本发明提出的基于生成对抗网络的数据增扩模型生成的“伪造”数据对提高无线电调制分类准确率是有帮助的。
[0090]
表1增扩数据分类准确率
[0091][0092][0093]
在同一个数据增扩比例下,调制样本数据分类准确率随着信噪比的提高不断增大。这与通信领域关于噪声值对无线电调制数据的影响的认识是一致的。随着增扩数据规模的扩大,低信噪比的调制分类准确率不断提高,低信噪比分类准确率较低的问题也得到了改善,但是仍旧存在不同信噪比调制分类准确率相差较大的问题,这个问题也是后续相关工作急需解决的。
[0094]
调制分类模型amcst、基于cnn的调制分类模型与基于lstm的调制分类模型三者相比,其总体均符合分类准确率随信噪比增加而增大的规律。在信噪比为-20db~-4db且数据增扩规模相同的情况下,本发明提出的调制分类模型amcst与基于cnn的调制分类模型数据分类准确率大致相同,两者分类准确率相较于基于lstm的调制分类模型有所提升;相同的数据增扩规模且信噪比为-4db~18db情况下,调制分类模型amcst的数据分类准确率最高,相较于传统的cnn调制分类模型与基于lstm的调制分类模型分类准确率有不同幅度的提高。这主要是因本发明提出的调制分类模型amcst,相较于另外两个分类模型对于调制信号数据的时序信息与空域信息的做了更为全面的考虑。
[0095]
图5中的(a)(b)图分别展示了信噪比为-8db增扩规模为20%与100%情况下,调制分类模型amcst识别增扩数据所获得的分类混淆矩阵。显而易见,数据增扩规模为100%的情况下数据分类准确率更高,可见数据规模对分类模型准确率高低的影响是较大的。其中主要表现为8psk、bpsk、cpfsk与qpsk等类别无线电调制数据被误认为am-ssb类别,这主要是由于信噪比为-8db,上述五中调制类别数据分布特征过于相似,这在原始数据集的数据分布统计中是可以发现的。
[0096]
图6中的(a)(b)图分别展示了增扩规模为100%的情况下调制分类模型amcst与传统的cnn调制分类模型的训练损失图。其中可以看出调制分类模型amcst相较于后者可以更快的实现收敛,大约25个epoch后就可以达到较低的训练损失与验证损失。
[0097]
图7中的(a)(b)图分别展示了增扩规模为100%信噪比分别为10db与-10db情况下,调制分类模型amcst识别增扩数据所获得的分类混淆矩阵。显而易见,信噪比为10db的分类准确率要大于信噪比为-10db的分类准确率。这主要是由于信噪比对无线电调制数据的影响。信噪比为-10db的混淆矩阵表现出对qam16与qam64之间的主要混淆。
[0098]
本发明利用gan捕获样本数据分布,生成具有原始数据分布特征的高质量“伪造”数据,从而解决获取无线调制数据困难与成本较高的问题;优化了调制数据分类模型,提出了调制分类模型amcst,提高了调制数据的分类准确率。通过在公共数据集上的实验,证明了所提出的数据增扩方法可以极大地提高调制分类模型amcst分类准确率。在未来的工作中,本发明将研究其他深度学习模型,如变分自编码器及其变种,在调制数据增扩领域的应用。
[0099]
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1