本发明属于信号分析领域,具体涉及一种基于深度学习的数字信号调制识别方法。
背景技术:
数字信号调制识别在无线移动通信系统中具有重要的研究意义,作为信号解调前的必经步骤,引起了人们越来越多的关注。数字信号调制识别的任务主要是不利用任何先验信息或者利用少量的先验信息对接受信号的调制方式进行确认,从而对后续的信号解调和信息的获取打下基础。在军用和民用领域,数字信号调制识别都扮演者重要的角色,尤其在军事领域,调制信号识别是对敌方通信进行干扰和监听的前提,在民用领域可用于频谱检测和信号确认等方面。
传统的数字信号调制类型识别大致上分为两种方法:一种是基于决策理论的最大似然假设检验法,另一类是基于特征提取的模式识别法。对于决策理论法,是基于接收信号的似然函数,并将似然比和适当的门限值进行比较,在贝叶斯最小误差准则下达到最佳分类效果。这类方法通常需要较多的先验知识,并且算法复杂度高。同时算法会因为信号模型变化产生失配问题,不具有适用性。对于模式识别法,需要对接收信号进行变换提取不同维度的特征,然后选用合适的机器学习分类器,例如svm、决策树等进行分类。这种方法分类性能受所选取特征的影响,并且很难从多种调制方式中提取同一种特征,另外当任务数据量很大时,这种方法效率不高。
随着计算机科学的进步和硬件水平的提升,深度学习技术得到了飞速发展,在分类识别任务中得到了广泛的应用,并取得了优异的性能。近些年来,得益于深度学习对大数据的充分运用和低算法复杂度,深度学习也逐渐被应用于无线通信领域的数字信号调制任务中,并取得了显著的成绩。然而目前存在的深度学习方法重点研究神经网络结构和参数对分类效果的影响,并没有考虑信道的变化对识别带来的精度损失。其中大部分工作都是在加性高斯白噪声(awgn)信道中展开的,或者是静态的多径实验场景,并且在训练模型的时候没有对信号进行通信相关的任何处理,这样产生的结果就是已经训练好的网络不能对来自其他信道环境中产生的信号数据集进行有效的识别,在实际的无线通信系统中无法使用。另外,目前的大部分通信系统都是以ofdm技术为基础的,但是与ofdm相关的数字信号调制识别研究较少。因此找到一种有效的适用于多载波ofdm通信系统数字信号调制识别方法极具研究价值。
技术实现要素:
针对现有技术中的上述不足,本发明提供的一种基于深度学习的数字信号调制识别方法解决了现有技术中的问题。
为了达到上述发明目的,本发明采用的技术方案为:一种基于深度学习的数字信号调制识别方法,包括以下步骤:
s1、通过ofdm发射机产生多载波数字信号,并将数字信号输入多径衰落信道;
s2、通过ofdm接收机接收不同多径信道下的传输信号;
s3、对传输信号进行信号预处理;
s4、构建rsn-mi神经网络,并对其进行训练;
s5、将预处理后的数据输入rsn-mi神经网络,得到数字信号调制识别结果。
进一步地,所述步骤s1中数字信号的调制方式为bpsk、qpsk、8psk、16qam、32qam或64qam;
所述数字信号具体为:
其中,scp(k)表示第k个发射的ofdm符号,k=1,2,...,k,k表示要发送的总的ofdm符号数,
进一步地,所述步骤s2具体为:
s2.1、构建多径衰落信道的离散单位冲击响应模型c(n)为:
其中,hl表示第l条信道衰落系数,l=0,1,2,...,l-1,l-1表示信道总数,l<d,n表示抽样后的离散时刻,τl表示第l条信道经采样时间ts归一化的路径时延;
s2.2、通过ofdm接收机经过多径衰落信道后的传输信号r(n)为:
r(n)=s(n)*c(n)+w(n)
其中,s(n)表示n时刻发送的数字信号,w(n)表示n时刻的高斯白噪声,*表示卷积运算;
s2.3、获取接收的第k个ofdm符号rcp(k)为:
其中,h0表示第一行为[h00...0]t,第一列为[h0...hl-10...0]t大小为p×p的topelize矩阵;h1表示第一行为[0...0hl-1...h1]t,第一列[00...0]t为大小为p×p的topelize矩阵;wp(k)=[w1(k)w1(k)...wp(k)],wp(k)表示信号上叠加的高斯白噪声向量,w1(k)w1(k)...wp(k)均表示高斯白噪声向量中点数;
进一步地,所述步骤s3具体为:
s3.1、根据ofdm符号rcp(k),获取接收的ofdm符号的自相关矩阵
其中,e表示求取数学期望,
s3.2、对自相关矩阵
其中,h(h)表示h0和h1构成的中间矩阵;
s3.3、以特征向量gi构成大小为(d+1)*8d的特征矩阵gi;并根据特征矩阵gi对衰落系数关系式整理得到:
hhgi=0,0≤i≤d-1
其中,hh表示信道系数向量;
s3.4、以特征矩阵gi构建中间关系式q为:
s3.5、对中间关系式q进行特征值分解,获取最小特征值对应的归一化向量,得到信道衰落系数h;
s3.6、采用子空间盲信道估计算法获取信道衰落系数h的模糊因子,根据模糊因子并采用mmse均衡器对信道进行补偿,完成信号预处理。
进一步地,所述步骤s4中rsn-mi神经网络包括依次连接的输入层、第一卷积层、第二卷积层、残差收缩单元、和运算层、bpg层、第一全连接层和输出层;所述第二卷积层的输出端还与和运算层的输入端连接;
所述残差收缩单元包括第三卷积层、第二全连接层、第三全连接层、第四全连接层、乘运算层以及特征修改层;
所述第三卷积层的输入端为残差收缩单元的输入端,其输出端分别与第二全连接层的输入端和特征修改层的输入端连接;所述第二全连接层的输出端分别与乘运算层的输入端和第三全连接层的输入端连接,所述第三全连接层的输出端通过第四全连接层与乘运算层的输入端连接,所述乘运算层输出端与特征修改层的输入端连接,所述特征修改层的输出端为残差收缩单元的输出端。
进一步地,所述第一卷积层、第二卷积层和第三卷积层的卷积核大小分别为(1,2)、(1,4)和(1,2),且卷积核数目均设置为50;所述第一卷积层、第二卷积层和第三卷积层的激活函数均为prelu函数;所述第三卷积层的输入数据通过batchnormalization操作进行批归一化处理,所述第二全连接层的输出数据分别通过flatten操作、dropout操作和batchnormalization操作进行处理,所述第三全连接层的输出数据均通过batchnormalization操作进行处理,所述第四全连接层的激活函数为sigmoid函数;所述乘运算层用于将第二全连接层输出的特征图与第四全连接层中每个通道的压缩系数a相乘,获取第四全连接层中每个通道的软阈值τ;所述特征修改层用于根据软阈值τ对第三卷积层输出的特征图进行修订更新,更新模型为:
其中,y表示更新后的特征图,x表示更新前的特征图;
所述bpg层表示由batchnormalization操作、prelu函数和globalaveragepooling操作封装组成的层,所述第一全连接层的激活函数为softmax激活函数。
进一步地,所述步骤s4中对rsn-mi神经网络进行训练的具体步骤为:
s4.1、采集若干awgn信道环境中的接收信号作为训练数据集;
s4.2、将训练数据集中数据进行功率归一化,并采用归一化后的训练数据对rsn-mi神经网络进行训练。
进一步地,所述步骤s4.2中对rsn-mi神经网络进行训练的具体步骤为:
s4.2.1、采集每种调制方式若干信号,并分别将每种调制方式对应信号划分为训练样本和验证样本;
s4.2.2、设置迭代次数为s;
s4.2.3、将训练样本输入rsn-mi神经网络,设置学习率为0.002,采用adam优化器对rsn-mi神经网络进行训练;
s4.2.4、重复步骤s4.2.3,采用早停回调函数对验证样本损失度进行检测,若验证样本的损失度收敛或迭代次数达到s,得到训练完成的rsn-mi神经网络。
本发明的有益效果为:
(1)本发明的信号预处理消除了多径效应对采集信号调制特征的干扰,尽量恢复发端数据,采用子空间盲信号估计算法获取信道衰落系数h,并利用少量导频信息消除模糊因子;在估计出了信道的衰落系数后,采用mmse均衡器对信道进行补偿;由于mmse均衡器考虑了信道噪声的影响,因此可以最大程度的恢复出发射机发送的信号。
(2)本发明搭建的rsn-mi神经网络可以忽略掉信道特征,包括噪声对模型学习的干扰,并将重点放在调制类型的特征学习当中。
(3)本发明具有更好的识别精度,同时对于不同信号环境中的接收数据具有鲁棒性,大大减少了网络的训练数目。
(4)本发明可应用于大规模数据量的智能识别场景中,极大的减少网络服务器的计算压力。
附图说明
图1为本发明提出的一种基于深度学习的数字信号调制识别方法流程图。
图2为本发明的rsn-mi神经网络示意图。
图3为本发明数字信号调制识别整体系统框图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
下面结合附图详细说明本发明的实施例。
如图1所示,一种基于深度学习的数字信号调制识别方法,包括以下步骤:
s1、通过ofdm发射机产生多载波数字信号,并将数字信号输入多径衰落信道;
s2、通过ofdm接收机接收不同多径信道下的传输信号;
s3、对传输信号进行信号预处理;
s4、构建rsn-mi神经网络,并对其进行训练;
s5、将预处理后的数据输入rsn-mi神经网络,得到数字信号调制识别结果。
所述步骤s1中数字信号的调制方式为bpsk、qpsk、8psk、16qam、32qam或64qam;
所述数字信号具体为:
其中,scp(k)表示第k个发射的ofdm符号,k=1,2,...,k,k表示要发送的总的ofdm符号数,
所述步骤s2具体为:
s2.1、构建多径衰落信道的离散单位冲击响应模型c(n)为:
其中,hl表示第l条信道衰落系数,l=1,2,...,l-1,l表示信道总数,l<d,n表示抽样后的离散时刻,τl表示第l条信道经采样时间ts归一化的路径时延;
s2.2、通过ofdm接收机经过多径衰落信道后的传输信号r(n)为:
r(n)=s(n)*c(n)+w(n)
其中,s(n)表示n时刻发送的数字信号,w(n)表示n时刻的高斯白噪声,*表示卷积运算;
s2.3、获取接收的第k个ofdm符号rcp(k)为:
其中,h0表示第一行为[h00...0]t,第一列为[h0...hl-10...0]t大小为p×p的topelize矩阵;h1表示第一行为[0...0hl-1...h1]t,第一列[00...0]t为大小为p×p的topelize矩阵;wp(k)=[w1(k)w1(k)...wp(k)],wp(k)表示信号上叠加的高斯白噪声向量,w1(k)w1(k)...wp(k)均表示高斯白噪声向量中点数;
所述步骤s3具体为:
s3.1、根据ofdm符号rcp(k),获取接收的ofdm符号的自相关矩阵
其中,e表示求取数学期望,
s3.2、对自相关矩阵
其中,h(h)表示h0和h1构成的中间矩阵;
s3.3、以特征向量gi构成大小为(d+1)*8d的特征矩阵gi;并根据特征矩阵gi对衰落系数关系式整理得到:
hhgi=0,0≤i≤d-1
其中,hh表示信道系数向量;
在本实施例中,按照发明中描述的方法,以特征向量gi构成大小为(d+1)*8d的特征矩阵gi;然后将s3.2中的等式中的各个符号按照其定义描述展开后,并利用构造的gi可以得到新的等式关系:
又因为s3.2中等式与0相同,即:
hhgi=0,0≤i≤d-1
s3.4、以特征矩阵gi构建中间关系式q为:
s3.5、对中间关系式q进行特征值分解,获取最小特征值对应的归一化向量,得到信道衰落系数h;
s3.6、采用子空间盲信道估计算法获取信道衰落系数h的模糊因子,根据模糊因子并采用mmse均衡器对信道进行补偿,完成信号预处理。
在本实施例中,h(h)表示
将大小为(2n+d)×1的gi均分为大小为d×1的9等份,可以表示为
令
采用子空间盲信道估计算法获取信道衰落系数h的估计
如图2所示,所述步骤s4中rsn-mi神经网络包括依次连接的输入层、第一卷积层、第二卷积层、残差收缩单元、和运算层、bpg层、第一全连接层和输出层;所述第二卷积层的输出端还与和运算层的输入端连接;
所述残差收缩单元包括第三卷积层、第二全连接层、第三全连接层、第四全连接层、乘运算层以及特征修改层;
所述第三卷积层的输入端为残差收缩单元的输入端,其输出端分别与第二全连接层的输入端和特征修改层的输入端连接;所述第二全连接层的输出端分别与乘运算层的输入端和第三全连接层的输入端连接,所述第三全连接层的输出端通过第四全连接层与乘运算层的输入端连接,所述乘运算层输出端与特征修改层的输入端连接,所述特征修改层的输出端为残差收缩单元的输出端。
所述第一卷积层、第二卷积层和第三卷积层的卷积核大小分别为(1,2)、(1,4)和(1,2),且卷积核数目均设置为50;所述第一卷积层、第二卷积层和第三卷积层的激活函数均为prelu函数;所述第三卷积层的输入数据通过batchnormalization操作进行批归一化处理,所述第二全连接层的输出数据分别通过flatten操作、dropout操作和batchnormalization操作进行处理,所述第三全连接层的输出数据均通过batchnormalization操作进行处理,所述第四全连接层的激活函数为sigmoid函数;所述乘运算层用于将第二全连接层输出的特征图与第四全连接层中每个通道的压缩系数a相乘,获取第四全连接层中每个通道的软阈值τ;所述特征修改层用于根据软阈值τ对第三卷积层输出的特征图进行修订更新,更新模型为:
其中,y表示更新后的特征图,x表示更新前的特征图;
所述bpg层表示由batchnormalization操作、prelu函数和globalaveragepooling操作封装组成的层,所述第一全连接层的激活函数为softmax激活函数。
如图3所示,使用本申请构建的rsn-mi神经网络进行信号调试识别的流程。
所述步骤s4中对rsn-mi神经网络进行训练的具体步骤为:
s4.1、采集若干awgn信道环境中的接收信号作为训练数据集;
s4.2、将训练数据集中数据进行功率归一化,并采用归一化后的训练数据对rsn-mi神经网络进行训练。
所述步骤s4.2中对rsn-mi神经网络进行训练的具体步骤为:
s4.2.1、采集每种调制方式若干信号,并分别将每种调制方式对应信号划分为训练样本和验证样本;
s4.2.2、设置迭代次数为s;
s4.2.3、将训练样本输入rsn-mi神经网络,设置学习率为0.002,采用adam优化器对rsn-mi神经网络进行训练;
s4.2.4、重复步骤s4.2.3,采用早停回调函数对验证样本损失度进行检测,若验证样本的损失度收敛或迭代次数达到s,得到训练完成的rsn-mi神经网络。
在本实施例中,模型训练集样本是的iq两路序列构成的大小为(2,2400)的张量。对于每一种调制方式采集5w的样本数目。六种调制方式其样本总数为30w。同时将该样本按照8:2的比例划分为训练集和验证集。网络训练优化器采用adam优化器,学习率设置为0.002,为了防止模型在训练的过程中采用早停回调函数对验证集损失度进行检测,当5次迭代不再下降或者迭代次数结束时,得到训练后的模型。测试网络模型时,测试集数据由不同多径信道下采集的调制信号构成,每一种调制方式收集1w样本,样本总数目为6w。将其经过预处理后送入训练好的模型中进行测试,得到分类结果。
本发明专门为数字信号调制识别设计了一种深度神经网络模型,命名为rsn-mi。该网络结构引入了一种软阈值处理机制,这种处理机制可以减轻噪声对网络特征学习的影响。并且软阈值τ是可以自动更新的,不用人为的进行设置,从而减轻了模型训练的调试难度。其特征更新机制表示为:
记τ为对应通道的软阈值,x表示原特征值,y表示更新后的特征值。目前这种结构应用于深度残差收缩神经网络中用于机械故障诊断。我们借鉴这种机制将其应用于数字信号调制识别任务当中,目的是针对不同信道中的接收数据提高模型的鲁棒性。其设计的网络结构如下:
网络结构考虑了iq数据流的维度特征和所选星座图尺寸大小m进行设计。rsn-mi的输入是接收数据同相支路i和正交支路q组成的二维数据序列,其大小为(2,2400)。选用该尺寸的原因是该大小的信号采样受噪声的影响较小,可以让网络更深层的检测到调制特征。网络的第一层和第二层是卷积层,卷积核大小分别为(1,2)和(1,4),卷积核数目设置为50。这两层卷积层的主要目的是提取到i和q单一维度的特征信息,并且所选卷积核尺寸的原因是在所规定的调制类型c={bpsk、qpsk、8psk、16qam、32qam、64qam}中单一维度最多出现8种值,刚好可以被两个核有效提取。另外(1,2)和(1,4)也可以照顾到低阶调制类型。
卷积层之后,引入修改的深度残差收缩单元,该模块的主要目的就是自动学习和更新软阈值,并对特征图进行修改。首先利用batchnormalization(bn)操作对接收的特征图进行数据归一化以加快网络训练和收敛速度。模块中第一层为卷积层,其卷积核大小为(1,2),卷积核数目为50。这个卷积层的目的是提取到i和q两个维度的组合特征,从而可以获取更加丰富的调制信息。模块的第二层是由flatten层、fullconnection(fc)层和dropout操作组合成的层结构,fc层的神经元数目设置为50。将其记为ffd层。ffd层的主要目的是将特征图压缩到一维空间,此时特征图大小为(50,1,1)。同时fc层又可以进一步提取数据特征。这一步是阈值学习的第一步。之后,模块的三四层均为fc层构成,神经元数目为50。每一层fc层后都加上bn操作来修正数据的分布。第四层fc层采用sigmoid函数将数据压缩到(0,1)范围内,得到每个通道对应的软阈值压缩系数αi,1≤i≤50。每个通道的软阈值可以表示为第一个fc层得到的特征图和对应通道的压缩系数相乘得到。然后根据特征更新机制对模块中卷积层得到的特征图进行修改更新。深度残差收缩单元输入的结果就是修改更新后的特征图。
在深度残差收缩单元后,为了减少特征损失,将整个模块的第二个卷积层得到的特征图通过和运算添加修改更新后的特征图的值后得到一个新的特征图,这个操作名为‘跨层恒等路径’。之后增加一由bn操作、prelu(parametricrectifiedlinearunit)函数和gap(globalaveragepooling)层共同组合的层,记为bpg层。这一层的主要目的是对所得到的特征图进行去复杂化,尽可能的保留有用的特征信息。另外本发明中所有卷积层需要用到的激活函数也都是prelu函数,其目的在于增加模型的非线性程度,保留特征的负值。因为iq序列的数值有正有负,这一点和像素值是有差别的。模型的最后一层是采用了softmax激活函数,拥有6个神经元的fc层,每个神经元对应一种调制方式的标签,通过将每个神经元输出的特征转化为对应的识别概率来预测标签。其最大概率值对应的神经元标签就是输入样本的调制方式。
记vj表示每个神经元对应的输出特征值,si表示第i神经元对应的输出概率,e表示自然常数。整个网络的特点是可以尽量避开信道特征,而提取到调制类型的特征。这样对于多信道接收数据就可以做到正确识别,而不会出现性能滑坡。
对模型的训练集和测试集进行正确的创建。训练集数据是采集于awgn信道环境或者具有很强直射径的信道环境中的接收信号。将采样数据进行归一化后即可训练网络模型。不用针对特定的多径信道场景的采样数据进行训练,每种信噪比下只训练一次即可。测试集数据是采集于不同多径信道环境中的经过前期信号处理过的数据集,将数据进行归一化即可送入网络进行预测
对于标注数据集的获取,本发明所采用的数据样本类型是常规ofdm信号。其标注数据集是经过多径衰落信道后的采样信号。其ofdm信号传输模型如步骤一所阐述。在真实的实验室场景中,可以采用软件无线电设备搭建标注数据采样平台,如附图3所示,利用usrp(universalsoftwareradioperipheral)模拟了真实空口的数据收发。在所搭建的数据平台中采集的数据,完全符合上述ofdm传输模型。
信号预处理是为了消除多径效应对采集信号调制特征的干扰,尽量恢复发端数据,采用子空间盲信号估计算法获取信道衰落系数h,并利用少量导频信息消除模糊因子。在估计出了信道的衰落系数后,采用mmse均衡器对信道进行补偿。由于mmse均衡器考虑了信道噪声的影响,因此可以最大程度的恢复出发射机发送的信号。
对于分类部分,结合调制识别数据类型特性搭建分类器模型rsn-mi。在传统卷积神经网络模型基础上引入残差收缩单元来降低噪声特征对模型学习的影响。结合iq序列,前两个卷积层识别i和q单一维度特征,第三个卷积层综合两个维度特征,通过全连接层来获取软阈值并对特征图进行修正。网络中所有relu激活函数用prelu激活函数替代来保留负特征值。
对模型的训练集和测试集进行正确的创建。训练集数据是采集于加性高斯白噪声(awgn)信道环境或者具有很强直射径的信道环境中的接收信号。将采样数据进行归一化后即可训练网络模型。不用针对特定的多径信道场景的采样数据进行训练,每种信噪比下只训练一次即可。测试集数据是采集于不同多径信道环境中的经过前期信号处理过的数据集,将数据进行归一化即可送入网络进行预测。