一种基于机器学习的Morse信号自动检测译码方法与流程

文档序号:11156353阅读:1167来源:国知局
一种基于机器学习的Morse信号自动检测译码方法与制造工艺
本发明涉及机器学习
技术领域
,尤其是涉及一种基于机器学习的Morse信号自动检测判别与译码的方法。
背景技术
:作为计算机实现自动模式识别的关键
技术领域
,机器学习旨在利用计算机模仿人类基于已有知识,进而对新数据进行分析判断的决策过程。其中,分类器是机器学习技术的重要研究方向。分类的概念是指在已有数据的基础上得出一个分类函数或构造出一个分类模型(即分类器)。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测。总之,分类器是数据挖掘中对样本进行分类的方法的统称,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。其中,决策树是一种常用的分类方法,相比于其他分类方法,其具有算法复杂度低,数据预测速度快的特点。决策树的预测过程为通过对已知数据的分析,构建一种树形结构,树形的各个分支节点代表一个测试输出,末端节点为最终的预测结果输出。在预测未知数据结果时,通过从树顶端开始向末端节点延伸,期间经过多个分支节点,最终指向唯一的末端节点,得到预测结果值。本发明技术所针对的Morse信号是短波通信中的一种通信方式,其具有信号带宽窄,设备简单,机动性、抗毁性强等特点,是强噪声干扰背景下信号通信的主要信号类型之一。通过信号接收仪器,对当前信道中存在的Morse信号频段进行定位,并进行码文翻译,从而完成基于Morse码的通信信息交互,是通信工作的重要任务之一。目前,Morse信号的接收仍然采用人工值守方式,随着科学技术的进步发展,这种人工方式日益暴露出一些弊端。人用耳朵接收到Morse信号后,大脑需要对Morse信号含义做出判别,才能翻译出所接收到Morse信号的含义。但人的反应能力毕竟是有限的,不可能长时间保持高度有效的工作状态。当信息量逐渐增加,要求对所接收到的信号做快速译码处理时,这就对报务员提出了一定的挑战。因为耳朵识别信号和译码都需要一定的时间,报务员在长时间精力高度集中的状态下工作,难以保证对Morse信号含义进行准确译码。这种重复的工作枯燥、易使人疲劳,所以,误译、漏译的情况是不可避免的。更重要的是,培养一名优秀的报务员,需要一定的时间和财力。因此,研究一种能够部分取代人的自动检测与判别系统,实现Morse信号的自动检测与译码,具有重要的意义。现有的Morse自动检测译码方法,存在信号判别类型固定、对手工发报的Morse信号的译码准确率较低的问题。本发明针对于人工进行Morse信号检测译码方法存在的人力成本高、准确率不稳定、以及现有其他一些Morse自动检测译码方法存在的检测译码适用性不高的问题,提出一种基于机器学习的Morse信号自动检测译码方法,在保证保持高检测译码准确率的同时,有效减少检测译码所需的人工成本,提高Morse检测译码的时效性。技术实现要素:本发明所要解决的技术问题是针对传统Morse信号检测译码方式存在的人工成本高、准确率受人为因素影响大的问题,提供一种基于机器学习构建的分类器Morse检测译码方法,在保证检测译码准确率的前提下,有效降低人工成本,提高Morse检测译码的效率。本发明解决上述技术问题所采用的技术方案为:一种基于机器学习的Morse信号特征构建分类器方法,针对Morse信号进行信号检测和译码。本发明的技术方案流程如图1所示。本方法包含如下步骤:1)读入宽带信号数据,并进行fft变换,得到宽带信号时频图谱。2)基于能量累积的有效信号检测:对宽带信号时频图谱沿频率方向求能量累积。根据信号强度与时频图谱能量成正比可知,当某一频率区间存在可检测的信号时,沿该频段方向求得的能量累积值将明显高于相邻的无检测信号区域的能量累积值。该过程如图2所示。图2中,上小图为时频图谱示例,下小图为沿频率方向求能量累计的能量累积曲线。可以发现,时频图谱存在可检测信号的频率段,对应下方的能量累积曲线的局部峰值。具体的峰值划分阈值的计算方法为计算输入时频图的行和矩阵V的均值μ与标准差σ,定位阈值T=μ+C*σ,C为常数系数,默认为1。将能量累积曲线中各个高于定位阈值T的连续区间定义为峰值区间。因此,通过按照能量累积曲线的等值区间,对时频图谱相应频率段进行截取,可以获取到有效信号时频图谱。3)对检测到的有效信号进行特征提取,得到有效信号的特征矩阵:通过对已获取的有效信号时频图进行特征分析,可以得到用于比对描述该有效信号时频图与Morse特征差距的特征矩阵。特征矩阵包含了以下几种特征:3.1)波动度特征信号的间断性是Morse信号的重要特征之一。该特征可以描述为对信号所处频段的时频图谱,沿频率方向求累积值,可得到较为规则的非等间距方波曲线,对该方波信号峰值部分的间断呈现出波动但不剧烈且持续的特点。为了这一特征数值化,采用对能量累积曲线的峰值部分求取标准差。上述过程可用以下公式描述:I_ij表示信号时频图,i表示y轴坐标,j表示x轴坐标,其中y轴坐标范围为[1,m],x轴坐标范围为[1,n]。对于y轴投影曲线最大值所在行称为图像局部区域,对该区域进行x轴投影:Hj=Ikj(k=i,k为y轴投影最大点)(j=1,2…n)。基于y轴投影最大区域位置行的x轴投影:(k为y轴投影最大点)(j=1,2…n)。对投影曲线求取标准差:标准差公式为将该标准差数值结果作为波动度特征结果输出。3.2)镜像度特征信号的镜像度是Morse信号的重要特征之一。该特征可以描述为对于Morse信号,信号时频图沿时间方向的能量累积曲线以最高点为中心近似对称。该特征主要为Morse信号等线性聚集信号所独有,而话音信号等不具备该特征,因此可以有效区分Morse信号与其他类型的信号。该特征如图3所示。其中图3左小图为Morse信号的能量累积曲线,右小图为话音信号的能量累积曲线,对比图3左右两小图可以观察到Morse信号具有很高的镜像度,而话音信号的镜像度很低。为了这一特征数值化,采用如下方式对镜像度进行计算:定义信号能量曲线的有效值域区间[a,b],设定阈值C,曲线中高于C的部分为有效区域。其中,C=0.3*(b-a)+a。以曲线最高点为起始点,向两侧找曲线第一次衰落到C以下时的位置作为结束点,分别求起始点与两侧结束点的距离L_l和L_r。求M=|L_l-L_r|,对称时结果接近0;将镜像度度量值M作为镜像度特征提取结果进行输出。3.3)分散度特征信号的分散度是Morse信号的重要特征之一。该特征可以描述为对于Morse信号,对信号区域对应的时频图谱沿时间方向累积得到能量曲线,实际上得到的是信号在每个离散频点的能量累积量,这些累积量的幅度分布是不均匀的,通过累积量的幅度分布间隔,可以区分。因此,对频点幅度对应的值域区间中包含的离散频点个数进行统计,得到曲线的空间分散度特征。通过区分度量指标,可以得到不同信号的曲线空间分布密度特征,表现为以下三种特征:高位聚集、中位聚集、低位聚集。Morse信号具有较强的低位聚集的曲线空间分布密度特征,如图4左小图所示;而话音信号、FM等信号的低位聚集特征不明显,如图4右小图所示。为了这一特征数值化,采用如下方式对分散度进行计算:求能量累积曲线的值域区间|V(i)|∈[a,b],设区间大小为k(k=b-a),对k划分(通过研究k值与时频分辨率的关系,得到对应关系数组),统计每个区间中的散点数量。将包含各区间的散点数量的数组作为分散度特征提取结果输出。对以上三种特征的输出结果进行合并,得到待检测信号时频图的特征矩阵。4)基于机器学习构建的决策树分类器,通过对有效信号的特征矩阵进行分析,从而实现Morse信号判别:通过对已知的信道环境下的Morse信号特征矩阵进行收集,构建决策树分类器并完成分类器训练。随后将待检测的信号的特征矩阵输入到已训练好的决策树分类器,得出Morse信号的判别结果。5)基于K-均值的Morse译码:Morse译码可理解为将以数据长度形式表示的Morse信号转换成有实际意义且可阅读的Morse电码报文。因此译码算法包括两部分内容:基于K-means的点划识别和查表译码。标准Morse码的各符号(点、划、码间隔、字符间隔、字间隔)的时宽存在1:3:1:5:7的比例关系。但在实际发报中,由于发报人手法各异以及信道中的噪声干扰,会使得Morse信号报文的数据长度不能严格满足上述比例关系。因此采用机器学习中的K-means聚类算法,从而提高点划的识别率。分析Morse时频图像,矩形块为信号区域,矩形块的长度代表码长,通过分析码长可以判断矩形块属于点还是划。相邻矩形块的距离代表了间隔,其长短代表了间隔的类型,包括码间隔、字符间隔和字间隔,通过间隔来对点划进行正确的分组。参数提取主要是获得码和间隔的长度。设Morse信号的时频二值化图像对应的时频矩阵为I(x,y),算法如下:Step1:通过对时频矩阵I求取列和,得到一维矩阵IA;Step2:一维矩阵IA中大于0的值设为1,得到二值矩阵B,其中0代表空码、1代表传码;Step3:定位到首个1出现的时间,并记录Pos_1;Step4:定位到首个0出现的时间,记录Pos_0,计算传码码长:ΔT1=Pos_0-Pos_1;Step5:定位到下一个1出现的时间,更新Pos_1,计算空码码长:ΔT0=Pos_1-Pos_0,如未定位到,则终止,否则跳转至Step4。通过以上步骤,可以得到更具有信息量的0、1分布情况的二维矩阵B(2行n列)。第一行表示0出现或者1出现;第二行表示0或者1的持续时间。这样就记录了码文和间隔的长度,可用于点划识别。随后,使用基于K-means的聚类算法对三种符号的长度进行聚集分类。方法如下:Step1:求初始聚类中心:对间隔长度直方图采用最大值方法,求得第一个峰、第二个峰的间隔长度和最大间隔长度作为初始中心;Step2:用K-means聚类算法聚类;Step3:将3个聚类结果归类为码间隔、字符间隔和字间隔。该过程如图5所示,其中左上图为Step1过程,右上图为Step2过程,下图为基于K-means的聚类算法的聚类划分结果,对Morse信号图进行三种符号的划分。随后,基于以上过程,对Morse报文进行二值化和间断化表示,最终完成由Morse信号时频图到Morse报文的转换。最后,按照图6所示Morse译码码表的电子表格,将报文自动化的转换为码文,实现Morse信号的译码过程。与传统的Morse检测译码技术相比,本发明的优点在于:传统的人工检测译码方法需要进行大量的人员培训工作,同时对于完成人工Morse信号检测译码的人员的经验要求很高,且在长时间进行信号检测工作后,检测译码准确率会随着人员的疲劳而下降。现有的Morse自动检测译码方法,主要以标准Morse信号为检测前提,没有充分考虑Morse信号码文长度因发报人员的习惯手法而导致的同一符号的长度不等。本发明充分利用Morse信号的时频图谱特征,引入机器学习领域的决策树分类器判别方法,通过对信号的特定特征进行提取,对Morse信号进行判别。同时,针对于Morse报文的长度不统一性,引入K-means聚类算法,解决不规范的Morse报文的译码。该方法可以在保证Morse信号检测译码的准确率的同时,有效提高Morse信号检测译码过程的自动化以及对不规范Morse码文的抗干扰能力,保持监测译码的高时效性。实验结果表明,本发明的方法与3D-HEVC中采用的合并模式快速判定方法相比,能够在码流只有少许增加,编码质量基本不降低的情况下,节省平均20.4%的非独立视点纹理图编码时间。所述4)中采用了基于信号的波动度、镜像度、分散度特征的决策树分类器构建方法,进而实现对于Morse信号的检测。所述5)中对Morse码文的三种符号间隔进行统计,并使用K-means聚类算法对三种符号的间隔进行聚类,得出基于聚类结果的间隔识别,对报文译码进行间隔识别。附图说明图1是本发明方法的流程图;图2是基于能量累积的有效信号检测示意图;图3是镜像度特征示意图;图4是分散度特征示意图;图5是基于K-means聚类方法的码文符号分析示意图。图6是Morse译码码表示意图。具体实施方式以下结合附图对本发明作进一步详细阐述。本发明针对Morse信号的检测与译码特点,设计了基于机器学习的Morse自动检测与译码方法。在实际的使用中,计算机将调用基于本发明方法流程的程序完成具体的Morse信号自动检测译码工作。图1为本发明方法的流程图。本发明的方法步骤如下:第一步:读入宽带信号数据,并进行fft变换,得到宽带信号时频图谱。第二步:基于能量累积的有效信号检测:对宽带信号时频图谱沿频率方向求能量累积。根据信号强度与时频图谱能量成正比可知,当某一频率区间存在可检测的信号时,沿该频段方向求得的能量累积值将明显高于相邻的无检测信号区域的能量累积值。该过程如图2所示。图2中,上小图为时频图谱示例,下小图为沿频率方向求能量累计的能量累积曲线。可以发现,时频图谱存在可检测信号的频率段,对应下方的能量累积曲线的局部峰值。因此,通过按照能量累积曲线的峰值位置,对时频图谱相应频率段进行截取,可以获取到有效信号时频图谱。第三步:对检测到的有效信号进行特征提取,得到有效信号的特征矩阵:通过对已获取的有效信号时频图进行特征分析,可以得到用于比对描述该有效信号时频图与Morse特征差距的特征矩阵。特征矩阵包含了以下几种特征:3.1)波动度特征信号的间断性是Morse信号的重要特征之一。该特征可以描述为对信号所处频段的时频图谱,沿频率方向求累积值,可得到较为规则的非等间距方波曲线,对该方波信号峰值部分的间断呈现出波动但不剧烈且持续的特点。为了这一特征数值化,采用对能量累积曲线的峰值部分求取标准差。上述过程可用以下公式描述:I_ij表示信号时频图,i表示y轴坐标,j表示x轴坐标,其中y轴坐标范围为[1,m],x轴坐标范围为[1,n]。对于y轴投影曲线最大值所在行称为图像局部区域,对该区域进行x轴投影:Hj=Ikj(i=k,k为y轴投影最大点)(j=1,2…n)。基于y轴投影最大区域位置行的x轴投影:(k为y轴投影最大点)(j=1,2…n)。对投影曲线求取标准差:标准差公式为将该标准差数值结果作为波动度特征结果输出。3.2)镜像度特征信号的镜像度是Morse信号的重要特征之一。该特征可以描述为对于Morse信号,信号时频图沿时间方向的能量累积曲线以最高点为中心近似对称。该特征主要为Morse信号等线性聚集信号所独有,而话音信号等不具备该特征,因此可以有效区分Morse信号与其他类型的信号。该特征如图3所示。其中图3左小图为Morse信号的能量累积曲线,右小图为话音信号的能量累积曲线,对比图3左右两小图可以观察到Morse信号具有很高的镜像度,而话音信号的镜像度很低。为了这一特征数值化,采用如下方式对镜像度进行计算:定义信号能量曲线的有效值域区间[a,b],设定阈值C,曲线中高于C的部分为有效区域。其中,C=0.3*(b-a)+a。以曲线最高点为起始点,向两侧找曲线第一次衰落到C以下时的位置作为结束点,分别求起始点与两侧结束点的距离L_l和L_r。求M=|L_l-L_r|,对称时结果接近0;将镜像度度量值M作为镜像度特征提取结果进行输出。3.3)分散度特征信号的分散度是Morse信号的重要特征之一。该特征可以描述为对于Morse信号,对信号区域对应的时频图谱沿时间方向累积得到能量曲线,实际上得到的是信号在每个离散频点的能量累积量,这些累积量的幅度分布是不均匀的,通过累积量的幅度分布间隔,可以区分。因此,对频点幅度对应的值域区间中包含的离散频点个数进行统计,得到曲线的空间分散度特征。通过区分度量指标,可以得到不同信号的曲线空间分布密度特征,表现为以下三种特征:高位聚集、中位聚集、低位聚集。Morse信号具有较强的低位聚集的曲线空间分布密度特征,如图4左小图所示;而话音信号、FM等信号的低位聚集特征不明显,如图4右小图所示。为了这一特征数值化,采用如下方式对分散度进行计算:求能量累积曲线的值域区间|V(i)|∈[a,b],设区间大小为k(k=b-a),对k划分(通过研究k值与时频分辨率的关系,得到对应关系数组),统计每个区间中的散点数量。将包含各区间的散点数量的数组作为分散度特征提取结果输出。对以上三种特征的输出结果进行合并,得到待检测信号时频图的特征矩阵。第四步:基于机器学习构建的决策树分类器,通过对有效信号的特征矩阵进行分析,从而实现Morse信号判别:通过对已知的信道环境下的Morse信号特征矩阵进行收集,构建决策树分类器并完成分类器训练。随后将待检测的信号的特征矩阵输入到已训练好的决策树分类器,得出Morse信号的判别结果。第五步:基于K-均值的Morse译码:Morse译码可理解为将以数据长度形式表示的Morse信号转换成有实际意义且可阅读的Morse电码报文。因此译码算法包括两部分内容:基于K-means的点划识别和查表译码。标准Morse码的各符号(点、划、码间隔、字符间隔、字间隔)的时宽存在1:3:1:5:7的比例关系。但在实际发报中,由于发报人手法各异以及信道中的噪声干扰,会使得Morse信号报文的数据长度不能严格满足上述比例关系。因此采用机器学习中的K-means聚类算法,从而提高点划的识别率。分析Morse时频图像,矩形块为信号区域,矩形块的长度代表码长,通过分析码长可以判断矩形块属于点还是划。相邻矩形块的距离代表了间隔,其长短代表了间隔的类型,包括码间隔、字符间隔和字间隔,通过间隔来对点划进行正确的分组。参数提取主要是获得码和间隔的长度。设Morse信号的时频二值化图像对应的时频矩阵为I(x,y),算法如下:Step1:通过对时频矩阵I求取列和,得到一维矩阵IA;Step2:一维矩阵IA中大于0的值设为1,得到二值矩阵B,其中0代表空码、1代表传码;Step3:定位到首个1出现的时间,并记录Pos_1;Step4:定位到首个0出现的时间,记录Pos_0,计算传码码长:ΔT1=Pos_0-Pos_1;Step5:定位到下一个1出现的时间,更新Pos_1,计算空码码长:ΔT0=Pos_1-Pos_0,如未定位到,则终止,否则跳转至Step4。通过以上步骤,可以得到更具有信息量的0、1分布情况的二维矩阵B(2行n列)。第一行表示0出现或者1出现;第二行表示0或者1的持续时间。这样就记录了码文和间隔的长度,可用于点划识别。随后,使用基于K-means的聚类算法对三种符号的长度进行聚集分类。方法如下:Step1:求初始聚类中心:对间隔长度直方图采用最大值方法,求得第一个峰、第二个峰的间隔长度和最大间隔长度作为初始中心;Step2:用K-means聚类算法聚类;Step3:将3个聚类结果归类为码间隔、字符间隔和字间隔。该过程如图5所示,其中左上图为Step1过程,右上图为Step2过程,下图为基于K-means的聚类算法的聚类划分结果,对Morse信号图进行三种符号的划分。随后,基于以上过程,对Morse报文进行二值化和间断化表示,最终完成由Morse信号时频图到Morse报文的转换。最后,按照图6所示Morse译码码表的电子表格,将报文自动化的转换为码文,实现Morse信号的译码过程。为了检验本发明所提出的方法的性能,将基于本发明方法的计算机程序对多个包含不同类型信号的信道的数据进行实际测试,并对该Morse自动检测译码的结果进行人工复检,得出本发明方法结果的正确率。实验硬件环境为Intel(R)Core(TM)i5-4200MCPU,8GBRAM配置的计算机。实验软件平台为VisualStudio2010,用于测试的信道数据包括5MHz、7MHz、9MHz、12MHz等多个频段的时长为101秒的采样时频数据.dat文件。表1为部分信道环境下的本发明方法的检测译码性能统计结果。由于各个信道数据除包含Morse信号外,还包含大量其他类型的信号(如话音信号、调频信号、调幅信号等),同时这些非Morse类型的信号在信号特征上各有异同,因此可以使用这些信道数据来测试本发明的算法在复杂信号环境下的Morse信号检测译码的适用性。与传统的检测译码过程相比,本发明方法克服了作业人员的疲劳导致的对于检测译码正确率的影响。同时,对于手工发报的不规范码文的译码准确率也处于同领域的较高水平。表1的第二行内容为在各个信道环境下,实际真实存在的Morse信号数量、基于本发明方法检测到的Morse信号数量,以及经过人工复检后,在基于本发明方法所检测到的Morse信号中包含正确的Morse的信号数量。后几行内容分别为Morse信号数量检测的正确率,Morse信号译码的正确率,以及同一频点的Morse信号的平均处理延迟。从表中可以看出,本发明在所列的4种信道环境下,能够高效地对Morse信号进行检测捕获,同时对信道中存在的非Morse信号类型具备抗检测干扰能力,检测正确率保持在95%以上。在译码方面,本发明方法对于信道中存在的机器码和手工码均具有较好的译码识别能力,译码正确率保持在80%以上。同时,通过统计平均单个频点Morse信号的检测译码过程处理延迟,可以发现平均到每个Morse信号,数据从开始检测到译码完成能够在0.25s内完成,Morse信号检测译码的高实时性。表1部分测试信道环境下的本发明方法的检测译码性能统计结果数据源(MHz)5MHz7MHz9MHz12MHz存在/检测/正确Morse数量25/26/2546/47/4542/43/4214/14/14检测正确率0.9620.9570.9771译码正确率0.8210.8370.8580.843平均处理延迟(s)0.250.240.270.22表2为对比基于人工的Morse检测译码方法、现有的一种基于时域分析的检测译码方法,以及本发明的基于机器学习的Morse自动检测译码方法。从表中可以看出,本发明方法在Morse信号的检测准确率方面,与具有丰富信号检查的经验的人员完成的人工检测译码方法的检测准确率基本持平,且高于现有的时域检测译码方法;在准确率波动性方面,本发明方法由于是基于计算机自动执行,因此受人员持续工作等因素的影响波动性明显少于人工检测译码的准确率稳定性;在译码正确率方面,本发明方法与具有丰富信号检测经验的人员完成的人工译码正确率基本持平,并高于现有的时域检测译码方法;在完成检测译码的平均用时方面,少于人工检测译码方法与时域检测译码方法。从而证明本发明方法在Morse检测译码的准确、稳定、高效方面具有先进性。表2不同Morse检测译码方法性能的对比Morse检测译码方法人工检测译码一种时域检测译码方法本发明方法检测准确率95%75%95%准确率波动性±20%±5%±5%译码正确率85%60%84.3%检测译码延迟(秒/字符)>1s<500ms<250ms当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1