本发明涉及信息可视化领域,特别涉及一种无线电信号数据的可视化方法。
背景技术:
无线电频谱是一种有限的自然资源,是现代无线信息传输的基本载体。为了减少无线电信号间的相互干扰、为了保证重要通讯链路的畅通、为了更好地利用有限的频谱资源,特别是在机场和边境等重点区域以及在重大活动保障任务中,加强无线电频谱监测和无线电信号管理,对保障国家安全和促进国民经济平稳发展具有重要战略意义。
对一定频段内无线电频谱进行监测是无线电管理活动的基石,各种监测设备采集的频谱监测数据为频谱占用度计算、干扰信号监测及频谱资源划分提供了信息源。传统频谱数据分析先将频谱用幅频图、时频图和余晖图等可视化方法展示出来,然后由分析人员根据各种频谱图感知信号的时频分布和寻找感兴趣信号。但这种做法对分析人员专业素质要求很高,普通用户没经过专业培训并积累实操经验很难从频谱图中及时准确地鉴别出无线电信号,而且当监测时间变长或频段内出现较多无线电信号时,人工分析效率会快速降低,从而导致难以主动检测不明信号和分析信号间的复杂关联,无线电管理过于依赖举报等被动管理方式。
通过信号处理和数学分析将无线电频谱数据转化为无线电信号数据是无线电管理的新方向,无线电信号数据的每个数据记录代表一个实际存在的无线电信号,其各数据项反映了对应无线电信号的中心频率、带宽、信噪比等多维特征。这种结构化程度更高、信号特征更明晰的无线电信号数据是无线电频谱数据的有益补充,有利于融合公共频率库和授权台站库等基础数据资源,也有利于固化专家经验,促进与各种智能化数据分析手段的应用。但无线电信号数据在实际应用中也存在一些亟需解决的问题,首先无线电信号数据是随时间提取的,大量信号特征记录可能对应同一实际非瞬时无线电信号,由于监测环境的不稳定性以及可能存在干扰信号和多用户时分复用同一频率,采用自动化方法很难正确地按实际无线电信号聚类信号特征记录;然后,传统散点图、线图和平行坐标等可视化方法,都很难表现出无线电信号多特征的时变模式,专家们缺少有效的无线电信号数据可视化方法来观察、比较和分析无线电信号。
技术实现要素:
本发明的目的在于提供一种有效的可视化方法来观察、比较和分析无线电信号,本发明提供了一种新的能够准确展示无线电信号多特征时变模式以及便于比较分析的可视化方法。
本发明的技术方案为:
一种无线电信号数据的可视化方法,包括以下几个步骤:
步骤1:获取无线电信号数据:
无线电信号数据包括在一个时间段[tstart,tend]中检测频段内检测到的所有n个无线电信号{S1,S2,…Si,…,Sn},每个无线电信号包含的特征有中心频率(freq)、带宽(baud)、信噪比(snr)、信号强度(dbm)和时间戳,时间戳表示该信号被检测到的时间点,标记信号Si(1≤i≤n)的中心频率、带宽、信噪比、信号强度和时间戳分别为
步骤2:根据步骤1所获得的无线电信号数据绘制频率‐带宽散点图:
散点图中X轴表示频率,Y轴表示带宽绘制散点图,频率范围为无线电信号被采集的频率区间,带宽范围为0到步骤1获得所有无线电信号中的带宽的最大值;根据每一个信号的中心频率和带宽值找到其在频率‐带宽散点图中的位置,绘制所有信号点;记录每个无线电信号Si在频率‐带宽散点图中的坐标Si(xi,yi)(1≤i≤n);根据信号强度颜色编码,填充信号点;信号强度颜色编码是指将信号强度值由小到大编码为渐变的RGB色度条;
步骤3:使用聚类算法对步骤1所获得的无线电信号数据进行聚类,得到k个聚类{C1,C2,C3,…,Ck},M个噪声点;
无线电信号数据提取是按时间间隔进行的,检测频段内的非瞬时无线电信号会被多次记录,由于信号和采集设备的不稳定性,同一无线电信号的特征会出现一定范围的波动,所以需要使用聚类算法对获取的无线电信号数据进行聚类。
步骤4:划分时间片:
将整个无线电信号采集时间区间[tstart,tend]划分为长度相同的p段,即p个时间片,标记第j个时间段为tj(1≤j≤p)
对每个聚类Ci(1≤i≤k),将该聚类中的所有信号按照其时间戳划分到相应的时间片中,每个聚类Ci(1≤i≤k)得到一个时间片划分序列Csti={sti1,sti2,…,stij,…,stip}(1≤i≤k),其中stij(1≤j≤p)(1≤i≤k)表示聚类Ci(1≤i≤k)中划分到时间片tj(1≤j≤p)内的信号的集合,当该集合内的信号个数为0时,否则将stij记为集合{Sq,…,Sq+r},该集合内信号个数为r+1,0≤r≤n-1,该集合内的所有信号的时间戳在时间片tj(1≤j≤p)内,其中Sq和Sq+r分别表示该集合内的所有信号点按时间戳排序后时间戳最小和最大的信号,q和q+r分别为信号Sq和Sq+r在信号集合{S1,S2,…Si,…,Sn}中的序号;
步骤5:根据步骤4中得到的每个聚类Ci(1≤i≤k)的时间片划分序列Csti={sti1,sti2,…,stip}(1≤i≤k),计算每个聚类Ci(1≤i≤k)中划分到时间片tj(1≤j≤p)内的所有信号的平均中心频率(mFreq)、平均带宽(mBaud)、平均信噪比(mSnr)和平均信号强度(mDbm),若则不进行计算;
步骤6:根据步骤3所获得的聚类结果以及步骤5的计算结果绘制信号流图,具体包括以下步骤:
步骤6.1):绘制信号流图坐标系,其中X轴表示频率,Y轴表示时间;频率范围为无线电信号数据被采集的频率区间,时间范围为无线电信号数据被采集的时间段;每个聚类被绘制成一条信号流;
步骤6.2):对聚类Ci(1≤i≤k),根据stij内信号的平均中心频率的值mFreqij,在信号流图坐标系中对应的频率和时间片tj起始位置绘制点A,根据划分到时间片tj+1内信号的平均中心频率mFreqi(j+1),在信号流图坐标系中对应的频率和时间片tj+1起始位置即时间片tj的终止位置绘制点B,连接点A和点B,绘制一条线段AB,以确定该聚类所对应的信号流在时间片tj的中心位置;
若时间片tj没有与之连续的后继时间片tj+1或则时间片tj对应的信号流不绘制;
步骤6.3):根据该聚类划分到时间片tj内信号的平均带宽确定信号流的宽度,并绘制信号流的左边界和右边界,左边界和右边界关于线段AB对称;
步骤6.4):根据该聚类划分到时间片tj内信号的平均信号强度的值及信号强度颜色编码,填充左边界到线段AB之间的区域;
步骤6.5):根据该聚类划分到时间片tj内信号的平均信噪比以及信噪比颜色编码,填充线段AB到右边界区域;信噪比颜色编码是指将信噪比值由小到大编码为渐变的渐变灰度值;
步骤6.6):重复上述步骤6.2)到步骤6.5),依次绘制Ci(1≤i≤k)所有的时间片,及所有的聚类。
所述步骤2的散点图中,用一个半径为R圆表示一个信号,根据该信号的信号强度,在信号强度颜色编码中找到其值所对应的颜色填充圆。
所述信号强度颜色编码具体实现方法为:颜色模式使用RGB模式,对颜色RGB中的参数以一定步长递减(递增)实现渐变,RGB颜色模式的三个参数的取值范围为0到255。初始颜色为红色(255,0,0),假设步长为i,初始颜色的第二个参数依次递增i,渐变为黄色(255,255,0),然后第一个参数依次递减i,渐变为绿色(0,255,0),然后第三个参数依次递增i,渐变为青色(0,255,255),然后第二个参数依次递减i,渐变为蓝色(0,0,255),然后第三个参数依次递减i,最后渐变为黑色(0,0,0)。从初始颜色红色渐变到黑色所经过的距离长度distance为(5*255)/i,将(0,‐140)dbm范围的信号强度值转化为(0,(5*255)/i)范围,即(0,‐140)范围中的每个信号强度值s(dbm)在(0,(5*255)/i)范围对应一个唯一的值mindex,得到mindex之后通过下述方式得到该信号强度值所对应的颜色color(r,g,b):
若mindex>=0且mindex<=255/i,则令
r=255;
g=map(mindex,0,255/i,0,255);
b=0;
若mindex>255/i且mindex<=255*2/i,则令
r=map(mindex,255/i,255*2/i,0,255);
g=255;
b=0;
若mindex>255*2/i且mindex<=255*3/i,则令
r=0;
g=255
b=map(mindex,255*2/i,255*3/i,0,255);
若mindex>3*255/i且mindex<=255*4/i,则令
r=0;
g=map(mindex,255*3/i,255*4/i,0,255);
b=255;
若mindex>4*255/i且mindex<=255*5/i,则令
r=0;
g=0;
b=map(mindex,255*4/i,255*5/i,0,255);
其中map(x,x1,x2,x3,x4)函数为返回取值在(x1,x2)范围内的x转化到(x3,x4)范围的对应值;
通过该方法,使得0到‐140dbm的信号强度值编码为由红色渐变为黄色再渐变为绿色再渐变为青色再渐变为蓝色,最后渐变为黑色的色度条。
所述信噪比颜色编码具体实现方法为:使用灰度颜色模式,即以0到255的不同灰度值来表示颜色,0表示黑色,255表示白色;将范围为0到100的信噪比值转化为0到255范围的颜色值,即(0,100)范围内的每个信噪比值对应(0,255)范围的一个颜色值,该颜色值即为该信噪比的灰度颜色编码;将0到100的信噪比值编码为从白色到黑色的渐变灰度;
所述步骤3使用DBScan聚类算法对无线电信号数据进行聚类,具体步骤如下:
步骤3.1:设置DBScan聚类算法所需的两个参数:半径eps和邻域内最少点的数量minpts;标记所有点的初始状态为未被访问(unvisited);
步骤3.2:计算步骤2频率‐带宽散点图的欧氏距离:作为聚类算法中两个信号Si,Sj(1≤i,j≤n,i≠j)之间的距离;
DBScan算法的具体方法:任选一个未被访问(unvisited)的点开始,找出与其距离在eps之内(包括eps)的所有附近点。如果附近点的数量≥minpts,则当前点与其附近点形成一个簇,并且出发点被标记为已访问(visited)。然后递归,以相同的方法处理该簇内所有未被标记为已访问(visited)的点,从而对簇进行扩展。如果附近点的数量<minpts,则该点暂时被标记作为噪声点。如果簇充分地被扩展,即簇内的所有点被标记为已访问,然后用同样的算法去处理未被访问的点;
步骤3.3:得到DBScan聚类算法的结果,共k个聚类,M个噪声点。
DBScan聚类算法是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。
DBScan聚类算法中,使用频率‐带宽散点图中信号点之间的欧式距离度量两个信号Si,Sj(1≤i,j≤n,i≠j)之间的距离;这是是因为中心频率和带宽是识别一个无线电信号的核心特征,而中心频率(单位Mhz)和带宽(单位db)之间的取值相差较大,直接使用会使得聚类时判断两个信号点之间的距离受带宽的影响太大,而中心频率的影响基本可以忽略不计,从而聚类得到结果偏差太大。
所述步骤3中,使用聚类算法对无线电信号数据进行聚类,并自定义各个聚类的颜色;定义各个聚类的颜色时,结合无线电信号数据信号强度的分布情况,选择信号强度编码未使用到并且和该聚类内的信号点填充颜色区分度高的颜色,以便更好地区分开聚类和该聚类内的信号点。
所述步骤4中,p的设定依据无线电信号采集的时间跨度以及采样率选择;例如:信号采集间隔时间为1秒,那么可以设置时间片的长度为1秒,则p的等于[tstart,tend]的秒数。
所述步骤4中,所述步骤5中,聚类Ci(1≤i≤k)中划分到时间片tj(1≤j≤p)内的所有信号的平均中心频率(mFreq)、平均带宽(mBaud)、平均信噪比(mSnr)和平均信号强度(mDbm)的计算方式如下:
所述步骤6中,在绘制信号流时,如果存在连续一段时间中没有信号出现,因为每个聚类中可能并不是所有时间片内都存在信号,那么这条流就可能出现不连续的情况,为了显示信号的时间不连续性,设置两个绘制参数:时间片信号点稀疏度e和连续稀疏时间片数z,时间片信号点稀疏度表示一个时间片内的最少信号个数,连续稀疏时间片数表示信号个数少于时间片信号稀疏度的连续时间片数,如果出现大于或等于z的连续时间片内的信号点都少于e,那么不绘制这一段信号流。
有益效果
本发明提供了一种无线电信号数据的可视化方法,步骤1:从频谱数据和原始电平采样数据中提取无线电信号数据;步骤2:使用聚类算法对无线电信号数据进行聚类;步骤3:对每个聚类计算每个时间片的平均中心频率、平均带宽、平均信噪比和平均信号强度;步骤4:绘制信号流图。利用信号流图有效编码无线电信号的多种特征,将时频上较离散的信号数据的多种重要特征平滑地展示出来,更好的有效的展示无线电信号的多特征时变模式,便于分析人员观察、比较和分析无线电信号,提高分析人员对无线电信号数量和微观特征的辨识能力,加快分析人员对无线电信号时变模式的宏观感知效率。
附图说明
图1为本发明所述方法的流程图;
图2为频率‐带宽二维散点图;
图3为使用DBScan聚类算法聚类后并对每个聚类分配好颜色的频率带宽二维散点图;
图4信号流图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步详细的描述。
一种无线电信号数据的可视化方法,包括以下几个步骤:
步骤1:获取无线电信号数据,无线电信号数据为2016/4/7 15:16:08到2016/4/7 15:17:42,一共94秒的时间段内频率范围为952‐961Mhz的所有信号点,无线电信号数据的每个数据记录都对应一个无线电信号,每个无线电信号包含的特征有中心频率(freq)、带宽(baud)、信噪比(snr)、信号强度(dbm)和时间戳,表示该信号在时间戳所表示的时间点被检测到,共包含6437个无线电信号,标记信号Si(1≤i≤6437)的中心频率、带宽、信噪比、信号强度和时间戳分别为
步骤2:根据步骤1所获得的无线电信号数据绘制频率‐带宽散点图,其中X轴表示频率,频率范围为952‐961Mhz,Y轴表示带宽,带宽范围0到4050db。频率‐带宽散点图中,每个信号被表示为一个半径为R的圆,圆的颜色表示该信号的信号强度,信号强度颜色编码为由红色渐变为黄色再渐变为绿色再渐变为青色再渐变为蓝色,最后渐变为黑色的色度条编码0到‐140dbm的信号强度值,记录信号点Si在频率‐带宽散点图中的坐标Si(xi,yi)(1≤i≤n)。频率‐带宽散点图如图2所示;
步骤3:使用DBScan聚类算法对步骤1所获得的无线电信号数据进行聚类。无线电信号数据提取是按时间间隔进行的,监测频段内的非瞬时无线电信号会被多次记录,由于信号和采集设备的不稳定性,同一无线电信号的特征会出现一定范围的波动,所以需要使用聚类算法对获取的无线电信号数据进行聚类。DBScan聚类算法是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。聚类算法中两个信号Si,Sj(1≤i,j≤n,i≠j)之间的距离使用步骤2频率‐带宽散点图的欧氏距离:设置DBScan聚类算法所需参数eps=30,minpts=40。DBScan聚类算法得到7个聚类{C1,C2,C3,…,C7},640个噪声点,自定义各个聚类的颜色,信号强度的值比较集中在‐30到‐80dbm之间,即点的颜色主要在橙色渐变到绿色的区间,所以选择聚类颜色时可以使用其它未使用到的其它颜色。使用DBScan进行聚类后的频率‐带宽散点图如图3所示,每个聚类使用一个多边形将其包围起来;
步骤4:划分时间片,将整个无线电信号采集时间区间2016/4/715:16:08到2016/4/715:17:42划分为94段,每段长度为1秒,标记第j个时间段为tj(1≤j≤94)。根据步骤3所得到的7个聚类,对每个聚类Ci(1≤i≤7),将该聚类中的所有信号点按照其时间戳划分到相应的时间片中,每个聚类Ci(1≤i≤7)得到一个时间序列Csti={sti1,sti2,…,sti94}(1≤i≤7),其中stij(1≤j≤94)(1≤i≤7)表示一个信号点的集合{Sq,…,Sq+r},集合内信号个数为r(0≤r≤6437),该集合内的所有信号点的时间戳在tj(1≤j≤94)时间片内;
步骤5:根据步骤4中得到的每个聚类Ci(1≤i≤7)时间片划分后的序列Csti={sti1,sti2,…,sti94}(1≤i≤7),对每个聚类的时间片划分序列,计算每个时间片tj(1≤j≤94)内信号的平均中心频率(mFreq)、平均带宽(mBaud)、平均信噪比(mSnr)和平均信号强度(mDbm),计算方式如下:
步骤6:根据步骤5计算得到的每个聚类的时间片划分后的每个时间片的平均中心频率(mFreq)、平均带宽(mBaud)、平均信噪比(mSnr)和平均信号强度(mDbm)绘制信号流图,信号流图中X轴表示频率,Y轴表示时间,并且时间自上而下递增,频率范围为无线电信号数据被采集的频率区间,时间范围为无线电信号数据被采集的时间段;每个聚类被绘制成一条信号流。首先取第一个聚类,绘制其第一个时间片,根据第一个时间片的中心频率的值以及第二个时间片的中心频率值在信号流图坐标系中对应的频率和该时间片所对应的时间区域绘制一条直线,确定该聚类所对应的信号流在该时间片的中心位置;然后根据该聚类在该时间片内的平均信号带宽绘制信号流的左边界和右边界,左边界到右边界的距离是其信号带宽的值,由于信号带宽可能较大,可以乘以一个小于1的系数,左边界到中心频率直线的距离是其平均带宽的二分之一,右边界到中心频率直线的距离也是其平均带宽的二分之一,左边界和右边界是平行于中心频率直线的直线;然后根据该时间片内平均信号强度的值填充左边界到中心频率线区域,颜色编码与步骤2中信号圆点的颜色编码相同;然后根据该时间片内平均信噪比填充中心频率线到右边界区域,颜色编码使用从白色到黑色的渐变灰度编码0到100的信噪比值;重复上述步骤依次绘制余下的时间片,最后一个时间片不绘制。同理绘制所有的聚类。在绘制信号流时,如果某条流在连续一段时间中都没有信号出现,那么这条流就可能出现不连续的情况,为了显示信号的时间不连续性,这里我们设置两个绘制参数:每秒信号点稀疏度和连续稀疏秒数,如果出现连续z秒信号点都较为稀疏,那么信号流将不绘制这一段。绘制好的信号流图如图4所示。