本发明属于自然语言处理与人工智能领域,特别涉及一种基于bls的navtex报文语境智能决策支持方法。
背景技术:
1、海上运输过程中,大部分船舶均装有全球海上遇险和安全系统。而该系统中包含的navtex系统,其播发的报文涉及到大量航行警告、气象警告、气象预报和其它有关航行安全的紧急信息等文本信息。因此,准确地掌握并利用navtex报文对船舶航行决策支持至关重要。但目前navtex报文尚未完全融入到船舶航行的辅助系统中去,在船舶驾驶管理、决策支持等实际场景中没有高效地发挥作用。这是由于船舶智能驾驶的相关技术当前仍然处于理论研究阶段,并未落实到实际应用中。同时航运业相对其他行业来说自身发展具有限制性,目前在技术以及管理等方面仍然相对落后,使得对航海人员依旧有较高程度的依赖性。在使用navtex系统过程中,航海人员接收到navtex报文后,须对其人工读取分析后,才能做出相应的航行决策。这不仅使航海人员的工作强度增加,而且影响其工作效率。此外,人工读取信息的准确率不如自动化程度高,进而会影响船舶航行的安全性。
2、针对上述问题,当前关于navtex报文内容进行智能分类,并为航海人员提供语境决策支持服务等方面的研究仍有很大的发展空间。目前在处理navtex报文的相关研究中,对于报文数据预处理方面仅进行了初步地去停用词,未进一步进行词型还原等处理过程,建立文本分类模型部分也只将传统机器学习模型进行应用,并且仅对报文内容分类并未进一步进行语境智能决策支持的研究。因此,需要一种方法对navtex报文进行语境智能分类并提供给航海人员决策支持,提高工作效率和报文语境分类的准确率,同时也进一步增强了船舶的安全航行性能。
技术实现思路
1、为了解决现有技术存在的上述问题,本发明要提出一种基于bls的navtex报文语境智能决策支持方法,将bls应用于航运领域,可以大幅提高navtex报文语境分类的准确率,并为航海人员提供智能化的航行决策支持服务,能够有效降低工作强度并保障船舶的安全航行。
2、为了实现上述目的,本发明采用的技术手段如下:基于bls的navtex报文语境智能决策支持方法,包括以下步骤:
3、s1、对navtex报文数据进行预处理
4、navtex报文数据即船舶航行过程中接收到的相关海上安全信息数据,navtex报文数据预处理包括数据清洗、词型还原、引入停用词以及类别标注四部分,操作过程如下:
5、s11、数据清洗
6、对原始报文进行数据清洗,剔除报文数据中的无效报文。并通过正则表达式的方法将报文中的非文本部分进行滤除,得到报文数据集d={d1,d2,...,di,...,dm},其中di表示集合中的第i条报文,m为报文样本数。
7、s12、词型还原
8、提取所述第i条报文di中单词的主干部分、去除词缀,将单词还原成原始形式。
9、s13、引入停用词
10、利用报文单词相互之间的空格对其进行拆分;通过引入停用词,去除报文中的一些虚词、短语以及标点符号来减少词库中不需要进行分析的内容,从而得到一组报文特征词集合d'={d'1,d'2,…,d'i,…,d'm},其中d'i表示第i条报文的特征词集合。
11、s14、类别标注
12、根据分析navtex报文中描述内容后需要作出的相应行动进行分类标注的语境标签,设置为6个语境类别,分别是禁止进入、保持警惕、宽让、保持认真瞭望、核对计划航线、其他行为。其中,每个报文特征词集合至少对应一类标签,标签矩阵记为l={l1,l2,...,li,...,lm},其中即l属于m×c维的向量空间,li为6类报文语境标签中的c类标签,且1≤c≤6。
13、s2、对报文特征词进行加权处理
14、根据所述特征词集合d',采用向量化和权重修正的方法对d'进行加权处理,步骤如下:
15、s21、对报文的特征词集合进行向量化
16、将第i条报文的特征词集合d'i用报文特征向量xi表示,即xi={(xi1,wi1),(xi2,wi2),…,(xij,wij),…,(xin,win)},将xi看成是二元特征组构成的n维特征向量。其中,xij表示第i个报文特征向量的第j个特征项;wij是特征项xij所对应的权重,代表特征项在报文里的重要程度;n代表特征维度,任一维度均表示报文特征向量xi中的一个特征项,且n为特征词集合d'中所有特征词数目去除包含的重复特征词数目后所剩余特征词的总数。
17、s22、对报文特征项权重进行修正
18、当报文数据中的特征维度确定后,将报文特征向量xi简化为:
19、x′i={wi1,wi2,…,wij,…,win}
20、表示第i条报文的特征项权重向量。对报文特征项权重进行修正包括以下步骤:
21、s221、求解报文特征项的词频
22、报文特征项的词频tf(xij,xi)表示特征项xij在报文特征向量xi中的频次,计算公式如下:
23、
24、其中,为特征项xij在报文特征向量xi中出现的次数,为xi中所有特征项合计出现的次数。
25、s222、求解报文特征项的逆文档频率
26、报文特征项的逆文档频率idf(xij)表示特征项xij在所有报文特征向量中出现的频率,其计算公式如下:
27、
28、其中,代表所有xi中出现特征xij的报文特征向量数。
29、s223、求解报文特征项的权重
30、将s2213和s222步骤所求得的结果相乘就得到特征项xij在xi中的权重,计算公式如下:
31、
32、其中,归一化因子e的计算公式如下:
33、
34、s3、将报文语境标签排序并进行编码
35、引入one-hot编码,将类别变量转换为便于分类模型利用的形式,步骤如下:
36、s31、对报文语境标签进行整数编码
37、规定6类报文语境标签排序并进行整数编码,分别将整数0至5依次对应分配给如步骤s14所述的6个语境类别。即将语境标签矩阵l映射到整数标签矩阵l'={l'1,l'2,...,l'i,...,l′m},其中l'i为代表对应语境类别的整数组,且1≤c≤6。
38、s32、对整数标签进行one-hot编码
39、将每个整数组均表示成一个二进制向量。根据共有6类整数值,从而确定二进制向量的长度为6;将每个整数组中的各个整数对应排序位置的索引标记为1,其余位置标记为0,则得到one-hot标签矩阵:
40、
41、其中且one-hot标签向量中至少一个位置为1,其余位置皆为0。
42、s4、建立语境智能决策支持模型
43、bls的网络结构包括四个部分:输入样本层、特征映射层、增强节点层以及求解输出层权重。针对bls的输出层进行改进来处理报文语境智能决策支持问题,语境智能决策支持模型训练流程如下:
44、s41、将报文特征项权重矩阵作为输入
45、在输入样本层,将报文特征项权重矩阵输入到bls网络,输入矩阵x'表示如下:
46、
47、其中,m为报文样本数,n为特征维度,wij为特征项xij在报文特征向量xi中的权重。
48、s42、将输入的报文特征项权重矩阵进行特征映射
49、bls网络将对输入的报文特征项权重矩阵x'进行特征映射,通过特征映射函数φg(*)将x'映射为t组报文特征映射节点,设每组映射生成k个节点,第g组报文特征映射节点zg的计算公式如下:
50、
51、其中,1≤g≤t,将zg进行并连表示为zt=(z1,z2,…,zt)且并把映射的报文特征视作一层,即特征映射层。其中,φg(*)为线性映射函数,为随机生成权值矩阵,为其对应偏置项。
52、s43、生成报文增强节点
53、将s42步骤得到的t组报文特征映射节点zg和增强节点层进行连接,随机生成权重系数矩阵和偏置项通过非线性函数ξs(*)将zt映射为p组随机生成权重的报文增强节点,即得到增强节点层。设每组映射生成q个节点,hs代表第s组报文增强节点,计算公式如下:
54、
55、将hs进行并连表示得到hp=(h1,h2,…,hp),其中
56、s44、求解连接权值矩阵
57、分别将由s42步骤得到的zt和由s43步骤得到的hp并连表示为:
58、a=(zt|hp)
59、将特征映射层和增强节点层并连得到的a直接连接到输出端,称为输出层。因此,输出的概率矩阵为:
60、y=aw
61、其中,w为输出层的连接权值矩阵,则有:
62、w=a-1y
63、式中a-1表示矩阵a的伪逆矩阵,通过求解a-1的岭回归近似解来计算a-1,进而得到连接权值矩阵w,至此模型训练结束,计算公式如下:
64、
65、其中i代表单位矩阵,at为a的转置矩阵。
66、s45、多标签输出
67、bls输出的概率矩阵y计算如下:
68、
69、其中,6为报文语境类别数,yi为第i条报文样本经过分类模型后所得的对应输出概率向量,yij分别为其中对应报文语境类别的概率值。在bls的输出层对每个yi中的yij进行均一化处理,计算公式如下:
70、
71、使其输出为均一化矩阵y',表示如下:
72、
73、此时,每个输出均一化向量y'i中有y'i1+y'i2+…+y'i6=1。再通过设置判定函数来对每个均一化向量中的y'ij进行筛选,公式如下:
74、
75、其中,θ为阈值,当y'ij大于设置的θ时,则f(y'ij)=1即当y'ij小于设置的θ时,则f(y′ij)=0即则bls最终的多标签输出矩阵表示如下:
76、
77、其中,代表第i条报文所对应的输出向量,且输出向量中至少一个位置为1,其余位置皆为0。根据与步骤s32得到的one-hot标签矩阵进行对比判定此报文语境类别,从而得到报文语境分类结果。
78、与现有技术相比,本发明具有以下有益效果:
79、1、本发明对navtex报文数据应用数据清洗和词型还原以及引用停用词等操作,并提出了报文语境标签来给报文标注类别,具体表现为对航行警告中所包含的报文内容进行分析,总结了6类报文语境标签。通过本发明能够做到准确提炼原始报文数据中的有效信息,并为后续的报文语境分类任务以及航行决策支持提供有力支持,使训练出来的报文特征更加精简且具有代表性。
80、2、本发明基于bls并对其加以改进,提高了navtex报文语境分类的准确率,并为航海人员提供智能化的航行决策支持服务,能够有效降低工作强度并提高工作效率,同时也进一步增强了船舶的安全航行性能、丰富了助航设备的功能。