1.本发明涉及大数据融合技术领域,尤其涉及一种多源船舶数据融合方法及装置。
背景技术:2.受船舶管理部门、国内外标准不同等因素影响,船舶数据的来源渠道较多,各数据来源对船舶信息描述各有侧重,既有重复也有不同,缺少能够全方位展示船舶信息全貌的权威数据。同时因为标准不同,各数据来源船舶数据之间缺少相互关联的标准,导致数据关联查询较为困难。
技术实现要素:3.本发明的目的在于提供一种多源船舶数据融合方法及装置,从而解决现有技术中存在的前述问题。
4.为了实现上述目的,本发明采用的技术方案如下:
5.一种多源船舶数据融合方法,包括如下步骤,
6.s1、以mmsi为条件进行多源数据关联;
7.s2、以imo number为条件进行多源数据关联;
8.s3、以船舶名称、船舶呼号、船舶船长和船舶船宽为条件进行多源数据关联;
9.s4、以船舶识别号为条件进行多源数据关联。
10.优选的,中国籍船舶的多源数据包括船舶ais数据、船舶登记数据、船舶检验数据、无线电数据、航运公司数据、中文船名数据、船舶运营证数据、船舶进出港数据、远洋渔业船舶档案数据、船员数据;国际船舶的多源数据除上述数据外还包括船舶档案数据。
11.优选的,步骤s1具体为,以船舶ais数据为基础,以mmsi为条件,将船舶ais数据与远洋渔业船舶档案数据、无线电数据、船舶进出港数据、具有mmsi的船舶登记数据、船舶检验数据进行直接关联。
12.优选的,步骤s2具体为,以船舶ais数据为基础,以imo number为条件,将船舶ais数据与国际船舶的船舶档案数据、具有imo number的船舶登记数据、船舶检验数据进行直接关联。
13.优选的,船舶ais数据包括ais静态数据和ais动态数据;步骤s3具体为,利用ais静态数据中的船舶名称、船舶呼号、船舶船长和船舶船宽与船舶登记数据和船舶检验数据中的对应信息按照比对规则进行比对,基于比对结果建立ais动态数据与船舶登记数据和船舶检验数据的直接关联。
14.优选的,所述比对规则为,
15.建立字符串长度为4的比对结果,初始值为0000,对比结果的每一位从左至右分别对应船舶名称、船舶呼号、船舶船长和船舶船宽,比对一致的,将相应位数值改为1,比对不一致的,相应位数值保持不变;
16.基于比对结果构建比对结果数据集;比对结果数据集中保存三类数据,分别为
mmis、船舶识别号和比对结果。
17.优选的,步骤s3中基于比对结果建立ais动态数据与船舶登记数据和船舶检验数据的直接关联,具体为,确定mmsi与船舶识别号之间的对应关系;基于比对结果将比对结果数据集进行降序排序,顺序排在第一位的mmsi与船舶识别号之间的对应关系即为最合适的对应关系;利用该最合适的对应关系将ais动态数据与船舶登记数据和船舶检验数据直接关联。
18.优选的,步骤s4具体为,以船舶登记数据和船舶检验数据为基础,以船舶识别号为条件,将船舶登记数据和船舶检验数据与船舶运营证数据、航运公司数据和船员数据进行直接关联。
19.本发明的目的还在于提供一种多源船舶数据融合装置,融合装置用于实现上述任一所述的融合方法,所述融合装置包括,
20.mmsi关联单元;用于以mmsi为条件进行多源数据关联;
21.imo number关联单元;用于以imo number为条件进行多源数据关联;
22.动静态数据关联单元;用于以船舶名称、船舶呼号、船舶船长和船舶船宽为条件进行多源数据关联;
23.船舶识别号关联单元;用于以船舶识别号为条件进行多源数据关联。
24.本发明的有益效果是:1、使得查询船舶数据的易用性上有了较大的提升,一次查询就能够获得较为全面的船舶数据,减少了数据查询的次数,提升了数据查询的效率,尤其对关联数据查询、多维数据查询效率提升尤为明显。2、在动静态数据结合方面效果显著,船舶ais数据提供了船舶的实时位置信息,但对于船舶自身的信息描述的并不完整,进行多源数据融合后,弥补了动静态数据各自的短板,使得信息查询更准确、及时。
附图说明
25.图1是本发明实施例中融合方法的流程示意图;
26.图2是本发明实施例中融合装置的结构示意图。
具体实施方式
27.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
28.实施例一
29.如图1所示,本实施例中,提供了一种多源船舶数据融合方法,包括如下步骤,
30.s1、以mmsi为条件进行多源数据关联;
31.s2、以imo number为条件进行多源数据关联;
32.s3、以船舶名称、船舶呼号、船舶船长和船舶船宽为条件进行多源数据关联;
33.s4、以船舶识别号为条件进行多源数据关联。
34.本实施例中,中国籍船舶的多源数据包括船舶ais数据、船舶登记数据、船舶检验数据、无线电数据、航运公司数据、中文船名数据、船舶运营证数据、船舶进出港数据、远洋渔业船舶档案数据、船员数据;国际船舶的多源数据除上述数据外还包括船舶档案数据。
35.本实施例中,步骤s1具体为,以船舶ais数据为基础,以mmsi为条件,将船舶ais数据与远洋渔业船舶档案数据、无线电数据、船舶进出港数据、具有mmsi的船舶登记数据、船舶检验数据进行直接关联。
36.mmsi(水上移动通信业务标识码maritime mobile service identify)是船舶ais数据中唯一标识一条船数据项,mmsi重复的船舶数据被认为是相同船舶。因此,在多源数据中,具有mmsi数据项的数据,可以使用mmsi数据项与船舶ais数据进行直接关联。
37.本实施例中,步骤s2具体为,以船舶ais数据为基础,以imo number为条件,将船舶ais数据与国际船舶的船舶档案数据、具有imo number的船舶登记数据、船舶检验数据进行直接关联。
38.imo(国际海事组织international maritime organization)number国际海事组织(imo)于1987年引入了船舶识别编号,该船号将伴随船舶终生,直至其报废,因此,在多源数据中,尤其是船舶ais数据和国际船舶的船舶档案数据,均可以使用imo number进行数据上的直接关联。
39.本实施例中,受imo number的登记政策、ais设备的使用范围等历史因素的影响,我国在进行船舶登记、船舶检验时并未强制要求船舶必须提供上述编号,因此,在国内船舶数据中,有约30%-40%的船舶不具备或未提供mmsi或imo number,这就导致在进行船舶ais数据与船舶登记数据、船舶检验数据进行关联时,需要再增加一种mmsi或imo number之外的数据关联方式,使船舶ais数据能够与船舶登记数据、船舶检验数据进行直接关联。
40.具体来说:船舶ais数据包括ais静态数据和ais动态数据;步骤s3具体为,利用ais静态数据中的船舶名称、船舶呼号、船舶船长和船舶船宽与船舶登记数据和船舶检验数据中的对应信息按照比对规则进行比对,基于比对结果建立ais动态数据与船舶登记数据和船舶检验数据的直接关联。
41.本实施例中,所述比对规则为,
42.1、建立字符串长度为4的比对结果,初始值为0000,对比结果的每一位从左至右分别对应船舶名称、船舶呼号、船舶船长和船舶船宽,比对一致的,将相应位数值改为1,比对不一致的,相应位数值保持不变;比如1100,表示船舶船名、船舶呼号比对一致,船舶船长、船舶船宽比对不一致。
43.2、基于比对结果构建比对结果数据集;比对结果数据集中保存三类数据,分别为mmis、船舶识别号(cn)和比对结果(matched)。
44.具体的,以ais静态数据为基础,利用其中船舶名称、船舶呼号、船舶船长、船舶船宽数据项,与船舶登记数据、船舶检验数据中的英文船名、船舶呼号、船舶船长、船宽进行比对,对比结果写入4位长度字符串,字符串每一位分别为:第1位-船舶名称、第2位-船舶呼号、第3位-船舶船长、第4位-船舶船宽,字符串初始值为0000,每比对成功一项则将该项对应的为置为1,例如0100,1100,1111等。构建比对结果数据集,并将最终的比对结果写入比对结果数据集中,比对结果数据集有3列,分别是mmsi、cn、matched(即为比对结果)。一个比对结果数据集为类似下表中的存储内容:
45.mmsicnmatched413999999cnxxxxxxxxxxx1000413999999cnxxxxxxxxxxx1111
413999999cnxxxxxxxxxxx1100
46.本实施例中,步骤s3中基于比对结果建立ais动态数据与船舶登记数据和船舶检验数据的直接关联,具体为,确定mmsi与船舶识别号之间的对应关系;基于比对结果将比对结果数据集进行降序排序,顺序排在第一位的mmsi与船舶识别号之间的对应关系即为最合适的对应关系;利用该最合适的对应关系将ais动态数据与船舶登记数据和船舶检验数据直接关联。
47.具体的,通过对matched排序,可得到最符合的mmsi-cn对。但有时由于数据质量的问题,matched可能相同,此时将随机选择一个作为最符合的mmsi-cn对。
48.通过以上过程,实现了ais动态数据(比如,船舶的实时位置信息)与船舶登记数据、船舶检验数据的直接关联,丰富了数据内容,提升了各自的短板。
49.本实施例中,步骤s4具体为,以船舶登记数据和船舶检验数据为基础,以船舶识别号为条件,将船舶登记数据和船舶检验数据与船舶运营证数据、航运公司数据和船员数据进行直接关联。
50.我国从2011年开始正式对中国旗船舶实施船舶识别号管理,此号码作为船舶唯一识别编码,用于永久识别船舶。因此,在我国的船舶管理数据中,均可以使用船舶识别号进行数据上的直接关联。
51.实施例二
52.如图2所示,本实施例中,提供了一种多源船舶数据融合装置,融合装置用于实现所述的融合方法,所述融合装置包括,
53.mmsi关联单元;用于以mmsi为条件进行多源数据关联;
54.imo number关联单元;用于以imo number为条件进行多源数据关联;
55.动静态数据关联单元;用于以船舶名称、船舶呼号、船舶船长和船舶船宽为条件进行多源数据关联;
56.船舶识别号关联单元;用于以船舶识别号为条件进行多源数据关联。
57.各个模块具体的关联方式与实施例一种的关联方式相同。
58.通过采用本发明公开的上述技术方案,得到了如下有益的效果:
59.本发明提供了一种多源船舶数据融合方法及装置,使得查询船舶数据的易用性上有了较大的提升,一次查询就能够获得较为全面的船舶数据,减少了数据查询的次数,提升了数据查询的效率,尤其对关联数据查询、多维数据查询效率提升尤为明显。在动静态数据结合方面效果显著,船舶ais数据提供了船舶的实时位置信息,但对于船舶自身的信息描述的并不完整,进行多源数据融合后,弥补了动静态数据各自的短板,使得信息查询更准确、及时。
60.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。