一种行程轨迹数据生成方法、装置、电子设备及存储介质与流程

文档序号:32403186发布日期:2022-12-02 19:42阅读:97来源:国知局
一种行程轨迹数据生成方法、装置、电子设备及存储介质与流程

1.本发明涉及行程轨迹数据生成技术领域,特别是涉及一种行程轨迹数据生成方法、一种行程轨迹数据生成装置、一种电子设备以及一种计算机可读存储介质。


背景技术:

2.生成行程轨迹数据,是一项重要的服务,但是,由于数据量大,平台在分析处理、数据传输等过程中难免存在一定差错,或者因为基站定位不够精准,会导致少量用户轨迹误报,即,针对用户生成的行程轨迹数据与用户的实际行程不相符,所以,需要相关技术人员在符合相关法规的前提下对相关用户的行程轨迹数据查询纠偏。
3.然而,相关技术通常会采用由人工在系统中写入指定编程语句的方式,再次生成针对该用户的行程轨迹数据,以用于核对针对该用户的行程轨迹数据进行核对,针对上述方式,需要相关技术人员具备较高的专业知识,导致操作门槛较高,并且,采用上述方式生成行程轨迹数据的方式过程繁琐,工作量大,导致生成行程轨迹数据的效率低下。


技术实现要素:

4.本发明实施例是提供一种行程轨迹数据生成方法、装置、电子设备以及计算机可读存储介质,以解决如何提升针对行程轨迹数据的生成效率的问题。
5.本发明实施例公开了一种行程轨迹数据生成方法,所述方法应用于行程轨迹数据查询系统,所述行程轨迹数据查询系统配置有对应的分布式数据库,可以包括:
6.获取信令数据,并将所述信令数据存储至所述分布式数据库中;
7.确定针对所述信令数据的目标场景类别信息,并采用所述目标场景类别信息生成判别模型;
8.获取目标终端设备识别号,并通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据;
9.将所述目标信令数据输入至所述判别模型中,生成针对所述目标终端设备识别号的第一行程轨迹数据。
10.可选地,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述分布式数据库具有用于针对所述信令数据进行索引的索引逻辑插件,所述方法还可以包括:
11.将所述索引逻辑插件封装至针对所述行程轨迹数据查询应用程序的应用程序编程接口中。
12.可选地,所述通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据的步骤可以包括:
13.通过所述应用程序编程接口调用所述索引逻辑插件,以采用所述目标终端设备识别号在所述信令数据检索出针对所述目标终端设备识别号的目标信令数据。
14.可选地,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装
有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述行程轨迹数据查询系统配置有对应的大规模并行处理数据库,所述方法还可以包括:
15.获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库;所述测量报告数据用于对所述移动终端进行定位计算;
16.通过所述目标终端设备识别号在所述大规模并行处理数据库中确定出针对所述目标终端设备识别号的目标测量报告数据;
17.采用所述目标测量报告数据生成针对所述目标终端设备识别号的第二行程轨迹数据。
18.可选地,所述获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库的步骤可以包括:
19.获取由移动终端上传的测量报告数据;
20.将所述测量报告数据写入于文本文档中;
21.将包含所述测量报告数据的所述文本文档储存至所述大规模并行处理数据库中。
22.可选地,所述行程轨迹数据查询应用程序包括用于显示行程轨迹数据的用户操作界面,所述方法还可以包括:
23.将所述第一行程轨迹数据,或,所述第二行程轨迹数据显示于所述用户操作界面中。
24.可选地,还可以包括:
25.采用所述第二行程轨迹数据生成电子地图;所述电子地图显示于所述用户操作界面中。
26.本发明实施例还公开了一种行程轨迹数据生成装置,所述装置应用于行程轨迹数据查询系统,所述行程轨迹数据查询系统配置有对应的分布式数据库,可以包括:
27.信令数据获取模块,用于获取信令数据,并将所述信令数据存储至所述分布式数据库中;
28.判别模型生成模块,用于确定针对所述信令数据的目标场景类别信息,并采用所述目标场景类别信息生成判别模型;
29.目标信令数据确定模块,用于获取目标终端设备识别号,并通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据;
30.第一行程轨迹数据生成模块,用于将所述目标信令数据输入至所述判别模型中,生成针对所述目标终端设备识别号的第一行程轨迹数据。
31.可选地,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述分布式数据库具有用于针对所述信令数据进行索引的索引逻辑插件,所述装置还可以包括:
32.索引逻辑插件封装模块,用于将所述索引逻辑插件封装至针对所述行程轨迹数据查询应用程序的应用程序编程接口中。
33.可选地,所述目标信令数据确定模块可以包括:
34.目标信令数据确定子模块,用于通过所述应用程序编程接口调用所述索引逻辑插件,以采用所述目标终端设备识别号在所述信令数据检索出针对所述目标终端设备识别号的目标信令数据。
35.可选地,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述行程轨迹数据查询系统配置有对应的大规模并行处理数据库,所述装置还可以包括:
36.测量报告数据获取模块,用于获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库;所述测量报告数据用于对所述移动终端进行定位计算;
37.目标测量报告数据确定模块,用于通过所述目标终端设备识别号在所述大规模并行处理数据库中确定出针对所述目标终端设备识别号的目标测量报告数据;
38.第二行程轨迹数据生成模块,用于采用所述目标测量报告数据生成针对所述目标终端设备识别号的第二行程轨迹数据。
39.可选地,所述测量报告数据获取模块可以包括:
40.测量报告数据获取子模块,用于获取由移动终端上传的测量报告数据;
41.测量报告数据写入子模块,用于将所述测量报告数据写入于文本文档中;
42.测量报告数据储存子模块,用于将包含所述测量报告数据的所述文本文档储存至所述大规模并行处理数据库中。
43.可选地,所述行程轨迹数据查询应用程序包括用于显示行程轨迹数据的用户操作界面,所述装置还可以包括:
44.行程轨迹数据显示模块,用于将所述第一行程轨迹数据,或,所述第二行程轨迹数据显示于所述用户操作界面中。
45.可选地,还可以包括:
46.电子地图生成模块,用于采用所述第二行程轨迹数据生成电子地图;所述电子地图显示于所述用户操作界面中。
47.本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
48.所述存储器,用于存放计算机程序;
49.所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。
50.本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。
51.本发明实施例包括以下优点:
52.本发明实施例,通过获取信令数据,并将所述信令数据存储至所述分布式数据库中;确定针对所述信令数据的目标场景类别信息,并采用所述目标场景类别信息生成判别模型;获取目标终端设备识别号,并通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据;将所述目标信令数据输入至所述判别模型中,生成针对所述目标终端设备识别号的第一行程轨迹数据,从而实现了在形成轨迹数据误报时,能够及时且准确的获得用于核对用户行程轨迹的第一行程轨迹数据,大幅的缩短了用于生成行程轨迹数据的时间,从而大幅提升了针对行程轨迹数据的生成效率。
附图说明
53.图1是本发明实施例中提供的一种行程轨迹数据生成方法的步骤流程图;
54.图2是本发明实施例中提供的一种行程轨迹数据查询系统的拓扑图;
55.图3是本发明实施例中提供的一种针对行程轨迹数据查询系统的数据交互示意图;
56.图4是本发明实施例中提供的一种用户操作界面的结构示意图;
57.图5是本发明实施例中提供的一种行程轨迹数据生成装置的结构框图;
58.图6是本发明各实施例中提供的一种电子设备的硬件结构框图。
具体实施方式
59.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
60.信令数据是例如手机、平板电脑、移动电脑等移动终端与通信网络保持联系的各种通信事件的记录,包括基站切换、心跳信息等都会被网络设备记录,分析信令数据中的基站位置坐标就可得到手机用户的相对位置。
61.但是,由于数据量大,平台在分析处理、数据传输等过程中难免存在一定差错,或者因为基站定位不够精准,会导致少量用户轨迹误报,即,针对用户生成的行程轨迹数据与用户的实际行程不相符,所以,需要相关技术人员在符合相关法规的前提下对相关用户的行程轨迹数据查询纠偏。
62.在相关技术中,行程轨迹相关的信令数据集中存放在大数据平台hive表中,hive是基于分布式计算hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在hadoop中的大规模数据的机制。hive通过多节点并行处理来支撑海量数据的存储和分析计算,支持传统sql(结构化查询语言,structured query language),使用方便。但hive没有索引机制,每次查询都要在相关节点做全表扫描,具体地,需要相关技术人员在符合相关法规的情况在hive系统中,编写符合hive数据规范的sql语句从hive表查询相关数据进行核对。为保证核查结果可靠,依据充分,确保被误判的行程轨迹数据能得到及时轨迹纠正,再次生成一个用于核对的且能够反映用户真实行程轨迹的行程轨迹数据,通常要查询4g(第四代的移动信息系统)、volte(voice over long-term evolution,长期演进语音承载)、开放信息动态数据oidd等多种信令详单数据进行相互补充和佐证,若采用这一方式,不但需要相关技术人员具备较强的专业技能,并且需要花费大量的时间来完成行程轨迹数据的生成工作,这导致人工和时间成本增高,从而降低了针对行程轨迹数据的生成效率。
63.参照图1,示出了本发明实施例中提供的一种行程轨迹数据生成方法的步骤流程图,具体可以包括如下步骤:
64.步骤101,获取信令数据,并将所述信令数据存储至所述分布式数据库中;
65.步骤102,确定针对所述信令数据的目标场景类别信息,并采用所述目标场景类别信息生成判别模型;
66.步骤103,获取目标终端设备识别号,并通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据;
67.步骤104,将所述目标信令数据输入至所述判别模型中,生成针对所述目标终端设备识别号的第一行程轨迹数据。
68.在具体实现中,本发明实施例可以应用于行程轨迹数据查询系统,行程轨迹数据查询系统配置有对应的分布式数据库,例如,hbase数据库,hbase是一个面向列式存储的分布式数据库。
69.本发明实施例可以从hive中获取信令数据,并将获取到的信令数据存储至分布式数据库中。
70.具体地,信令数据是移动终端与通信网络保持联系的各种通信事件的记录,包括但不限于基站切换数据、针对移动终端的心跳信息数据等,在实际应用中,分析信令数据中的基站位置坐标可以确定移动终端的相对位置,即,可以确定针对用户的行动轨迹数据。本发明实施例的移动终端包括但不限于手机、平板电脑、移动电脑等。
71.本发明实施例可以确定针对信令数据的目标场景类别信息,并采用目标场景类别信息生成判别模型,例如,可以进行针对场景进行特征分类,确定用户在目标区域的停留时间信息,用户与不同基站发生数据交互的基站数量信息,用户与不同基站发生数据交互的间隔时间信息,与用户发生数据交互的基站和周边行政区域的距离信息等目标场景类别信息,然后可以通过目标场景类别信息生成特征向量,并采用该特征向量训练出判别模型。
72.在获取到信令数据,以及生成判别模型后,可以获取目标终端设备识别号,例如,待查询的目标用户的手机号,并通过目标终端设备识别号在分布式数据库中确定出针对目标终端设备识别号的目标信令数据,然后将目标信令数据输入至判别模型中,通过判别模型生成针目标终端设备识别号的第一行程轨迹数据,第一行程轨迹数据可以是与目标信令数据对应的行程轨迹数据。
73.本发明实施例,通过获取信令数据,并将所述信令数据存储至所述分布式数据库中;确定针对所述信令数据的目标场景类别信息,并采用所述目标场景类别信息生成判别模型;获取目标终端设备识别号,并通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据;将所述目标信令数据输入至所述判别模型中,生成针对所述目标终端设备识别号的第一行程轨迹数据,从而实现了在出现轨迹数据误报时,避免由人工生成用于核对用户行程轨迹的行程轨迹数据,能够及时且准确的获得用于核对用户行程轨迹的第一行程轨迹数据,大幅的缩短了用于生成行程轨迹数据的时间,从而大幅提升了针对行程轨迹数据的生成效率。
74.在上述实施例的基础上,提出了上述实施例的变型实施例,在此需要说明的是,为了使描述简要,在变型实施例中仅描述与上述实施例的不同之处。
75.在本发明的一个可选地实施例中,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述分布式数据库具有用于针对所述信令数据进行索引的索引逻辑插件,所述方法还包括:
76.将所述索引逻辑插件封装至针对所述行程轨迹数据查询应用程序的应用程序编程接口中。
77.在相关技术中,往往是由客服人员接到对用户的行程轨迹进行核查的要求,然后客服人员再将该用户的电话号码告知相关技术人员,并由相关技术人员生成用于核查用户行程轨迹的行程轨迹数据后再将核查结果发送给客服人员,由于相关技术只能依赖于人工
核查,导致不具备相关技术能力的客服人员无法对该用户的行程轨迹进行核查,所以,本发明实施例的行程轨迹数据查询系统可以配置有对应的前端终端设备,例如,客服人员使用的工作电脑,前端终端设备中可以安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,以使客服人员能够在被授权且符合相关法规的情况下,直接通100002
78.过行程轨迹数据查询应用程序自动生成用于核对用户行程数据的第一行程轨迹数据。
79.在实际应用中,由于hbase与hive对数据存储方式不同,导致针对数据的查询方式也不同,为了实现把hive中的数据转到hbase,能够实现用户能够通过在分布式数据库中确定出针对目标终端设备识别号的目标信令数据,从而生成第一行程轨迹数据,本发明实施例可以将索引逻辑插件封装至针对行程轨迹数据查询应用程序的应用程序编程接口中,例如,可以将具有行键rowkey技术的索引逻辑插件封装至针对行程轨迹数据查询应用程序的api(application programming interface,应用程序编程接口)中。
80.在本发明的另一个可选地实施例中,所述通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据的步骤包括:
81.通过所述应用程序编程接口调用所述索引逻辑插件,以采用所述目标终端设备识别号在所述信令数据检索出针对所述目标终端设备识别号的目标信令数据。
82.本发明实施例可以将索引逻辑插件封装至针对行程轨迹数据查询应用程序的应用程序编程接口中,在需要通过行程轨迹数据查询应用程序自动生成用于核对用户行程数据的第一行程轨迹数据时,可以通过应用程序编程接口调用索引逻辑插件,以采用目标终端设备识别号在信令数据检索出针对目标终端设备识别号的目标信令数据。例如,可以将具有行键rowkey技术的索引逻辑插件封装至针对行程轨迹数据查询应用程序的api中,以使客服人员能够在需要通过行程轨迹数据查询应用程序自动生成用于核对用户行程数据的第一行程轨迹数据时,通过api调用具有行键rowkey技术的索引逻辑插件,在众多信令数据中检索出与手机号对应的目标信令数据。
83.本发明实施例,通过将所述索引逻辑插件封装至针对所述行程轨迹数据查询应用程序的应用程序编程接口中;通过所述应用程序编程接口调用所述索引逻辑插件,以采用所述目标终端设备识别号在所述信令数据检索出针对所述目标终端设备识别号的目标信令数据,从而使用户能够在需要通过行程轨迹数据查询应用程序自动生成用于核对用户行程数据的第一行程轨迹数据时,可以通过应用程序编程接口调用索引逻辑插件,在分布式数据库中检索出针对目标终端设备识别号的目标信令数据,从而更进一步地提升了针对行程轨迹数据的生成效率。
84.在本发明的一个可选地实施例中,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述行程轨迹数据查询系统配置有对应的大规模并行处理数据库,所述方法还包括:
85.获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库;所述测量报告数据用于对所述移动终端进行定位计算;
86.通过所述目标终端设备识别号在所述大规模并行处理数据库中确定出针对所述目标终端设备识别号的目标测量报告数据;
87.采用所述目标测量报告数据生成针对所述目标终端设备识别号的第二行程轨迹
数据。
88.在实际应用中,常规轨迹判定是参考信令数据中的基站位置坐标来进行,而基站信号覆盖距离可达千米级,本身就存在跨区、跨境覆盖的情况。还有部分基站存在跨区建设情况,归属区与实际建站区分属不同的行政区,类似的情况在相邻行政区边界区域情况较为突出。因此,仅依据基站坐标很容误判处于边界附近区域用户的行程轨迹,即,由于信令数据的详单数据特征无法真实的反映出用户行程轨迹,无论采用判别模型识别还是人工比对都难清晰判断行程轨迹上显示的用户到访地地区到底是否真实、合理。
89.所以,本发明实施例除了获取信令数据并基于信令数据生成用于核对用户行程轨迹的第一行程轨迹数据,还可以获取由移动终端上传的测量报告数据,即,mr(measurement report,测量报告)数据,区别于信令数据,虽然可以通过信令数据定位移动终端,但基于信令数据的定位逻辑是通过信令数据确定与该移动终端发生过数据交互的基站,然后再用该基站的坐标对移动终端进行定位,该定位方式的定位精度是相对低下的,而mr数据则可以用于对手机进行较为准确的定位计算,在实际应用中,mr数据可以包括手机收到的信号质量、手机本身终端属性、手机自身位置等数据。
90.在实际应用中,依赖于hive独特的数据存储特性,使得hive可以存储的数据更多,并且,由于hive对数据的兼容性强,使得网络上收集到的原始数据,如mr数据等,也更容易的存储于hive中。但是,由上可知,基于hive的检索特性,导致在hive中查询文件需要花费大量的时间,并且,通常mr数据只会以日志文件方式临时存储于hive,不会对mr数据长期储存,这是因为在实际应用中mr数据的生成量非常大,而针对mr数据的应用场景不多,所以很快会被后续写入服务器的mr数据覆盖,所以,本发明实施例可以为行程轨迹数据查询系统配置对应的大规模并行处理数据库greenplum,greenplum的架构采用了mpp(大规模并行处理)。在mpp系统中,每个smp(对称多处理,symmetrical multi-processing)节点也可以运行自己的操作系统、数据库等,greenplum可以专门用于存放数据,并提供数据统计分析的功能,并且,greenplum可以组合成gp大数据集群,相比传统单台数据库,可以存储的数据更多,数据分析处理速度更快。
91.所以,在具体实现中,本发明实施例可以在hive中获取mr数据,并将mr数据存储于greenplum中,以为mr数据提供更好的查询和长期保存服务。
92.进一步地,本发明实施例的行程轨迹数据查询系统可以配置有对应的前端终端设备,例如,客服人员使用的工作电脑,前端终端设备中可以安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,在需要生成核对用户行程时,可以通过行程轨迹数据查询应用程序,利用目标终端设备识别号在greenplum中确定出与目标终端设备识别号对应的mr数据,并采用mr数据生成针对目标终端设备识别号的第二行程轨迹数据,第二行程轨迹数据可以是与mr数据对应的行程轨迹数据,例如,当客服人员接收到针对用户的行程轨迹进行核对指令时,可以在被授权且符合相关法规的情况下,在行程轨迹数据查询应用程序中输入手机号,以在greenplum中确定出与手机号对应的mr数据,并采用mr数据生成针对该手机号的第二行程轨迹数据,以用于对用户行程轨迹进行核对。
93.本发明实施例,通过获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库;所述测量报告数据用于对所述移动终端进行定位计算;通过所述目标终端设备识别号在所述大规模并行处理数据库中确定出针对所述目标终端设备识别号的目
标测量报告数据;采用所述目标测量报告数据生成针对所述目标终端设备识别号的第二行程轨迹数据,从而在实现了在形成轨迹数据误报时,能够及时且准确的获得用于核对用户行程轨迹的第一行程轨迹数据,大幅的缩短了用于生成行程轨迹数据的时间的基础上,进一步地提升了针对用户行程轨迹的精度,从而更进一步地提升了针对用户行程轨迹数据的生成效率。
94.在本发明的一个可选地实施例中,所述获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库的步骤包括:
95.获取由移动终端上传的测量报告数据;
96.将所述测量报告数据写入于文本文档中;
97.将包含所述测量报告数据的所述文本文档储存至所述大规模并行处理数据库中。
98.在实际应用中greenplum虽然能够提供快速查询服务,而将数据更新至greenplum中的速度则很慢,这是因为针对greenplum数据的每次修改,即使只修改其中一条记录,也要耗费很多时间去做各种一致性检查,这需要耗费大量的时间,所以,本发明实施例可以在将mr数据存储至greenplum前,先将mr数据写入文本文档中,并将文本文档储存于hive中,然后再将包含mr数据的文本文档一次性传输至greenplum中作关联更新,这样即便文本文档中包含了大量的mr数据,也只需对新存储的mr数据做一次检查,从而大幅的缩短了用于存储mr数据的时间,进而提升了针对行程轨迹数据的生成效率。
99.本发明实施例,通过获取由移动终端上传的测量报告数据;将所述测量报告数据写入于文本文档中;将包含所述测量报告数据的所述文本文档储存至所述大规模并行处理数据库中,从而大幅的缩短了用于存储mr数据的时间,更进一步地提升了针对行程轨迹数据的生成效率。
100.在本发明的一个可选地实施例中,所述行程轨迹数据查询应用程序包括用于显示行程轨迹数据的用户操作界面,所述方法还包括:
101.将所述第一行程轨迹数据,和/或,所述第二行程轨迹数据显示于所述用户操作界面中。
102.由上可知,在实际应用中,通常由客服人员接收到针对用户行程轨迹的核查指令,所以,本发明实施例可以为行程轨迹数据查询应用程序配置相应的用户操作界面,以用于显示行程轨迹数据,以使在需要对用户行程轨迹进行核查时,能够将第一行程轨迹数据,或,第二行程轨迹数据显示于用户操作界面中,供相关人员进行查看。
103.本发明实施例通过将所述第一行程轨迹数据,或,所述第二行程轨迹数据显示于所述用户操作界面中,更进一步地提升了针对行程轨迹数据的生成效率。
104.在本发明的一个可选地实施例中,还包括:
105.采用所述第二行程轨迹数据生成电子地图;所述电子地图显示于所述用户操作界面中。
106.本发明实施例还可以采用第二行程轨迹数据生成web(world wide web,全球广域网)电子地图,web电子地图可以显示于用户操作界面中。
107.在实际应用中,无论基站位置坐标还是mr数据中的位置坐标,都无法直接在web电子地图上使用,必须经过坐标转换才能在地图上准确呈现。所以,本发明实施例可以采用任意网络地图作为底图,采用在线转换方式得到地图坐标。但在线方式每秒只能转换数百个
左右的坐标,无法满足每天百亿量级的坐标转换要求,所以可以基于离线坐标转换算法转换地图坐标,在实际应用中,主流配置机器基于离线坐标转换算法转换地图坐标,每秒可转换百万量级的坐标值。通过转换结果比对,核对行程轨迹的误差在10米左右,完全满足轨迹展示的精度要求。
108.为使本领域人员更好的理解本发明实施例,以下用一完整示例对本发明实施例进行说明。
109.参考图2,图2是本发明实施例中提供的一种行程轨迹数据查询系统的拓扑图,行程轨迹数据查询系统配置有对应的gp大数据集群,gp集群由多台服务器组成,是承担数据存储和在线分析计算的核心。具体配置部署可以根据需要存储和计算的数据量决定。例如,对于一个省份的mr数据做全量位置采集分析,历史数据保存一个月左右,10个节点服务器,单节点存储10tb是典型配置。
110.行程轨迹数据查询系统配置有对应的行程轨迹数据查询应用程序(客户端),采用web界面支撑行程轨迹核查处理。轨迹详单查询、比对、核查,轨迹地图均在web界面完成。客户端通过浏览器打开网页实现人机交互,向服务器提交参数,接受计算及处理结果,并呈现用户活动路线的web可视化地图,判断模型识别结果,人工比对核查结论都在web界面完成。因此,对客户端要求不高,能支持主流浏览器正常运行的普通个人计算机即可
111.参考图3,图3是本发明实施例中提供的一种针对行程轨迹数据查询系统的数据交互示意图。
112.1、hive数据查询的自动化和界面化处理。
113.hive数据操作客户端命令行工具tunnel进行开发实现了数据查询的自动化。如图4所示,图4是本发明实施例中提供的一种用户操作界面的结构示意图,行程轨迹数据查询系统可以配置有对应的前端终端设备,例如,客服人员使用的工作电脑,前端终端设备中可以安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序(客户端),以使相关人员能够在被授权且符合相关法规的情况下,直接在用户操作界面上输入指定手机号码,行程轨迹数据查询系统可以自动封装相关信令数据底层查询逻辑,并在一个用户操作界面中展示所有查询结果。
114.2、详单数据查询速度提升措施。
115.信令详单的原始存储为hive方式,但hive没有索引机制,每次查询都要在相关数据存储节点做全表扫描,集群资源调度响应效率低,响应相对较慢。单个投诉的详单平均查询响应时间超过10分钟,在需要对大量用户行程轨迹进行核对的情况下,需要消耗大量人力、时间进行应对。
116.针对需要频繁查询的数据可以进行存储方式转换,每天定时将最新产生的信令数据从hive读取转化到hbase库中,再将hbase数据查询的底层实现逻辑进行api封装后供前端界面程序调用。hbase采用rowkey技术进行查询数据的快速定位,详单查询响应速度得到大幅改善,单个轨迹核查数据生成约2秒,基本做到了实时响应。
117.3、行程轨迹数据准确性智能判断
118.争议轨迹核查就是基于各种通信详单事件分析判断在先行程轨迹数据所显示的轨迹信息是否存在问题。
119.可以对场景进行特征分类,将人工判定的经验规则进行抽象和数值化,建立判别
模型。在查询到详单数据后,由系统进行规则匹配,自动统计轨迹争议日期内,停留地市持续时间,持续期间发生交互的不同基站数,与相邻地市距离,间隔时间等特征值进行综合判别,能实时给出争议轨迹是否合理,是否需要修正。针对多数需要核查的行程轨迹能得到及时、明确的判定,避免了人工比对的耗时过程及可能的人为差错。
120.4、利用mr数据精准判别。
121.mr数据是手机周期性自动上报的测量报告,包含信号强度,基站切换原因,终端位置信息等,主要用于网络评估和优化。从mr数据中得到位置偏差仅有几米到几十米,能更精准的反映用户实际位置,可为用户活动轨迹判定提供清晰而充分的支撑依据。采用mr数据获取用户精准位置的措施,有效降低了跨区轨迹争议投诉处理的复杂度并提升了判别准确性。
122.5、行程轨迹的地图化呈现。
123.将详单轨迹数据在web地图上呈现,相关人员可直观的看到手机号码对应用户在指定日期的区域活动情况及前后关联信息,可有效帮助相关人员对争核查行程轨迹。
124.在实际应用中,无论基站位置坐标还是mr数据中的位置坐标,都无法直接在web地图上使用,必须经过坐标转换才能在地图上准确呈现。可以采用任意网络地图作为底图,采用在线转换方式得到地图坐标。但在线方式每秒只能转换数百个左右的坐标,无法满足每天百亿量级的坐标转换要求,所以可以基于离线坐标转换算法,主流配置机器每秒可转换百万量级的坐标值。通过转换结果比对,核对行程轨迹的误差在10米左右,完全满足轨迹展示的精度要求。
125.为进一步提升转换速度,规避gp更新慢的问题,转换结果不直接更新数据库,而是先写到文本文档再批量加载到gp进行储存,最后关联运算得到所需结果,如不考虑mr数据其他方面应用,也可在使用时只对手机号码对应的位置坐标进行实时转换,可大幅缩短生成行程轨迹数据的时间,几乎不影响使用体验。
126.对比现有技术,达到了如下效果。
127.1、基于tunnel二次开发实现了集团专区hive数据操作的界面化处理,可以输入手机号码实现事件触发,可用于很多数据采集及加工场景的自动化处理;现有技术不支持事件触发,多数场景需要手动编写sql实现,较难实现hive数据的界面化查询。
128.2、将hive数据转换到hbase支撑相关行程轨迹数据核查,响应性能得到显著提升。可将针对单个行程轨迹数据的核查时间由10分钟以上缩短到2秒内。
129.3、针对多数轨迹争议场景,建立了机器识别规则,能快速准确生成用于核查的行程轨迹数据,以识别在先行程轨迹数据是否为误判。
130.4、采集mr数据结合web地图,精准识别用户活动轨迹,可清晰准确判别跨区、跨境轨迹误报问题。传统方式依赖基站位置坐标识别用户行程轨迹,因存在基站信号跨区覆盖,基站跨区建设等问题,无法准确识别区域边界附近活动用户的真实轨迹,也难于依赖相关详单中的信令数据处理跨区轨迹误报问题。
131.利用mr数据精准识别用户轨迹的方法也可用于感染人员或高风险人员的流调工作,核验流调问询结果的准确性,可大幅简化繁琐的流调工作量。
132.需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依
据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
133.参照图5,示出了本发明实施例中提供的一种行程轨迹数据生成装置的结构框图,具体可以包括如下模块:
134.信令数据获取模块501,用于获取信令数据,并将所述信令数据存储至所述分布式数据库中;
135.判别模型生成模块502,用于确定针对所述信令数据的目标场景类别信息,并采用所述目标场景类别信息生成判别模型;
136.目标信令数据确定模块503,用于获取目标终端设备识别号,并通过所述目标终端设备识别号在所述分布式数据库中确定出针对所述目标终端设备识别号的目标信令数据;
137.第一行程轨迹数据生成模块504,用于将所述目标信令数据输入至所述判别模型中,生成针对所述目标终端设备识别号的第一行程轨迹数据。
138.可选地,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述分布式数据库具有用于针对所述信令数据进行索引的索引逻辑插件,所述装置还可以包括:
139.索引逻辑插件封装模块,用于将所述索引逻辑插件封装至针对所述行程轨迹数据查询应用程序的应用程序编程接口中。
140.可选地,所述目标信令数据确定模块可以包括:
141.目标信令数据确定子模块,用于通过所述应用程序编程接口调用所述索引逻辑插件,以采用所述目标终端设备识别号在所述信令数据检索出针对所述目标终端设备识别号的目标信令数据。
142.可选地,所述行程轨迹数据查询系统包括前端终端设备,所述前端终端设备安装有用于查询行程轨迹数据的行程轨迹数据查询应用程序,所述行程轨迹数据查询系统配置有对应的大规模并行处理数据库,所述装置还可以包括:
143.测量报告数据获取模块,用于获取由移动终端上传的测量报告数据,并存储于所述大规模并行处理数据库;所述测量报告数据用于对所述移动终端进行定位计算;
144.目标测量报告数据确定模块,用于通过所述目标终端设备识别号在所述大规模并行处理数据库中确定出针对所述目标终端设备识别号的目标测量报告数据;
145.第二行程轨迹数据生成模块,用于采用所述目标测量报告数据生成针对所述目标终端设备识别号的第二行程轨迹数据。
146.可选地,所述测量报告数据获取模块可以包括:
147.测量报告数据获取子模块,用于获取由移动终端上传的测量报告数据;
148.测量报告数据写入子模块,用于将所述测量报告数据写入于文本文档中;
149.测量报告数据储存子模块,用于将包含所述测量报告数据的所述文本文档储存至所述大规模并行处理数据库中。
150.可选地,所述行程轨迹数据查询应用程序包括用于显示行程轨迹数据的用户操作界面,所述装置还可以包括:
151.行程轨迹数据显示模块,用于将所述第一行程轨迹数据,或,所述第二行程轨迹数
据显示于所述用户操作界面中。
152.可选地,还可以包括:
153.电子地图生成模块,用于采用所述第二行程轨迹数据生成电子地图;所述电子地图显示于所述用户操作界面中。
154.对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
155.另外,本发明实施例还提供了一种电子设备,包括:处理器,存储器,存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述行程轨迹数据生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
156.本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述行程轨迹数据生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
157.图6为实现本发明各个实施例的一种电子设备的硬件结构示意图。
158.该电子设备600包括但不限于:射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解,图6中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,电子设备包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
159.应理解的是,本发明实施例中,射频单元601可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器610处理;另外,将上行的数据发送给基站。通常,射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元601还可以通过无线通信系统与网络和其他设备通信。
160.电子设备通过网络模块602为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
161.音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元603还可以提供与电子设备600执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。
162.输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(graphics processing unit,gpu)6041和麦克风6042,图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。
163.电子设备600还包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度,接近传感器可在电子设备600移动到耳边时,关闭显示面板6061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
164.显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061,可以采用液晶显示器(liquid crystal display,lcd)、有机发光二极管(organic light-emitting diode,oled)等形式来配置显示面板6061。
165.用户输入单元607可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器610,接收处理器610发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071,用户输入单元607还可以包括其他输入设备6072。具体地,其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
166.进一步的,触控面板6071可覆盖在显示面板6061上,当触控面板6071检测到在其上或附近的触摸操作后,传送给处理器610以确定触摸事件的类型,随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中,触控面板6071与显示面板6061是作为两个独立的部件来实现电子设备的输入和输出功能,但是在某些实施例中,可以将触控面板6071与显示面板6061集成而实现电子设备的输入和输出功能,具体此处不做限定。
167.接口单元608为外部装置与电子设备600连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到电子设备600内的一个或多个元件或者可以用于在电子设备600和外部装置之间传输数据。
168.存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器609可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
169.处理器610是电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器609内的软件程序和/或模块,以及调用存储在存储器609内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。处理器610可包括一个或多个处理单元;优选的,处理器610可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器610中。
170.电子设备600还可以包括给各个部件供电的电源611(比如电池),优选的,电源611可以通过电源管理系统与处理器610逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
171.另外,电子设备600包括一些未示出的功能模块,在此不再赘述。
172.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
173.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
174.上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
175.本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
176.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
177.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
178.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显
示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
179.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
180.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
181.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1