1.本技术涉及计算机网络技术领域,特别是涉及一种车辆数据的质量评估方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:2.随着车辆网联化进程不断加快,各主机厂都在为新车型匹配网联智能终端设备,以达到获得车辆实时数据,进而进行存储、加工以服务于企业数字化转型或提升用户体验。因此,车载网联智能终端采集的数据质量直接影响基于此形成的一系列数字产品的品质。目前通常是在安装有车载网联智能终端的车辆投入使用后,由车载网联智能终端上传车辆数据至服务器,再由服务器对车辆数据的质量进行评估。由于评估过程是在车辆投入使用后执行的,从而会导致车载终端在使用过程中出现诸多问题。
技术实现要素:3.基于此,有必要针对上述技术问题,提供一种能够提前评估的车辆数据的质量评估方法、装置、计算机设备、存储介质和计算机程序产品。
4.一方面,本技术提供了一种车辆数据的质量评估方法,该方法应用于目标车辆上,目标车辆上安装有can网络数据采集设备和车载终端;该方法包括:
5.获取目标车辆在行驶过程中由车载终端采集到的第一can网络数据、gps数据和行驶统计数据,并获取由can网络数据采集设备所采集到的第二can网络数据;
6.获取用于表征目标数据中数据类型质量异常程度的第一评价指标,目标数据包括第一can网络数据、gps数据或行驶统计数据中的至少一种;
7.将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标;
8.根据针对第一can网络数据和gps数据中各自数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标;
9.根据第一评价指标、第二评价指标和第三评价指标,获取用于表征车载终端所采集到数据的质量的评估结果。
10.在其中一个实施例中,目标数据包括第一can网络数据、gps数据和行驶统计数据;获取用于表征目标数据中数据类型质量异常程度的第一评价指标,包括:
11.根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型;
12.根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型;
13.将不同采样时刻所采集到的行驶统计数据与车辆行驶统计模型的统计结果进行对比,确定行驶统计数据所覆盖的数据类型中的质量异常数据类型;
14.根据第一can网络数据、gps数据和行驶统计数据各自所覆盖的数据类型中的质量异常数据类型,确定第一评价指标。
15.在其中一个实施例中,根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型,包括:
16.对于第一can网络数据与第二can网络数据所覆盖的任一数据类型,分别获取相同采集时刻所采集到的第一can网络数据中该数据类型相应的第一目标数据,以及第二can网络数据中该数据类型相应的第二目标数据;
17.针对相同采样时刻所采集到的第一目标数据和第二目标数据,分别获取第一目标数据与第二目标数据之间的差异程度值;
18.根据获取到的差异程度值和相应获取到的数量,确定该数据类型的质量异常程度值,根据该数据类型的质量异常程度值,获取该数据类型的判定结果,判定结果用于指示是否为质量异常数据类型。
19.在其中一个实施例中,根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型,包括:
20.对于gps数据所覆盖的任一数据类型,根据每一采集时刻的上一采集时刻、每一采集时刻和每一采集时刻的下一采集时刻分别所采集到的该数据类型的数据,确定每一采集时刻所采集到的该数据类型的数据是否为质量异常数据;
21.根据该数据类型的质量异常数据在所有采集到的该数据类型的数据中的数量占比,确定该数据类型是否为质量异常数据类型。
22.在其中一个实施例中,第一can网络数据与第二can网络数据的数量均为多个;将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标,包括:
23.对多个第一can网络数据进行规整,以使得规整后的多个第一can网络数据所呈现出的采集频率与第一can网络数据的采集频率一致;
24.将规整后的多个第一can网络数据各自的采集时刻与多个第二can网络数据各自的采集时刻进行对齐,确定规整后的多个第一can网络数据中采集时刻存在误差的第一can网络数据;
25.获取采集时刻存在误差的第一can网络数据在规整后的多个第一can网络数据中的数量占比,作为第二评价指标。
26.在其中一个实施例中,根据针对第一can网络数据和gps数据中各自所覆盖的数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标,包括:
27.将第一can网络数据和gps数据中各自所覆盖的数据类型所使用的数据规范与预设数据规范进行比对,确定不符合预设数据规范的异常数据类型;
28.获取不符合预设数据规范的异常数据类型在第一can网络数据和gps数据各自所覆盖的数据类型中的数量占比,作为第三评价指标。
29.另一方面,本技术还提供了一种车辆数据的质量评估装置,该装置包括:
30.第一获取模块,用于获取目标车辆在行驶过程中由车载终端采集到的第一can网络数据、gps数据和行驶统计数据,并获取由can网络数据采集设备所采集到的第二can网络
数据。
31.第二获取模块,用于获取用于表征目标数据中数据类型质量异常程度的第一评价指标,目标数据包括第一can网络数据、gps数据或行驶统计数据中的至少一种;
32.对比模块,用于将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标;
33.第三获取模块,用于根据针对第一can网络数据和gps数据中各自数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标;
34.第四获取模块,用于根据第一评价指标、第二评价指标和第三评价指标,获取用于表征车载终端所采集到数据的质量的评估结果。
35.在其中一个实施例中,目标数据包括第一can网络数据、gps数据和行驶统计数据;第一获取模块,用于根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型;根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型;将不同采样时刻所采集到的行驶统计数据与车辆行驶统计模型的统计结果进行对比,确定行驶统计数据所覆盖的数据类型中的质量异常数据类型;根据第一can网络数据、gps数据和行驶统计数据各自所覆盖的数据类型中的质量异常数据类型,确定第一评价指标。
36.在其中一个实施例中,第一获取模块,还用于对于第一can网络数据与第二can网络数据所覆盖的任一数据类型,分别获取相同采集时刻所采集到的第一can网络数据中该数据类型相应的第一目标数据,以及第二can网络数据中该数据类型相应的第二目标数据;针对相同采样时刻所采集到的第一目标数据和第二目标数据,分别获取第一目标数据与第二目标数据之间的差异程度值;根据获取到的差异程度值和相应获取到的数量,确定该数据类型的质量异常程度值,根据该数据类型的质量异常程度值,获取该数据类型的判定结果,判定结果用于指示是否为质量异常数据类型。
37.在其中一个实施例中,第一获取模块,还用于对于gps数据所覆盖的任一数据类型,根据每一采集时刻的上一采集时刻、每一采集时刻和每一采集时刻的下一采集时刻分别所采集到的该数据类型的数据,确定每一采集时刻所采集到的该数据类型的数据是否为质量异常数据;根据该数据类型的质量异常数据在所有采集到的该数据类型的数据中的数量占比,确定该数据类型是否为质量异常数据类型。
38.在其中一个实施例中,第一can网络数据与第二can网络数据的数量均为多个;对比模块,用于对多个第一can网络数据进行规整,以使得规整后的多个第一can网络数据所呈现出的采集频率与第一can网络数据的采集频率一致;将规整后的多个第一can网络数据各自的采集时刻与多个第二can网络数据各自的采集时刻进行对齐,确定规整后的多个第一can网络数据中采集时刻存在误差的第一can网络数据;获取采集时刻存在误差的第一can网络数据在规整后的多个第一can网络数据中的数量占比,作为第二评价指标。
39.在其中一个实施例中,第三获取模块,用于将第一can网络数据和gps数据中各自所覆盖的数据类型所使用的数据规范与预设数据规范进行比对,确定不符合预设数据规范的异常数据类型;获取不符合预设数据规范的异常数据类型在第一can网络数据和gps数据各自所覆盖的数据类型中的数量占比,作为第三评价指标。
40.另一方面,本技术还提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述车辆数据的质量评估方法中的步骤。
41.另一方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述车辆数据的质量评估方法中的步骤。
42.另一方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述车辆数据的质量评估方法的步骤。
43.上述车辆数据的质量评估方法、装置、计算机设备、存储介质和计算机程序产品,通过在车载终端投入使用之前开发阶段,在目标车辆上安装车载终端和can网络数据采集设备采集数据,通过数据对比,确定用于表征车载终端采集到数据的异常程度评价指标,以基于评价指标,对车载终端采集到的数据质量进行评估。由于可以在开发阶段即可对车载终端采集到的车辆数据的质量进行评估,从而可以做到车载终端有问题在开发阶段即可,而不需要在使用阶段完全由服务器仅根据车载终端采集到的数据进行分析,以评估车载终端的数据质量。另外,由于可以不需要由服务器对车载终端采集到的数据进行分析,从而可以降低服务器的处理负担。最后,由于在评价车载终端采集到的车辆数据质量时,采用了多种评价指标进行综合评估,从而可以提高车辆数据质量评估的精准程度。
附图说明
44.图1为一个实施例中车辆数据的质量评估方法的应用环境图;
45.图2为一个实施例中车辆数据的质量评估方法的流程示意图;
46.图3为另一个实施例中车辆数据的质量评估方法的流程示意图;
47.图4为一个实施例中车辆数据的质量评估装置的结构框图;
48.图5为一个实施例中计算机设备的内部结构图。
具体实施方式
49.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
50.在一些实施例中,本技术实施例提供的车辆数据的质量评估方法,可以应用于如图1所示的应用环境中。其中,车载终端102可通过有线或者无线网络,直接或者间接地与服务器104进行通信,本技术实施例对此不作具体限定。车载终端102与服务器104可协同执行本技术实施例中的车辆数据的质量评估方法。现以车载终端102和服务器104协同执行车辆数据的质量评估方法时的其中一种实施过程为例。
51.具体地,车载终端102可以采集目标车辆在行驶过程中由车载终端采集到的第一can网络数据、gps数据和行驶统计数据,将采集到的数据发送至服务器104。车载终端10还可以获取由can网络数据采集设备所采集到的第二can网络数据,也同时发送至服务器104。
52.服务器104获取用于表征目标数据中数据类型质量异常程度的第一评价指标;将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标;根据针对第一can网络数据和gps数据中各自数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标;根据第一评价指标、第二评价
指标和第三评价指标,获取用于表征车载终端所采集到数据的质量评估结果。可以理解的是,服务器104可以集成在云端。
53.其中,车载终端102可以安装在目标车辆上。服务器104则可以是与软件或是网页、小程序等相对应的后台服务器,或者是专门用于进行车辆数据质量评估的服务器,本技术实施例不做具体限定。服务器104可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
54.在一些实施例中,结合上述实施环境说明,如图2所示,提供了一种车辆数据的质量评估方法。以该方法应用于计算机设备(该计算机设备具体可以是图1中的车载终端或服务器)为例进行说明,包括以下步骤:
55.步骤202、获取目标车辆在行驶过程中由车载终端采集到的第一can网络数据、gps数据和行驶统计数据,并获取由can网络数据采集设备所采集到的第二can网络数据。
56.其中,第一can网络数据与第二can网络数据主要是用来区分由车载终端和can网络数据采集设备这两种采集源。第一can网络数据、第二can网络数据、gps数据和行驶统计数据,均可以是数据统称,也即四者均可以覆盖多种类型的数据,本技术实施例对此不作具体限定。例如,gps数据中可以包括经纬度、gps车速、gps方向或gps海拔中的至少一种,而行驶统计数据中可以包括车辆加速度、行驶里程或刹车次数中的至少一种。对于can网络数据,则可以包括目标车辆在行驶过程中所产生的所有信号数据。
57.其中,can网络数据采集设备可以是canoe设备,can网络数据采集设备与车载终端可以设置为相同的采集频率,并对采集到的数据进行记录,本技术实施例对此不作具体限定。
58.步骤204、获取用于表征目标数据中数据类型质量异常程度的第一评价指标,目标数据包括第一can网络数据、gps数据或行驶统计数据中的至少一种。
59.具体地,本步骤中的第一评价指标,可以仅仅是评价第一can网络数据、gps数据或者行驶统计数据中任意一种数据的数据质量,也可以是评价其中任意两种数据的数据质量,也可以三种数据的数据质量,本技术实施例对此不作具体限定。另外,第一评价指标的获取方式可以是将数据与预设取值范围进行比较,从而确定目标数据所覆盖的数据类型中哪些数据类型为质量异常数据类型。再确定质量异常数据类型在目标数据所覆盖的数据类型中的数量占比,以作为第一评价指标。
60.步骤206、将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标。
61.可以理解的是,由can网络数据采集设备所采集到的第二can网络数据可以作为对比对象,以确定第一can网络数据中哪些数据的质量异常。通过确定质量异常的数据在第一can网络数据中的数量占比,可以直接作为第二评价指标。
62.步骤208、根据针对第一can网络数据和gps数据中各自数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标。
63.由于车载终端的生产厂家所采集的数据规范需要匹配车辆生产厂家所规定的预设数据规范,从而可以确定车载终端采集的第一can网络数据和gps数据中,哪些数据不符
合车辆生产厂家所规定的数据规范。由此,通过将车载终端采集的第一can网络数据和gps数据所呈现出的数据规范,与车辆生产厂家所规定的预设数据规范进行对比,即可确定车载终端采集的第一can网络数据和gps数据中哪些数据类型不符合预设数据规范,从而得到第三评价指标。
64.步骤210、根据第一评价指标、第二评价指标和第三评价指标,获取用于表征车载终端所采集到数据的质量的评估结果。
65.由上述解释说明可知,第一评价指标、第二评价指标和第三评价指标实际均可以为占比。而通过将占比转化为分值,根据分值可以得到用于表征车载终端所采集到数据的质量的评估结果。而评估结果可以用于指导相关工作人员对车载终端进行问题排查。当然,实际实施过程中,第一评价指标、第二评价指标、第三评价指标同样具有指导意义,也即也可以根据三者对车载终端进行问题排查,本技术实施例对此不作具体限定。
66.上述车辆数据的质量评估方法,通过在车载终端投入使用之前开发阶段,在目标车辆上安装车载终端和can网络数据采集设备采集数据,通过数据对比,确定用于表征车载终端采集到数据的异常程度评价指标,以基于评价指标,对车载终端采集到的数据质量进行评估。由于可以在开发阶段即可对车载终端采集到的车辆数据的质量进行评估,从而可以做到车载终端有问题在开发阶段即可,而不需要在使用阶段完全由服务器仅根据车载终端采集到的数据进行分析,以评估车载终端的数据质量。另外,由于可以不需要由服务器对车载终端采集到的数据进行分析,从而可以降低服务器的处理负担。最后,由于在评价车载终端采集到的车辆数据质量时,采用了多种评价指标进行综合评估,从而可以提高车辆数据质量评估的精准程度。
67.在一些实施例中,目标数据包括第一can网络数据、gps数据和行驶统计数据;获取用于表征目标数据中数据类型质量异常程度的第一评价指标,包括:
68.根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型;根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型;将不同采样时刻所采集到的行驶统计数据与车辆行驶统计模型的统计结果进行对比,确定行驶统计数据所覆盖的数据类型中的质量异常数据类型;根据第一can网络数据、gps数据和行驶统计数据各自所覆盖的数据类型中的质量异常数据类型,确定第一评价指标。
69.其中,车载终端与can网络数据采集设备是在目标车辆在行驶过程中同时进行数据采集的,且可以使用相同的采集频率。由此,可以理解的是,两个采集过程是具有时间同步性的。而在本技术实施例中正是将同步时间下的,也即相同采集时刻所采集到的第一can网络数据与第二can网络数据作对比,从而确定车载终端采集到的第一can网络数据,与作为对比对象的第二can网络数据之间差距有多大,以确定出数据差异程度。而对于数据差异程度较大的那些数据类型,即可确定为质量异常数据类型。
70.同理,基于类似过程,也可以确定出gps数据所覆盖的数据类型中的质量异常数据类型。而行驶统计数据,如行驶里程之类,通常可以通过建模进行预测。类似地,通过将行驶统计数据与车辆行驶统计模型的统计结果进行对比,也可以确定行驶统计数据所覆盖的数据类型中的质量异常数据类型。
71.通过上述过程,可以确定第一can网络数据、gps数据和行驶统计数据各自所覆盖的数据类型中的质量异常数据类型。通过统计三者中质量异常数据类型的第一总数量;再统计三者各自覆盖的数据类型的总数量之和,获得第二总数量,计算第一总数量与第二总数量之间的比值,并可以作为第一评价指标。
72.上述实施例中,由于可以获取第一评价指标,而第一评价指标用于表征第一can网络数据、gps数据或行驶统计数据中的至少一种数据的数据类型质量异常程度,也即可以综合对由车载终端采集到的多种数据进行评估,以获取车载终端采集到的车辆数据的质量评价结果,进而可以提高车辆数据质量评估的精准程度。
73.在一些实施例中,根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型,包括:
74.对于第一can网络数据与第二can网络数据所覆盖的任一数据类型,分别获取相同采集时刻所采集到的第一can网络数据中该数据类型相应的第一目标数据,以及第二can网络数据中该数据类型相应的第二目标数据;针对相同采样时刻所采集到的第一目标数据和第二目标数据,分别获取第一目标数据与第二目标数据之间的差异程度值;根据获取到的差异程度值和相应获取到的数量,确定该数据类型的质量异常程度值,根据该数据类型的质量异常程度值,获取该数据类型的判定结果,判定结果用于指示是否为质量异常数据类型。
75.具体地,为了便于理解,以任一数据类型a,而采集时刻分别为a、b、c和d为例。分别获取在a、b、c和d四个采集时刻所采集到的第一can网络数据中a类型相应的第一目标数据,均记为x
i1
。其中,i表示第i个采集时刻,“1”表示是第一can网络数据中的第一目标数据。同时,还可以别获取在a、b、c和d四个采集时刻所采集到的第二can网络数据中a类型相应的第二目标数据,可均记为x
i2
。其中,i表示第i个采集时刻,“2”表示是第二can网络数据中的第二目标数据。
76.其中,差异程度值可以通过计算两个数据之间的差值,或者是平方差所得到的。当然,实际实施过程中,也可以采用别的方式进行计算,本技术实施例对此不作具体限定。而在本技术实施例,可采用如下公式进行计算:
[0077][0078]
在上述公式中,x
i1
表示第i个采集时刻采集到的第一can网络数据中数据类型为a的第一目标数据,x
i2
表示第i个采集时刻采集到的第二can网络数据中数据类型为a的第二目标数据,n表示共有n个采集时刻。δ表示数据类型a的质量异常程度值。
[0079]
而表示针对数据类型a,第一目标数据与第二目标数据之间的差异程度值。通过计算差异程度值与获取到的差异程度值的数量(也即采集时刻的个数)之间的比值,获得的比值δ即为该数据类型a的质量异常程度值。通过判断δ是否大于预设阈值,在大于的情况下,则可以判定数据类型a为质量异常数据类型。
[0080]
上述实施例中,通过将第二can网络数据作为参考,通过累计相同时刻采集到的,每一数据类型的第一can网络数据与第二can网络数据之间的数据差异程度,以获得针对每一数据类型的质量是否异常的判定结果,并基于判定结果判断每一数据类型是否为质量异常数据类型。由于针对每一数据类型,可以累计车载终端采集到的数据与can网络数据采集设备在相同采集时刻的数据之间的差异程度,从而可以有效评估车载终端在采集can网络数据中每一数据类型的数据时数据质量的异常程度,以精准对车载终端采集的数据质量进行评估。
[0081]
在一些实施例中,根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型,包括:
[0082]
对于gps数据所覆盖的任一数据类型,根据每一采集时刻的上一采集时刻、每一采集时刻和每一采集时刻的下一采集时刻分别所采集到的该数据类型的数据,确定每一采集时刻所采集到的该数据类型的数据是否为质量异常数据;根据该数据类型的质量异常数据在所有采集到的该数据类型的数据中的数量占比,确定该数据类型是否为质量异常数据类型。
[0083]
具体地,以某一采集时刻以及gps数据中某一数据类型为例,若该采集时刻采集到的该数据类型的数据,与该采集时刻的上一采集时刻所采集到的该数据类型的数据之间的差异程度为δx1,而该采集时刻采集到的该数据类型的数据,与该采集时刻的下一采集时刻所采集到的该数据类型的数据之间的差异程度为δx2,则可以根据δx1和δx2,确定该采集时刻采集到的该数据类型的数据是否为质量异常数据。
[0084]
其中,确定过程可以为判断δx1和δx2是否大于某一预设阈值。若均大于,则说明该采集时刻采集到的该数据类型的数据突变的可能性较大,从而可以确定该采集时刻采集到的该数据类型的数据为质量异常数据。由于针对该数据类型究竟采集了多少个数据是可以获知的,而针对该数据类型的质量异常数据的数量也是可以获知的,从而通过计算两者的比值,即可得到该数据类型的质量异常数据在所有采集到的该数据类型的数据中的数量占比。
[0085]
上述实施例中,通过将gps数据自身作为参考,也即针对同一数据类型,通过比较不同采集时刻采集到的该数据类型的数据之间的差异程度,以获得每一采集时刻采集到的数据是否为质量异常数据。由此,通过累计质量异常数据的出现次数,并计算在全部数据中的数量占比,从而可有效评估车载终端在采集gps数据中每一数据类型的数据时数据质量的异常程度,以精准对车载终端采集的数据质量进行评估。
[0086]
在一些实施例中,第一can网络数据与第二can网络数据的数量均为多个;将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标,包括:
[0087]
对多个第一can网络数据进行规整,以使得规整后的多个第一can网络数据所呈现出的采集频率与第一can网络数据的采集频率一致;将规整后的多个第一can网络数据各自的采集时刻与多个第二can网络数据各自的采集时刻进行对齐,确定规整后的多个第一can网络数据中采集时刻存在误差的第一can网络数据;获取采集时刻存在误差的第一can网络数据在规整后的多个第一can网络数据中的数量占比,作为第二评价指标。
[0088]
由上述实施例的内容可知,车载终端与can网络数据采集设备可以使用相同的采
集频率。而即使使用相同的采集频率,也存在车载终端与can网络数据采集设备各自呈现的采集时刻不一致的情形。例如,车载终端在采集数据时可能会出现重采集,漏采集和采集周期跳变之类的问题,这导致车载终端采集到的数据所呈现的采集时刻与can网络数据采集设备采集到的数据所呈现的采集时刻不一致。因此,为使得采集时刻呈现出一致,在本技术实施例中可以先对第一can网络数据进行规整。
[0089]
其中,规整过程可以是将车载终端重传或者漏传的数据删除,还可以是将因采集周期跳变而导致相对于can网络数据采集设备的采集频率所多采集到的数据进行删除,本技术实施例对此不作具体限定。可以理解的是,经过规整主要是使得第一can网络数据的采集时刻与第二can网络数据的采集时刻实现基本对齐。实际实施过程中,两者的采集时刻可能还是有些许时间间隔上的误差。有ic,可以将第一can网络数据的采集时刻与第二can网络数据的采集时刻进行对齐,以此来确定多个第一can网络数据中哪些数据相对于第二can网络数据的采集时刻存在时间间隔上的误差。通过统计这些存在时间间隔上误差的数据数量,可以计算这些数据的数量在规整后的多个第一can网络数据中的数量占比,并可以作为第二评价指标。
[0090]
上述实施例中,通过将第二can网络数据作为参考,将第一can网络数据的采集时刻与第二can网络数据的采集时刻进行对齐,确定存在采集时刻误差的第一can网络数据的数量。由于可以通过计算存在误差的第一can网络数据的数量在第一can网络数据的总数量中的占比,从而可在时间维度上有效评估车载终端在采集can网络数据时的数据质量。
[0091]
另外,在评估过程之前,还可以先对第二can网络数据进行规整,从而可以避免采集过程中的意外状况,影响对车载终端采集can网络数据的评估过程,以提高评估结果的精准性。
[0092]
在一些实施例中,根据针对第一can网络数据和gps数据中各自所覆盖的数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标,包括:
[0093]
将第一can网络数据和gps数据中各自所覆盖的数据类型所使用的数据规范与预设数据规范进行比对,确定不符合预设数据规范的异常数据类型;获取不符合预设数据规范的异常数据类型在第一can网络数据和gps数据各自所覆盖的数据类型中的数量占比,作为第三评价指标。
[0094]
其中,预设数据规范可以包括采集到的数据精度规范、采集到的数据取值范围规范、数据格式规范和计量单位规范等,本技术实施例对此不作具体限定。预设数据规范主要是要求车载终端采集到的数据需要满足车辆制造厂家的数据合规性要求,若车载终端采集到的数据不符合预设数据规范,则有可能会因数据不兼容导致车载终端安装上目标车辆后无法使用。通过确定第一can网络数据和gps数据中不符合预设数据规范的数据类型的数量,再计算该数量在第一can网络数据和gps数据中所有数据类型中的数量占比,即可得到第三评价指标。
[0095]
上述实施例中,由于可判断车载终端采集到的数据是否符合预设数据,并统计不符合预设数据规范的数据类型数量占比,以此作为其中一项评价指标,从而可以有效评估车载终端在采集can网络数据和gps数据时的数据质量,以保证车载终端后续使用过程中与目标车辆兼容。
[0096]
为了便于理解,如图3所示,现结合上述实施例的内容,对本技术提及的车辆数据
的质量评估方法进行说明,包括以下步骤:
[0097]
步骤302、获取目标车辆在行驶过程中由车载终端采集到的第一can网络数据、gps数据和行驶统计数据,并获取由can网络数据采集设备所采集到的第二can网络数据。
[0098]
步骤304、根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型;根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型。
[0099]
步骤306、将不同采样时刻所采集到的行驶统计数据与车辆行驶统计模型的统计结果进行对比,确定行驶统计数据所覆盖的数据类型中的质量异常数据类型;根据第一can网络数据、gps数据和行驶统计数据各自所覆盖的数据类型中的质量异常数据类型,确定第一评价指标。
[0100]
步骤308、对多个第一can网络数据进行规整,以使得规整后的多个第一can网络数据所呈现出的采集频率与第一can网络数据的采集频率一致;将规整后的多个第一can网络数据各自的采集时刻与多个第二can网络数据各自的采集时刻进行对齐,确定规整后的多个第一can网络数据中采集时刻存在误差的第一can网络数据;获取采集时刻存在误差的第一can网络数据在规整后的多个第一can网络数据中的数量占比,作为第二评价指标。
[0101]
步骤310、将第一can网络数据和gps数据中各自所覆盖的数据类型所使用的数据规范与预设数据规范进行比对,确定不符合预设数据规范的异常数据类型;获取不符合预设数据规范的异常数据类型在第一can网络数据和gps数据各自所覆盖的数据类型中的数量占比,作为第三评价指标。
[0102]
步骤312、根据第一评价指标、第二评价指标和第三评价指标,获取用于表征车载终端所采集到数据的质量的评估结果。
[0103]
在上述实施例中,通过在车载终端投入使用之前开发阶段,在目标车辆上安装车载终端和can网络数据采集设备采集数据,通过数据对比,确定用于表征车载终端采集到数据的异常程度评价指标,以基于评价指标,对车载终端采集到的数据质量进行评估。由于可以在开发阶段即可对车载终端采集到的车辆数据的质量进行评估,从而可以做到车载终端有问题在开发阶段即可,而不需要在使用阶段完全由服务器仅根据车载终端采集到的数据进行分析,以评估车载终端的数据质量。另外,由于可以不需要由服务器对车载终端采集到的数据进行分析,从而可以降低服务器的处理负担。最后,由于在评价车载终端采集到的车辆数据质量时,采用了多种评价指标进行综合评估,从而可以提高车辆数据质量评估的精准程度。
[0104]
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0105]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的车辆数
据的质量评估方法的车辆数据的质量评估装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个车辆数据的质量评估装置实施例中的具体限定可以参见上文中对于车辆数据的质量评估方法的限定,在此不再赘述。
[0106]
在一些实施例中,如图4所示,提供了一种车辆数据的质量评估装置,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:第一获取模块402、第二获取模块404、对比模块406、第三获取模块408和第四获取模块410,其中:
[0107]
第一获取模块402,用于获取目标车辆在行驶过程中由车载终端采集到的第一can网络数据、gps数据和行驶统计数据,并获取由can网络数据采集设备所采集到的第二can网络数据。
[0108]
第二获取模块404,用于获取用于表征目标数据中数据类型质量异常程度的第一评价指标,目标数据包括第一can网络数据、gps数据或行驶统计数据中的至少一种;
[0109]
对比模块406,用于将第一can网络数据与第二can网络数据进行对比,获得用于表征第一can网络数据中数据质量异常程度的第二评价指标;
[0110]
第三获取模块408,用于根据针对第一can网络数据和gps数据中各自数据类型的数据规范评判结果,获取用于表征数据合规程度的第三评价指标;
[0111]
第四获取模块410,用于根据第一评价指标、第二评价指标和第三评价指标,获取用于表征车载终端所采集到数据的质量的评估结果。
[0112]
在一些实施例中,目标数据包括第一can网络数据、gps数据和行驶统计数据;第一获取模块402,用于根据在相同采集时刻所采集到的第一can网络数据与第二can网络数据之间的数据差异程度,确定第一can网络数据与第二can网络数据所覆盖的数据类型中的质量异常数据类型;根据不同采集时刻所采集到的gps数据之间的数据差异程度,确定gps数据所覆盖的数据类型中的质量异常数据类型;将不同采样时刻所采集到的行驶统计数据与车辆行驶统计模型的统计结果进行对比,确定行驶统计数据所覆盖的数据类型中的质量异常数据类型;根据第一can网络数据、gps数据和行驶统计数据各自所覆盖的数据类型中的质量异常数据类型,确定第一评价指标。
[0113]
在一些实施例中,第一获取模块402,还用于对于第一can网络数据与第二can网络数据所覆盖的任一数据类型,分别获取相同采集时刻所采集到的第一can网络数据中该数据类型相应的第一目标数据,以及第二can网络数据中该数据类型相应的第二目标数据;针对相同采样时刻所采集到的第一目标数据和第二目标数据,分别获取第一目标数据与第二目标数据之间的差异程度值;根据获取到的差异程度值和相应获取到的数量,确定该数据类型的质量异常程度值,根据该数据类型的质量异常程度值,获取该数据类型的判定结果,判定结果用于指示是否为质量异常数据类型。
[0114]
在一些实施例中,第一获取模块402,还用于对于gps数据所覆盖的任一数据类型,根据每一采集时刻的上一采集时刻、每一采集时刻和每一采集时刻的下一采集时刻分别所采集到的该数据类型的数据,确定每一采集时刻所采集到的该数据类型的数据是否为质量异常数据;根据该数据类型的质量异常数据在所有采集到的该数据类型的数据中的数量占比,确定该数据类型是否为质量异常数据类型。
[0115]
在一些实施例中,第一can网络数据与第二can网络数据的数量均为多个;对比模
块406,用于对多个第一can网络数据进行规整,以使得规整后的多个第一can网络数据所呈现出的采集频率与第一can网络数据的采集频率一致;将规整后的多个第一can网络数据各自的采集时刻与多个第二can网络数据各自的采集时刻进行对齐,确定规整后的多个第一can网络数据中采集时刻存在误差的第一can网络数据;获取采集时刻存在误差的第一can网络数据在规整后的多个第一can网络数据中的数量占比,作为第二评价指标。
[0116]
在一些实施例中,第三获取模块408,用于将第一can网络数据和gps数据中各自所覆盖的数据类型所使用的数据规范与预设数据规范进行比对,确定不符合预设数据规范的异常数据类型;获取不符合预设数据规范的异常数据类型在第一can网络数据和gps数据各自所覆盖的数据类型中的数量占比,作为第三评价指标。
[0117]
关于对车辆数据的质量评估装置的具体限定可以参见上文中对于车辆数据的质量评估方法的限定,在此不再赘述。上述车辆数据的质量评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0118]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端或服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(input/output,简称i/o)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储车载终端和can网络数据采集设备所采集到的数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种车辆数据的质量评估方法。
[0119]
本领域技术人员可以理解,图5中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0120]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0121]
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0122]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0123]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器
(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0124]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。