基于车联网的车、路状况与驾驶安全大数据相关性分析法
【专利摘要】本发明公开了一种基于车联网的车、路状况与驾驶安全大数据相关性分析法,包括数据采集、数据传输与存储、数据降噪、数据分析、数据展示与反馈。其中,采集的数据不仅包括车辆本身的数据,还包括道路情况数据和周边车辆相关数据,通过数据分类存储、降噪去除异常值,多元线性回归拟合分析,确定危险行车情况、车辆硬件状态和道路环境、周边车辆、驾驶行为之间的相关性,并反馈给车主。本发明中公开的分析法能使驾驶员更好地了解自身的驾驶行为及车辆状态,通过及时更换潜在危险的部件和修正不良驾驶行为,达到降低能耗、延长车辆寿命,提高行车安全的目的。
【专利说明】
基于车联网的车、路状况与驾驶安全大数据相关性分析法
技术领域
[0001] 本发明设及一种基于车联网的车、路状况与驾驶安全大数据相关性分析法。
【背景技术】
[0002] 近年来,随着智能汽车技术的不断提高,车辆本身产生了越来越多的数据,并且车 联网技术的不断发展使人们对道路情况的监测和掌控也越来越多,车车通信也成为了现 实。而与此同时,数据分析的方法和工具也越来越多,因此越来越多的机构或个人希望通过 分析运些数据来分析驾驶行为,W达到提高行车安全的目的。
[0003] 然而,现有的一些方法只单独着眼于车辆本身记录的数据来进行驾驶行为分析, 分析结果的准确性普遍较低,为此,国内许多技术人员对行车方面的数据分析方法进行了 改进。
[0004] 专利文件CN104952249A公开了一种基于车联网的驾驶行为纠正方法及装置,主要 是通过不同的信息获取器实时获取本车及驾驶员状态信息、行驶道路和其他周边车辆车况 信息,并通过判断单元实时判断本车的驾驶行为是否具有危险性,并发出纠正提示。然而, 该技术将重点放在驾驶行为是否危险的结论判定上,只重视实时结果,分析不够全面。
[0005] 专利文件CN105160883A公开了一种基于大数据的节能驾驶行为分析方法,主要是 通过车载终端和路侧系统收集车辆相关信息、环境信息和交通信息,将数据发送到信息服 务后台后,通过分析对比得到数据模型,从而进行节能驾驶分析,为驾驶员提供经济、可靠 的驾驶建议,从而达到节能减排的效果。该技术仅将分析重点单一地放在节能之上,而没有 考虑到驾驶行为、路况等方面。
【发明内容】
[0006] 本发明的目的在于提供一种综合本车车辆数据、道路数据、车车间的数据进行驾 驶行为、行车环境与本车车况的大数据相关性分析方法,W克服现有技术中用W分析的数 据不全面、重视结果忽略数据相关性的缺陷。
[0007] 为实现上述目的,本发明的设计方案如下:
[000引1、数据采集:
[0009] 1)通过外设硬件设备从车辆CAN总线(Con化oiler Area化twork)获取本车车辆 数据(均是经过帖提取等操作的有意义数据),包括W下数据:车辆GPS定位经缔度数据、车 辆速度V、加速度a、转弯角速度ω、制动踏板数据、油口数据、排挡位置信息、方向盘的旋转 角度数据,安全带数据、车灯雨刷控制数据、耗油量数据、耗电量数据、发动机转速、冷却液 溫度等各硬件状态实时记录的关键数据。
[0010] 2)通过车联网路侧单元获取道路情况及数据(均是经过帖提取等操作的有意义数 据),包括W下数据:车流量、拥堵状况、人流状况、事故状况、交通信号、道路限速限高及其 他规定信息等。
[0011] 3)车联网中本车与周边车辆相关数据(均是经过帖提取等操作的有意义数据),包 括w下数据:前、后、左、右车距信息、通信讯息、车车预警信息等。
[0012] 2、数据传输与存储:
[0013] 1)数据传输:通过3G/4G无线网络进行传输
[0014] 2)数据存储:
[0015] (1)云端:将数据传输至云计算平台,根据W上数据分类分别存储为不同的数据 集,包括:
[0016] a)将本车车辆数据中与人为驾驶因素紧密相关的数据单独提取出来,单独存储一 个数据集Cdbl,如:油口、刹车、离合、车灯雨刷开关操作等;
[0017] b)将行车安全特征数据单独提取存储一个数据集Cdb2,如车速、加速度、转弯加速 度、W及前后左右的车距等;
[0018] C)其余数据集为,本车设备状态数据Cdb3、道路环境数据Cdb4、周边车辆数据 0化5。
[0019] (2)本地:同时在本地存储一份数据,W-定的周期频率进行数据更新。
[0020] 3、数据降噪:
[0021] 在上述各个数据集中各自进行数据降噪工作,剔除噪声数据(异常值)。采用利用 数据分布特征及箱型图方法来识别每一个因子的噪声,具体步骤如下:
[0022] 1)假设一组数据E_0如下: rmwi
[0024] 将数据集等分成α个区间(d可取1,10,100,1000-),区间大小(1为:
[0025]
[0026] 截取数据分布较为集中的区间作为数据集中域,使数据集中域形成新数据组6_1。
[0027] 2)对6_1数据集做箱形图分析,计算75%分位数Q3、25%分位数Q1、上下四分位差 IQR,得到非离群数据组[Q1-3IQR,Q3+3IQR],再取非异常数据组[Q1-1.5IQR,Q3+1.5IQR], 在非异常数据组区间之外的即异常值,予W剔除,得到降噪后的数据集D_0。
[002引4、数据分析:
[0029] 1)对某一个固定周期内的数据进行分析,如周期为一周,对非量化数据进行量化, 进一步对所有影响因子进行标准化处理,目的是去除数据的单位限制,转化为落入一个特 定区间的无量纲数值。采用0-1标准化方法,使结果落到区间内,转换函数如下:
[0030]
[0031] 2)按需求选择性进行此步骤,通过对照本车车辆数据W及与车辆行驶相关的道路 数据,分析出缺失或错误的驾驶行为,如转弯不打或打错方向灯,未按照交通信号灯规范行 车。具体步骤如下:
[0032] a) W秒为单位,按照相同的时间序列依次分组进行比照,组1为转弯加速度数据列 和方向灯控制数据列,组2为交通信号灯数据列和加速度数据列;
[0033] b)W转弯及速度数据为标准,判断是否正确进行车灯控制操作,得到判决结果。W 交通给信号灯数据为标准,判断是否按照规定加速或减速;
[0034] C)将判决结果生成一列新数据组添加到驾驶行为数据集内。
[0035] 3) W行车安全特征数据为主要研究对象,如车速、加速度(急加速、急减速)、转弯 加速度、W及前后左右的车距(表征碰撞危险情况)等,分析每一个危险行车情况和道路环 境(利用数据分析中步骤2的分类结果)、周边车辆、各个驾驶行为W及车辆硬件状态的相关 性,具体为:
[0036] a)根据交通安全规范,划定行车安全特征数据的安全与危险区间,识别出非安全 区间的特征数据。
[0037] b)通过多元线性回归算法,W每一个行车安全特征数据为因变量,其他上述数据 为影响因子,进行拟合,根据拟合结果中每一个影响因子的系数大小及相关计算数据可W 看出相关程度,具体步骤如下:
[003引i)抽取某一个行车安全特征数据的样本作为为因变量Y=[yi,y2,y3,...,yn,]T,W 其他上述数据的样本作为P个影响因子,形成矩阵X:
[0039]
[0040] ii)多元线性回归模型为
[0041] Υ = β〇+βιΧι+β2 拉+...+βρΧρ+Ε
[0042] 利用最小二乘法对系数(β〇,βι,β2, . . .,βρ)进行估计,通过软件完成数据运算过 程,从而得到回归模型f反)=瓜+托+資2? +…卡度,馬+ f。其中系数的最小二乘估计 公式为房=(沪巧-1沪y
[0043] iii)对模型进行零假设检验;
[0044] iv)通过软件计算得到f统计量及P值,检验各个影响因子的显著相关性;
[0045] V)计算R2统计量,检验因变量能被回归模型解释的程度。
[0046] C)采用后退逐步回归法(Backward Stepwise Selection),剔除低相关因子,具体 步骤:
[0047] i )Mp表示全因子模型,包含所有P个影响因子;
[004引ii)令k = p,p-l,…1,拟合所有k个模型,模型中包含k-1个影响因子,依次剔除一 个影响因子进行拟合。选择在运k个拟合模型中最佳模型Mk-i,其中最佳的判断标准为计算 得到最小的RSS值和最大的R2值;
[0049] iii)从Mo. . .Mp中,通过交叉检验法确定唯一最佳模型其中,交叉检验法 具体为K折交叉检验方法。
[0050] d)分析得到回归模型后,观察存在的影响因子及其相关系数,可推论得到各个影 响因子与行车安全特征数据的相关性。
[0051] 4) W本车车辆各硬件设备状态数据为主要研究对象,如耗油量、耗电量、发动机老 化情况等,分析其与道路环境、周边车辆W及各个驾驶行为的相关性,具体步骤与上述第3) 步相同。
[0化2] 5、数据展示与反馈:
[0053] 将数据分析结果通过移动端app的方式进行展示,反馈给车主及司机。
[0054] 本发明的优点和有益效果在于:
[0055] 现有的一些方法根据自身车辆数据来分析驾驶行为,或综合道路状况分析驾驶行 为进行危险性评分等,多注重结果,其中的相关性未得到关注,综合道路和周边车辆信息能 够增加分析结果的准确性和合理性。
[0056] 同时,车辆自身状况,行车环境与驾驶行为和安全Ξ者之间有着密切关联,对运些 相关性的明确能够让驾驶行为的分析更加客观,同时驾驶员对自己的驾驶行为有更清晰的 把控和认知,从而更具针对性地修正不良驾驶行为,也能让车主对本车车况及产生原因更 明确,不仅能及时更换有潜在危险的车辆部件,也能够更具针对性地通过改变驾驶行为等 措施来降低能耗、延长车辆寿命,总体上提高行车安全。
【附图说明】
[0057] 图1为本发明的方法总体框架图;
[005引图2为本发明的数据分析过程框图。
【具体实施方式】
[0059] 下面结合附图和实施例,对本发明的【具体实施方式】作进一步描述。W下实施例仅 用于更加清楚地说明本发明的技术方案,而不能W此来限制本发明的保护范围。
[0060] 实例一、分析急刹车驾驶行为与行车环境因素、车况因素的相关性。
[0061] 1、获取在云端存储的一周内数据,包括车辆加速度数据、档位数据、道路车流和信 号灯数据、前车距数据,车辆异常报告数据,电瓶电量数据;
[0062] 2、通过箱形图的方法剔除所需数据的异常值;
[0063] 3、由于车辆刹车时加速度为负值,并且急刹车时加速度绝对值较大,因此识别选 取出负加速度值并取其绝对值,进一步筛选出高出平均值的那部分数据,作为急刹车表征 数据,同时W相同的时间段为标定,筛选出其他相关数据中需要的部分;
[0064] 4、由于W上各个数据的单位不同,需要全部进行标准化处理,使结果落到[0,1]区 间内;
[0065] 5、W筛选出的急刹车表征数据作为因变量Y,其他数据项整合作为影响因子集合 X,其中档位数据为XI,道路车流数据X2,交通信号灯数据X3,前车车距X4,车辆异常报告数 据X5,电瓶电量数据X6。通过软件进行多元线性回归的模型拟合,得到模型;
[0066] f爵=2.巧日 5 + 4.8486乂1 + 1.9 巧 2乂2 + 0.目 1〇8而 + 1-14〇4乂4 + 0.0702Xs + 0.00 巧 乂6
[0067] 6、对上述线性回归模型进行零假设检验并通过,急刹车表征数据和至少一个数据 项相关联;
[0068] 软件计算所得结果见下表:
[0069]
[0070] 7、通过计算结果发现数据X6的p值最大,考虑运一周期内急刹车行为与电池电量 相关度最低,可考虑剔除,下一步进行子集选择;
[0071] 8、通过后退逐步回归法得到,当影响因子集中包含乂1^2心3^4时,模型具有最小 的RSS和最大的R2值。
[0072] 9、f煩品t = 2.9615 + 5.8463而 +1.的66兩 + 0.如1〇乂3 + 1-3化5?,通过分析 发现,在运一周期内,急刹车行为的发生和档位有着很大正相关性,和道路车流也有着较强 的相关性,和交通信号灯数据和前车车距的相关性其次。推断急刹车行为较为经常发生在 高档位时,也就是说驾驶员在运一周期内经常在车速较高的情况下做出急刹车反应,具有 一定的危险性,需要引起重视。
[0073] 10、将上述分析结果在app上通过图形结合数据的方法进行展示,将分析结果反馈 给车主或驾驶员。
[0074] W上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明技术原理的前提下,还可W做出若干改进和润饰,运些改进和润饰 也应视为本发明的保护范围。
【主权项】
1. 一种基于车联网的车、路状况与驾驶安全大数据相关性分析法,其特征在于,包括以 下步骤:数据采集、数据传输与存储、数据降噪、数据分析、数据展示与反馈。2. 根据权利要求1中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,所述的数据采集包括以下部分: 1) 通过外设硬件设备从车辆CAN总线获取的本车车辆数据; 2) 通过车联网路侧单元获取的道路数据; 3) 车联网中本车与周边车辆的相关数据。3. 根据权利要求1中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,所述的数据传输通过3G/4G无线网络进行传输;所述的数据存储包括云端存储 和本地存储两种方式。4. 根据权利要求3中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,所述的云端存储方式中,将采集的数据传输至云计算平台,根据数据分类分别 存储为不同的数据集,具体为:本车车辆数据中与人为驾驶因素紧密相关的数据,单独提取 存储为数据集Cdbl;行车安全特征数据,单独提取存储为数据集Cdb2;本车设备状态数据存 储为数据集Cdb3、道路环境数据存储为数据集Cdb4、周边车辆数据存储为数据集Cdb5。5. 根据权利要求3中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,在云端存储的同时,将采集的所述的数据在本地也存储一份,并以一定的周期 频率进行数据更新。6. 根据权利要求4中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,在所述的各个数据集中各自进行数据降噪,利用数据分布特征截取数据分布 集中的区间作为数据集中域,对所述的数据集中域作箱型图分析,得到非离群数据组,再取 非异常数据组,剔除所述的非异常数据组区间之外的异常值,得到降噪后的数据集。7. 根据权利要求6中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,所述的数据分析包括以下步骤: 1) 对一固定周期内降噪后的数据进行分析,将非量化数据进行量化,然后采用0-1标准 化方法,对所有影响因子的数据进行标准化处理,使所述的数据转化为落入一个特定区间 的无量纲数值; 2) 通过对比本车车辆数据以及与车辆行驶相关的道路数据,分析判断出缺失或错误的 驾驶行为,并将所述的判断结果生成一列新数据组,添加到驾驶行为的数据集内; 3) 以行车安全特征数据为主要研究对象,分析每一个危险行车情况和道路环境、周边 车辆、各个驾驶行为以及车辆硬件状态的相关性,具体为: a) 根据交通安全规范,划定行车安全特征数据的安全与危险区间,识别出非安全区间 的特征数据。 b) 通过多元线性回归算法,以每一个行车安全特征数据为因变量,其他所述的数据为 影响因子,进行拟合,根据拟合结果中每一个影响因子的系数大小及计算数据确定相关程 度; c) 采用后退逐步回归法,剔除低相关因子; d) 分析得到回归模型后,观察存在的影响因子及相关系数,得到各个影响因子与行车 安全特征数据的相关性; 4)以本车车辆各硬件设备状态数据为主要研究对象,分析其与道路环境、周边车辆以 及各个驾驶行为的相关性,具体步骤与步骤3)相同。8. 根据权利要求7中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,所述的通过多元线性回归算法进行拟合的具体步骤为: 1) 抽取一个行车安全特征数据的样本作为因变量,以其他所述的数据的样本作为P个 影响因子,形成矩阵X,2 )多兀线性回归|?型为Y = β()+βlXl+β2X2^ Ι~βρΧρ+ e,利用最小-乘法对系数(β〇,βι, β2,...,βρ)进行估计,通过软件完成数据运算过程,W*苜刑+ e;所述的系数的最小二乘估计公3 3) 对模型进行零假设检验; 4) 通过软件计算得到f统计量及p值,检验各个影响因子的显著相关性; V)计算R2统计量,检验因变量能被回归模型解释的程度。9. 根据权利要求8中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析法, 其特征在于,所述的后退逐步回归法的具体步骤为: 1邋表示全因子模型,包含所有p个影响因子; 2) 令k = p,p-l,…1,拟合所有k个模型,模型中包含k-Ι个影响因子,依次剔除一个影响 因子进行拟合,选择在这k个拟合模型中最佳模型,所述的最佳模型的判断标准为计算得到 最小的RSS值和最大的R 2值; 3) 从Mo. . .Mp中,通过交叉检验法确定唯一最佳模型J(X)best,所述的交叉检验法具体为K 折交叉检验方法。10. 根据权利要求7中所述的基于车联网的车、路状况与驾驶安全大数据相关性分析 法,其特征在于,将所述的数据分析结果通过移动端app的方式进行展示,反馈给车主及司 机。
【文档编号】H04L29/08GK105844913SQ201610232260
【公开日】2016年8月10日
【申请日】2016年4月15日
【发明人】刘富强
【申请人】苏州爱诺信信息科技有限公司