本技术涉及数据处理,具体涉及一种基于物联网的智慧交通数据优化存储方法。
背景技术:
1、智慧交通是通过各种物联网设备采集交通数据,通过大数据分析采集的交通数据,及时的对交通各个街道的压力情况进行调整。要通过采集的数据进行调整各种道路的压力情况,例如对街道上的红绿灯时长等条件进行调整避免拥堵问题。对上述进行调整时需要大量的数据进行支持,由于智慧交通会获取到大量的数据,为了提高对采集的智慧交通数据的处理效率,需要对采集的数据进行压缩存储。
2、旋转门压缩算法可以将平滑的数据使用斜率和压缩节点的方式拟合,其压缩率和其容差参数有关,容差参数越大其压缩的效率越高但是数据信息的损失情况越严重,对获取的智慧交通数据进行压缩时,需要根据获取数据调整容差参数,对可能产生问题的数据进行压缩时要保留其信息能力,对正常数据可以增加其损失情况提高其压缩效率,本发明通过自适应容差参数使得保留压缩效率的同时提高对重要信息的保留能力。
技术实现思路
1、为了解决上述技术问题,本发明提供一种基于物联网的智慧交通数据优化存储方法,以解决现有的问题。
2、本发明的一种基于物联网的智慧交通数据优化存储方法采用如下技术方案:
3、本发明一个实施例提供了一种基于物联网的智慧交通数据优化存储方法,该方法包括以下步骤:
4、采集各时刻的道路中车辆的各类数据,包括车辆密度、车流量及平均车速数据;
5、预设固定时间长度作为一个周期;获取各周期车辆密度时间序列及车流量时间序列;根据各周期的车辆密度数据及车流量数据得到各周期的车辆密度曲线及车流量曲线;根据车辆密度时间序列与车流量时间序列之间的匹配情况得到每个周期的各匹配数据组;结合直角坐标系获取各周期的第一直角坐标图,拟合获取各周期的第一曲线;根据各周期第一直角坐标图中数据聚集情况及第一曲线的波动变化得到各周期内车辆密度与车流量之间的整体关联性;根据整体关联性结合车辆密度曲线及车流量曲线波动变化得到车辆密度与车流量之间的动态关联指数;通过车辆密度与车流量之间的动态关联指数的获取方式得到任意两类数据之间的动态关联指数;根据动态关联指数结合各周期各类数据之间的差异得到各周期各类数据中每个数据点的重要性;根据各数据点的重要性结合预设初始容差参数得到各数据点的自适应容差参数;
6、通过旋转门压缩算法结合各数据点的自适应容差参数对各类数据进行旋转门压缩,实现数据压缩存储。
7、优选的,所述平均车速数据为:各时刻道路中所有车辆的平均速度。
8、优选的,所述获取各周期车辆密度时间序列及车流量时间序列,具体为:
9、将各周期内所有时刻的车辆密度数据组成的序列作为各周期的车辆密度时间序列;
10、将各周期内所有时刻的车流量数据组成的序列作为各周期的车流量时间序列。
11、优选的,所述根据各周期的车辆密度数据及车流量数据得到各周期的车辆密度曲线及车流量曲线,具体为:
12、将各周期内所有时刻的车辆密度数据通过最小二乘法进行曲线拟得到的拟合曲线作为各周期的车辆密度曲线;通过各周期的车辆密度曲线的获取方式结合车辆密度数据得到各周期的车流量曲线。
13、优选的,所述根据车辆密度数据与车流量数据之间的匹配情况得到每个周期的各匹配数据组,具体为:
14、在各周期中,将车辆密度时间序列中数据与车流量时间序列中数据通过动态时间规整算法进行匹配得到各组匹配数据,记为各匹配数据组。
15、优选的,所述结合直角坐标系获取各周期的第一直角坐标图,拟合获取各周期的第一曲线,具体为:
16、以车辆密度为横坐标、以车流量为纵坐标构建直角坐标系,在各周期内,通过各匹配数据组的车辆密度及车流量数据在直角坐标系中绘制坐标点,将所有坐标点构成的直角坐标图作为周期的第一直角坐标图,将所有坐标点进行曲线拟合得到的曲线记为周期的第一曲线。
17、优选的,所述根据各周期第一直角坐标图中数据聚集情况及第一曲线的波动变化得到各周期内车辆密度与车流量之间的整体关联性,具体包括:
18、在各周期内,计算第一直角坐标图中任意两个坐标点之间的欧氏距离;将所有欧氏距离的最大值作为第一欧氏距离,计算车辆密度与车流量之间的整体关联性的表达式为:式中,为第i周期内车辆密度与车流量u之间的整体关联性,为以为半径所画圆的面积,为所述圆内包含的坐标点的个数,为第i周期内、u数据对应的第一曲线上所有坐标点处斜率的方差,为以e为底的指数函数。
19、优选的,所述根据整体关联性结合车辆密度曲线及车流量曲线波动变化得到车辆密度与车流量之间的动态关联指数,具体包括:
20、在各周期中,计算各匹配数据组中车辆密度在车辆密度曲线上的斜率的导数,记为车辆密度二阶导;计算各匹配数据组中车流量在车流量曲线上的斜率的导数,记为车流量二阶导;计算各匹配数据组的车辆密度二阶导绝对值与车流量二阶导绝对值之间的差值;计算以自然常数为指数、以所述差值的绝对值的相反数为指数的指数函数的计算结果;计算所有匹配数据组的所述计算结果的平均值;计算周期内车辆密度与车流量之间的整体关联性与所述平均值的乘积;
21、将所有周期的所述乘积的和值的归一化值作为车辆密度与车流量之间的动态关联指数。
22、优选的,所述根据动态关联指数结合各周期各类数据之间的差异得到各周期各类数据中每个数据点的重要性,表达式为:式中,表示第i个周期的第a类数据的第q个数据点的重要性,为归一化函数,表示第i个周期的第a类数据中第q个数据点与其前一个数据点的数据值之间的差值绝对值,表示周期个数,表示第i个周期的第a类数据中第q个数据点的数据值,表示第j个周期的第a类数据中第q个数据点的数据值,表示数据种类,表示第i周期中第a类数据与第b类数据之间的动态关联指数,表示第i个周期的第a类数据中第q个数据点的邻域中的数据的方差,其中将同周期同类数据中第到第个数据点作为第q个数据点的邻域。
23、优选的,所述根据各数据点的重要性结合预设初始容差参数得到各数据点的自适应容差参数,具体包括:
24、计算1与各数据点的重要性的差值;将所述差值与预设初始容差参数的乘积作为各数据点的自适应容差参数。
25、本发明至少具有如下有益效果:
26、本发明通过采集智慧交通的各类数据,分析不同周期中数据之间的波动相似情况,根据不同数据之间各组匹配数据构建直角坐标图,分析各组匹配数据的聚集情况,构建整体关联性,评估不同数据之间的相关性;结合不同数据中匹配数据点在各自类型数据中的波动差异构建任意两类数据之间的动态关联指数,更准确的判断出两类数据之间的关联程度;根据动态关联指数结合自身数据点的波动情况和其在不同周期中的离散情况,分析不同数据对这个数据点的影响,确定这个数据点在多维空间中的波动情况,根据两个波动情况获取到每类数据中的每个数据点的重要性;通过重要性去调整容差参数的大小,避免旋转门压缩算法的容差参数选取的过大导致数据信息损失严重或容差参数过小导致压缩的效率不明显的问题,在保证压缩效率的同时提高了对重要信息的保留能力。