动态跟驰车距调整的主从协同控制方法、装置及存储介质

文档序号:31446459发布日期:2022-09-07 11:58阅读:97来源:国知局
动态跟驰车距调整的主从协同控制方法、装置及存储介质
(t)和a2(t)分别表示后车在时刻t的位置、速度和加速度。令u(t)=a1(t)-a2(t)、y(t)=d
actual
(t)=p1(t)-p2(t),可以建立车辆跟驰系统的连续时间数学模型:
[0016][0017]
其中,c=[0 1];
[0018]
步骤1-2)对连续时间数学模型进行离散化处理,建立车辆跟驰系统的离散模型:
[0019]
令在第k个采样周期状态向量控制向量u(k)=a1(k)-a2(k)和输出y(k)=d
actual
(k),车辆跟驰系统的离散状态空间模型为:
[0020][0021]
其中,状态向量x(k)反映了前、后车辆的实时行为与实际跟驰车距,v1(k)、v2(k)分别为前、后车辆在第k个采样周期的速度,p1(k)、p2(k)分别为前、后车辆在第k个采样周期的位置,a1(k)、a2(k)分别为前、后车辆在第k个采样周期的加速度,d
actual
(k)为前、后车辆在第k个采样周期的实际车距,状态转移矩阵控制矩阵输出矩阵c=[0 1],t为采样周期;
[0022]
步骤1-3)令r(k)=d
safe
(k)、e(k)=r(k)-y(k),构建系统状态预报观测器:
[0023][0024]
其中,为系统状态估计,d
safe
(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,k为状态估计的误差补偿矩阵,控制向量u(k)为其中,l为预报观测状态反馈矩阵,m为控制向量的误差补偿矩阵。
[0025]
所述步骤2)建立基于卡尔曼滤波的最优状态估计模型包括:
[0026]
建立车辆跟驰系统状态预报观测器:
[0027][0028]
其中,为系统状态估计,u(k)为控制向量,e(k)=r(k)-y(k),r(k)=d
safe
(k),d
safe
(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,y(k)为第k个采样周期的输出,w(k)为第k个采样周期的噪声,符合高斯分布,状态转移矩阵控制矩阵k为状态估计的误差补偿矩阵;
[0029]
建立车辆跟驰系统最优状态的估计模型:
[0030][0031]
其中,为第k+1个采样周期的状态估计,p-(k+1)为在第k+1个采样周期协方差矩阵的估计值,和p-(k+1)与其各自带有噪声w(k)的真实值存在不确定性误差,p(k)表示在第k个采样周期状态估计的协方差矩阵,q(k)为第k个采样周期的状态转移协方差矩阵;
[0032]
建立最优状态估计的校正模型;
[0033]
令z(k+1)=fx(k)+v(k),其中z(k+1)为第k+1个采样周期通过测量仪器或传感器获得的系统状态向量的观测值矩阵,f=i(i为单位矩阵),v(k)为第k个采样周期由外部环境带来的观测噪声,最优状态估计的校正模型为:
[0034][0035]
其中,为第k+1个采样周期卡尔曼系数矩阵,r(k)为第k个采样周期观测噪声v(k)的协方差矩阵,为第k+1个采样周期校正后的系统状态估计,p(k+1)为第k+1个采样周期更新后的状态估计协方差矩阵。
[0036]
所述步骤2)的卡尔曼滤波算法包括以下步骤:
[0037]
步骤2-1)初始化参数,所述参数包括:k=1,g、h、u(k)、k、r(k)、f;
[0038]
步骤2-2)确定协方差矩阵p(k)和状态转移协方差矩阵q(k);
[0039]
步骤2-3)根据公式计算和p-(k+1);
[0040]
步骤2-4)根据公式计算计算和p(k+1);
[0041]
步骤2-5)判断跟驰过程是否结束,若跟驰过程结束,停止滤波计算;若跟驰过程未结束,令k=k+1,更新u(k)、r(k),重新执行步骤2-3)-步骤2-5)。
[0042]
所述步骤3)pareto优化目标为:
[0043][0044]
其中,e(k)为跟驰系统在第k个采样周期的能耗,s为安全、高效跟驰稳态,s0为跟驰系统的初始状态,σ为后车跟驰行为的控制序列,time(s0[σ>s)为车辆跟驰系统从初始状态s0经后车控制序列σ进入到安全、高效跟驰稳态s的时间求解函数,优化目标j和控制序列σ均以控制律k、l、m为决策变量,ξ为微小正数,用于限定动态跟驰车距的调整范围,f
1_traction
(k)、f
1_braking
(k)、v1(k)和a1(k)分别表示前车在第k个采样周期的牵引力、制动力、速度和加速度,f
2_traction
(k)、f
2_braking
(k)、v2(k)和a2(k)分别表示后车在第k个采样周期的牵引力、制动力、速度和加速度,f
1_traction_max
、f
1_braking_max
、v
1_max
、a
1_max
和a
1_min
分别表示前车的最大牵引力、最大制动力、最大的允许运行速度、最大加速度和最小加速度,f
2_traction_max
、f
2_braking_max
和v
2_max
分别表示后车的最大牵引力、最大制动力和最大运行速度,v
line_max
表示线路允许的车辆最大运行速度,j1(k)=|(a1(k+1)-a1(k))/t|和j2(k)=|(a2(k+1)-a2(k))/t分别为在第k个采样周期前、后车辆加速度时间变化率的绝对值,j
1_min
和j
1_max
分别为前车加速度时间变化率的最小值和最大值,a
comfort
和j
comfort
分别为车辆行为调整满足平稳性的两个上边界;所述车辆跟驰系统处于安全、高效跟驰稳态s时满足以下条件:
[0045][0046]
其中,d
actual
(k)为前、后车辆在第k个采样周期的实际车距,d
safe
(k)为第k个采样周期车辆跟驰系统应保持的动态安全车距,v1(k)、v2(k)分别为前、后车辆在第k个采样周期的速度,a1(k)、a2(k)分别为前、后车辆在第k个采样周期的加速度。
[0047]
所述步骤3)求解最优控制律过程包括:
[0048]
控制律(k,l,m)的pareto最优解集表示为:
[0049][0050]
其中,ω是控制律(k,l,m)的解空间,j0为车辆跟驰系统的优化目标初始值,表示j优于j0,即j在每一个指标上均不大于j0、且至少在一个指标上小于j0;
[0051]
如果则pareto优化得到的控制律(k,l,m)可以接受,并令j0=j;否则,保持j0不变;继续进行pareto优化,直至优化结果满意时结束,最后得到的控制律(k,l,m)即为所求最优控制律。
[0052]
所述步骤4)包括以下步骤:
[0053]
将实际测量的时间序列数据和经卡尔曼滤波校正后的时间序列数据作为样本数据,对gru深度神经网络模型进行训练,所述时间序列数据包括前车速度、后车速度、实际跟
驰车距和动态安全车距;
[0054]
若gru深度神经网络的优化目标均能达到pareto最优,即与minj满足一致性要求,并且gru深度神经网络得到的控制律与满足pareto最优的控制律(k,l,m)相比较也满足一致性要求,则gru深度神经网络训练成功,建立控制律(k,l,m)与车辆跟驰系统状态及最优行为调整过程的非线性映射关系;否则,继续进行gru深度神经网络训练。
[0055]
所述步骤6)中后车根据控制律进行自身行为的控制包括以下步骤:
[0056]
求解车辆跟驰行为和动态列车间隔的控制策略:
[0057]
a2(k)=a1(k)-u(k)
[0058]
其中,u(k)为控制律;
[0059]
根据车辆质量和受力情况,利用a2(k)计算车辆跟驰行为与动态跟驰车距同步控制所需的牵引力或制动力,实现车辆跟驰行为与动态跟驰车距的实时同步控制。
[0060]
一种动态跟驰车距调整的主从协同控制装置,包括存储器、处理器,以及存储于所述存储器中的程序,所述处理器执行所述程序时实现如上述所述的方法。
[0061]
一种存储介质,其上存储有车辆跟驰行为和动态跟驰车距控制程序,所述程序被执行时实现如上述所述的方法。
[0062]
与现有技术相比,本发明具有以下有益效果:
[0063]
(1)本发明将模型预测与pareto优化结合起来,实现了跟驰行为调整与动态跟驰车距的同步控制优化。
[0064]
(2)本发明采用卡尔曼滤波,降低了噪声的负面影响,提高了车辆跟驰系统状态估计的精度。
[0065]
(3)本发明采用gru深度神经网络,经训练后,提高了控制律计算的实时性,可以达到动态跟驰车距实时控制的目的。
[0066]
(4)现有车辆跟驰控制技术后车具有防范与前车追尾的能力,但前车对后车跟驰行为缺乏控制手段,不具备主动防范后车与自身追尾的能力。针对现有车辆跟驰控制技术这一缺陷,本发明采用主从协同控制策略进行克服,有效增强了跟驰运行过程中整个跟驰系统的主动安全能力。
附图说明
[0067]
图1为本发明流程图;
[0068]
图2为基于模型预测的车辆跟驰行为与动态跟驰车距同步控制的离散模型;
[0069]
图3为车辆跟驰行为控制的gru深度神经网络模型;
[0070]
图4为本发明与现有列控技术的兼容性示意图。
具体实施方式
[0071]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了本发明技术方案在轨道交通领域用于动态列车间隔(即动态跟驰车距)调整主从协同控制的详细实施方式和具体操作过程,但本发明的保护范围不限于下述的实施例。
[0072]
本发明涉及一种动态列车间隔调整的主从协同控制方法,在技术上与现有列车控技术兼容,见图4所示。d
safe
(t)、d
actual
(t)分别为前、后车在时刻t的动态安全车距和实际车距,p1(t)、p2(t)分别为前、后车在时刻t的位置,v1(t)、v2(t)分别为前、后车在时刻t的速度,v
e1
(p1(t))和v
e2
(p2(t))分别为前、后车在时刻t根据期望速度曲线自动生成的期望速度,a1(t)、a2(t)分别为前、后车在时刻t的加速度,p1(t0)、p2(t0)分别为前、后车在初始时刻t0的线路位置,v1(t0)、v2(t0)分别为前、后车在初始时刻t0的速度,m1(t)、m2(t)分别为t时刻前、后车的质量,列车解体、编组作业或旅客乘、降作业会造成列车质量的变化,f1(t)、f2(t)分别为前、后车在t时刻的牵引力(f1(t)>0、f2(t)>0)或制动力(f1(t)<0、f2(t)<0),f1(t)、f2(t)分别为t时刻前、后车的运行阻力(》0,指列车在运行过程中受摩擦、冲击、振动以及线路的平面和断面等外界条件的影响所产生的与列车运行方向相反且非列车为减速主动施加的作用力),∫表示对时间积分。
[0073]
当列车自主智能和主动安全能力较低的情况下,可采取“基于期望速度曲线跟踪的列车站间行为控制”与“列车时刻表”相结合的方式,实现列车在区间线路的跟驰运行,但动态列车间隔的调整精度和实时性受到较大限制,往往只能在停车站通过调整列车间隔时间来完成对跟驰车距的“粗放式”主动控制;“目标距离速度曲线”,主要用于列车跟驰运行过程中的安全防护,一旦实际列车间隔等于或小于目标距离速度曲线所规定的安全车距,后车必须采取常用制动或紧急制动方式减速运行,令动态列车间隔增大,以提高跟驰运行的安全性;“移动授权”则针对列车跟驰行为的实时连续调整给出了约束条件,后车必须在移动授权允许的范围内进行自身行为的调整,才能保证自身在跟驰运行过程中的行车安全。
[0074]
一种动态列车间隔调整的主从协同控制方法,包括以下步骤:
[0075]
步骤1)建立基于模型预测的列车跟驰行为与动态列车间隔实时连续调整的列车跟驰系统的同步控制模型。
[0076]
步骤1-1)建立列车跟驰系统的连续时间数学模型:
[0077]
假定p1(t)、v1(t)和a1(t)分别表示前车在时刻t的位置、速度和加速度,p2(t)、v2(t)和a2(t)分别表示后车在时刻t的位置、速度和加速度。令u(t)=a1(t)-a2(t)、y(t)=d
actual
(t)=p1(t)-p2(t),可以建立列车跟驰系统的连续时间数学模型:
[0078][0079]
其中,c=[0 1];
[0080]
步骤1-2)对连续时间数学模型进行离散化处理,建立列车跟驰系统的离散模型:
[0081]
令在第k个采样周期状态向量控制向量u(k)=a1(k)-a2(k)和输出y(k)=d
actual
(k),列车跟驰运行的离散状态空间模型为:
[0082][0083]
其中,状态向量x(k)反映了前、后列车的实时行为与实际跟驰车距,v1(k)、v2(k)分别为前、后列车在第k个采样周期的速度,p1(k)、p2(k)分别为前、后列车在第k个采样周期的位置,a1(k)、a2(k)分别为前、后列车在第k个采样周期的加速度,d
actual
(k)为前、后列车在第k个采样周期的实际车距,状态转移矩阵控制矩阵输出矩阵c=[0 1],t为采样周期;
[0084]
步骤1-3)令r(k)=d
safe
(k)、e(k)=r(k)-y(k),构建系统状态预报观测器:
[0085][0086]
其中,为系统状态估计,d
safe
(k)为第k个采样周期列车跟驰系统应保持的动态安全车距,k为状态估计的误差补偿矩阵,控制向量u(k)为其中,l为预报观测状态反馈矩阵,m为控制向量的误差补偿矩阵。
[0087]
基于模型预测的列车跟驰行为与动态列车间隔同步控制的离散模型,见图2所示,将动态安全车距作为跟踪目标,同时把实际车距和速差作为跟驰系统的状态变量,从而为列车跟驰行为与动态列车间隔的同步控制与优化创造了有利条件。
[0088]
步骤2)建立基于卡尔曼滤波的最优状态估计模型优化所述同步控制模型,基于卡尔曼滤波算法得到状态变量的最优估计。
[0089]
首先,考虑噪声的影响,建立符合实际运行环境的列车跟驰系统状态预报观测器:
[0090][0091]
其中,为系统状态估计,u(k)为控制向量,e(k)=r(k)-y(k),r(k)=d
safe
(k),d
safe
(k)为第k个采样周期列车跟驰系统应保持的动态安全车距,y(k)为第k个采样周期的输出,w(k)为第k个采样周期的噪声,符合高斯分布,状态转移矩阵控制矩阵k为状态估计的误差补偿矩阵;
[0092]
然后,建立列车跟驰系统最优状态状态估计模型:
[0093][0094]
其中,为第k+1个采样周期的状态估计,p-(k+1)为在第k+1个采样周期协方差矩阵的估计值,和p-(k+1)与其各自带有噪声w(k)的真实值存在不确定性误差,p(k)表示在第k个采样周期状态估计的协方差矩阵,q(k)为第k个采样周期的状态转移协方差矩阵;
[0095]
最后,建立最优状态估计的校正模型;
[0096]
令z(k+1)=fx(k)+v(k),其中z(k+1)为第k+1个采样周期通过测量仪器或传感器
获得的系统状态向量的观测值矩阵,f=i(i为单位矩阵),v(k)为第k个采样周期由外部环境带来的观测噪声,最优状态估计的校正模型为:
[0097][0098]
其中,为第k+1个采样周期卡尔曼系数矩阵,r(k)为第k个采样周期观测噪声v(k)的协方差矩阵,为第k+1个采样周期校正后的系统状态估计,p(k+1)为第k+1个采样周期更新后的状态估计协方差矩阵。
[0099]
根据上述用于列车跟驰系统最优状态估计的卡尔曼滤波模型,建立实现状态变量最优估计的卡尔曼滤波算法,具体包括以下步骤:
[0100]
步骤2-1)初始化参数,所述参数包括:k=1,g、h、u(k)、k、r(k)、f;
[0101]
步骤2-2)确定协方差矩阵p(k)和状态转移协方差矩阵q(k);
[0102]
步骤2-3)根据公式计算和p-(k+1);
[0103]
步骤2-4)根据公式计算计算和p(k+1);
[0104]
步骤2-5)判断跟驰过程是否结束,若跟驰过程结束,停止滤波计算;若跟驰过程未结束,令k=k+1,更新u(k)、r(k),重新执行步骤2-3)-步骤2-5)。
[0105]
步骤3)确定pareto优化目标,求解列车跟驰行为与动态列车间隔的最优控制律。
[0106]
pareto优化目标为:
[0107][0108]
其中,e(k)为跟驰系统在第k个采样周期的能耗,s为安全、高效跟驰稳态,s0为跟驰系统的初始状态,σ为后车跟驰行为的控制序列,time(s0[σ>s)为列车跟驰系统从初始状态s0经后车控制序列σ进入到安全、高效跟驰稳态s的时间求解函数,优化目标j和控制序列σ均以控制律k、l、m为决策变量,ξ为微小正数,用于合理限定动态列车间隔的调整范围,f
1_traction
(k)、f
1_braking
(k)、v1(k)和a1(k)分别表示前车在第k个采样周期的牵引力、制动力、速度和加速度,f
2_traction
(k)、f
2_braking
(k)、v2(k)和a2(k)分别表示后车在第k个采样周期的
牵引力、制动力、速度和加速度,(列车的牵引力与制动力不同时呈现),f
1_traction_max
、f
1_braking_max
、v
1_max
、a
1_max
和a
1_min
分别表示前车的最大牵引力、最大制动力、最大的允许运行速度、最大加速度和最小加速度,f
2_traction_max
、f
2_braking_max
和v
2_max
分别表示后车的最大牵引力、最大制动力和最大运行速度,v
line_max
表示线路允许的列车最大运行速度,j1(k)=|(a1(k+1)-a1(k))/t|和j2(k)=|(a2(k+1)-a2(k))/t|分别为在第k个采样周期前、后列车加速度时间变化率的绝对值,j
1_min
和j
1_max
分别为前车加速度时间变化率的最小值和最大值,a
comfort
和j
comfort
分别为列车行为调整满足平稳性的两个上边界。
[0109]
列车跟驰行为调整的目的是建立一个安全、高效跟驰稳态,而不是处在无休止的行为调整过程中。当列车跟驰系统处于安全、高效跟驰稳态时,满足以下条件:
[0110][0111]
其中,d
actual
(k)为前、后列车在第k个采样周期的实际车距,d
safe
(k)为第k个采样周期列车跟驰系统应保持的动态安全车距,v1(k)、v2(k)分别为前、后列车在第k个采样周期的速度,a1(k)、a2(k)分别为前、后列车在第k个采样周期的加速度。
[0112]
在动态列车间隔调整过程中d
actual
(k)-d
safe
(k)允许调整的范围较大,一旦安全、高效跟驰稳态建立,d
actual
(k)-d
safe
(k)的值较小,略大于0,以满足列车跟驰运行的安全性和高效性。当v1(k)=v2(k)=0时,前、后车列车将处在停车状态,此时所描述的状态可视为一种特殊的安全、高效跟驰稳态。
[0113]
控制律(k,l,m)的pareto最优解集表示为:
[0114][0115]
其中,ω是控制律(k,l,m)的解空间,j0为列车跟驰系统的优化目标初始值,表示j优于j0,即j在每一个指标上均不大于j0、且至少在一个指标上小于j0;
[0116]
求解最优控制律的过程包括:
[0117]
如果则pareto优化得到的控制律(k,l,m)可以接受,并令j0=j;否则,保持j0不变;继续进行pareto优化,直至优化结果满意时结束,最后得到的控制律(k,l,m)即为所求最优控制律。
[0118]
步骤4)构建车辆跟驰行为控制的gru深度神经网络模型,经训练建立控制律与车辆跟驰系统状态及最优行为调整过程的非线性映射关系。
[0119]
通过pareto优化求解控制律(k,l,m),如果时间比较长,将无法满足列车跟驰行为与动态列车间隔连续调整的实时性控制需求。可采取gru等深度神经网络求解列车跟驰行为与动态列车间隔实时连续调整满足pareto最优的控制律(k,l,m)。所建gru深度神经网络模型见图3所示,其中n为正整数,前车速度、后车速度、实际跟驰车距和动态安全车距均为以时间序列形式存在的变量,所形成的输入数据应当能覆盖列车跟驰系统的全部状态及其变迁过程。
[0120]
将实际测量的时间序列数据和经卡尔曼滤波校正后的时间序列数据作为样本数据,对gru深度神经网络模型进行训练,所述时间序列数据包括前车速度、后车速度、实际跟
驰车距和动态安全车距;
[0121]
若gru深度神经网络的优化目标均能达到pareto最优,即与minj满足一致性要求,并且gru深度神经网络得到的控制律与满足pareto最优的控制律(k,l,m)相比较也满足一致性要求,则gru深度神经网络训练成功,建立控制律(k,l,m)与列车跟驰系统各种状态及最优行为调整过程的非线性映射关系;否则,继续进行gru深度神经网络训练。
[0122]
模型训练完成后,可以利用gru深度神经网络实时求解控制律(k,l,m),进而实现动态列车间隔实时、精确调整的主从协同控制。
[0123]
步骤5)前车和后车分别将采集到的或以通信方式获取的基础数据输入各自的gru深度神经网络模型,根据映射关系分别得到第一控制律和第二控制律。
[0124]
步骤6)后车将第二控制律发送给前车,前车将第二控制律和第一控制律进行对比分析,若满足安全性、高效性、平稳性和节能运行需求,则允许后车按第二控制律进行自身行为的控制,否则前车将第一控制律发送给后车,后车按第一控制律进行自身行为的控制。
[0125]
最优控制律用于列车跟驰行为与动态列车间隔的实时控制,包括以下步骤:
[0126]
首先,求解列车跟驰行为和动态列车间隔的控制策略,其计算公式为:
[0127]
a2(k)=a1(k)-u(k)
[0128]
然后,根据列车质量和受力情况,利用上式计算列车跟驰行为与动态列车间隔同步控制所需的牵引力或制动力,实现列车跟驰行为与动态列车间隔的实时同步控制。
[0129]
步骤7)判断跟驰过程是否已结束,若跟驰过程未结束,重新执行步骤5)-步骤7)。
[0130]
上述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1