一种基于驾驶经验和在线学习的城轨列车智能控制方法
【专利摘要】本发明公开一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法。该方法通过模拟有经验司机的驾驶策略,利用列车运行的实时数据,通过推理和归纳,得到控制器的输出,利用列车的实时信息和限速信息,将列车运行的剩余时间合理分配,得到时间精度估算值和速度估算值,并且基于实时信息的MTDA算法,利用列车运行限速和当前位置、速度和时间,推导列车运行期望运行时间和期望运行速度。本发明这种智能控制方法同北京市亦庄线的列车自动驾驶(ATO)仿真结果对比,能够节约能耗,提高准点率。
【专利说明】—种基于驾驶经验和在线学习的城轨列车智能控制方法
【技术领域】
[0001]本发明涉及轨道交通控制领域,更具体地涉及一种基于驾驶经验和在线学习的城市轨道交通(城轨)列车智能控制方法。
【背景技术】
[0002]列车自动控制系统ATC(Automatic Train Control)采用先进的列车自动控制技术可以大大提高行车的效率、安全性,对于城市轨道交通高效率高密度的要求来说是必不可少的。ATC 系统一般包括 ATS (Automatic Train Supervis1n)系统、ATP (AutomaticTrain Protect1n)系统和 ATO (Automatic Train Operat1n)。其中,ATO 作为列车自动控制系统的一个重要的子系统,利用车载固化信息和地面信息实现对列车牵引、制动的控制,使列车经常处于最佳运行状态,提高乘客的舒适度,提高列车准点率,节约能源。对城市轨道交通运行控制系统来说,不管是人工驾驶还是全程无人驾驶,ATO都将发挥其重要作用,对两站间的列车行驶速度进行控制,其控制效果直接影响各项性能指标。在ATO中应用不同的控制算法,其控制效果是不一样的,因此,有必要研究有效的ATO控制算法,以使列车最大限度地处于最佳运行状态。
[0003]实际应用中最广泛的ATO控制算法是PID控制。PID是一种线性调节器,它将设定值与输出值的偏差按比例、积分和微分进行控制。这种控制方法要事先设定出距离-速度曲线。显然,这是一种按照事先安排好的行车曲线进行速度控制的方法。这种方法的缺点是控制速度时的加减速度切换次数过多,这种情况既不利于平稳运行,又破坏了乘坐的舒适性,同时也增加了能耗和降低了停车精度,并且无法根据运营计划时间进行灵活调整;此外控制器的频繁切换也影响了控制器的使用寿命。
[0004]此外ATO控制算法还包括自适应鲁棒控制、迭代学习控制、模糊控制等方法,但是,这些方法都需要离线的目标速度曲线,很难顾及列车运行过程中的乘客舒适度等问题;并且这些控制算法很难周全的考虑复杂的列车模型,并且列车运行过程中,会受到需要未知因素的干扰,如不确定的摩擦力、车厢之间的作用力等因素的影响、列车控制器输出的非线性特性和饱和特性等问题,很难实现精确地追踪,难以实现在线-智能的驾驶策略。
【发明内容】
[0005]为避免以上现有技术的不足,本发明提供一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法。
[0006]本发明采用下述技术方案:
[0007]—种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法,利用列车运行的实时信息,实现列车多目标运行控制,该控制方法包括如下步骤:
[0008]I)列车运行时,每隔At的时间间隔,确定列车当前位置s和当前速度V信息,以及线路的限速(S1 b,S2 bLS ;VL1, V12LO),期望运行时间T和列车停车区间Sp,判断如果s彡Sp,转向步骤5,进入停车阶段,否则,转向步骤2 ;
[0009]2)判断列车当前所处的限速区间,即Slri ( s ( Sk,k表示列车当前所处的限速区间,对应的限速大小为Vk ;
[0010]3)根据专家知识库得到列车当前的工况,再根据限速情况和列车当前速度,计算各限速区段的最短运行时间并将剩余运行时间按比例分配到各个限速区段中,进而得出当前限速区段内的剩余运行时间;再根据推理机对列车当前的运行信息推理出列车此后是否加速、减速或者惰行;
[0011]4)对列车智能驾驶控制器进行在线学习,得到该控制器输出值;
[0012]5)对列车运行线路布置应答器,并根据应答器提供的位置信息调整所述控制器输出值。
[0013]进一步,所述步骤3中列车当前运行信息包括当前速度、当前位置、当前限速和当前剩余运行时间。
[0014]进一步,所述步骤3中据推理机对列车当前的运行信息推理出列车此后是否加速、减速或者惰行具体包括:
[0015]当列车前方没有下降的限速和无需停车时,列车的工况只能是加速或者惰行,此时再计算时间精度估算值Γ =,其中Ta为时间精度估算值,Te为时间估算值,Tc为
C
当前限速区段内的剩余运行时间,通过比较时间精度值和速度值就可推理出加速或惰行工况:gTa>Ta°且¥<9,则加速,其中Ta°为设定的最大时间精度误差,加速度的大小为a =a。+ Δ amax,其中a为下一步的控制器初始输出,a。为前一步控制器输出,△ amax为加速度变化的最大值Aamax = 0.2 ;否则惰行,惰行时控制器最终输出为a = O ;
[0016]当列车前方有下降的限速时,根据ATP曲线生成方法,在一定的距离阈量内进行
(γΥ )2 -V2
减速以防止超过限速,距离阈量值为Se = v ——,其中V1 next为下一区段限速值,Y
2aset—
为速度系数即期望减速到下一个限速的百分比,以防止超过限速,Y =0.9,V为当前的速度,aset为设置的参考减速度,值的大小应满足舒适度要求,不能过大asrt = -0.5m/s2,当列车运行进入到距离阈量范围内后,按照设定的减速度进行减速即控制器初始输出为a =£iset — —0.5m/s ο
[0017]进一步,所述步骤4对列车智能驾驶控制器进行在线学习包括:
[0018]I)设定梯度下降法的目标优化函数为f = (Ve-V)2,输入为列车当前运行信息;
[0019]2)判断列车当前所处的限速区间,即Slri ( s ( Sk,k表示列车当前所处的限速区间,对应的限速大小为Vk ;
[0020]3)根据如下过程计算速度估计值P和入:
[0021]Tl = T-t ;
[0022]Tc=^HT — t).,
Lmxxi
S, h-sSc ,-Sr
[0023]V = -,Ve = -;
T' T
CC
[0024]4)列车运行距离和列车当前速度可用如下表示:
[0025]S = / vdT = Vavgt ;
[0026]V = / adT = aavgt ;
[0027]其中,Vavg为此前运行的平均速度,aavg为此前运行的平均加速度;
[0028]5)将以上公式带入目标优化函数,并对t求导数得到目标函数的梯度为:
TP? /
[0029]V/= 2(,-V) (5 -s)^-Vavgt-Gav/ T;;
—.厂min_ /
[0030]6)基于梯度下降法,可知列车控制器输出调整为/ λ为步长,数值为λ = 0.01,V/为梯度值。
[0031]进一步,所述步骤5中根据应答器提供的位置信息调整所述控制器输出值时,经
2
过第i个应答器时估算的减速度估算值力《 = -*,其中V。为当前的速度,Si为第i个应答器距离停车终点的距离,将ae」作为列车从第i个应答器运行到第i+Ι个应答器之间的控制器初始输出即此时控制器初始输出为a = ae i,依次类推,直到最后停车。
[0032]本发明的有益效果如下:
[0033]本发明,即模拟司机的列车智能驾驶技术能够在线驾驶城市轨道交通列车,不需要以往控制方法中的离线目标速度曲线,并且可以克服列车模型参数的不确定性;通过总结专家规则,建立了专家知识库,模拟有经验的司机的驾驶策略,综合考虑列车的运行和停车过程;利用列车运行过程中的实时数据,我们提出并设计了 MTDA算法,以计算列车实时剩余时间分配等参数;定义和推导了基于梯度法的在线学习公式,以在线优化列车运行过程的性能指标;并且我们根据北京地铁亦庄线的实际数据,对本发明进行了在线的仿真实验,对比了本发明方法的驾驶曲线和实际运营中的PID驾驶曲线,结果显示,本发明能够保证列车不超速,准点到站,并且提高了乘客的乘坐舒适度,降低了运行能耗,满足了停车精度;此外我们还针对不同的期望运行时间条件下的列车控制方法进行了仿真,结果表明,本发明的驾驶策略能够适应不同的期望运行时间。
【专利附图】
【附图说明】
[0034]下面结合附图对本发明的【具体实施方式】作进一步详细的说明。
[0035]图1示出本发明结构原理图。
[0036]图2示出本发明方法流程图。
[0037]图3示出城轨限速示意图;
[0038]图4、图5示出最快运行时间MTDA算法示意图;
[0039]图6示出本发明列车智能控制算法与实际北京亦庄线ATO效果对比图;
[0040]图7示出改变运行时间的条件下本发明的方法的效果示意图;
【具体实施方式】
[0041]为了更清楚地说明本发明,下面结合优选实施例和附图对本发明做进一步的说明。附图中相似的部件以相同的附图标记进行表示。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。
[0042]本发明通过模拟司机驾驶,建立了列车智能驾驶专家系统和在线学习算法,设计一种实时智能控制方法以使列车运行更加平稳舒适、节能准时。该智能控制方法主要包括以下环节:知识库、推理机和梯度下降法,如图1所示。其中知识库和推理机组成了模拟司机驾驶的专家系统,知识库包含了驾驶经验,推理机能够根据知识库和当前列车状态推理出列车下一步应处于的运行工况,专家系统得出的是控制器的初始输出,再加上梯度下降法计算出的控制器微调量,合成该智能控制器的最终输出。
[0043]如图2所示为本发明提供的具体所述方法流程图,该方法包括如下步骤。
[0044]英文字符变量说明:
[0045]列车实时状态信息:
[0046]s 列车位置
[0047]V 列车速度
[0048]t 列车运行时间
[0049]At 列车接收信息的最小时间间隔
[0050]a 控制器输出
[0051]离线信息:
[0052](S1 b,S2 bLS ;VL1, V12L O)线路限速
[0053]其他英文字符及变量:
[0054]Ta 时间精度估算值
[0055]Te 时间估算值
[0056]Tc 区间剩余运行时间
[0057]Ta° 设定的最大时间精度误差
[0058]V 速度估计值
[0059]Δ amax加速度最大变化值
[0060]T/;mm 列车在当前限速的最短时间
[0061]T^mm 列车在剩余路程的最短时间
[0062]V/ 梯度下降法的梯度值
[0063]λ 在线学习步长
[0064]步骤一:在城市轨道交通CBTC(Communicat1n based train control system,基于无线通信的列车自动控制系统)中,运行的列车能够通过列控中心传输的无线消息,每经过At的时间间隔,获得列车当前位置s和当前速度V信息,以及线路的限速(S1 b,S2bLS ;
V1,V1 2L0),期望运行时间T和列车停车区间Sp。判断如果s彡Sp,转向步骤四,进入停车阶段,否则,转向步骤二。如图3所示。
[0065]步骤二:判断列车当前所处的限速区间,即Slri ^ s ^ Sk, k表示列车当前所处的限速区间,对应的限速大小为Vk。
[0066]步骤三:首先根据如下专家知识库得到列车当前工况的大概表示,保证列车运行的舒适度、能耗和准点率,之后根据限速情况和列车当前的速度,计算各限速区段的最短运行时间并将剩余运行时间按比例分配到各个限速区段中,进而得出当前限速区段内的剩余运行时间;再根据如下推理机对列车当前的运行信息,主要包括当前速度、当前位置、当前限速、当前剩余的运行时间等,根据知识库,推理出列车此后应处于的精确运行工况即加速、减速或者惰行。
[0067]专家知识库部分内容
[0068]知识库主要包含了一些保证列车平稳运行的经验规则,比如工况转换规则,如表1所示。
[0069]表1:工况转换规则
[0070]
【权利要求】
1.一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法,其特征在于,该控制方法包括如下步骤: 1)列车运行时,每隔At的时间间隔,确定列车当前位置s和当前速度V信息,以及线路的限速(S1 b,S2 bLS ;VL1, V12L O),期望运行时间T和列车停车区间Sp,判断如果s彡Sp,转向步骤5,进入停车阶段,否则,转向步骤2 ; 2)判断列车当前所处的限速区间,即Slri^ s ^ Sk, k表示列车当前所处的限速区间,对应的限速大小为Vk ; 3)根据专家知识库得到列车当前的工况,再根据限速情况和列车当前速度,计算各限速区段的最短运行时间并将剩余运行时间按比例分配到各个限速区段中,进而得出当前限速区段内的剩余运行时间;再根据推理机对列车当前的运行信息推理出列车此后是否加速、减速或者惰行; 4)对列车智能驾驶控制器进行在线学习,得到该控制器输出值; 5)对列车运行线路布置应答器,并根据应答器提供的位置信息调整所述控制器输出值。
2.根据权利要求1所述的一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法,其特征在于,所述步骤3中列车当前运行信息包括当前速度、当前位置、当前限速和当前剩余运行时间。
3.根据权利要求1所述的一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法,其特征在于,所述步骤3中据推理机对列车当前的运行信息推理出列车此后是否加速、减速或者惰行具体包括: 当列车前方没有下降的限速和无需停车时,列车的工况只能是加速或者惰行,此时再计算时间精度估算值其中Ta为时间精度估算值,Te为时间估算值,T。为当前限速区段内的剩余运行时间,通过比较时间精度值和速度值就可推理出加速或惰行工况:gTa>Ta°且ν<ι),则加速,其中Ta°为设定的最大时间精度误差,加速度的大小为a =a。+ Δ amax,其中a为下一步的控制器初始输出,a。为前一步控制器输出,△ amax为加速度变化的最大值Aamax = 0.2 ;否则惰行,惰行时控制器最终输出为a = O ; 当列车前方有下降的限速时,根据ATP曲线生成方法,在一定的距离阈量内进行减速
(vK )2—V2以防止超过限速,距离阈量值为足-,其中Vlmxt为下一区段限速值,Y为速
2ase>-度系数即期望减速到下一个限速的百分比,以防止超过限速,Y =0.9,V为当前的速度,aset为设置的参考减速度,值的大小应满足舒适度要求,不能过大aset = -0.5m/s2,当列车运行进入到距离阈量范围内后,按照设定的减速度进行减速即控制器初始输出为a = aset=-0.5m/s2。
4.根据权利要求1所述的一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法,其特征在于,所述步骤4对列车智能驾驶控制器进行在线学习包括: 1)设定梯度下降法的目标优化函数为f= (Ι-v)2,输入为列车当前运行信息; 2)判断列车当前所处的限速区间,即Slri^ s ^ Sk, k表示列车当前所处的限速区间,对应的限速大小为Vk ; 3)根据如下过程计算速度估计值〖和\:
Tl = T-t ;
rTP T =^^{T-t)% c rpW \7
Amin ,S2 b—sT/ Si b-Sc V= ----,Ve - ----; CC 4)列车运行距离和列车当前速度可用如下表示:
S= I vdT = Vavgt ;
V— / adT — aavgt ; 其中,Vavg为此前运行的平均速度,Bavg为此前运行的平均加速度; 5)将以上公式带入目标优化函数,并对t求导数得到目标函数的梯度为: ▽/ = 2(v — V)[(S2—b-s)^-U — ]k2 ;
_imin— / 6)基于梯度下降法,可知列车控制器输出调整为λ为步长,数值为λ=0.01,Y/为梯度值。
5.根据权利要求1所述的一种基于驾驶经验和在线学习的城市轨道交通列车智能控制方法,其特征在于,所述步骤5中根据应答器提供的位置信息调整所述控制器输出值时,经过第i个应答器时估算的减速度估算值为I」,其中V。为当前的速度,S1为第i个应答器距离停车终点的距离,将ae」作为列车从第i个应答器运行到第i+Ι个应答器之间的控制器初始输出即此时控制器初始输出为a = ae i,依次类推,直到最后停车。
【文档编号】G09B9/04GK104134378SQ201410283677
【公开日】2014年11月5日 申请日期:2014年6月23日 优先权日:2014年6月23日
【发明者】陈德旺, 阴佳腾, 冷勇林 申请人:北京交通大学