基于学习的列车自动运行控制方法与流程

文档序号:16311378发布日期:2018-12-19 05:17阅读:207来源:国知局
基于学习的列车自动运行控制方法与流程

本发明涉及列车运行控制技术领域,尤其涉及一种基于学习的列车自动运行控制方法。

背景技术

目前,在ato(automatictrainoperation,列车自动运行系统)的控制算法中将控制过程分为巡航阶段和精确停车阶段。在巡航阶段,将ebi(emergencybrakeinterventioncurve,紧急制动干预曲线)减固定值作为目标速度,采用pid(proportional、integral、derivative,比例,积分,微分)控制或最大牵引-惰行模式追踪。在精确停车阶段,从停车点开始,以常用制动率生成制动曲线,作为目标速度曲线,采用pid控制追踪。通过反复调整巡航阶段降低的固定值,得出不同的站间运行时间。

现有技术中还没有一种有效的基于学习的列车自动运行控制方法。



技术实现要素:

本发明的实施例提供了一种基于学习的列车自动运行控制方法,以克服现有技术的缺点。

为了实现上述目的,本发明采取了如下技术方案。

一种基于学习的列车自动运行控制方法,其特征在于,包括:

设定列车的初始牵引切除门限值和牵引建立门限值,基于所述初始牵引切除门限值和牵引建立门限值通过学习迭代和线性插值方法建立列车运行时间与牵引切除门限值、牵引建立门限值之间的映射矩阵;

根据列车的线路分段和分配的初始运行时间获取列车的计划运行时间,根据所述列车的计划运行时间和所述映射矩阵对列车进行运行控制;

根据所述列车的实际站间运行时间和所述计划运行时间对所述映射矩阵进行更新管理。

进一步地,所述的设定列车的初始牵引切除门限值和牵引建立门限值,基于所述初始牵引切除门限值和牵引建立门限值通过学习迭代方法建立列车运行时间与牵引切除门限值、牵引建立门限值之间的映射矩阵,包括:

步骤1:给定两组列车的初始牵引切除门限值和牵引建立门限值,其中一组初始牵引切除门限值和牵引建立门限值对应列车最短运行时间;

步骤2:列车分别按所述两组初始牵引切除门限值和牵引建立门限值运行,得到两组初始牵引切除门限值和牵引建立门限值条件下对应的列车运行时间;

步骤3:给定某一尚未记录的列车计划运行时间,当所述列车计划运行时间处于已记录列车计划运行时间之间时,通过线性插值的方法计算所述列车计划运行时间所对应的牵引切除门限值和牵引建立门限值;

当所述列车计划运行时间大于或小于所有已记录的列车计划运行时间时,采用迭代学习的方法计算所述列车计划运行时间所对应的牵引切除门限值和牵引建立门限值;

步骤4:针对所述列车计划运行时间,列车按步骤3所确定的牵引切除门限值和牵引建立门限值运行;

步骤5:列车运行至终点时,获取列车在不同线路段的实际的列车运行时间,将所述实际的列车运行时间,以及所对应的牵引切除门限值、牵引建立门限值关联存储在映射矩阵中;

步骤6:重复执行上述步骤3、步骤4和步骤5,直到所述映射矩阵中列车计划运行时间满足设定的时间分辨率时,停止执行上述步骤1-步骤6的处理流程。

进一步地,所述线性插值的计算公式如下:

其中tl,tn表示已记录的位于列车计划运行时间之前和之后最接近的列车运行时间,t为列车计划运行时间,c(t)为与所述列车计划运行时间相对应的牵引切除门限值或者牵引建立门限值,cn为已记录的位于列车计划运行时间之后最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值,cl为已记录的位于列车计划运行时间之前最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值。

进一步地,所述迭代学习的公式如下:

c1=c2+q*(ts-tm)

其中c1为该列车计划运行时间所对应的牵引切除门限值或者牵引建立门限值,c2为已记录的最大或最小列车计划运行时间所对应的牵引切除门限值或者牵引建立门限值,q为学习步长,ts为给定列车计划运行时间,tm为已记录的最大列车计划运行时间。

进一步地,所述的根据列车的线路分段和分配的初始运行时间获取列车的计划运行时间,包括:

按照线路固定限速的转折点对列车运行的线路进行分段,在每段线路的起始位置设置列车状态检查点;根据站间最短运行时间和下发的站间计划运行时间,对每段线路进行初始运行时间分配,获得该区段上的初始列车计划运行时间。

进一步地,当采用不同线路段长度与线路总长度的比值作为权重时,每段线路的初始运行时间的分配规则如下式:

其中是第j个分配区段的最短运行时间,xj是第j个区段的分配权重,t是站间计划运行时间,tmin是站间最短运行时间,是第j个区段的计划运行时间。

进一步地,所述的根据所述列车的计划运行时间和所述映射矩阵对列车进行运行控制,包括:

根据列车计划运行时间查询所述映射矩阵,获得所述列车计划运行时间对应的牵引切除门限值、牵引建立门限值;如果所述列车计划运行时间处于映射矩阵的空隙处,则通过线性插值的方法获得映射矩阵空隙处所对应的牵引切除门限值、牵引建立门限值的近似值,将所述近似值作为所述列车计划运行时间对应的牵引切除门限值、牵引建立门限值;

所述线性插值的计算公式如下:

其中tu,tv表示已记录的位于列车计划运行时间之前和之后最接近的列车运行时间,t为列车计划运行时间,d(t)为与上述列车计划运行时间相对应的牵引切除门限值或者牵引建立门限值,dv为已记录的位于列车计划运行时间之后最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值,du为已记录的位于列车计划运行时间之前最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值;

根据所获得的牵引切除门限值和牵引建立门限值控制列车运行,当列车加速运行并且牵引力达到牵引切除门限值时,列车开始惰行;当列车惰行运行并且牵引力达到牵引建立门限值时,列车重新加速,直到牵引力达到牵引切除门限值。

进一步地,所述的根据所述列车的实际站间运行时间和所述计划运行时间对所述映射矩阵进行更新管理,包括:

列车运行至每段线路起始位置时,对列车状态进行检查;

如果列车状态满足检查条件,则根据列车当前运行时间,对剩余线路段运行时间进行再分配;

如果列车状态不满足检查条件,选取使列车运行速度最快的牵引切除门限值、牵引建立门限值;

当列车未运行完成最后一段线路时,重复执行上述根据述列车的计划运行时间和映射矩阵对列车进行运行控制、对列车状态进行检查的处理过程;当列车运行完成最后一段线路时,记录列车在整个站间的列车实际运行时间,当列车计划运行时间与列车实际运行时间相差在设定时间阈值时,利用列车实际运行时间替换映射矩阵中当前牵引切除门限值、牵引建立门限值所对应的列车运行时间。

进一步地,当采用不同剩余线路段长度与剩余线路段总长度的比值作为权重时,列车当前运行时间再分配的公式如下:

其中n是分配区段的数量,j是经过的前一分配区段索引,左侧是更新后的第j+m个区段的计划运行时间,右侧是未更新的第j+m个区段的计划运行时间,yj+m是第j+m个区段上的分配权重,是第j个区段上的计划分配时间,tac是上一区段的实际运行时间。

由上述本发明的实施例提供的技术方案可以看出,本发明实施例的方法通过学习迭代建立列车运行时间与牵引切除、建立门限值之间的映射矩阵,能够根据下发的列车计划运行时间,选取合适的牵引切除、建立门限值,使列车在ato条件下达到在当前站间准时运行的目的。

本发明附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于学习的列车自动运行控制方法的处理流程图;

图2为本发明实施例提供的一种列车在线运行更新映射矩阵的处理过程示意图;

图3为本发明实施例提供的一种线路分段示意图;

图4为本发明实施例提供的一种初始运行时间分配示意图。

具体实施方式

下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解,下面将结合附图以几个具体实施例为例做进一步的解释说明,且各个实施例并不构成对本发明实施例的限定。

实施例一

本发明实施例提出了一种基于学习的列车自动运行控制方法,该方法能够构建牵引切除门限值和牵引建立门限值与列车运行时间的映射矩阵阶段,以及列车在线运行更新映射矩阵。

本发明实施例提出的一种基于学习的列车自动运行控制方法的处理流程如图1所示,该处理流程用于构建列车的列车运行时间与牵引切除门限值、牵引建立门限值之间的映射矩阵,包括如下的处理步骤:

步骤s110:给定两组列车的初始的牵引切除门限值和牵引建立门限值,其中一组牵引切除门限值和牵引建立门限值对应列车最短运行时间。

列车分别按上述两组初始的牵引切除门限值和牵引建立门限值运行,得到两个不同门限条件下对应的运行时间。

步骤s120:给定某一尚未记录的列车计划运行时间,当该列车计划运行时间处于已记录列车计划运行时间之间时,通过线性插值的方法计算该列车计划运行时间所对应的牵引切除门限值和牵引建立门限值;

上述线性插值的计算公式如下:

其中tl,tn表示已记录的位于列车计划运行时间之前和之后最接近的列车运行时间,t为列车计划运行时间,c(t)为与上述列车计划运行时间相对应的牵引切除门限值或者牵引建立门限值,cn为已记录的位于列车计划运行时间之后最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值,cl为已记录的位于列车计划运行时间之前最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值。

当该列车计划运行时间大于或小于所有已记录的列车计划运行时间时,采用迭代学习的方法计算该列车计划运行时间所对应的牵引切除门限值和牵引建立门限值。

迭代学习公式如下:

c1=c2+q*(ts-tm)

其中c1为该列车计划运行时间所对应的牵引切除门限值或者牵引建立门限值,c2为已记录的最大或最小列车计划运行时间所对应的牵引切除门限值或者牵引建立门限值,q为学习步长,ts为给定列车计划运行时间,tm为已记录的最大列车计划运行时间。

步骤s130:列车按步骤s120所确定的牵引切除门限值和牵引建立门限值运行。

列车运行至终点时,获取列车在不同线路段的实际的列车运行时间(替换上述列车计划运行时间),将所述实际的列车运行时间,以及所对应的牵引切除门限值、牵引建立门限值关联存储在映射矩阵中。

步骤s140:重复执行步骤s120、s130。直到所述映射矩阵中列车计划运行时间满足设定的时间分辨率时,可以停止上述方法的处理流程。

实施例二

图2为本发明实施例提供的一种列车在线运行更新映射矩阵的处理过程示意图,具体包括以下步骤:

步骤1:图3为本发明实施例提供的一种线路分段示意图,按照线路固定限速的转折点对线路进行分段,在每段线路的起始位置设置列车状态检查点;

步骤2:图4为本发明实施例提供的一种初始运行时间分配示意图。根据站间最短运行时间和下发的站间计划运行时间,对每段线路进行初始运行时间分配。当采用不同线路段长度与线路总长度的比值作为权重时,每段线路的初始运行时间的分配公式如下:

其中是第j个分配区段的最短运行时间,xj是第j个区段的分配权重,t是站间计划运行时间,tmin是站间最短运行时间,是第j个区段的计划运行时间。

步骤3:根据每段线路分配的初始运行时间获取列车计划运行时间。然后,根据列车计划运行时间查询所述映射矩阵,获得所述列车计划运行时间对应的牵引切除门限值、牵引建立门限值;

如果列车计划运行时间处于映射矩阵空隙处,则通过线性插值的方法获得映射矩阵空隙处所对应的牵引切除门限值、牵引建立门限值的近似值,将所述近似值作为所述列车计划运行时间对应的牵引切除门限值、牵引建立门限值。

所述线性插值的计算公式如下:

其中tu,tv表示已记录的位于列车计划运行时间之前和之后最接近的列车运行时间,t为列车计划运行时间,d(t)为与上述列车计划运行时间相对应的牵引切除门限值或者牵引建立门限值,dv为已记录的位于列车计划运行时间之后最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值,du为已记录的位于列车计划运行时间之前最接近的列车运行时间相对应的牵引切除门限值或者牵引建立门限值。

步骤4:根据所获得的牵引切除门限值和牵引建立门限值控制列车运行,当列车加速运行并且牵引力达到牵引切除门限值时,列车开始惰行;当列车惰行运行并且牵引力达到牵引建立门限值时,列车重新加速,直到牵引力达到牵引切除门限值。

步骤5:列车运行至每段线路起始位置时,对列车状态进行检查。如满足检查条件,则根据列车当前运行时间,对剩余线路段运行时间进行再分配。否则,选取使列车运行速度最快的牵引切除门限值、牵引建立门限值。当采用不同剩余线路段长度与剩余线路段总长度的比值作为权重时,列车当前运行时间再分配的公式如下:

其中n是分配区段的数量,j是经过的前一分配区段索引,左侧是更新后的第j+m个区段的计划运行时间,右侧是未更新的第j+m个区段的计划运行时间,yj+m是第j+m个区段上的分配权重,是第j个区段上的计划分配时间,tac是上一区段的实际运行时间。

步骤6:当列车未运行至最后一段线路时,重复步骤3、4、5。

当列车运行至最后一段线路时,记录列车在整个站间的实际运行时间,比较列车实际运行时间和计划运行时间,采用学习的方法更新列车运行时间与牵引切除门限值、牵引建立门限值之间的映射矩阵,即当列车计划运行时间与列车实际运行时间相差在设定时间阈值(比如10秒内)时,利用列车实际运行时间替换映射矩阵中当前牵引切除门限值、牵引建立门限值所对应的列车运行时间。

综上所述,本发明实施例的方法通过学习迭代建立列车运行时间与牵引切除、建立门限值之间的映射矩阵,通过控制牵引切除门限值和牵引建立门限值的变化来调整列车站间运行曲线,通过实际测试结合列车实际站间运行时间和列车计划运行时间,更新列车运行时间与牵引切除门限值、牵引建立门限值之间的映射矩阵。通过多次测试,本发明能够根据下发的列车计划运行时间,选取合适的牵引切除门限值和牵引建立门限值,使列车在ato条件下达到在当前站间准时运行的目的。

本发明实施例提出的基于学习的列车自动运行控制方法能够实时调整列车的站间运行时间,ats(automatictrainsupervision,自动列车监控系统)发车前向列车下发站间运行时间,发车后列车按照站间运行时间准时到站,偏差不超过±2%,并保证停车精度、舒适度(曲线上未被平衡的离心加速度、冲击率),适当地降低能耗。

本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1