一种电流预测模型的训练及其电流预测方法与相关装置与流程

文档序号:23984057发布日期:2021-02-20 11:28阅读:86来源:国知局
一种电流预测模型的训练及其电流预测方法与相关装置与流程

[0001]
本发明实施例涉及交通的技术领域,尤其涉及一种电流预测模型的训练及其电流预测方法与相关装置。


背景技术:

[0002]
目前,在地铁、brt(bus rapid transit,快速公交系统)等交通系统中,车站沿站台边缘通常布置站台门,将站台与行车区域隔离开,降低车站空调通风系统的运行能耗,同时减少了列车运行噪音和活塞风对车站的影响,防止人员跌落轨道产生意外事故,为乘客提供了舒适、安全的候车环境。
[0003]
在列车到达车站时,站台门开启,乘客可通过闸门上下车,而后站台门关闭,列车继续行驶。站台门在关闭时,锁紧开关扣紧站台门,站台门在启动时,为一电磁铁通电,电磁铁执行衔铁动作,带动锁紧开关开启,使得站台门可以滑动。
[0004]
电磁铁发生故障时,会导致站台门发生开门故障、关门故障、安全回路故障、手动开关门装置无法解锁、锁机构无法锁闭等故障,导致站台门滑动门无法开关,影响乘客正常乘降地铁列车,影响列车运行。
[0005]
为保障电磁铁正常运行,目前通常采用故障修、定期修等维修方式对电磁铁进行检修。
[0006]
故障修是电磁铁带发生故障或遭到破坏后,使其恢复到规定的技术状态所进行的事后维修活动,而定期修是发生故障之前,使电磁铁保持在规定状态所进行的定期维修活动,均是人工作业,不仅成本高,而且,故障修是发生在故障之后、定期修存在一定的周期,成功预防电磁铁发生故障的几率较小,从而导致维修的效率较低。


技术实现要素:

[0007]
本发明实施例提出了一种电流预测模型的训练及其电流预测方法与相关装置,以解决站台门中的电磁铁维修不及时,维修成本较高、效率较低的问题。
[0008]
第一方面,本发明实施例提供了一种电流预测模型的训练方法,包括:
[0009]
检测电磁铁连续多次通电解除锁定站台门时的电流值,获得样本电流曲线;
[0010]
将所述样本电流曲线输入非线性网络中提取时间维度下非线性的特征,作为样本非线性特征;
[0011]
将所述样本电流曲线输入线性网络中提取时间维度下线性的特征,作为样本线性特征;
[0012]
根据所述样本非线性特征与所述样本线性特征生成所述电磁铁下一次通电解除锁定所述站台门时的电流值,获得预测电流曲线;
[0013]
根据所述预测电流曲线将所述非线性网络与所述线性网络训练为电流预测模型。
[0014]
第二方面,本发明实施例还提供了一种电流预测方法,包括:
[0015]
检测电磁铁连续多次通电解除对站台门的锁定时的电流值,获得原始电流曲线;
[0016]
将所述原始电流曲线输入非线性网络中提取时间维度下非线性的特征,作为原始非线性特征;
[0017]
将所述原始电流曲线输入线性网络中提取时间维度下线性的特征,作为原始线性特征;
[0018]
根据所述原始非线性特征与所述原始线性特征生成所述电磁铁下一次通电解除所述站台门锁定时的电流值,获得目标电流曲线。
[0019]
第三方面,本发明实施例还提供了一种电流预测模型的训练装置,包括:
[0020]
样本电流曲线检测模块,用于检测电磁铁连续多次通电解除锁定站台门时的电流值,获得样本电流曲线;
[0021]
样本非线性特征提取模块,用于将所述样本电流曲线输入非线性网络中提取时间维度下非线性的特征,作为样本非线性特征;
[0022]
样本线性特征提取模块,用于将所述样本电流曲线输入线性网络中提取时间维度下线性的特征,作为样本线性特征;
[0023]
预测电流曲线生成模块,用于根据所述样本非线性特征与所述样本线性特征生成所述电磁铁下一次通电解除锁定所述站台门时的电流值,获得预测电流曲线;
[0024]
电流预测模型训练模块,用于根据所述预测电流曲线将所述非线性网络与所述线性网络训练为电流预测模型。
[0025]
第四方面,本发明实施例还提供了一种电流预测装置,包括:
[0026]
原始电流曲线检测模块,用于检测电磁铁连续多次通电解除对站台门的锁定时的电流值,获得原始电流曲线;
[0027]
原始非线性特征提取模块,用于将所述原始电流曲线输入非线性网络中提取时间维度下非线性的特征,作为原始非线性特征;
[0028]
原始线性特征提取模块,用于将所述原始电流曲线输入线性网络中提取时间维度下线性的特征,作为原始线性特征;
[0029]
目标电流曲线生成模块,用于根据所述原始非线性特征与所述原始线性特征生成所述电磁铁下一次通电解除所述站台门锁定时的电流值,获得目标电流曲线。
[0030]
第五方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
[0031]
一个或多个处理器;
[0032]
存储器,用于存储一个或多个程序,
[0033]
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的电流预测模型的训练方法,或者,如第二方面所述的电流预测方法。
[0034]
第六方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的电流预测模型的训练方法,或者,如第二方面所述的电流预测方法。
[0035]
在本实施例中,检测电磁铁连续多次通电解除锁定站台门时的电流值,获得样本电流曲线,将样本电流曲线输入非线性网络中提取时间维度下非线性的特征,作为样本非线性特征,将样本电流曲线输入线性网络中提取时间维度下线性的特征,作为样本线性特征,根据样本非线性特征与样本线性特征生成电磁铁下一次通电解除锁定站台门时的电流
值,获得预测电流曲线,根据预测电流曲线将非线性网络与线性网络训练为电流预测模型,电磁铁在一定的时间范围内,状态是较为稳定的,即其通电时的电流值在一定的时间范围内存在相关性,样本电流曲线属于在时间维度相关的、长序列的数据,通过非线性网络提取时间维度下非线性的样本非线性特征,保证特征的丰富度,通过线性网络提取时间维度下线性的样本线性特征,关注局部缩放的问题,样本非线性特征、样本线性特征互补,以此训练电流预测模型,可以保证电流预测模型的性能,即保证所预测的电流值的准确性,从而实现实时监测电磁铁在站台门开启时的状态,有助于提升开启站台门的控制效果,并提供电磁铁在站台门启动时状态的异常预警,减小站台门在启动时电磁铁发生故障的几率,从而提升检修电磁铁的效率。
附图说明
[0036]
图1为本发明实施例一提供的一种电流预测模型的训练方法的流程图;
[0037]
图2为本发明实施例一提供的一种电磁铁的电流示例图;
[0038]
图3为本发明实施例一提供的一种电流预测模型的结构示意图;
[0039]
图4为本发明实施例一提供的一种卷积神经网络的结构示意图;
[0040]
图5为本发明实施例一提供的一种递归跳跃组件的处理示例图;
[0041]
图6为本发明实施例一提供的一种损失值的计算示例图;
[0042]
图7是本发明实施例二提供的一种电流预测方法的流程图;
[0043]
图8为本发明实施例三提供的一种电流预测模型的训练装置的结构示意图;
[0044]
图9为本发明实施例四提供的一种电流预测装置的结构示意图;
[0045]
图10为本发明实施例五提供的一种计算机设备的结构示意图。
具体实施方式
[0046]
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0047]
实施例一
[0048]
图1为本发明实施例一提供的一种电流预测模型的训练方法的流程图,本实施例可适用于按照时间顺序切分电磁铁的电流作为样本标签(tag)训练电流预测模型的情况,该方法可以由电流预测模型的训练装置来执行,该电流预测模型的训练装置可以由软件和/或硬件实现,可配置在计算机设备中,例如,服务器、工作站、个人电脑,等等,具体包括如下步骤:
[0049]
步骤101、检测电磁铁连续多次通电解除锁定站台门时的电流值,获得样本电流曲线。
[0050]
在地铁、brt等交通系统的站台门设置有电磁铁、电机、皮带等部件。
[0051]
其中,电磁铁是一种通电产生电磁的装置,在电磁铁中,在铁芯的外部缠绕与其功率相匹配的导电绕组,导电绕组通电后磁化铁芯,使得铁芯具有磁性。
[0052]
导电绕组通常制成条形或蹄形状,以使铁芯更加容易磁化。另外,导电绕组往往采用消磁较快的软铁或硅钢材料制作,以使断电后快速消磁。
[0053]
在具体实现中,交通系统的门控器dcu在接到开门命令后,给电磁铁通电,电磁铁执行衔铁动作,带动锁紧开关动作,解除站台门的锁定。
[0054]
皮带的一端套接在电机上,皮带的另一端套接在站台门上,门控器dcu控制电机转动,带动皮带转动,皮带带动站台门往两侧移动,从而驱动站台门开启。
[0055]
在本实施例中,将电磁铁串联电流计,该电流计以预设的频率(如5ms采集一次)实时检测电磁铁在通电解除锁定站台门时的电流值,每次采集指定数量(如300个)的电流值。
[0056]
每次检测形成一个数据结构,存储在数据库中,其中,数据结构包括采集的时间(time)、数值(value)等参数。
[0057]
如图2所示,以时间(time)为横轴,数值(value)为纵轴,建立坐标轴,将各个电磁铁在通电解除锁定站台门时的电流值以点的形式标记在该坐标轴上,从而生成样本电流曲线。
[0058]
如图2所示,从设备运行机理上看,站台门开启时,为了快速解除站台门的锁定,通常把电磁铁的电流快速提升到额定的数值,并持续一小段时间,当电磁铁衔铁锁紧开关结束,则停止为电磁铁通电,电流值迅速下降至0。
[0059]
在训练电流预测模型时,可从数据库提取历史一段时间内电磁铁连续多次通电解除锁定站台门时的电流值,作为样本电流曲线。
[0060]
所谓连续,可以通过电磁铁通电解除锁定站台门这个操作,一个接着一个,假设样本电流曲线的数量为n,则可提取当前时间之前,第1次电磁铁通电解除锁定站台门的样本电流曲线,第2次电磁铁通电解除锁定站台门的样本电流曲线,第3次电磁铁通电解除锁定站台门的样本电流曲线
……
第n次电磁铁通电解除锁定站台门的样本电流曲线。
[0061]
步骤102、将样本电流曲线输入非线性网络中提取时间维度下非线性的特征,作为样本非线性特征。
[0062]
在具体实现中,电流预测模型中包括非线性网络,其中,非线性网络具有提取时间维度下非线性的特征的功能,所谓非线性,可以指输出和输入既不是正比例也不是反比例的情形。
[0063]
在本发明的一个实施例中,非线性网络包括:
[0064]
1、卷积神经网络(convolutional neural network,cnn)
[0065]
其中,卷积神经网络是一种带有卷积结构的神经网络,即卷积神经网络包含了一个由卷积层和子采样层(池化层)构成的特征抽取器。在卷积神经网络的卷积层中,一个神经元只与部分邻层神经元连接。在cnn的一个卷积层中,通常包含若干个特征图(featuremap),每个特征图由一些矩形排列的神经元组成,同一特征图的神经元共享权值,这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中卷积核将学习得到合理的权值。共享权值(卷积核)带来的直接好处是减少网络各层之间的连接,同时又降低了过拟合的风险。子采样也叫做池化(pooling),通常有均值子采样(mean pooling)、最大值子采样(max pooling)、最小值子采样(min pooling)等形式。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了模型复杂度,减少了模型的参数。
[0066]
2、循环神经网络(recurrent neural network,rnn)
[0067]
循环神经网络是一种以序列数据为输入来进行建模的深度学习模型,由于循环神
经网络将状态在自身网络中循环传递,因此可以接受更广泛的时间序列结构输入,用于描述动态时间行为。
[0068]
在本实施例中,步骤102包括如下步骤:
[0069]
步骤1021、将样本电流曲线输入卷积神经网络中提取时间维度下非线性的特征,作为样本短期时间特征。
[0070]
在本实施例中,如图3所示,以样本电流曲线301构成时间序列数据,输入至卷积神经网络311中进行处理,通过变量之间的局部依赖关系来提取时间维度下的短期特征,作为样本短期时间特征。
[0071]
假设以100条样本电流曲线作为输入,批大小为200,每条样本电流曲线包括300个点,则数据的维度为[200,100,300]。
[0072]
在一个示例中,如图4所示,卷积神经网络包括多个卷积层(conv)401、多个激活层402,卷积层401、激活层402的数量可以由本领域技术人员根据实际情况进行设置,例如,卷积层401的数量为100、激活层402的数量为100,等等。
[0073]
卷积层401与激活层402交错连接,一般情况下,卷积神经网络的首层为卷积层401、尾层为激活层402,则卷积神经网络的结构为卷积层401、激活层402、卷积层401、激活层402、
……
、卷积层401、激活层402。
[0074]
其中,卷积层401的参数保持一致,例如,卷积核kernel的大小为5*5,步长是1,输出维度为100。
[0075]
激活层402应用的激活函数保持一致,可应用relu(rectified linear unit,线性整流函数)函数、tanh函数等作为激活函数(activation function),通过添加非线性因素,提高卷积神经网络的表达能力。
[0076]
在本示例中,可将样本电流曲线依次输入卷积层401执行卷积处理、输入激活层402执行激活处理,当所有卷积处理与所有激活处理执行完成时,输出时间维度下非线性的特征,作为样本短期时间特征。
[0077]
在本示例中,卷积神经网络包括多个卷积层、多个激活层,经过卷积层的卷积处理、激活层的激活处理,可以保留样本电流曲线中丰富的信息,避免使用池化层等对样本电流曲线中的信息造成破坏,提高了样本短期时间特征的准确性,从而提高了电流预测模型的性能。
[0078]
当然,上述卷积神经网络的结构只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他卷积神经网络的结构,例如,在激活层之后设置全连接层,等等,本发明实施例对此不加以限制。另外,除了上述卷积神经网络的结构外,本领域技术人员还可以根据实际需要采用其它卷积神经网络的结构,本发明实施例对此也不加以限制。
[0079]
步骤1022、将样本短期时间特征输入循环神经网络中提取时间维度下非线性的特征,作为样本非线性特征。
[0080]
在本实施例中,将样本短期时间特征构成时间序列数据,输入至循环神经网络中进行处理,通过周期性来提取时间维度下的长期特征,作为样本非线性特征。
[0081]
在一个示例中,如图3所示,循环神经网络包括递归组件312、第一递归跳跃组件313、第二递归跳跃组件314。
[0082]
其中,递归组件312是带有门控递归单元(gated recurrent unit,gru)的递归层,
使用relu等函数作为隐藏层更新激活函数。
[0083]
gru用门控机制控制输入、记忆等信息而在当前时间步做出预测,gru有两个门,一个重置门(reset gate),另一个更新门(update gate),重置门决定了如何将新的输入信息与前面的记忆相结合,更新门定义了前面记忆保存到当前时间步的量。
[0084]
带有gru的递归层可以记住历史信息,从而了解相对长期的依赖关系,然而,由于梯度消失问题,gru通常不能捕捉到非常长期的相关性。
[0085]
而第一递归跳跃组件313、第二递归跳跃组件314均是递归跳跃组件(rnn-skip),即具有时间跳跃连接的递归结构,即在当前的隐藏单元和相邻周期的同一相位的隐藏单元之间添加跳转链接(skip),以扩展信息流的时间跨度,捕捉到非常长期的相关性。
[0086]
具体而言,均是在循环神经网络的神经元中增加了skip(跳字)门,skip门的输出将决定循环神经网络的神经元在该时刻是否执行状态更新。当skip门的输出为0时,在该时刻神经元不进行状态更新,保留上一时刻的状态。当skip门的输出为1时,在该时刻神经元的状态进行更新,生成新的神经元状态。因此,增加skip门之后,神经元将跳过某些时刻的状态更新,减少神经元更新的次数,获得更高的预测准确率。
[0087]
在本示例中,第一递归跳跃组件313、第二递归跳跃组件314的模型参数不同,例如,在第一递归跳跃组件中,参数周期长度skip=25,周期数量pt=3,在第二递归跳跃组件中,参数周期长度skip=10,周期数量pt=9。
[0088]
其中,周期数量pt用于表示在时间窗口window下会存在多少个以skip为周期的数据点。
[0089]
如图5所示,以pt=2,skip=7为例,针对长度为2
×
7=14的序列向量501,其中,7是周期,2是周期数据,即序列向量每间隔7个点代表同一时刻状态,经过reshape(对数组的结构进行改变的函数)502和permute(按指定的向量来重新排列一个数组的函数)503,转化为维度(7,2)的矩阵504,代表同一时刻状态的数据位于同一行,每一行代表一条长周期样本,输入到循环神经网络的时间步长为2,即以同周期数据作为输入,周期数目作为时间步长。
[0090]
第一递归跳跃组件313、第二递归跳跃组件314的输入均可以为卷积神经网络311输出的100维度数据,输出为10维度。
[0091]
在本示例中,将样本短期时间特征输入递归组件312中提取时间维度下非线性的特征,作为第一样本长期时间特征。
[0092]
将样本短期时间特征输入第一递归跳跃组件313中提取时间维度下非线性的特征,作为第二样本长期时间特征。
[0093]
将样本短期时间特征输入第二递归跳跃组件314中提取时间维度下非线性的特征,作为第三样本长期时间特征。
[0094]
以全连接层等网络组合递归组件、第一递归跳跃组件、第二递归跳跃组件的输出,即将第一样本长期时间特征、第二样本长期时间特征与第三样本长期时间特征输入至全连接层等网络,从而融合为样本非线性特征315。
[0095]
全连接层的输入包括在时间戳t时刻递归组件的隐藏状态从时间戳t-p+1到t时刻递归跳跃组件的p个隐藏状态标记为
则全连接层的输出可以表示为:
[0096][0097]
其中,w
r
为对隐藏状态设置的权重,w
s
为对隐藏状态设置的权重,b为常量。
[0098]
需要说明的是,如果非线性网络输出(即样本非线性特征)的维度与线性网络输出(即样本线性特征)的维度不一致,则可以通过线性的神经元对非线性网络输出(即样本非线性特征)进行映射,使得非线性网络输出(即样本非线性特征)的维度与线性网络输出(即样本线性特征)的维度一致,便于两者融合。
[0099]
例如,非线性网络输出(即样本非线性特征)的维度为[350,1000],线性网络输出(即样本线性特征)的维度为[200,1000],则可以使用线性的神经元对非线性网络输出(即样本非线性特征)进行映射,使其维度为[200,1000]。
[0100]
在本实施例中,使用递归组件从样本短期时间特征中提取相对长期的依赖关系,分别使用第一递归跳跃组件、第二递归跳跃组件从样本短期时间特征中提取非常长期的相关性,可以以互补的形式丰富时间维度下长期特征的多样性,从而提高了样本非线性特征的准确性,从而提高了电流预测模型的性能。
[0101]
当然,上述循环神经网络的结构只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他循环神经网络的结构,例如,使用lstm(long short term memory,长短期记忆网络)替代gru,等等,本发明实施例对此不加以限制。另外,除了上述循环神经网络的结构外,本领域技术人员还可以根据实际需要采用其它循环神经网络的结构,本发明实施例对此也不加以限制。
[0102]
在本发明的一个实施例中,在循环神经网络中增加dropout机制,防止过拟合。
[0103]
对于dropout机制,针对循环神经网络中除最后一层之外的其它层,如上述第一递归跳跃组件、第二递归跳跃组件中除最后一层之外的其它层,可在本次训练(前向传播)中,以指定的概率(如dropout=0.5时,概率为50%),通过掩膜等方式忽略当前循环神经网络中的部分神经网络单元。
[0104]
将样本短期时间特征输入循环神经网络中、以未忽略的神经网络单元提取时间维度下非线性的特征,作为样本非线性特征。
[0105]
步骤103、将样本电流曲线输入线性网络中提取时间维度下线性的特征,作为样本线性特征。
[0106]
由于卷积神经网络、循环神经网络(如递归组件、第一递归跳跃组件、第二递归跳跃组件)等非线性网络的非线性特性,导致预测时对输入的规模不敏感,即不能识别小范围波动,因此,可在电流预测模型中设置线性网络,关注局部缩放的问题,提高电流预测模型的预测精度,其中,线性网络具有提取线性的特征的功能,所谓线性,可以指输出和输入是正比例或反比例的情形。
[0107]
将样本电流曲线输入线性网络中进行处理,可提取时间维度下线性的特征,作为样本线性特征。
[0108]
在本发明的一个实施例中,如图3所示,线性网络包括自回归模型
(autoregressive model,ar)316,自回归模型316是用自身做回归变量的过程,即利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型,可用于处理时间序列。
[0109]
在本实施例中,可将样本电流曲线301输入自回归模型316中线性预测电磁铁下一次通电解除站台门锁定时的电流值,作为样本线性特征,表达如下:
[0110][0111]
其中,x
t
为电磁铁第t次通电解除站台门锁定时的电流值,x
t-t
为电磁铁第t-1次通电解除站台门锁定时的电流值,c为常数项,为自然相关数,ε
t
为假设平均数等于0,标准差等于σ的随机误差值,σ对于任何的t不变。
[0112]
此时,电磁铁下一次通电解除站台门锁定时的电流值(即期望值)等于在先电磁铁连续多次通电解除锁定站台门时的电流值的线性组合加上常数项、随机误差,由于自回归所需的资料较少,可以使用自身的样本电流曲线进行预测,计算量低,操作简便。
[0113]
在本实施例中,ar通道的输出节点数目为25。
[0114]
当然,上述线性网络只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他线性网络,例如,移动平均模型(ma)、自回归移动平均模型(arma)、差分自回归移动平均模型(arima),等等,本发明实施例对此不加以限制。另外,除了上述线性网络外,本领域技术人员还可以根据实际需要采用其它线性网络,本发明实施例对此也不加以限制。
[0115]
步骤104、根据样本非线性特征与样本线性特征生成电磁铁下一次通电解除锁定站台门时的电流值,获得预测电流曲线。
[0116]
在本实施例中,如图3所示,可以对样本非线性特征与样本线性特征执行融合操作317,从而生成电磁铁下一次通电解除锁定站台门时的电流值,作为预测电流曲线。
[0117]
在具体实现中,样本非线性特征的维度与样本线性特征的维度一般相同,可以将样本非线性特征与样本线性特征按照维度进行拼接,作为样本综合特征,将样本综合特征输入预设的映射网络(如一个全连接层)中,从而将样本综合特征映射为电磁铁下一次通电解除锁定站台门时的电流值,获得预测电流曲线。
[0118]
步骤105、根据预测电流曲线将非线性网络与线性网络训练为电流预测模型。
[0119]
在具体实现中,预测电流曲线为预估的结果,可以用于评估电流预测模型(即非线性网络与线性网络)的质量,以此指导电流预测模型(即非线性网络与线性网络)的训练。
[0120]
在本发明的一个实施例中,步骤105包括如下步骤:
[0121]
步骤1051、检测电磁铁下一次通电解除锁定站台门时的电流值,获得参考电流曲线。
[0122]
在本实施例中,可检测电磁铁在下一次(即第n+1次)通电解除锁定站台门时的电流值,作为参考电流曲线,对于电流预测模型,该参考电流曲线可视为样本(即样本电流曲线)的标签(tag)。
[0123]
步骤1052、计算预测电流曲线与参考电流曲线之间的差异,作为损失值。
[0124]
参考电流曲线为实际的结果,预测电流曲线为预估的结果,将预测电流曲线与参
考电流曲线进行比较,可以得到预测电流曲线与参考电流曲线之间的差异,作为预测电磁铁在下一次通电解除锁定站台门时电流值的损失值loss。
[0125]
在一个示例中,如图6所示,可针对每个相同的时间(即采集电流的时间),分别计算预测电流曲线中的电流值601(颜色较深的部分)与参考电流曲线中的电流值602(颜色较浅的部分)之间的差值,作为点偏差值,计算所有点偏差值的平均值,作为损失值。
[0126]
当然,除了点偏差值的平均值之外,还可以采用其他方式计算损失值loss,例如,计算点偏差值的和值,等等,本实施例对此不加以限制。
[0127]
步骤1053、判断是否满足停止条件;若是,则执行步骤1054,若否,则执行步骤1055。
[0128]
步骤1054、输出非线性网络与线性网络为电流预测模型。
[0129]
步骤1055、更新非线性网络与线性网络,返回执行步骤102、步骤103、步骤104,进入下一次迭代训练。
[0130]
在本实施例中,可以预先设置停止条件,如损失值loss小于预设的阈值、到达训练迭代次数,等等。
[0131]
在满足该停止条件时,确定完成训练电流预测模型,存储非线性网络与线性网络的结构、参数(包括神经网络单元中的权重),非线性网络与线性网络在加载该参数(包括神经网络单元中的权重)时,可用于根据电磁铁连续多次通电解除对站台门的锁定时的电流值,预测电磁铁下一次通电解除站台门锁定时的电流值。
[0132]
在未满足该停止条件时,继续训练电流预测模型,在本实施例中,可以基于损失值loss进行反向传播,以随机梯度下降(stochastic gradient descent,sgd)等方式更新非线性网络与线性网络的参数(包括神经网络单元中的权重)。
[0133]
在本发明的一个实施例中,非线性网络包括卷积神经网络、循环神经网络,可在循环神经网络(如第一递归跳跃组件、第二递归跳跃组件)中增加dropout机制,防止过拟合。
[0134]
对于dropout机制,可在本次训练(反向传播)中,针对循环神经网络(如第一递归跳跃组件、第二递归跳跃组件)中除最后一层的其他层,确定循环神经网络中未忽略的神经网络单元,通过掩膜等方式更新未忽略的神经网络单元中的权重。
[0135]
在本实施例中,若电流预测模型(非线性网络与线性网络)训练完成,则可以对电流预测模型(非线性网络与线性网络)进行测试,测试的指标为可决系数r。
[0136]
可决系数,亦称测定系数、决定系数、可决指数,表示一个随机变量与多个随机变量关系的数字特征,用来反映回归模式说明因变量变化可靠程度的一个统计指标,可定义为自变量的变差对自变量总变差的比值。
[0137]
测试的可决系数r分别如下:
[0138]
96.02%、95.66%、96.75%、95.37%、96.60%、91.74%、96.98%、95.61%、96.78%、91.76%、96.53%、89.86%、97.40%、93.02%、97.37%、97.04%、95.90%、96.01%、96.53%、96.88%、95.84%、95.61%、97.51%。
[0139]
在本实施例中,检测电磁铁连续多次通电解除锁定站台门时的电流值,获得样本电流曲线,将样本电流曲线输入非线性网络中提取时间维度下非线性的特征,作为样本非线性特征,将样本电流曲线输入线性网络中提取时间维度下线性的特征,作为样本线性特征,根据样本非线性特征与样本线性特征生成电磁铁下一次通电解除锁定站台门时的电流
值,获得预测电流曲线,根据预测电流曲线将非线性网络与线性网络训练为电流预测模型,电磁铁在一定的时间范围内,状态是较为稳定的,即其通电时的电流值在一定的时间范围内存在相关性,样本电流曲线属于在时间维度相关的、长序列的数据,通过非线性网络提取时间维度下非线性的样本非线性特征,保证特征的丰富度,通过线性网络提取时间维度下线性的样本线性特征,关注局部缩放的问题,样本非线性特征、样本线性特征互补,以此训练电流预测模型,可以保证电流预测模型的性能,即保证所预测的电流值的准确性,从而实现实时监测电磁铁在站台门开启时的状态,有助于提升开启站台门的控制效果,并提供电磁铁在站台门启动时状态的异常预警,减小站台门在启动时电磁铁发生故障的几率,从而提升检修电磁铁的效率。
[0140]
实施例二
[0141]
图7为本发明实施例二提供的一种电流预测方法的流程图,本实施例可适用于针对站台门开启,基于电磁铁在先的电流预测未来电流的情况,该方法可以由电流预测装置来执行,该电流预测装置可以由软件和/或硬件实现,可配置在计算机设备中,例如,服务器、工作站、个人电脑,等等,具体包括如下步骤:
[0142]
步骤701、检测电磁铁连续多次通电解除对站台门的锁定时的电流值,获得原始电流曲线。
[0143]
在实际应用中,若实时预测电磁铁下一次通电解除对站台门的锁定时的电流值,则可以从数据库提取当前时间之前一段时间内的电磁铁连续多次通电解除对站台门的锁定时的电流值,作为原始电流曲线。
[0144]
步骤702、将原始电流曲线输入非线性网络中提取时间维度下非线性的特征,作为原始非线性特征。
[0145]
在具体实现中,已预先训练电流预测模型,该电流预测模型包括非线性网络和线性网络。
[0146]
将原始电流曲线输入非线性网络中进行处理,可以提取时间维度下非线性的特征,作为原始非线性特征。
[0147]
在本发明的一个实施例中,非线性网络包括卷积神经网络、循环神经网络,则在本实施例中,步骤702包括如下步骤:
[0148]
步骤7021、将原始电流曲线输入卷积神经网络中提取时间维度下非线性的特征,作为原始短期时间特征。
[0149]
在本实施例中,以原始电流曲线构成时间序列数据,输入至卷积神经网络中进行处理,通过变量之间的局部依赖关系来提取时间维度下的短期特征,作为原始短期时间特征。
[0150]
在一个示例中,卷积神经网络包括多个卷积层、多个激活层,卷积层与激活层交错连接,则在本示例中,可将原始电流曲线依次输入卷积层执行卷积处理、输入激活层执行激活处理;当所有卷积处理与所有激活处理执行完成时,输出时间维度下非线性的特征,作为原始短期时间特征。
[0151]
在本示例中,卷积神经网络包括多个卷积层、多个激活层,经过卷积层的卷积处理、激活层的激活处理,可以保留原始电流曲线中丰富的信息,避免使用池化层等对原始电流曲线中的信息造成破坏,提高了原始短期时间特征的准确性,从而提高了电流预测的精
确度。
[0152]
步骤7022、将原始短期时间特征输入循环神经网络中提取时间维度下非线性的特征,作为原始非线性特征。
[0153]
在本实施例中,将原始短期时间特征构成时间序列数据,输入至循环神经网络中进行处理,通过周期性来提取时间维度下的长期特征,作为原始非线性特征。
[0154]
在本发明的一个实施例中,循环神经网络包括递归组件、第一递归跳跃组件、第二递归跳跃组件;则在本实施例中,将原始短期时间特征输入递归组件中提取时间维度下非线性的特征,作为第一原始长期时间特征;将原始短期时间特征输入第一递归跳跃组件中提取时间维度下非线性的特征,作为第二原始长期时间特征;将原始短期时间特征输入第二递归跳跃组件中提取时间维度下非线性的特征,作为第三原始长期时间特征;将第一原始长期时间特征、第二原始长期时间特征与第三原始长期时间特征融合为原始非线性特征。
[0155]
在本实施例中,使用递归组件从原始短期时间特征中提取相对长期的依赖关系,分别使用第一递归跳跃组件、第二递归跳跃组件从原始短期时间特征中提取非常长期的相关性,可以以互补的形式丰富时间维度下长期特征的多样性,从而提高了原始非线性特征的准确性,从而提高电流预测的精确度。
[0156]
步骤703、将原始电流曲线输入线性网络中提取时间维度下线性的特征,作为原始线性特征。
[0157]
在本实施例中,将原始电流曲线输入线性网络中进行处理,可提取时间维度下线性的特征,作为原始线性特征。
[0158]
在一个示例中,线性网络包括自回归模型,则将原始电流曲线输入自回归模型中线性预测电磁铁下一次通电解除站台门锁定时的电流值,作为原始线性特征,由于自回归所需的资料较少,可以使用自身的原始电流曲线进行预测,计算量低,操作简便。
[0159]
步骤704、根据原始非线性特征与原始线性特征生成电磁铁下一次通电解除站台门锁定时的电流值,获得目标电流曲线。
[0160]
在本实施例中,可以对原始非线性特征与原始线性特征执行融合操作,从而生成电磁铁下一次通电解除锁定站台门时的电流值,作为目标电流曲线。
[0161]
在具体实现中,原始非线性特征的维度与原始线性特征的维度一般相同,可以将原始非线性特征与原始线性特征按照维度进行拼接,作为原始综合特征;将原始综合特征映射为电磁铁下一次通电解除锁定站台门时的电流值,获得目标电流曲线。
[0162]
在本发明实施例中,由于检测原始电流曲线(步骤701)、提取原始非线性特征(步骤702)、提取原始线性特征(步骤703)、计算目标电流曲线(步骤704)与实施例一的应用基本相似,所以描述的比较简单,相关之处参见实施例一的部分说明即可,本发明实施例在此不加以详述。
[0163]
在本实施例中,检测电磁铁连续多次通电解除对站台门的锁定时的电流值,获得原始电流曲线,将原始电流曲线输入非线性网络中提取时间维度下非线性的特征,作为原始非线性特征,将原始电流曲线输入线性网络中提取时间维度下线性的特征,作为原始线性特征,根据原始非线性特征与原始线性特征生成电磁铁下一次通电解除站台门锁定时的电流值,获得目标电流曲线,电磁铁在一定的时间范围内,状态是较为稳定的,即其通电时
的电流值在一定的时间范围内存在相关性,原始电流曲线属于在时间维度相关的、长序列的数据,通过非线性网络提取时间维度下非线性的原始非线性特征,保证特征的丰富度,通过线性网络提取时间维度下线性的原始线性特征,关注局部缩放的问题,原始非线性特征、原始线性特征互补,以此生成目标电流曲线,可保证所预测的电流值的准确性,从而实现实时监测电磁铁在站台门开启时的状态,有助于提升开启站台门的控制效果,并提供电磁铁在站台门启动时状态的异常预警,减小站台门在启动时电磁铁发生故障的几率,从而提升检修电磁铁的效率。
[0164]
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0165]
实施例三
[0166]
图8为本发明实施例三提供的一种电流预测模型的训练装置的结构框图,具体可以包括如下模块:
[0167]
样本电流曲线检测模块801,用于检测电磁铁连续多次通电解除锁定站台门时的电流值,获得样本电流曲线;
[0168]
样本非线性特征提取模块802,用于将所述样本电流曲线输入非线性网络中提取时间维度下非线性的特征,作为样本非线性特征;
[0169]
样本线性特征提取模块803,用于将所述样本电流曲线输入线性网络中提取时间维度下线性的特征,作为样本线性特征;
[0170]
预测电流曲线生成模块804,用于根据所述样本非线性特征与所述样本线性特征生成所述电磁铁下一次通电解除锁定所述站台门时的电流值,获得预测电流曲线;
[0171]
电流预测模型训练模块805,用于根据所述预测电流曲线将所述非线性网络与所述线性网络训练为电流预测模型。
[0172]
在本发明的一个实施例中,所述非线性网络包括卷积神经网络、循环神经网络;
[0173]
所述样本非线性特征提取模块802包括:
[0174]
样本短期时间特征生成子模块,用于将所述样本电流曲线输入卷积神经网络中提取时间维度下非线性的特征,作为样本短期时间特征;
[0175]
样本非线性特征生成子模块,用于将所述样本短期时间特征输入循环神经网络中提取时间维度下非线性的特征,作为样本非线性特征。
[0176]
在本发明的一个实施例中,所述卷积神经网络包括多个卷积层、多个激活层,所述卷积层与所述激活层交错连接;
[0177]
所述样本短期时间特征生成子模块包括:
[0178]
卷积激活处理单元,用于将所述样本电流曲线依次输入卷积层执行卷积处理、输入激活层执行激活处理;
[0179]
样本短期时间特征输出单元,用于当所有所述卷积处理与所有所述激活处理执行完成时,输出时间维度下非线性的特征,作为样本短期时间特征。
[0180]
在本发明的一个实施例中,所述循环神经网络包括递归组件、第一递归跳跃组件、
第二递归跳跃组件;
[0181]
所述样本非线性特征生成子模块包括:
[0182]
第一样本长期时间特征提取单元,用于将所述样本短期时间特征输入递归组件中提取时间维度下非线性的特征,作为第一样本长期时间特征;
[0183]
第二样本长期时间特征提取单元,用于将所述样本短期时间特征输入第一递归跳跃组件中提取时间维度下非线性的特征,作为第二样本长期时间特征;
[0184]
第三样本长期时间特征提取单元,用于将所述样本短期时间特征输入第二递归跳跃组件中提取时间维度下非线性的特征,作为第三样本长期时间特征;
[0185]
样本长期时间特征融合单元,用于将所述第一样本长期时间特征、所述第二样本长期时间特征与所述第三样本长期时间特征融合为样本非线性特征。
[0186]
在本发明的一个实施例中,所述样本非线性特征生成子模块包括:
[0187]
神经网络单元忽略单元,用于针对循环神经网络中除最后一层之外的其它层,以指定的概率忽略部分神经网络单元;
[0188]
神经网络单元提取单元,用于将所述样本短期时间特征输入所述循环神经网络中、以未忽略的神经网络单元提取时间维度下非线性的特征,作为样本非线性特征。
[0189]
在本发明的一个实施例中,所述线性网络包括自回归模型;
[0190]
所述样本线性特征提取模块803包括:
[0191]
样本自回归子模块,用于将所述样本电流曲线输入自回归模型中线性预测所述电磁铁下一次通电解除所述站台门锁定时的电流值,作为样本线性特征。
[0192]
在本发明的一个实施例中,所述预测电流曲线生成模块804包括:
[0193]
样本综合特征生成子模块,用于将所述样本非线性特征与所述样本线性特征进行拼接,作为样本综合特征;
[0194]
样本综合特征映射子模块,用于将所述样本综合特征映射为所述电磁铁下一次通电解除锁定所述站台门时的电流值,获得预测电流曲线。
[0195]
在本发明的一个实施例中,所述电流预测模型训练模块805包括:
[0196]
参考电流曲线检测子模块,用于检测所述电磁铁下一次通电解除锁定所述站台门时的电流值,获得参考电流曲线;
[0197]
损失值计算子模块,用于计算所述预测电流曲线与所述参考电流曲线之间的差异,作为损失值;
[0198]
停止条件判断子模块,用于判断是否满足停止条件;若是,则调用电流预测模型输出子模块,若否,则调用电流预测模型更新子模块;
[0199]
电流预测模型输出子模块,用于输出所述非线性网络与所述线性网络为电流预测模型;
[0200]
电流预测模型更新子模块,用于更新所述非线性网络与所述线性网络,返回调用所述样本非线性特征提取模块802。
[0201]
在本发明的一个实施例中,所述损失值计算子模块包括:
[0202]
点偏差值计算单元,用于针对每个相同的时间,分别计算所述预测电流曲线中的电流值与所述参考电流曲线中的电流值之间的差值,作为点偏差值;
[0203]
平均值计算单元,用于计算所有所述点偏差值的平均值,作为损失值。
[0204]
在本发明的一个实施例中,所述非线性网络包括卷积神经网络、循环神经网络;所述电流预测模型更新子模块包括:
[0205]
神经网络单元确定单元,用于确定循环神经网络中未忽略的神经网络单元;
[0206]
神经网络单元更新单元,用于更新未忽略的所述神经网络单元中的权重。
[0207]
本发明实施例所提供的电流预测模型的训练装置可执行本发明任意实施例所提供的电流预测模型的训练方法,具备执行方法相应的功能模块和有益效果。
[0208]
实施例四
[0209]
图9为本发明实施例四提供的一种电流预测装置的结构框图,具体可以包括如下模块:
[0210]
原始电流曲线检测模块901,用于检测电磁铁连续多次通电解除对站台门的锁定时的电流值,获得原始电流曲线;
[0211]
原始非线性特征提取模块902,用于将所述原始电流曲线输入非线性网络中提取时间维度下非线性的特征,作为原始非线性特征;
[0212]
原始线性特征提取模块903,用于将所述原始电流曲线输入线性网络中提取时间维度下线性的特征,作为原始线性特征;
[0213]
目标电流曲线生成模块904,用于根据所述原始非线性特征与所述原始线性特征生成所述电磁铁下一次通电解除所述站台门锁定时的电流值,获得目标电流曲线。
[0214]
在本发明的一个实施例中,所述非线性网络包括卷积神经网络、循环神经网络;
[0215]
所述原始非线性特征提取模块902包括:
[0216]
原始短期时间特征生成子模块,用于将所述原始电流曲线输入卷积神经网络中提取时间维度下非线性的特征,作为原始短期时间特征;
[0217]
原始非线性特征生成子模块,用于将所述原始短期时间特征输入循环神经网络中提取时间维度下非线性的特征,作为原始非线性特征。
[0218]
在本发明的一个实施例中,所述卷积神经网络包括多个卷积层、多个激活层,所述卷积层与所述激活层交错连接;
[0219]
所述原始短期时间特征生成子模块包括:
[0220]
卷积激活处理单元,用于将所述原始电流曲线依次输入卷积层执行卷积处理、输入激活层执行激活处理;
[0221]
原始短期时间特征输出单元,用于当所有所述卷积处理与所有所述激活处理执行完成时,输出时间维度下非线性的特征,作为原始短期时间特征。
[0222]
在本发明的一个实施例中,所述循环神经网络包括递归组件、第一递归跳跃组件、第二递归跳跃组件;
[0223]
所述原始非线性特征生成子模块包括:
[0224]
第一原始长期时间特征提取单元,用于将所述原始短期时间特征输入递归组件中提取时间维度下非线性的特征,作为第一原始长期时间特征;
[0225]
第二原始长期时间特征提取单元,用于将所述原始短期时间特征输入第一递归跳跃组件中提取时间维度下非线性的特征,作为第二原始长期时间特征;
[0226]
第三原始长期时间特征提取单元,用于将所述原始短期时间特征输入第二递归跳跃组件中提取时间维度下非线性的特征,作为第三原始长期时间特征;
[0227]
原始长期时间特征融合单元,用于将所述第一原始长期时间特征、所述第二原始长期时间特征与所述第三原始长期时间特征融合为原始非线性特征。
[0228]
在本发明的一个实施例中,所述线性网络包括自回归模型;
[0229]
所述原始线性特征提取模块903包括:
[0230]
原始自回归子模块,用于将所述原始电流曲线输入自回归模型中线性预测所述电磁铁下一次通电解除所述站台门锁定时的电流值,作为原始线性特征。
[0231]
在本发明的一个实施例中,所述目标电流曲线生成模块904包括:
[0232]
原始综合特征生成子模块,用于将所述原始非线性特征与所述原始线性特征进行拼接,作为原始综合特征;
[0233]
原始综合特征映射子模块,用于将所述原始综合特征映射为所述电磁铁下一次通电解除锁定所述站台门时的电流值,获得预测电流曲线。
[0234]
本发明实施例所提供的电流预测装置可执行本发明任意实施例所提供的电流预测方法,具备执行方法相应的功能模块和有益效果。
[0235]
实施例五
[0236]
图10为本发明实施例五提供的一种计算机设备的结构示意图。图10示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图10显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0237]
如图10所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0238]
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0239]
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0240]
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图10未显示,通常称为“硬盘驱动器”)。尽管图10中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0241]
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0242]
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0243]
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明任意实施例所提供的电流预测模型的训练方法,或者,电流预测方法。
[0244]
实施例六
[0245]
本发明实施例六还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述任意实施例所提供的电流预测模型的训练方法,或者,电流预测方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0246]
其中,计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0247]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1