一种体现驾驶员个性化行为的车道变换方法与流程

文档序号:22473326发布日期:2020-10-09 22:08阅读:172来源:国知局
一种体现驾驶员个性化行为的车道变换方法与流程

本发明属于汽车智能驾驶技术领域,特别涉及一种体现驾驶员个性化行为的车道变换方法。



背景技术:

随着经济水平的持续提高,拥有车辆的人群比例不断上涨,人们对汽车的行车安全问题也投入了更多的关注。但行车安全的提高不能仅仅依靠驾驶员自身驾驶能力与意识的改变,同样也对驾驶员行为特征识别及其在高级驾驶员辅助系统(adas)中的应用提出了更严苛的需求。尽管adas在人-车-环境闭环系统中发挥着重要作用,但是现有的产品很少考虑驾驶员自身因素,对于所有驾驶员采取相同的控制策略,只是根据车辆安全性需求进行设计,而忽略了对驾驶员个性化的考虑,难以符合驾驶员的真实驾驶特性,导致系统对驾驶员的适应性较低。因此近年来越来越多的研究聚焦在人性化的驾驶辅助系统上。车道变换作为驾驶辅助系统研究的热点,自然对其有了更高的要求。因此,形成一种体现驾驶员个性化行为的车道变换方法有着重要的意义。



技术实现要素:

本发明的目的是提供一种体现驾驶员个性化行为的车道变换方法,其基于采集数据离线学习,建立描述驾驶员共性化的车道变换轨迹规划算法;同时通过对驾驶员个体数据的在线学习,实现对规划算法的微调,使其更精准体现驾驶员的个性化操控行为规律,最终生成与真人数据高度一致的换道轨迹。

本发明提供的技术方案为:

一种体现驾驶员个性化行为的车道变换方法,包括如下步骤:

步骤一、建立换道轨迹规划模型,得到换道规划轨迹:

其中,μy=td+ts,

式中,y(t)为车道变换过程中车辆的横向位移,b表示车道宽度,ts表示转向系统反应时间,td表示驾驶员的反应及操作时间,jc表示驾驶员的特性系数;

步骤二、根据实际采集的驾驶员换道轨迹和所述驾驶员对应的换道规划轨迹,确定所述驾驶员的最佳特性系数和最佳反应及操作时间;

步骤三、建立多个驾驶员的个性行为样本集{x1,x2,x3,...,xn},并且通过聚类算法对x1、x2、x3……xn进行分类,得到每个类别的聚类中心值;

其中,1,2,3,……n分别为驾驶员编号,x1、x2、x3……xn分别包括对应编号的驾驶员的最佳特性系数和最佳反应及操作时间;

步骤四、对实际采集的驾驶员的驾驶数据进行转向特征工况提取,并且识别出所述转向特征工况对应的类别;根据所述转向特征工况对应的类别结果和聚类中心值得到该类别的驾驶员的个性化特性系数和个性化反应及操作时间;

步骤五、将所述驾驶员的个性化特性系数和个性化反应及操作时间带入所述换道规划模型,得到体现驾驶员个性化行为的变道轨迹。

优选的是,在所述步骤二中,采用动态时间规整算法确定所述驾驶员的最佳特性系数和最佳反应及操作时间,包括:

确定归整路径的形式为:

w=w1,w2,......,wk

max(|x|,|y|)≤k≤|x|+|y|

其中,x驾驶员对应的换道规划轨迹,其长度为|x|;y表示实际采集的驾驶员换道轨迹,其长度为|y|;wk(i,j)中i表示驾驶员拟合轨迹x中第i个点的位置坐标,j表示驾驶员实际轨迹y中第j个点的位置坐标;以及

确定目标函数为:

d(i,j)=dist(i,j)+min[d(i-1,j),d(i,j-1)d(i-1,j-1)];

其中,dist(i,j)表示轨迹x第i个点与轨迹y第j个点之间的距离;对jc和td进行动态调整以改变x,直到获得d(i,j)最小值;

其中,d(i,j)最小值对应的jc和td分别为该驾驶员的最佳特性系数和最佳反应及操作时间。

优选的是,在所述步骤三中,对多个驾驶员的个性行为样本集{x1,x2,x3,...,xn}进行聚类分析,包括如下步骤:

步骤1、建立相似度矩阵s;

其中,xi、xj和xk均为所述样本集中的样本;当xi与xj的相似性程度大于xi与xk的相似程度时,s(i,j)>s(i,k);

步骤2、建立吸引信息矩阵r和归属信息矩阵a,以及建立吸引信息迭代公式和归属信息迭代公式;其中,

所述吸引信息迭代公式为:

rt+1(i,k)=s(i,k)-max{at(i,k′)+s(i,k′)},k′≠k;

所述归属信息迭代公式为:

其中,r(i,k)表示xk适合作为xi的聚类中心的程度;a(i,k)表示xi选择xk作为其聚类中心的适合程度;

步骤3、经过多次迭代之后,计算结果保持不变或处于变化阈值内,即可得到样本的聚类中心个数和每个类别聚类中心值。

优选的是,在所述步骤四中,基于长短期记忆网络得到驾驶员的个性化特性系数和个性化反应及操作时间,包括如下步骤:

步骤a、根据车速、方向盘转角和方向盘转速提取出多个转向特征工况;

步骤b、将提取的特征转向工况数据输入长短期记忆网络,进行多次识别,得到所述转向特征工况对应的类别;并且根据类别识别结果和聚类中心值得到该类别的驾驶员的特性系数和反应及操作时间进行动态更新;

其中,所述特性系数为:

所述反应和操作时间为:

式中,m为聚类算法获得的类数,jci和tdi为第i类中心值,ni为辨识出为第i类的次数,n为转向特征工况的个数;

步骤c、直到得到的所述驾驶员对应的换道规划轨迹和实际采集的驾驶员换道轨迹的一致程度达到设定的阈值时,输出对应的jc和td即为该类别的驾驶员的个性化特性系数和个性化反应及操作时间。

优选的是,所述转向特征工况的提取标准为:v>2m/s、δsw>5°和

其中,v表示车速,δsw表示方向盘转角,表示方向盘转速。

优选的是,在所述步骤四之前,还包括对所述长短期记忆网络进行训练,得到所述长短期记忆网络的权重值,包括如下步骤:

步骤a、按照采样周期,获取方向盘转角δsw,车速v,方向盘转速纵向加速度ax,横向加速度ay和航向角变化ψ作为长短期记忆网络的输入门参数xt,对输入门参数xt分成两组后,以不同函数进行激活,分别得到第一更新参数和第二更新参数:

it=σ(wiht-1+uixt1+bi)

at=tanh(waht-1+uaxt2+ba)

其中,xt1表示第一组xt中的元素,xt2表示第二组xt中的元素;it表示第一更新参数,at表示第二更新参数;wi,ui,wa和ua分别表示输入门状态更新的系数,bi和ba分别表示输入门状态更新的偏移;σ表示sigmoid激活函数,tanh表示tanh激活函数;ht-1表示遗忘门中t-1采样周期的隐藏状态参数;

步骤b、根据ht-1和xt得到遗忘门输出参数ft:

ft=σ(wfht-1+ufxt+bf)

式中,wf,ut分别表示遗忘门状态更新的系数,bt遗忘门状态更新的偏移;

步骤c、根据所述第一更新参数、所述第二更新参数和所述遗忘门输出参数得到状态参数ct:

ct=ct-1⊙ft+it⊙at;

步骤d、得到输出门的输出结果为:

ot=σ(woht-1+uoxt+bo)

ht=ot⊙tanh(ct)

步骤e、根据所述输出门的输出结果,获得所述长短期记忆网络的最优权重值。

本发明的有益效果是:

本发明提供的体现驾驶员个性化行为的车道变换方法,基于采集数据离线学习,建立描述驾驶员共性化的车道变换轨迹规划算法;同时通过对驾驶员个体数据的在线学习,实现对规划算法的微调,使其更精准体现驾驶员的个性化操控行为规律,最终生成与真人数据高度一致的换道轨迹。

附图说明

图1为本发明所述的体现驾驶员个性化行为的车道变换系统流程图。

图2为动态规整算法规整前的换道规划轨迹和实际采集的驾驶员换道轨迹示意图。

图3为动态规整算法规整后的换道规划轨迹和实际采集的驾驶员换道轨迹示意图。

图4为本发明所述的长短期记忆网络结构图。

图5为本发明所述的步骤四的运行流程图。

具体实施方式

下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。

如图1所示,本发明提供了体现驾驶员个性化行为的车道变换方法,包括如下步骤:

步骤1、在高斯分布拟合换道轨迹的基础上引入了驾驶员特性系数jc和驾驶员反应及操作时间td,建立了个性化换道轨迹规划模型;

进一步,所述步骤1的具体如下:

步骤1.1、以高斯分布拟合的换道过程中的横向速度公式为:

其中,t是换道时间,d,μy和σy是拟合系数。

步骤1.2、依据步骤1.1中的横向速度公式,车道变换过程中车辆的横向位移公式为:

式中,t是换道时间。

步骤1.3、引入驾驶员特性系数jc和驾驶员反应及操作时间td,用于计算步骤1.1和步骤1.2中的σy,建立个性化的换道轨迹规划系统,步骤1.1和步骤1.2中相关系数便可如下表示:

μy=td+ts

式中,b是车道宽度,ts是转向系统反应时间。

步骤2、使用了动态时间规整算法对实际采集的换道轨迹和拟合轨迹进行匹配;

进一步,所述步骤2的具体实现如下:采集若干位驾驶员进行换道实验,并录制轨迹。令步骤1中拟合生成的轨迹和真实采集换道轨迹分别为x和y,长度分别为|x|和|y|。归整路径(warppath)的形式为:

w=w1,w2,......,wk

max(|x|,|y|)≤k≤|x|+|y|

其中,x表示驾驶员对应的拟合换道规划轨迹,其长度为|x|;y表示实际采集的驾驶员换道轨迹,其长度为|y|;wk(i,j)中i表示驾驶员拟合轨迹x中第i个点的位置坐标,j表示驾驶员实际轨迹y中第j个点的位置坐标。

归整路径w必须从w1=(1,1)开始,到wk=(|x|,|y|)结尾,以保证x和y中的每个坐标都在w中出现,同时还要满足下式:

wk=(i,j),wk+1=(i′,j′)

其中i≤i′≤i+1,j≤j′≤j+1

最终要得到的归整路径就是距离最短的一个归整路径:

d(i,j)=dist(i,j)+min[d(i-1,j),d(i,j-1),d(i-1,j-1)];

其中,dist(i,j)表示轨迹x第i个点与轨迹y第j个点之间的距离;d(i,j)表示轨迹x的前i个点与轨迹y的前j个点的总距离,d(i,j)衡量的是轨迹x的前i个点与轨迹y的前j个点的相似性;d(i-1,j)表示轨迹x的前i-1个点与轨迹y的前j个点之间的总距离,d(i,j-1)表示轨迹x的前i个点与轨迹y的前j-1个点之间的总距离,d(i-1,j-1)表示轨迹x的前i-1个点与轨迹y的前j-1个点之间的总距离。

通过对驾驶特性系数jc和反应及操作时间td的动态调整以改变拟合轨迹,使用动态时间规整算法(dtw算法)将每一对jc和td下的拟合轨迹与真实轨迹匹配,直到获得最小的平方欧式距离,此时的jc和td即为该名驾驶员的最佳参数,具体效果如图2-3所示。

步骤3、根据步骤2中获得的匹配结果,通过ap聚类算法,建立了离线学习模型,获得了jc和td的共性化值;

进一步,所述步骤3的具体方法如下:

步骤3.1、基于步骤2获得的若干名驾驶员的最佳jc和td,获得样本集{x1,x2,x3,...,xn},其中,xi为一组jc和td值。

步骤3.2、令s是一个刻画点之间相似度的矩阵,s(i,j)表示节点i与节点j之间的相似度,也表明了j作为i的聚类中心的合适程度。

步骤3.3、吸引信息矩阵r(i,k)描述了数据对象k适合作为数据对象i的聚类中心的程度,表示的是从i到k的消息吸引信息,按照如下迭代:

rt+1(i,k)=s(i,k)-max{at(i,k′)+s(i,k′)},k′≠k

步骤3.4、归属信息矩阵a(i,k)描述了数据对象i选择数据对象k作为其聚类中心的适合程度,表示从k到i的消息,按照如下迭代:

步骤3.5、对步骤3.3和步骤3.4进行迭代,当这些决策经过若干次迭代之后保持不变或者一个小区域内的关于样本点的决策经过数次迭代后保持不变,即可得到最终结果。ap算法作为一种不指定聚类中心的分类算法,最终将(jc,td)最终分为若干类,同时获得了每类的聚类中心值,将该值作为共性化的参数值。

步骤4、以实车获得的自由驾驶数据进行特征工况的提取,并基于长短期记忆网络(lstm)搭建了驾驶员特性在线辨识的模型,具体的网络结构如图4所示。该模型能够动态更新jc和td得到个性化值,最终生成体现驾驶员个性化的车道变换轨迹。

进一步地,所述步骤4的具体过程如下:

步骤4.1、采集若干名驾驶员自由驾驶数据,并依据车速v>2m/s、方向盘转角δsw>5°和方向盘转速三个条件提取出转向特征工况。

步骤4.2输入门xt包含方向盘转角δsw,车速v,方向盘转速纵向加速度ax,横向加速度ay和经过计算得到的航向角变化ψ的时间序列。输入门由两部分组成,第一部分使用了sigmoid激活函数,输出为it,第二部分使用了tanh激活函数,输出为at,两者的结果后面会相乘再去更新细胞状态。表达式如下:

it=σ(wiht-1+uixt+bi)

at=tanh(waht-1+uaxt+ba)

式中,wi,ui,wa和ua分别表示输入门状态更新的系数,bi和ba分别表示输入门状态更新的偏移,σ为sigmoid激活函数。

步骤4.3、遗忘门中上一序列的隐藏状态ht-1和本序列数据xt,通过一个sigmoid激活函数,得到遗忘门的输出ft。由于sigmoid的输出ft在[0,1]之间,因此ft代表了遗忘上一层隐藏细胞状态的概率。表达式如下:

ft=σ(wfht-1+ufxt+bf)

式中,wf,ut分别表示遗忘门状态更新的系数,bt遗忘门状态更新的偏移。

步骤4.4、输入门和遗忘门的结果都会作用于细胞状态ct。细胞状态ct由两部分组成,具体表示如下:

ct=ct-1⊙ft+it⊙at

步骤4.5、输出门的输出描述如下:

ot=σ(woht-1+uoxt+bo)

ht=ot⊙tanh(ct)

步骤4.6、根据所述输出门的输出结果与训练标签(样本所属的聚类中心)的不断对比,逐渐更新网络中的状态更新系数及偏移,直到训练网络的损失达到设定阈值0.01以下,最终获得所述长短期记忆网络的最优权重值。

步骤4.7、在训练完成获得权重后,将实车数据输入获得辨识结果,动态更新jc和td值,从而获得个性化的车道变换轨迹。

进一步,所述步骤4.7中jc和td的具体动态更新方法如下:

式中,m为步骤3.5中ap聚类获得类数,jci和tdi为第i类中心(jc,td)值,ni为辨识出为第i类的次数,n为特征工况的总个数。

在神经网络训练完成后,该系统便可在实车在线运行,具体流程如图5所示。当驾驶员驾驶车辆时,该系统不断进行特征工况提取401,当提取到转向特征工况时402,便将其置入长短期记忆网络中进行辨识403,得到该次工况的类型404。随着驾驶数据的累计,特征工况数量逐渐增多,对单次工况的辨识结果进行统计405,不断更新jc和td406,从而逐渐生成与驾驶员真实轨迹高度一致的拟合轨迹407。

尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1