本发明涉及自动驾驶的技术领域,尤其涉及一种自动驾驶决策方法及其系统。
背景技术:
近年来对于无人驾驶车辆来说,无人驾驶汽车是通过车载传感系统感知道路环境,自动规划行车路线并控制车辆到达预定目标的智能汽车,它是利用车载传感器来感知车辆周围环境,并根据感知所获得的道路、车辆位置和障碍物信息,控制车辆的转向和速度,从而使车辆能够安全、可靠地在道路上行驶,主要依靠车内的以计算机系统为主的智能驾驶仪来实现无人驾驶的目的。
无人车作为一个复杂软硬件结合的系统,其安全可靠运行需要车载硬件、传感器集成、感知预测以及控制规划等多个模块的协同配合,智能决策是其关键组成部分,也是研究的热点之一。在城区环境中,由于驾驶场景复杂多变,交通参与者的行为难以预测,无法采用一个标准、统一的决策模型进行描述。为了解决城区复杂环境下无人驾驶车辆的决策、规划问题。
技术实现要素:
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的一个技术问题是:本发明通过学习人类驾驶员复杂场景下的决策过程,提出了一种新的驾驶行为决策决策系统完成了无人车的运动规划。
为解决上述技术问题,本发明提供如下技术方案:一种自动驾驶决策系统,包括感知模块,所述感知模块能够采集车辆周边环境的物体信息和车辆自身的状态信息;预测模块,所述预测模块与所述感知模块连接,能够接收感知信息并进行信息融合计算生成预测轨迹;决策模块,与所述预测模块连接,能够接收所述预测轨迹输出决策的轨迹点;控制模块与上层所述决策模块连接,消化所述轨迹点,控制车辆执行所述轨迹点。
作为本发明所述的自动驾驶决策系统的一种优选方案,其中:所述感知模块负责从传感器数据中探测计算出周边环境的物体及车辆自身属性,物体信息经过所述预测模块的计算,生成预测轨迹传递给决策规划控制系统中的行为决策模块。
作为本发明所述的自动驾驶决策系统的一种优选方案,其中:所述决策模块包括行为决策和轨迹规划模块;所述行为决策接受路由寻径的结果,同时也接收感知预测和地图信息,综合输入信息生成输入至所述轨迹规划模块中进行轨迹规划。
作为本发明所述的自动驾驶决策系统的一种优选方案,其中:所述行为决策包括输出当前车辆行为、车辆运动目标点和目标车速,输入所述行为决策后输出车辆运动目标点、目标车速的规划轨迹。
作为本发明所述的自动驾驶决策系统的一种优选方案,其中:所述感知模块的环境状态包括激光雷达、毫米波雷达、超声波雷达和视觉传感器采集的环境信息。
作为本发明所述的自动驾驶决策系统的一种优选方案,其中:所述车辆自身的状态信息包括定位/惯导和轮速传感器采集的信息
作为本发明所述的自动驾驶决策系统的一种优选方案,其中:所述控制模块包括路径跟踪系统、档位控制、踏板控制、转角控制和附件控制;所述轨迹规划模块输出车辆运动目标点、目标车速的规划轨迹至所述路径跟踪系统中输出油门/制动、踏板开度和转向盘转角控制信号至所述踏板控制、转角控制中进行车辆驾驶控制。
作为本发明所述的自动驾驶决策方法的一种优选方案,其中:包括以下步骤,感知模块采集车辆周边环境的物体信息;所述物体信息输入预测模块的计算生成预测轨迹;决策模块接收所述预测轨迹输出决策的轨迹点;反馈控制模块消化所述轨迹点,控制车辆执行所述轨迹点。
作为本发明所述的自动驾驶决策方法的一种优选方案,其中:所述反馈控制包括以下步骤,在每个控制周期内得到了控制时域内的一系列控制输入增量:
式中:δut*·为t时刻的控制增量;根据模型预测控制的基本原理,将该控制序列中第一个元素作为实际的控制输入增量作用于系统,即:
u(t)=u(t-l)+δut*
式中:u(t)·为系统的实际控制量;系统执行这一控制量直到下一时刻,在新的时刻,根据状态信息重新预测下一阶段时域的输出,通过优化过程得到一个新的控制增量序列;如此循环往复,直至完成控制过程。
作为本发明所述的自动驾驶决策方法的一种优选方案,其中:所述预测模块还包括以下预测步骤,将不同时刻的车辆位置信息收集构成多条完整的轨迹序列数据;定义具有环境特征的不确定移动轨迹、轨迹参考点和预测轨迹点与轨迹参考点的集合空间;建立轨迹预测模型并进行训练。
本发明的有益效果:本发明通过模块的划分,非常有效地将无人车决策控制规划这样一个复杂问题,按照计算逻辑从抽象到具体的做出了非常合理的切分;这样的划分使得每个模块可以各司其职专注解决本层次的问题,从而提升了整个复杂软件系统的开发效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明第一种实施例所述自动驾驶决策系统的原理结构示意图;
图2为本发明第一种实施例所述自动驾驶决策系统的模块结构示意图;
图3为本发明第二种实施例所述自动驾驶决策方法的流程示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1~2的示意,本实施例中提出一种自动驾驶决策系统,无人车作为一个复杂软硬件结合的系统,其安全可靠运行需要车载硬件、传感器集成、感知预测以及控制规划等多个模块的协同配合。具体的,该决策系统包括,
感知模块100,感知模块100能够采集车辆周边环境的物体信息和车辆自身的状态信息;感知模块100的环境状态包括激光雷达、毫米波雷达、超声波雷达和视觉传感器采集的环境信息。车辆自身的状态信息包括定位/惯导和轮速传感器采集的信息。
预测模块200,预测模块200与感知模块100连接,能够接收感知信息并进行信息融合计算生成预测轨迹;
决策模块300,与预测模块200连接,能够接收预测轨迹输出决策的轨迹点;且决策模块300包括行为决策301和轨迹规划模块302;行为决策301接受路由寻径的结果,同时也接收感知预测和地图信息,综合输入信息生成输入至轨迹规划模块302中进行轨迹规划。行为决策301包括输出当前车辆行为、车辆运动目标点和目标车速,输入行为决策301后输出车辆运动目标点、目标车速的规划轨迹。
控制模块400与上层决策模块300连接,消化轨迹点,控制车辆执行轨迹点。控制模块400包括路径跟踪系统、档位控制、踏板控制、转角控制和附件控制;
轨迹规划模块302输出车辆运动目标点、目标车速的规划轨迹至路径跟踪系统中输出油门/制动、踏板开度和转向盘转角控制信号至踏板控制、转角控制中进行车辆驾驶控制。
其中感知模块100负责从传感器数据中探测计算出周边环境的物体及车辆自身属性,物体信息经过预测模块200的计算,生成预测轨迹传递给决策规划控制系统中的行为决策模块300。
实施例2
参照图3的示意,基于上述系统,本实施例提出一种自动驾驶决策方法,能够应用于上述系统,实现使得每个模块可以各司其职专注解决本层次的问题,从而提升了整个复杂软件系统的开发效率。具体的,包括以下步骤,
感知模块100采集车辆周边环境的物体信息;
物体信息输入预测模块200的计算生成预测轨迹;
决策模块300接收预测轨迹输出决策的轨迹点;
反馈控制模块400消化轨迹点,控制车辆执行轨迹点。
其中在每个控制周期内得到了控制时域内的一系列控制输入增量:
式中:δut*·为t时刻的控制增量;
根据模型预测控制的基本原理,将该控制序列中第一个元素作为实际的控制输入增量作用于系统,即:
u(t)=u(t-1)+δut*
式中:u(t)·为系统的实际控制量;
系统执行这一控制量直到下一时刻,在新的时刻,根据状态信息重新预测下一阶段时域的输出,通过优化过程得到一个新的控制增量序列;
如此循环往复,直至完成控制过程。
需要说明的是,本实施例增加连接控制时间模型,增加采样时刻周期,解决控制过程中需要提供恒定的采样周期问题,本实施例为用于区别间隔控制中的连续控制,能够实现在自动驾驶决策方法中对于自动驾驶车辆的实时连续控制,其具体实现过程如下:
建立时间和空间上均为连续的时间模型,如下:
假设x(t)为自动驾驶控制的连续信号、以及d(t)=0。此时自动控制系统的实际离散输出s0(t)与x(t)间的传递函数为:
hf(s)=ko(s)f(s)h(s)[1+s0(s)f(s)g(s)]-1x(t)
其中ko(s)为实际连续控制输出、函数h(s)、f(s)和g(s)均为控制器的连续函数。因此连续驾驶控制系统的输出hf(s)也可写为:
s0(s)=r(s)hf(s),其中r(s)=1/s。
完成设计自动驾驶的控制模型为:
u(t)=u(t-1)+δut*=x(t)r(s),即:
hf(s)=ko(s)f(s)h(s)[1+c0(s)f(s)g(s)]-1u(t)=u(t-1)+δut*r(s)
s0(s)=r(s)hf(s)。
联立上式,可知最终控制模型co(s)为:
预测模块200还包括以下预测步骤,
将不同时刻的车辆位置信息收集构成多条完整的轨迹序列数据;
定义具有环境特征的不确定移动轨迹、轨迹参考点和预测轨迹点与轨迹参考点的集合空间;
建立轨迹预测模型并进行训练。
具体形式:
trj=<ci,{p0,p1,…,pn}>,{pi=<xi,yi,ti>|1<=i<=n},其中ci为当时所处的环境类别,<xi,yi>为空间位置点的经纬度,ti(i=0,…,n)是相应时间戳。
本实施例中预测模块200为模型预测控制器。模型预测控制(mpc)是一类特殊的控制。它的当前控制动作是在每一个采样瞬间通过求解一个有限时域开环最优控制问题而获得。过程的当前状态作为最优控制问题的初始状态,解得的最优控制序列只实施第一个控制作用。这是它与那些使用预先计算控制律的算法的最大不同。本质上模型预测控制求解一个开环最优控制问题。它的思想与具体的模型无关,但是实现则与模型有关。
决策规划控制系统的另一个上游模块是路由寻径模块,其作用在简单意义上可以理解为无人车软件系统内部的导航,即在宏观层面上指导无人车软件系统的控制规划模块按照什么样的道路行驶从而实现从起始点到目的地点。值得注意的是这里的路由寻径虽然在一定程度上类似传统的导航,但其细节上紧密依赖于专门为无人车导航绘制的高精度地图,所以和传统的导航还是有本质的不同。
一般来说,路由寻径会作为单独的模块来进行实现,而交通预测部分,则既可以做为感知模块的业务延伸,也可以看成是决策规划控制模块的外围模块而单独进行实现。
决策规划控制系统的任务,就是在对感知到的周边物体的预测轨迹的基础上,结合无人车的路由意图和当前位置,对车辆做出最合理的决策和控制。
整个决策规划控制软件系统,可以按照解决问题的不同层面,如图所示自上而下划分为行为决策、动作规划以及反馈控制这三个模块。
其中行为决策模块(decision),可以直观理解成无人车的“副驾驶”。
行为决策接受路由寻径的结果,同时也接收感知预测和地图信息。
综合这些输入信息,行为决策模块在宏观上决定了无人车如何行驶。
宏观层面的决策包括在道路上的正常跟车,在遇到交通灯和行人时的等待避让,以及在路口和其他车辆的交互通过等。
例如,在路由寻径要求无人车保持当前车道(lane)行驶,感知发现前方有一辆正常行驶的车辆,行为决策的决定便很可能是跟车行为。
动作规划模块,在上图的划分中,解决的是具体的无人车动作(motion)的规划问题。其功能可以理解为,在一个较小的时空区域内,具体解决无人车从a点到b点如何行驶的问题。动作规划模块在这里解决的问题,相对行为决策,又更加具体了一步。动作规划需要具体把一个短暂时间t内从a到b的中间路径点做出规划,包括选择途经哪些具体的路径点,以及到达每个路径点时,无人车的速度、朝向、加速度等。不仅如此,动作规划还需要保证两点:一是在后续时间内,生成从a到b的时空路径需要保持一定的一致性;二是,这些生成的a到b之间的路径点,包括到达每个点的速度朝向加速度等,都在下游的反馈控制的实际可操作的物理范围之内。
决策规划控制系统最下层的模块是反馈控制模块。这是一个直接和无人车底层控制接口can-bus对接的模块。其核心任务是消化上层动作规划模块的输出轨迹点,通过一系列结合车身属性和外界物理因素的动力学计算,转换成对车辆drive-by-wire控制的油门、刹车以及方向盘信号,从而尽可能地控制车去实际执行这些轨迹点。
反馈控制模块主要涉及对车辆自身控制,以及和外界物理环境交互的建模。
上述模块的划分方法,非常有效地将无人车决策控制规划这样一个复杂问题,按照计算逻辑从抽象到具体的做出了非常合理的切分。这样的划分使得每个模块可以各司其职专注解决本层次的问题,从而提升了整个复杂软件系统的开发效率。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。