本发明的实施方式总体涉及操作自动驾驶车辆。更具体地,本发明的实施方式涉及自动驾驶车辆的轨迹重新规划。
背景技术
以自动驾驶模式操作(例如,无人驾驶)的车辆可以将乘员、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式操作时,车辆可以使用车载传感器导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。
运动规划和控制是自动驾驶的关键操作。当规划自动驾驶车辆(adv)的操作时,目标是规划路线或轨迹并控制adv尽可能地靠近规划的路线或轨迹。然而,由于驾驶环境的多种因素,一些时候adv可能无法像预期的那样遵循规划的线路或轨迹。在这种情况下,可能需要重新规划路线或轨迹。在该时间点的驾驶环境下,难以确定应该执行重新规划还是常规规划。
技术实现要素:
本申请的一方面提供了一种用于操作自动驾驶车辆的计算机实施的方法,所述方法包括:当所述自动驾驶车辆沿着规划的路线移动时,确定所述自动驾驶车辆的当前状态与所述自动驾驶车辆的目标状态之间的状态差异;根据所述自动驾驶车辆的前一状态确定当前状态的状态趋势,所述状态趋势表示所述当前状态与所述前一状态之间的差异的变化趋势;基于所述状态差异和所述状态趋势计算重新规划分数;以及响应于确定所述重新规划分数大于预定阈值,对所述路线的下一路线段执行重新规划。
本申请的另一方面提供了一种存储有指令的非暂时性机器可读介质,所述指令在由处理器执行时致使所述处理器执行操作,所述操作包括:当自动驾驶车辆沿着规划的路线移动时,确定所述自动驾驶车辆的当前状态与所述自动驾驶车辆的目标状态之间的状态差异;根据所述自动驾驶车辆的前一状态确定当前状态的状态趋势,所述状态趋势表示所述当前状态与所述前一状态之间的差异的变化趋势;基于所述状态差异和所述状态趋势计算重新规划分数;以及响应于确定所述重新规划分数大于预定阈值,对所述路线的下一路线段执行重新规划。
本申请的又一方面提供了一种数据处理系统,包括:处理器;以及存储器,所述存储器联接到所述处理器以存储指令,所述指令在由所述处理器执行时致使所述处理器执行操作,所述操作包括:当自动驾驶车辆沿着规划的路线移动时,确定所述自动驾驶车辆的当前状态与所述自动驾驶车辆的目标状态之间的状态差异;根据所述自动驾驶车辆的前一状态确定当前状态的状态趋势,所述状态趋势表示所述当前状态与所述前一状态之间的差异的变化趋势;基于所述状态差异和所述状态趋势计算重新规划分数;以及响应于确定所述重新规划分数大于预定阈值,对所述路线的下一路线段执行重新规划。
附图说明
本发明的实施方式在附图的各图中以举例而非限制的方式示出,在附图中,相同的附图标记指示相似的元件。
图1是示出根据本发明的一个实施方式的网络化系统的框图。
图2是示出根据本发明的一个实施方式的自动驾驶车辆的示例的框图。
图3是示出根据本发明的一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。
图4是示出根据本发明的一个实施方式的规划模块的示例的框图。
图5是示出根据本发明的一个实施方式的用于生成重新规划分数的过程的处理流程图。
图6是示出根据本发明的一个实施方式的用于操作自动驾驶车辆的过程的示例的流程图。
图7是示出根据本发明的一个实施方式的确定自动驾驶车辆的当前状态与目标状态之间的差异的过程的流程图。
图8是示出根据本发明的一个实施方式的确定自动驾驶车辆的当前状态与目标状态之间的差异的趋势的过程的流程图。
图9是示出根据一个实施方式的数据处理系统的框图。
具体实施方式
将参考以下所讨论的细节来描述本发明的各种实施方式和方面,附图将示出所述各种实施方式。下列描述和附图是对本发明的说明,而不应当解释为限制本发明。描述了许多特定细节以提供对本发明各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本发明的实施方式的简洁讨论。
本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本发明的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。
根据一些实施方式,利用重新规划确定机制基于adv在时间点的驾驶状态和条件(例如,规划位置与实际位置之间的差异、当前速度与目标速度之间的差异和当前前进方向与目标前进方向之间的差异)来确定adv是否需要重新规划路线或轨迹。这种差异总体上表示了规划与来自adv的实际响应之间的误差。如果误差大于预定阈值,则可以执行重新规划;否则,执行常规规划。
在常规规划期间,规划模块基于前一规划循环的adv的目标状态(例如,预期状态)(例如,目标位置、目标速度、目标前进方向)为下一路线段执行当前规划循环的规划。控制模块基于规划模块提供的规划和控制数据生成并发出控制命令。在重新规划期间,当前规划循环的规划是基于adv的实际状态(例如,实际速度、实际位置、实际前进方向),而不是基于下一路线段的adv的目标状态。
根据一个实施方式,当adv沿着规划的路线移动时,确定在adv的当前状态与adv的目标状态之间的状态差异。当前状态的状态趋势是根据adv的前一状态确定的,其中状态趋势表示当前状态与前一状态之间的差异的变化趋势。adv的状态至少包括adv的位置、adv的速度和/或adv的前进方向。重新规划分数是基于状态差异和状态趋势使用重新规划评分函数来计算的。状态差异可以包括:adv的当前位置与目标位置之间的距离差异、adv的当前速度与目标速度之间的速度差异、和/或adv的当前前进方向与目标前进方向之间的方向差异。在一个实施方式中,进一步基于adv的当前速度和/或路线的曲率来计算重新规划分数。如果重新规划分数大于预定阈值,则执行对路线的下一路线段的重新规划。否则,如果重新规划分数小于或等于预定阈值,则执行常规规划。
图1是示出根据本发明的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(lan)、诸如互联网的广域网(wan)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(mpoi)服务器或者位置服务器等。
自动驾驶车辆是指可以配置成处于自动驾驶模式下的车辆,在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可以包括传感器系统,所述传感器系统具有配置成检测与车辆操作环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下操作。
在一个实施方式中,自动驾驶车辆101包括,但不限于,感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可以包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如,加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。
部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可以经由控制器局域网(can)总线通信地联接到彼此。can总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。
现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个相机211、全球定位系统(gps)单元212、惯性测量单元(imu)213、雷达单元214以及光探测和测距(lidar)单元215。gps系统212可以包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。imu单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中,除感测对象之外,雷达单元214可以另外感测对象的速度和/或前进方向。lidar单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,lidar单元215还可以包括一个或多个激光源、激光扫描器以及一个或多个检测器。相机211可以包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。相机211可以是静物相机和/或视频相机。相机可以是可机械地移动的,例如,通过将相机安装在旋转和/或倾斜平台上。
传感器系统115还可以包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可以配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可以配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可以集成为集成式油门/制动传感器。
在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度,电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。
回到图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(wlan),例如,使用wifi,以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分,包括例如键盘、触摸屏显示装置、麦克风和扬声器等。
自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储设备)和软件(例如,操作系统、规划和路线安排程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。替代地,感知与规划系统110可以与车辆控制系统111集成在一起。
例如,作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可以从mpoi服务器中获得位置和路线信息,所述mpoi服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且mpoi服务器提供地图服务和某些位置的poi。替代地,此类位置和mpoi信息可以本地缓存在感知与规划系统110的永久性存储装置中。
当自动驾驶车辆101沿着路线移动时,感知与规划系统110也可以从交通信息系统或服务器(tis)获得实时交通信息。应注意,服务器103至104可以由第三方实体进行操作。替代地,服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、mpoi信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。
服务器103可以是数据分析系统以针对多种客户端执行数据分析服务。在一个实施方式中,数据分析系统103包括数据采集器121和机器学习引擎122。数据采集器121从多种车辆(自动驾驶车辆或由人类驾驶员驾驶的常规车辆)采集驾驶统计123。驾驶统计123包括指示发出的驾驶命令(例如,油门命令、制动命令、转向命令)的信息和在不同时间点由车辆的传感器采集的车辆的响应(例如,速度、加速度、减速度、方向)的信息。驾驶统计123还可以包括描述不同时间点的驾驶环境的信息,例如,路线(包括出发位置和目的地位置)、mpoi、道路状况、天气状况等。
基于驾驶统计123,机器学习引擎122生成或训练用于多种目的的一系列规则、算法和/或预测模型124。在一个实施方式中,算法124包括基于多种因素(例如,当前位置与目标位置之间的距离差异、当前速度与目标速度之间的速度差异和当前前进方向与目标前进方向之间的方向差异等)计算重新规划分数的算法。算法124还可以包括特定评分函数以计算表示距离差异、速度差异和方向差异中的每一个的分数。重新规划评分函数可以利用这些分数来计算最终重新规划分数。算法124还可以包括分数阈值,所述分数阈值可用于根据具体重新规划分数来确定是否应该执行重新规划。这些评分函数和阈值可以特定地与一个或多个具体类型的adv相关联。也就是说,不同类型的adv可以与不同的评分函数和阈值相关联。评分函数和阈值可以被上传到adv以被实时利用。
图3是示出根据本发明的一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以作为图1的自动驾驶车辆101的一部分被实施,包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3,感知与规划系统110包括,但不限于,定位模块301、感知模块302、决策模块303、规划模块304以及控制模块305。
模块301至305中的一些或全部可以以硬件、软件或其组合实施。例如,这些模块可以安装在永久性存储装置352中,加载到存储器351中,并且由一个或多个处理器(未示出)执行。应注意,这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至305中的一些可以集成在一起成为集成模块。
定位模块301确定自动驾驶车辆300的当前位置(例如,利用gps单元212)并管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图和路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的其它部件(诸如地图和路线信息311)通信,以获得行程相关数据。例如,定位模块301可以从位置服务器和地图与poi(mpoi)服务器获得位置和路线信息。位置服务器提供位置服务,并且mpoi服务器提供地图服务和某些位置的poi,这些可以作为地图和路线信息311的一部分缓存。当自动驾驶车辆300沿着路线移动时,定位模块301也可以从交通信息系统或服务器获得实时交通信息。
基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可以包括例如对象形式的车道配置(例如,直线车道或弯曲车道)、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。
感知模块302可以包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个相机采集的图像,从而识别在自动驾驶车辆的环境中的对象和/或特征。所述对象可以包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中,计算机视觉系统可以绘制环境地图、跟踪对象和估算对象的速度等。感知模块302也可以基于由诸如雷达和/或lidar的其它传感器提供的其它传感器数据来检测对象。
针对每个对象,决策模块303作出关于如何处置该对象的决策。例如,针对具体对象(例如,交叉路线中的另一车辆)以及描述该对象的元数据(例如,速度、方向、转弯角度),决策模块303决定如何与该对象相遇(例如,超车、让行、停止、超过)。决策模块303可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定,所述规则集可以存储在永久性存储装置352中。
基于针对所感知对象中的每个的决策,规划模块304为自动驾驶车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。也就是说,针对给定的对象,决策模块303决定对该对象做什么,而规划模块304确定如何去做。例如,针对给定的对象,决策模块303可以决定超过该对象,而规划模块304可以确定是在该对象的左侧还是右侧超过。规划与控制数据由规划模块304生成,所述规划与控制数据包括描述车辆300在下一个移动循环(例如,下一个路线/路径段)中将如何移动的信息。例如,规划与控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米,随后以25mph的速度变到右侧车道。
基于规划与控制数据,控制模块305根据由规划与控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划与控制数据包括足够的信息,以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如,油门命令、制动命令和转弯命令)将车辆从路线或路径的第一点驾驶到第二点。
在一个实施方式中,规划阶段被执行多个规划循环(也被称为命令循环),例如,以每100毫秒(ms)的时间间隔执行。对于每个规划循环或命令循环,将基于规划和控制数据发出一个或多个控制命令。也就是说,对于每100ms,规划模块304规划下一路线段或路径段,例如,包括目标位置以及adv到达目标位置所需的时间。替代地,规划模块304还可以指定特定的速度、方向和/或转向角度等。在一个实施方式中,规划模块304为下一个预定时间段(例如,5秒)规划路线段或路径段。对于每个规划循环,规划模块304基于前一循环中所规划的目标位置为当前循环(例如,下一个5秒)规划目标位置。控制模块305随后基于当前循环的规划和控制数据生成一个或多个控制命令(例如,油门命令、制动命令、转向控制命令)。
应注意,决策模块303和规划模块304可以集成为集成模块。决策模块303/规划模块304可以包括导航系统或导航系统的功能,以确定自动驾驶车辆的驾驶路径。例如,导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向:所述路径使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时,基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆操作的同时动态地更新驾驶路径。导航系统可以将来自gps系统和一个或多个地图的数据合并,以确定用于自动驾驶车辆的驾驶路径。
决策模块303/规划模块304还可以包括防撞系统或防撞系统的功能,以识别、评估并且避免或以其它方式越过自动驾驶车辆的环境中的潜在障碍物。例如,防撞系统可以通过以下方式实现自动驾驶车辆的导航中的变化:操作控制系统111中的一个或多个子系统来采取变向操纵、转弯操纵、制动操纵等。防撞系统可以基于周围的交通模式、道路状况等自动确定可行的障碍物回避操纵。防撞系统可以配置成使得当其它传感器系统在自动驾驶车辆将变向进入的相邻区域中检测到车辆、建筑障碍物等时不采取变向操纵。防撞系统可以自动选择既可使用又使得自动驾驶车辆的乘员的安全性最大化的操纵。防撞系统可以选择预测使得自动驾驶车辆的乘客舱中出现最小量的加速度的避让操纵。
根据一个实施方式,规划模块304配置成基于adv在时间点的驾驶状态和条件(例如,规划位置与实际位置之间的差异、当前速度与目标速度之间的差异和当前前进方向与目标前进方向之间的差异)来确定adv是否需要重新规划路线或轨迹。这种差异总体上表示了规划与来自adv的实际响应之间的误差。如果误差大于预定阈值,则可以由规划模块304执行重新规划;否则,执行常规规划。
在常规规划期间,规划模块304基于前一规划循环的adv的目标状态(例如,预期状态)(例如,目标位置、目标速度、目标前进方向)为下一路线段执行当前规划循环的规划。控制模块305基于规划模块304提供的规划和控制数据生成并发出控制命令。在重新规划期间,当前规划循环的规划是基于下一路线段的adv的实际状态(例如,实际速度、实际位置、实际前进方向)的。
根据一个实施方式,当adv沿着规划的路线移动时,规划模块304确定adv的当前状态与adv的目标状态之间的状态差异。规划模块304还根据adv的前一状态基于adv的驾驶统计314确定当前状态的状态趋势。状态趋势表示当前状态与前一状态之间的差异的变化趋势(例如,增加或减少)。adv的状态至少包括adv的位置、adv的速度和/或adv的前进方向。规划模块304基于状态差异和状态趋势使用重新规划评分函数313来计算重新规划分数。重新规划评分函数313可以作为算法124的一部分被生成。
状态差异可以包括:adv的当前位置与目标位置之间的距离差异(也被称为位置差异)、adv的当前速度与目标速度之间的速度差异、和/或adv的当前前进方向与目标前进方向之间的方向差异。在一个实施方式中,规划模块304还基于adv的当前速度和/或路线的曲率计算重新规划分数。如果重新规划分数大于预定阈值,则规划模块304执行对路线的下一路线段的重新规划。否则,如果重新规划分数小于或等于预定阈值,则规划模块304执行常规规划。
图4是示出根据本发明的一个实施方式的规划模块的示例的框图。参考图4,规划模块304包括重新规划评分模块411、差异评分模块412、趋势评分模块413、速度评分模块414和曲率评分模块415。应注意,评分模块411至415中的一些或全部可以集成在较少的评分模块或单个评分模块中。评分模块411至415使用评分函数313中的至少一些来计算各种分数。在一个实施方式中,评分函数313包括重新规划评分函数421、差异评分函数422、趋势评分函数423、速度评分函数424和曲率评分函数425。
现在参考图4和图5,根据一个实施方式,差异评分模块412配置成基于adv的当前位置与adv的目标位置之间的差异使用差异评分函数422(被称为评分函数f1)来计算距离或位置差异分数501(被称为分数f1(距离))。adv的目标位置是指在前一规划循环中规划的目标位置或期望位置。差异评分模块412还基于adv的当前速度与adv的目标速度之间的差异使用差异评分函数422来计算速度差异分数502(被称为分数f1(速度))。adv的目标速度是指在前一规划循环中规划的目标速度或期望速度。差异评分模块412还基于adv的当前前进方向与adv的目标前进方向之间的差异使用差异评分函数422来计算方向差异分数503(被称为分数f1(方向))。adv的目标前进方向是指在前一规划循环中规划的目标前进方向或期望前进方向。应注意,差异评分函数422可以包括用于计算位置差异分数501、速度差异分数502和/或方向差异分数503的特定或单独的评分函数。类似地,差异评分模块412可以包括特定或单独的评分模块以执行计算。
在一个实施方式中,规划阶段被执行多个规划循环(也被称为命令循环),例如,以每100毫秒(ms)的时间间隔执行。对于每个规划循环或命令循环,将基于规划和控制数据发出一个或多个控制命令。也就是说,对于每100ms,规划模块304规划下一路线段或路径段,例如,包括目标位置以及adv到达目标位置所需的时间。替代地,规划模块304还可以指定特定的速度、方向和/或转向角度等。在一个实施方式中,规划模块304为下一个预定时间段(例如,5秒)规划路线段或路径段。对于每个规划循环(例如,100ms),规划模块304基于前一循环中所规划的目标位置为当前循环(例如,下一个5秒)规划目标位置。如果adv的当前实际位置与前一规划循环所规划的目标位置显著不同,则规划模块304可能必须基于adv的实际位置而不是基于前一规划循环的目标位置来重新规划下一段。控制模块305随后基于当前循环的规划和控制数据生成一个或多个控制命令(例如,油门命令、制动命令、转向控制命令)。
回到参考图4和图5,根据一个实施方式,趋势评分模块413配置成使用趋势评分函数423(被称为评分函数f2)根据作为驾驶历史的一部分的驾驶统计314来计算距离趋势分数504(被称为分数f2(距离))。距离趋势分数504是指距离差异的变化趋势。距离趋势分数504根据先前规划循环中计算的差异来指示差异是增加还是减小。如果差异在增加,则趋势分数可以是正的;否则,如果差异在减小,则趋势分数可以是负的。驾驶统计314包括在过去的不同时间点记录驾驶命令和来自adv的响应的信息。驾驶统计314可以记录adv在一段时间内的状态(例如,位置、速度、前进方向)。
趋势评分模块413配置成使用趋势评分函数423根据驾驶统计314来计算速度趋势分数505(被称为分数f2(速度))。速度趋势分数505是指adv的当前速度与目标速度之间的速度差异的变化趋势。速度趋势分数505根据先前规划循环中计算的差异来指示差异是增加还是减小。趋势评分模块413还使用趋势评分函数423根据驾驶统计314来计算方向趋势分数506(被称为分数f2(方向))。方向趋势分数506是指adv的当前前进方向与目标前进方向之间的方向差异的变化趋势。方向趋势分数506根据上个规划循环中计算的差异来指示差异是增加还是减小。应注意,趋势评分函数423可以包括用于计算距离趋势分数504、速度趋势分数505和/或方向趋势分数506的特定或单独的评分函数。类似地,趋势评分模块413可以包括特定或单独的评分模块以执行计算。
在一个实施方式中,重新规划评分模块411使用重新规划评分函数421基于距离差异分数501、速度差异分数502、方向差异分数503,根据距离趋势分数504、速度趋势分数505和方向趋势分数506,来计算重新规划分数510。距离趋势分数504,速度趋势分数505和方向趋势分数506中的每一个可以为正值或负值。如果从前一趋势来看趋势在增加,则相应的趋势分数可以是正的。如果从前一趋势来看趋势在减小,则相应的趋势分数可以是负的。如果重新规划分数510高于预定阈值,则规划模块304可以执行对下一路线段的重新规划;否则,规划模块304可以执行常规规划。
根据另一实施方式,速度评分模块414基于adv的当前速度使用速度评分函数424来计算速度分数507(在本文中被称为分数f3)。adv的速度越高,速度分数507可越高。重新规划评分模块411还基于速度分数507来计算重新规划分数510。在一个实施方式中,较高的速度分数可以降低总体重新规划分数510。其背后的基本原理是,如果adv以较高的速度行驶,则会允许较高的误差容许。
根据另一实施方式,曲率评分模块415基于路线段或路线的曲率使用曲率评分函数来计算曲率分数508(在本文中被称为分数f4)。如果路线具有较急剧的弯曲,则曲率分数508可较高。重新规划评分模块411还基于曲率分数508来计算重新规划分数510。在一个实施方式中,较高的曲率分数可以降低总体重新规划分数510。其背后的基本原理是,如果adv在具有较急剧的弯曲的路线上移动,则会允许较高的误差容许。
根据一个实施方式,可以基于差异分数501至503、趋势分数504至506、速度分数507和曲率分数508计算重新规划分数510。在一个具体的实施方式中,重新规划分数510可以如下计算:
重新规划分数=[f1(距离)×f2(距离)/f3]+
[f1(速度)×f2(速度)/f3]+
[f1(方向)×f2(方向)/f4]
如以上等式所示,速度分数f3通常影响距离误差和速度误差,而曲率分数f4通常影响差异分数和趋势分数的曲率分量。
图6是示出根据本发明的一个实施方式的操作自动驾驶车辆的过程的流程图。过程600可以由处理逻辑执行,所述处理逻辑可以包括软件、硬件或其组合。例如,过程600可以由规划模块304执行。参考图6,在操作601中,处理逻辑确定adv的当前状态(例如,当前位置、当前速度、当前前进方向)与所述adv的目标状态(例如,目标位置、目标速度、目标前进方向)之间的差异。生成差异分数。在一个实施方式中,差异分数可以包括如上所述的距离差异分数、速度差异分数和方向差异分数。
在操作602中,处理逻辑根据所述adv的前一状态例如使用驾驶统计的先前历史来确定所述adv的当前状态与目标状态之间的差异的趋势。生成趋势分数。在一个实施方式中,趋势分数可以包括如上所述的距离趋势分数、速度趋势分数和方向趋势分数。在操作603中,处理逻辑基于所述差异分数和所述趋势分数计算重新规划分数。在一个实施方式中,处理逻辑可选地基于所述adv的当前速度确定速度分数和/或基于路线段或路线的曲率确定曲率分数。可以进一步基于速度分数和/或曲率分数计算重新规划分数。在操作604中,处理逻辑将重新规划分数与预定阈值进行比较。如果所述重新规划分数大于所述预定阈值,则在操作605中,处理逻辑执行对路线段或路线的重新规划;否则,执行常规规划。
图7是示出根据本发明的一个实施方式的确定自动驾驶车辆的当前状态与目标状态之间的差异的过程的流程图。例如,过程700可以作为图6的操作601的一部分来执行。参考图7,在操作701中,处理逻辑确定adv的当前位置与目标位置之间的距离差异。可选地生成距离差异分数,例如,如上所述的f1(距离)。在操作702中,处理逻辑确定所述adv的当前速度与目标速度之间的速度差异。可选地生成速度差异分数,例如,如上所述的f1(速度)。在操作703中,处理逻辑确定所述adv的当前前进方向与目标前进方向之间的方向差异。可选地生成方向差异分数,例如,如上所述的f1(方向)。
图8是示出根据本发明的一个实施方式的确定自动驾驶车辆的当前状态与目标状态之间的差异的趋势的过程的流程图。例如,过程800可以作为图6的操作602的一部分来执行。参考图8,在操作801中,处理逻辑基于adv的当前位置与目标位置之间的距离差异、根据先前规划循环的先前距离差异来确定距离差异趋势。可选地生成距离趋势分数,例如,如上所述的f2(距离)。在操作802中,处理逻辑基于所述adv的当前速度与目标速度之间的速度差异、根据先前规划循环的先前速度差异来确定速度差异趋势。可选地生成速度趋势分数,例如,如上所述的f2(速度)。在操作803中,处理逻辑基于所述adv的当前前进方向与目标前进方向之间的方向差异、根据先前规划循环的先前方向差异来确定方向差异趋势。可选地生成方向趋势分数,例如,如上所述的f2(方向)。
应注意,如上文示出和描述的部件中的一些或全部可以在软件、硬件或其组合中实施。例如,此类部件可以实施为安装并存储在永久性存储装置中的软件,所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施贯穿本申请所述的过程或操作。替代地,此类部件可以实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或asic)、数字信号处理器(dsp)或现场可编程门阵列(fpga))中的可执行代码,所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可以实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。
图9是示出可以与本发明的一个实施方式一起使用的数据处理系统的示例的框图。例如,系统1500可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统,例如,图1的感知与规划系统110或者服务器103至104中的任一个。系统1500可以包括许多不同的部件。这些部件可以实施为集成电路(ic)、集成电路的部分、分立电子装置或适用于电路板(诸如,计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。
还应注意,系统1500旨在示出计算机系统的许多部件的高阶视图。然而,应当理解的是,某些实施例中可以具有附加的部件,此外,其它实施例中可以具有所示部件的不同布置。系统1500可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(pda)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(ap)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。
在一个实施方式中,系统1500包括通过总线或互连件1510连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可以表示一个或多个通用处理器,诸如,微处理器、中央处理单元(cpu)等。更具体地,处理器1501可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如,专用集成电路(asic)、蜂窝或基带处理器、现场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。
处理器1501(其可以是低功率多核处理器套接口,诸如超低电压处理器)可以充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(soc)。处理器1501配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可以包括与可选的图形子系统1504通信的图形接口,图形子系统1504可以包括显示控制器、图形处理器和/或显示装置。
处理器1501可以与存储器1503通信,存储器1503在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储。存储器1503可以包括一个或多个易失性存储(或存储器)装置,诸如,随机存取存储器(ram)、动态ram(dram)、同步dram(sdram)、静态ram(sram)或者其它类型的存储装置。存储器1503可以存储包括由处理器1501或任何其它装置执行的指令序列的信息。例如,各种操作系统、装置驱动程序、固件(例如,输入输出基本系统或bios)和/或应用的可执行代码和/或数据可以加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统,例如,机器人操作系统(ros)、来自
系统1500还可以包括io装置,诸如装置1505至1508,包括网络接口装置1505、可选的输入装置1506,以及其它可选的io装置1507。网络接口装置1505可以包括无线收发器和/或网络接口卡(nic)。所述无线收发器可以是wifi收发器、红外收发器、蓝牙收发器、wimax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(gps)收发器)或其它射频(rf)收发器或者它们的组合。nic可以是以太网卡。
输入装置1506可以包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504集成在一起)、指针装置(诸如,手写笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可以包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。
io装置1507可以包括音频装置。音频装置可以包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其它io装置1507还可以包括通用串行总线(usb)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,pci-pci桥)、传感器(例如,诸如加速度计运动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可以包括成像处理子系统(例如,相机),所述成像处理子系统可以包括用于促进相机功能(诸如,记录照片和视频片段)的光学传感器,诸如电荷耦合装置(ccd)或互补金属氧化物半导体(cmos)光学传感器。某些传感器可以经由传感器集线器(未示出)联接到互连件1510,而诸如键盘或热传感器的其它装置可以根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。
为了提供对诸如数据、应用、一个或多个操作系统等信息的永久性存储,大容量存储设备(未示出)也可以联接到处理器1501。在各种实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应性,这种大容量存储设备可以经由固态装置(ssd)来实施。然而,在其它实施方式中,大容量存储设备可以主要使用硬盘驱动器(hdd)来实施,其中较小量的ssd存储设备充当ssd高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储,从而使得在系统活动重新启动时能够实现快速通电。另外,闪存装置可以例如经由串行外围接口(spi)联接到处理器1501。这种闪存装置可以提供系统软件的非易失性存储,所述系统软件包括所述系统的bios以及其它固件。
存储装置1508可以包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质),其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可以表示上述部件中的任一个,例如,规划模块304和/或控制模块305。处理模块/单元/逻辑1528还可以在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内,数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可以通过网络经由网络接口装置1505进行传输或接收。
计算机可读存储介质1509也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且使得所述机器执行本发明的任何一种或多种方法。因此,术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质,或者任何其它非暂时性机器可读介质。
本文所述的处理模块/单元/逻辑1528、部件以及其它特征可以实施为分立硬件部件或集成在硬件部件(诸如,asics、fpga、dsp或类似装置)的功能中。此外,处理模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。
应注意,虽然系统1500被示出为具有数据处理系统的各种部件,但是并不旨在表示使部件互连的任何特定架构或方式;因为此类细节和本发明的实施方式没有密切关系。还应当认识到,具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可以与本发明的实施方式一起使用。
前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。
然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。
本发明的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“rom”)、随机存取存储器(“ram”)、磁盘存储介质、光存储介质、闪存存储器装置)。
前述附图中所描绘的过程或方法可以由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可以按不同的顺序执行。此外,一些操作可以并行地执行而不是顺序地执行。
本发明的实施方式并未参考任何特定的编程语言进行描述。应认识到,可以使用多种编程语言来实施如本文描述的本发明的实施方式的教导。
在以上的说明书中,已经参考本发明的具体示例性实施方式对本发明的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本发明的更宽泛精神和范围的情况下,可以对本发明作出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。