引导车辆行驶的方法及相关系统、存储介质与流程

文档序号：28487257发布日期：2022-01-15 01:31阅读：110来源：国知局

1.本技术涉及车辆技术领域，尤其涉及一种引导车辆行驶的方法及相关系统、存储介质。

背景技术：

2.在复杂城市道路场景中，车道级路径规划及导航引导直接影响自动驾驶系统的智能性、安全性和舒适性。特别地，与人类驾驶仅需提供粗略的语义级导航建议不同，自动驾驶系统必须依靠明确的、精准的、连续变化的导航信息才能完成自动驾驶任务。尤其，若提供的换道指引和换道紧急程度的信息能具备全局视野，将更有利于自动驾驶车辆对基于全局任务的导航换道与基于局部场景感知的超车换道等多源换道意图进行实时仲裁，从而做出更合理更智能的自动驾驶行为决策，表现出在陌生道路网络中更优于人类司机的智能驾驶行为。
3.目前智能驾驶系统中的车道级导航功能，仅能根据车辆前方最近路口信息进行局部车道级引导，满足车辆在过路口时的换道需求，但无法提供全局性引导，且非连续的引导信息无法满足自动驾驶车辆的实时换道决策需求；或者，仅提供一条能处理直行、转弯、掉头、路口等交通场景的全局引导线，实现从导航任务指定起点到指定目的点之间的全局引导，但该路线中换道位置等都是固定的，不能提供完备的路径选择空间，限制了自动驾驶车辆实时动态决策的自由度；或者，可以提供从出发点到目的点的多条车道级导航路径，选择通行成本低的导航路径为自动驾驶车辆提供导航引导，但提供的多条导航路径并没有适用于不同场景的评价引导机制，使得车辆没有足够的全局导航信息以结合实时动态交通信息进行更具前瞻性、更智能地行驶决策，无法满足真实的高实时高动态道路场景或商用自动驾驶车辆产品的需求。
4.因此，现有自动驾驶系统的车道级导航技术均只提供部分车道级规划轨迹及局部规划所需的车道信息，对多条备选的车道级规划路径缺乏合理评价和引导机制，不能提供选择空间更完备的、具备全局视野的、在实时动态场景中具有连续可比较性的导航引导信息，无法满足在高实时高动态的复杂城市道路场景中自动驾驶系统进行全局视野下实时行为决策的需求。

技术实现要素：

5.本技术公开了一种引导车辆行驶的方法及相关系统、存储介质，可以提高路径引导的可靠性。
6.第一方面，本技术实施例提供一种引导车辆行驶的方法，包括：通过路径规划获取车辆从出发点到目的点之间的k条路径，k为正整数；根据所述k条路径中每个参考区域计算所述每个参考区域的导航评价值，所述参考区域是通过将所述k条路径进行划分得到的区域；根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的全局评价值；根据所述每个参考区域到达目的点的全局评价值确定所述k条路径中每个参考区域的
每个位置到达目的点的全局评价值；当所述车辆位于所述k条路径中的第一位置时，根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，其中，所述第二位置为所述第一位置对应在可换道备选车道中的位置。
7.本技术实施例，通过根据k条路径中每个参考区域计算每个参考区域的导航评价值；基于每个参考区域的导航评价值确定所述每个参考区域到达目的点的全局评价值，进而得到每个位置到达目的点的全局评价值，当车辆位于该k条路径中的第一位置时，可确定第一位置的全局评价值，以及在可换道备选车道中的第二位置的全局评价值，进而确定目标路径，以引导车辆按照所述目标路径行驶。采用该手段，基于每个参考区域的导航评价值来评估每个参考区域到达目的点的全局评价值，进而在实时导航时将车辆的前瞻范围扩大到全局视野，提供完备的选择空间和连续可比较的车道评价值，从而引导车辆进行多源换道意图仲裁，选择合理的路径进行行驶，实现比人类司机更智能的自动驾驶决策。
8.其中，上述根据所述k条路径中每个参考区域计算所述每个参考区域的导航评价值，可以是基于所述k条路径中每个参考区域的换道时机、换道行为评价值中的至少一种确定的。
9.作为一种可选的实现方式，所述根据所述k条路径中每个参考区域计算所述每个参考区域的导航评价值，包括：根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值中的至少一种惩罚值，得到所述每个参考区域的换道行为评价值；根据所述每个参考区域的换道时机评价值和所述每个参考区域的换道行为评价值得到所述每个参考区域的导航评价值。
10.采用该手段，基于每个参考区域对应的剩余可行驶距离、单次换道行为惩罚值以及连续换道行为惩罚值、折返换道行为惩罚值来确定每个参考区域到达目的点的评价值，可评估自动驾驶车辆在该参考区域换道的合理性与换道成功率，从而使自动驾驶车辆在最合适的位置与时机换道到最优车道。
11.作为又一种可选的实现方式，所述k条路径中的参考区域包括至少一个风险区域，所述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区域中的至少一种，所述方法还包括：根据所述每个风险区域计算所述至少一个风险区域的风险评价值；所述根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的全局评价值，包括：根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的全局评价值。
12.采用该手段，基于风险区域计算每个风险区域的风险评价值，并基于导航评价值和该风险评价值来计算每个参考区域到达目的点的全局评价值，通过充分利用高精度地图的先验信息，提前感知自动驾驶任务出发点到目的点之间所有的风险区域，引导自动驾驶车辆在风险区域做出提前合理的决策，保证自动驾驶车辆的安全性。
13.作为一种可选的实现方式，所述参考区域包括第一参考区域、第二参考区域，所述第一参考区域为所述目的点对应在各车道中的区域，所述第二参考区域为与所述第一参考区域相邻、且位于所述目的点向出发点的方向的区域，所述根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的全局评价值，包括：根据每个第一参考区域的导航评价值和所述至少一个风险区域的风险评
价值，计算所述每个第一参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；根据所述每个第一参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第一参考区域到达所述目的点的全局评价值；根据每个第二参考区域的导航评价值和所述至少一个风险区域的风险评价值，以及所述每个第一参考区域到达所述目的点的全局评价值，得到所述每个第二参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；根据所述每个第二参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第二参考区域到达所述目的点的全局评价值，其中，所述每个参考区域到达目的点的全局评价值包括所述每个第一参考区域到达目的点的全局评价值和所述每个第二参考区域到达目的点的全局评价值。
14.上述每个第一参考区域换道到达所述目的点的全局评价值，可以是指所述每个第一参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值。
15.采用该手段，通过迭代计算不同车道位置、采取不同决策行为到达目的点的最优累计代价，不仅保证了最大实时决策空间，还可同时提供所有车道的最优路径引导信息，使自车在行驶时能结合动态信息进行合理决策，提升自动驾驶车辆的类人性。
16.作为一种可选的实现方式，所述方法还包括：根据所述车辆的单次换道行为惩罚值，确定所述第二位置的连续换道惩罚评价值以及折返换道惩罚评价值；根据所述第二位置的连续换道惩罚评价值、折返换道惩罚评价值，以及所述第二位置到达目的点的评价值确定所述第二位置到达目的点的全局参考评价值；所述根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，包括：根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局参考评价值确定所述目标路径。
17.采用该手段，在意图仲裁决策时，当第二位置的评价值优于第一位置的评价值时，基于车辆的单次换道行为惩罚值确定可换道备选车道中第二位置的连续换道惩罚评价值以及折返换道惩罚评价值，进而确定第二位置的全局参考评价值，以此来确定第一位置和第二位置中的最优评价值，即目标路径。通过考虑假设自动驾驶车辆从第一位置换道到第二位置之后的最优动作，使自动驾驶车辆尽量减少短距离连续换道和折返换道，提升自动驾驶车辆在行驶过程中的安全性和舒适性。
18.第二方面，本技术实施例提供一种引导车辆行驶的方法，包括：根据路径规划结果获取车辆从出发点到目的点之间的k条路径；根据所述k条路径中每个参考区域的换道时机以及换道行为计算所述每个参考区域的导航评价值；根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的评价值，其中，所述每个参考区域到达目的点的评价值是根据所述每个参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值确定的；当所述车辆位于所述k条路径中的第一位置时，根据所述每个参考区域到达目的点的评价值确定所述第一位置的评价值，以及第二位置的评价值，所述第二位置为所述第一位置对应在可换道备选车道中的位置；根据所述第一位置的评价值，以及所述第二位置的评价值确定目标路径，以引导所述车辆按照所述目标路径行驶。
19.本技术实施例，通过根据k条路径中每个参考区域的换道时机以及换道行为计算
每个参考区域的导航评价值；基于每个参考区域的导航评价值确定所述每个参考区域到达目的点的评价值，当车辆位于该k条路径中的第一位置时，基于每个参考区域到达目的点的评价值来确定第一位置的评价值，以及在可换道备选车道中的第二位置的评价值，进而确定目标路径，以引导车辆按照所述目标路径行驶。采用该手段，基于每个参考区域的导航评价值来评估每个参考区域到达目的点的评价值，进而在实时导航时将车辆的前瞻范围扩大到全局视野，提供完备的选择空间和连续可比较的车道评价值，从而引导车辆进行多源换道意图仲裁，选择合理的路径进行行驶，实现比人类司机更智能的自动驾驶决策。
20.作为一种可选的实现方式，所述根据所述k条路径中每个参考区域的换道时机以及换道行为计算所述每个参考区域的导航评价值，包括：根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值，得到所述每个参考区域的换道行为评价值；根据所述每个参考区域的换道时机评价值和所述换道行为评价值，得到所述每个参考区域的导航评价值。
21.采用该手段，基于每个参考区域对应的剩余可行驶距离、单次换道行为惩罚值以及连续换道行为惩罚值、折返换道行为惩罚值来确定每个参考区域到达目的点的评价值，可评估自动驾驶车辆在该参考区域换道的合理性与换道成功率，从而使自动驾驶车辆在最合适的位置与时机换道到最优车道。
22.作为又一种可选的实现方式，所述k条路径中的参考区域包括至少一个风险区域，所述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区域中的至少一种，所述方法还包括：根据所述每个风险区域的长度以及风险大小计算所述至少一个风险区域的风险评价值；所述根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的评价值，包括：根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的评价值。
23.采用该手段，基于风险区域的长度以及风险大小计算每个风险区域的风险评价值，并基于导航评价值和该风险评价值来计算每个参考区域到达目的点的评价值，通过充分利用高精度地图的先验信息，提前感知自动驾驶任务出发点到目的点之间所有的风险区域，引导自动驾驶车辆在风险区域做出提前合理的决策，保证自动驾驶车辆的安全性。
24.作为又一种可选的实现方式，所述参考区域包括第一参考区域、第二参考区域，所述第一参考区域为所述目的点对应在各车道中的区域，所述第二参考区域为与所述第一参考区域相邻、且位于所述目的点向出发点的方向的区域，所述根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的评价值，包括：根据每个第一参考区域的导航评价值和所述至少一个风险区域的风险评价值，计算所述每个第一参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值；根据所述每个第一参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值，确定所述每个第一参考区域到达所述目的点的评价值；根据每个第二参考区域的导航评价值和所述至少一个风险区域的风险评价值，以及所述每个第一参考区域到达所述目的点的评价值，得到所述每个第二参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值；根据所述每个第二参考区域
向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值，确定所述每个第二参考区域到达所述目的点的评价值，其中，所述每个参考区域到达目的点的评价值包括所述每个第一参考区域到达目的点的评价值和所述每个第二参考区域到达目的点的评价值。
25.采用该手段，通过迭代计算不同车道位置、采取不同决策行为到达目的点的最优累计代价，不仅保证了最大实时决策空间，还可同时提供所有车道的最优路径引导信息，使自车在行驶时能结合动态信息进行合理决策，提升自动驾驶车辆的类人性。
26.作为一种可选的实现方式，所述方法还包括：根据所述车辆的单次换道行为惩罚值，确定所述第二位置的连续换道惩罚评价值以及折返换道惩罚评价值；根据所述第二位置的连续换道惩罚评价值、折返换道惩罚评价值，以及所述第二位置的评价值确定所述第二位置的参考评价值；所述根据所述第一位置的评价值，以及所述第二位置的评价值确定目标路径，包括：根据所述第一位置的评价值、所述第二位置的参考评价值确定所述目标路径。
27.采用该手段，在意图仲裁决策时，当第二位置的评价值优于第一位置的评价值时，基于车辆的单次换道行为惩罚值确定可换道备选车道中第二位置的连续换道惩罚评价值以及折返换道惩罚评价值，进而确定第二位置的参考评价值，以此来确定第一位置和第二位置中的最优评价值，即目标路径。通过考虑假设自动驾驶车辆从第一位置换道到第二位置之后的最优动作，使自动驾驶车辆尽量减少短距离连续换道和折返换道，提升自动驾驶车辆在行驶过程中的安全性和舒适性。
28.第三方面，本技术实施例提供一种引导车辆行驶的装置，包括：获取模块，用于通过路径规划获取车辆从出发点到目的点之间的k条路径；第一计算模块，用于根据所述k条路径中每个参考区域计算所述每个参考区域的导航评价值，所述参考区域是通过将所述k条路径进行划分得到的区域；第二计算模块，用于根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的全局评价值；第一确定模块，用于根据所述每个参考区域到达目的点的全局评价值确定所述k条路径中每个参考区域的每个位置到达目的点的全局评价值；第二确定模块，用于当所述车辆位于所述k条路径中的第一位置时，根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，其中，所述第二位置为所述第一位置对应在可换道备选车道中的位置。
29.作为一种可选的实现方式，所述第一计算模块，用于：根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；
30.根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值中的至少一种惩罚值，得到所述每个参考区域的换道行为评价值；
31.根据所述每个参考区域的换道时机评价值和所述每个参考区域的换道行为评价值得到所述每个参考区域的导航评价值。
32.作为又一种可选的实现方式，所述k条路径中的参考区域包括至少一个风险区域，所述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区域中的至少一种，所述装置还包括第三计算模块，用于：根据所述每个风险区域计算所述至少一个风险区域的风险评价值；所述第二计算模块，还用于：根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的
全局评价值。
33.作为一种可选的实现方式，所述参考区域包括第一参考区域、第二参考区域，所述第一参考区域为所述目的点对应在各车道中的区域，所述第二参考区域为与所述第一参考区域相邻、且位于所述目的点向出发点的方向的区域，所述第二计算模块，还用于：根据每个第一参考区域的导航评价值和所述至少一个风险区域的风险评价值，计算所述每个第一参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；根据所述每个第一参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第一参考区域到达所述目的点的全局评价值；根据每个第二参考区域的导航评价值和所述至少一个风险区域的风险评价值，以及所述每个第一参考区域到达所述目的点的全局评价值，得到所述每个第二参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；根据所述每个第二参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第二参考区域到达所述目的点的全局评价值，其中，所述每个参考区域到达目的点的全局评价值包括所述每个第一参考区域到达目的点的全局评价值和所述每个第二参考区域到达目的点的全局评价值。
34.作为一种可选的实现方式，所述装置还包括第四计算模块，用于：根据所述车辆的单次换道行为惩罚值，确定所述第二位置的连续换道惩罚评价值以及折返换道惩罚评价值；根据所述第二位置的连续换道惩罚评价值、折返换道惩罚评价值，以及所述第二位置到达目的点的评价值确定所述第二位置到达目的点的全局参考评价值；所述第二确定模块，用于：根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局参考评价值确定所述目标路径。
35.第四方面，本技术实施例提供一种引导车辆行驶的装置，包括：获取模块，用于根据路径规划结果获取车辆从出发点到目的点之间的k条路径；第一计算模块，用于根据所述k条路径中每个参考区域的换道时机以及换道行为计算所述每个参考区域的导航评价值；第二计算模块，用于根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的评价值，其中，所述每个参考区域到达目的点的评价值是根据所述每个参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值确定的；第一确定模块，用于当所述车辆位于所述k条路径中的第一位置时，根据所述每个参考区域到达目的点的评价值确定所述第一位置的评价值，以及第二位置的评价值，所述第二位置为所述第一位置对应在可换道备选车道中的位置；第二确定模块，用于根据所述第一位置的评价值，以及所述第二位置的评价值确定目标路径，以引导所述车辆按照所述目标路径行驶。
36.作为一种可选的实现方式，所述第一计算模块，用于：根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值，得到所述每个参考区域的换道行为评价值；根据所述每个参考区域的换道时机评价值和所述换道行为评价值，得到所述每个参考区域的导航评价值。
37.作为一种可选的实现方式，所述k条路径中的参考区域包括至少一个风险区域，所述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区
域中的至少一种，所述装置还包括第三计算模块，用于：根据所述每个风险区域的长度以及风险大小计算所述至少一个风险区域的风险评价值；所述第二计算模块，还用于：根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的评价值。
38.作为一种可选的实现方式，所述参考区域包括第一参考区域、第二参考区域，所述第一参考区域为所述目的点对应在各车道中的区域，所述第二参考区域为与所述第一参考区域相邻、且位于所述目的点向出发点的方向的区域，所述第二计算模块还用于：根据每个第一参考区域的导航评价值和所述至少一个风险区域的风险评价值，计算所述每个第一参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值；根据所述每个第一参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值，确定所述每个第一参考区域到达所述目的点的评价值；根据每个第二参考区域的导航评价值和所述至少一个风险区域的风险评价值，以及所述每个第一参考区域到达所述目的点的评价值，得到所述每个第二参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值；根据所述每个第二参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值，确定所述每个第二参考区域到达所述目的点的评价值，其中，所述每个参考区域到达目的点的评价值包括所述每个第一参考区域到达目的点的评价值和所述每个第二参考区域到达目的点的评价值。
39.作为一种可选的实现方式，所述装置还包括第四计算模块，用于：根据所述车辆的单次换道行为惩罚值，确定所述第二位置的连续换道惩罚评价值以及折返换道惩罚评价值；根据所述第二位置的连续换道惩罚评价值、折返换道惩罚评价值，以及所述第二位置的评价值确定所述第二位置的参考评价值；所述第二确定模块，用于：根据所述第一位置的评价值、所述第二位置的参考评价值确定所述目标路径。
40.第五方面，本技术提供了一种引导车辆行驶的装置，包括处理器和存储器；其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如第一方面任一种可能的实施方式和第二方面任一种可能的实施方式所述的方法。
41.第六方面，本技术提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如第一方面任一种可能的实施方式和第二方面任一种可能的实施方式所述的方法。
42.第七方面，本技术提供了一种计算机程序产品，当计算机程序产品在计算机上运行时，使得所述计算机执行如第一方面任一种可能的实施方式和第二方面任一种可能的实施方式所述的方法。
43.第八方面，本技术提供了一种芯片系统，所述芯片系统应用于电子设备；所述芯片系统包括一个或多个接口电路，以及一个或多个处理器；所述接口电路和所述处理器通过线路互联；所述接口电路用于从所述电子设备的存储器接收信号，并向所述处理器发送所述信号，所述信号包括所述存储器中存储的计算机指令；当所述处理器执行所述计算机指令时，所述电子设备执行如第一方面任一种可能的实施方式和第二方面任一种可能的实施方式所述方法。
44.第九方面，本技术提供了一种智能驾驶车辆，包括行进系统、传感系统、控制系统和计算机系统，其中，所述计算机系统用于执行如第一方面任一种可能的实施方式和第二方面任一种可能的实施方式所述的方法。
45.可以理解地，上述提供的第三方面所述的装置、第四方面所述的装置、第五方面所述的引导车辆行驶的装置、第六方面所述的计算机可读存储介质或者第七方面所述的计算机程序产品、第八方面所述的芯片系统、第九方面所述的智能驾驶车辆，均用于执行第一方面中任一所提供的方法以及第二方面中任一所提供的方法。因此，其所能达到的有益效果可参考对应方法中的有益效果，此处不再赘述。
附图说明
46.下面对本技术实施例用到的附图进行介绍。
47.图1是本技术实施例提供的一种引导车辆行驶的系统架构示意图；
48.图2是本技术实施例提供的一种引导车辆行驶的方法的流程示意图；
49.图3是本技术实施例提供的一种路径规划结果示意图；
50.图4是本技术实施例提供的一种参考区域划分示意图；
51.图5是本技术实施例提供的一种确定第二位置的示意图；
52.图6是本技术实施例提供的另一种引导车辆行驶的方法的流程示意图；
53.图7是本技术实施例提供的一种车道场景示意图；
54.图8是本技术实施例提供的一种路点评价值分布示意图；
55.图9是本技术实施例提供的另一种车道场景示意图；
56.图10是本技术实施例提供的一种引导车辆行驶的装置的结构示意图；
57.图11是本技术实施例提供的另一种引导车辆行驶的装置的结构示意图。
具体实施方式
58.下面结合本技术实施例中的附图对本技术实施例进行描述。本技术实施例的实施方式部分使用的术语仅用于对本技术的具体实施例进行解释，而非旨在限定本技术。
59.参照图1所示，是本技术实施例提供的一种引导车辆行驶的系统架构示意图。该系统可包括：车道级路径规划模块、换道引导模块，以及换道意图仲裁与换道决策生成模块。其中，车道级路径规划模块根据高精度地图和驾驶任务的出发点、目的点确定出k条路径，k为正整数。换道引导模块可通过对所述k条路径的各车道进行区域划分，得到多个参考区域，根据所述k条路径中每个参考区域的换道时机以及换道行为计算所述每个参考区域的导航评价值(即导航代价)。进一步地，通过确定所述k条路径中包含风险区域的参考区域，进而计算得到所述k条路径中风险区域的风险评价值(即风险代价)。基于该每个参考区域的导航评价值以及包含风险区域的风险评价值，得到每个参考区域到达目的点的全局评价值。其中，每个参考区域到达目的点的评价值是通过进行全局最优代价计算得到的，具体地，任一参考区域到达目的点的评价值是根据该参考区域向左换道到达目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值中的最优评价值确定的。进一步地，基于每个参考区域到达目的点的评价值确定所述k条路径中每个位置到达目的点的全局评价值。然后，在实时导航过程中，根据车辆当前位置进行实时车道匹配，获
取车辆的当前所在车道和可选的换道备选车道，并获取当前车道和所有备选车道的全局评价值；从而换道意图仲裁与换道决策生成模块引导车辆按照目标路径行驶，实现比人类司机更智能的自动驾驶决策。其中，目标路径是根据所述当前车道和所有备选车道的评价值产生的导航换道意图、实时动态环境感知产生的其他换道意图，以及道路实时交通拥堵状态等确定的当前时刻自动驾驶收益最大的路径。
60.其中，上述导航评价值是用于根据导航信息(laneremain)评价车道某一位置好坏的指标，其可以理解为局部的代价值。上述全局评价值，可以理解为综合考虑了导航信息、风险信息而得到的评价车道某一位置好坏的指标，其可以理解为全局的代价值。
61.上述仅以本技术实施例应用于自动驾驶场景为例进行说明。其中，本技术提供的引导车辆行驶的方法，还可以应用于辅助驾驶场景，本方案对此不做具体限定。
62.本实施例可以由车载装置(如车机)来执行，其还可以由手机、电脑等终端设备来执行。本方案对此不做具体限定。
63.需要说明的是，本技术提供的引导车辆行驶的方法，可以在本地执行，也可以由云端执行。其中，云端可以由服务器来实现，该服务器可以是虚拟服务器、实体服务器等，其还可以是其他装置，本方案对此不做具体限定。
64.参照图2所示，是本技术实施例提供的一种引导车辆行驶的方法流程示意图。该方法可包括步骤201-205，具体如下：
65.201、通过路径规划获取车辆从出发点到目的点之间的k条路径；
66.优选地，根据道路级全局路径规划结果获取车辆从出发点到目的点之间的k条路径，其中，该k条路径为车道级全局规划路径结果对应的路径，k为正整数。
67.上述道路级全局路径规划结果，可以理解为：基于标准精度或高精度地图描述的路网模型，结合自动驾驶任务的给定出发点和目的点，按照性能指标(时间最短、距离最短、红绿灯路口最少、智能驾驶区域范围最大等)规划出能从出发点到达目的点、由一系列前后拓扑相连的道路段构成的一条最优路径。
68.车道级全局路径规划结果，可以理解为由同一条道路级全局规划路径结果中所有道路段包含的若干车道段构成，沿道路级全局规划路径结果方向且保证各车道段前后拓扑相连，尽可能覆盖道路级全局规划路径结果但不具有相互包含关系的所有路径。
69.车道级全局路径规划结果不仅能表征道路级全局规划路径结果中各车道段之间的前后拓扑连接关系，还能表征各车道段本身的属性信息，从而提供更丰富更精确的车道级导航引导，其包括当前车道是否可向左/右换道、当前位置虚线可换道剩余长度、当前位置到路口/终点的距离等。
70.具体地，根据高精度地图以及出发点、途经点和目的点可获取道路级全局路径规划结果和车道级全局路径规划结果。
71.例如图3所示，从出发点(如图3中的点a)到目的点(如图3中的点b)之间的道路级全局路径规划结果为：道路1-1
→
道路1-2
→
道路1-3
→
道路1-4。
72.从出发点到目的点之间的车道级全局路径规划结果为：
73.路径1：由道路1-1、1-2、1-3的车道1纵向连通构成，记为：r1-1l1
→
r1-2l1
→
r1-3l1；
74.该r1-1l1表示道路1-1上的车道1，相应地，r1-2l1表示道路1-2上的车道1，r1-3l1
表示道路1-3上的车道1。
75.路径2：由道路1-1、1-2、1-3的车道2纵向连通构成，记为：r1-1l2
→
r1-2l2
→
r1-3l2；
76.同样地，r1-1l2表示道路1-2上的车道2，r1-2l2表示道路1-2上的车道2，r1-3l2表示道路1-3上的车道2。
77.路径3：由道路1-1、1-2、1-3的车道3纵向连通构成，记为：r1-1l3
→
r1-2l3
→
r1-3l3；
78.路径4：由道路1-1、1-2、1-3的车道4以及道路1-4的车道1连通构成，记为：r1-1l4
→
r1-2l4
→
r1-3l4
→
r1-4l1。
79.此时，上述k为4。
80.202、根据所述k条路径中每个参考区域计算所述每个参考区域的导航评价值；
81.上述参考区域可以是通过对各车道进行预设距离的划分得到的多个区域。
82.具体地，从目的点开始，对其所在的车道进行预设距离的划分，进而得到目的点所在车道对应的多个参考区域；以此类推，对其他车道也进行相应划分，进而可得到k条路径的参考区域。上述预设距离例如可以是50m，100m等，本方案对此不做具体限制。
83.需要说明的是，当上述预设距离足够小时，上述参考区域也可以理解为足够小的区域，此时上述参考区域即为车道中的各个位置。
84.上述对车道的划分是按照均匀划分来说的，其也可以是按照不同距离来进行划分，例如，各车道初始以间隔5m进行划分，然后依次以间隔10m、15m、20m等进行划分，本方案对此不做具体限制。
85.上述根据所述k条路径中每个参考区域计算所述每个参考区域的导航评价值，可以是根据所述k条路径中每个参考区域的换道时机计算所述每个参考区域的导航评价值，也可以是根据所述k条路径中每个参考区域的换道行为计算所述每个参考区域的导航评价值，还可以是根据所述k条路径中每个参考区域的换道时机和换道行为计算所述每个参考区域的导航评价值，本方案对此不做具体限定。
86.其中，根据车辆在各路径中的换道时机(换道位置)的不同，对应的换道代价也不同。例如，当剩余换道距离足够长时，即使很密集的车流，自车也可以缓慢行驶并等待合适的换道时机，以保证换道的安全性和舒适性。当剩余换道距离较短时，自车则可能不足以完成换道。
87.上述换道行为，可以包括单次换道、多次换道等。该多次换道可包括连续换道、折返换道等。连续换道例如可以是从车道1换道到车道2，又从车道2换道到车道3；折返换道例如可以是从车道1换道到车道2，又从车道2换回到车道1等。
88.在自车行驶过程中，换道次数越多，则风险越大，所以，在自动驾驶任务中一般尽量减少换道次数，避免无效换道。
89.可以理解，对于折返换道，先向左换道再向右换道，或者先向右换道再向左换道，其两次换道可以视作无效换道。
90.其中，上述步骤202可包括：
91.根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；
92.根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值中的至少一种惩罚值，得到所述每个参考区域的换道行为评价值；
93.根据所述每个参考区域的换道时机评价值和所述换道行为评价值，得到所述每个参考区域的导航评价值。
94.需要说明的是，上述基于剩余可行驶距离来评估每个参考区域的换道时机评价值，当然，还可以基于其他参数来评估换道时机评价值，本方案对此不做具体限定。
95.本实施例中的上述单次换道行为惩罚值，可以设为固定值，例如可以是150。上述连续换道行为惩罚值，例如可以是80。上述折返换道行为惩罚值，例如可以是360。当然，还可以是其他数值，或者不是固定值等，本方案对此不做具体限定。
96.上述根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值，得到所述每个参考区域的换道行为评价值，具体可以基于如下方式得到：
97.calclccost(lane)＝α*(ω*actionlccost)+β*continuouslccost；
98.其中，calclccost(lane)表示换道行为评价值，α、β均为系数，actionlccost为单次换道行为惩罚项，ω与换道行为的横向偏移量有关，continuouslccost为连续换道行为惩罚项或折返换道行为惩罚项。
99.具体地，continuouslccost可以基于如下方式得到：
[0100][0101]
其中，上述maxdis为固定值，其表示系统可容忍连续换道或折返换道的最小距离。其中，在该距离内，若出现了两次同方向的换道行为则认为是连续换道，若出现了两次相反方向的换道行为则认为是折返换道。distonextaction表示自车当前所处区域到下一次换道行为的距离，对应计算连续换道代价或折返换道代价，其中两次换道动作越近，惩罚值越大；上述actioncost为连续换道行为惩罚或者折返换道行为惩罚。
[0102]
采用该手段，基于每个参考区域对应的剩余可行驶距离、单次换道行为惩罚值以及连续换道行为惩罚值、折返换道行为惩罚值来确定每个参考区域的导航评价值，可评估自动驾驶车辆在该参考区域换道的合理性与换道成功率，从而使自动驾驶车辆在最合适的位置与时机换道到最优车道。
[0103]
203、根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的全局评价值；
[0104]
具体地，基于每个参考区域的导航评价值以及该参考区域的前一参考区域(近目的点方向)到达所述目的点的全局评价值，综合得到该参考区域到达所述目的点的全局评价值。其中，每个参考区域到达所述目的点的全局评价值为每个参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值中的最优值。
[0105]
也就是说，通过递归计算来得到每个参考区域到达目的点的全局评价值。
[0106]
上述每个参考区域到达目的点的全局评价值可以是根据该参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值确定的。可以理解为，例如，每个参考区域到达目的点的全局评价值可以是该参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述
目的点的评价值三者中数值大小超出预设阈值的评价值，或者三者中数值大小小于预设阈值的评价值。
[0107]
具体地，上述全局评价值是该参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值三者中的最优值。即，当评价值越大越好时，则上述评价值是三者中的最大值；当评价值越小越好时，则上述评价值是三者中的最小值。
[0108]
具体如图4所示，基于车道划分，可得到4个第一参考区域a1、a2、a3、a4，以及4个第二参考区域b1、b2、b3、b4，以及4个第三参考区域等(图中未示出)。
[0109]
该第一参考区域a1、a2、a3、a4是目的点q对应在各车道中的区域。可以理解为，对目的点q所在的车道由目的点开始间隔预设距离划分得到第一参考区域a4，然后基于第一参考区域a4，得到与其平行的其他各车道的第一参考区域a1、a2、a3，基于该手段得到第一参考区域。当然，还可以是以目的点所在的水平线为起始，间隔预设距离对各车道进行划分，进而得到每个第一参考区域。
[0110]
以此类推，间隔预设距离可得到每个第二参考区域b1、b2、b3、b4。
[0111]
其中，根据每个第一参考区域a1、a2、a3、a4的换道时机评价值和换道行为评价值计算所述每个第一参考区域向左换道的导航评价值、向右换道的导航评价值以及直行的导航评价值。
[0112]
由于第一参考区域为目的点对应在各车道中的区域，也就是说，第一参考区域相邻的前一区域不存在，因此可直接根据所述每个第一参考区域向左换道到达所述目的点的导航评价值、向右换道到达所述目的点的导航评价值以及直行到达所述目的点的导航评价值，确定所述每个第一参考区域的评价值。
[0113]
进而，根据每个第二参考区域b1、b2、b3、b4的换道时机评价值和换道行为评价值，以及所述每个第一参考区域的导航评价值，得到所述每个第二参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值；然后根据所述每个第二参考区域向左换道到达所述目的点的评价值、向右换道到达所述目的点的评价值以及直行到达所述目的点的评价值，确定每个第二参考区域的全局评价值。
[0114]
具体地，以第一参考区域a1为例进行说明。第一参考区域a1仅可以直行和向右换道。由于直行无法到达目的点q，因此，最优动作是向右换道。根据第一参考区域a1的换道时机评价值和换道行为评价值得到第一参考区域a1向右换道到达所述目的点的导航评价值，此时由于第一参考区域a1直行无法到达所述目的点，且第一参考区域a1无法向左换道，因此第一参考区域a1向右换道到达所述目的点的导航评价值，即为第一参考区域a1到达所述目的点的评价值。
[0115]
对于第二参考区域b1的评价值，由于第二参考区域b1可以直行到达目的点或者向右换道到达目的点，因此：
[0116]
第二参考区域b1直行到达目的点q的全局评价值，可以通过计算该第二参考区域b1直行的换道时机评价值和换道行为评价值，然后基于第二参考区域b1相邻的第一参考区域a1的评价值，得到第二参考区域b1直行到达所述目的点的全局评价值。
[0117]
第二参考区域b1向右换道到达目的点q的全局评价值，可以通过计算该第二参考区域b1向右换道的换道时机评价值和换道行为评价值，然后基于换道后相邻的第一参考区
域a2的评价值，得到第二参考区域b1向右换道到达所述目的点的全局评价值。
[0118]
基于第二参考区域b1直行到达所述目的点的评价值和向右换道到达所述目的点的评价值，将最优值对应的评价值作为该第二参考区域b1的全局评价值。
[0119]
然后，再根据每个第二参考区域的全局评价值来得到每个第三参考区域的全局评价值。以此类推，直到得到每个参考区域的全局评价值。
[0120]
采用该手段，通过迭代计算不同车道位置、采取不同决策行为到达目的点的最优累计代价，不仅保证了最大实时决策空间，还可同时提供所有车道的最优路径引导信息，使自车在行驶时能结合动态信息进行合理决策，提升自动驾驶车辆的类人性。
[0121]
204、根据所述每个参考区域到达目的点的全局评价值确定所述k条路径中每个位置到达目的点的全局评价值；
[0122]
可选的，对于任一位置，当其所处的参考区域的导航评价值为1000，其长度为50m，该位置处于该参考区域中从出发点到目的点方向10m处，则该位置的评价值为1000*(50-10)/50，即800。
[0123]
可替代的，可以基于该位置所处的参考区域的导航评价值以及与其相邻的位于目的点方向的参考区域的全局评价值来确定该位置的全局评价值。
[0124]
具体地，将该位置所处的参考区域相邻的近目的点方向的参考区域的评价值作为第一位置所处的参考区域的终点位置(近目的点位置)的评价值，将该位置所处的参考区域的评价值作为该参考区域的起点位置(近出发点位置)的评价值，然后将该两个评价值之间的数值平滑分配到每个路点上，进而可得到每个位置的评价值。
[0125]
当然，还可以采用其他手段确定每个位置的评价值。本方案对此不做具体限定。
[0126]
205、当所述车辆位于所述k条路径中的第一位置时，根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，其中，所述第二位置为所述第一位置对应在可换道备选车道中的位置。
[0127]
具体地，通过获取第一位置对应的可换道备选车道，并确定第一位置对应在可换道备选车道中的位置，进而基于上述k条路径中每个位置到达目的点的全局评价值得到第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值。
[0128]
上述第一位置对应在可换道备选车道中的位置，可以理解为，所述k条路径中除所述第一位置外与第一直线相交的位置，所述第一直线为经过所述第一位置且与所述第一位置所在道路方向垂直的直线，所述第二位置所在车道的行驶方向与所述第一位置所在车道的行驶方向一致。
[0129]
如图5所示，车辆位于车道1的第一位置p处，通过位置p作与车道方向垂直的直线l，其中，l与车道1、车道2、车道3均相交。由于车道5的行驶方向与车道1的行驶方向相反，因此将车道4、车道5排除。即，车道2中的位置q1、车道3中的位置q2均为上述第二位置。
[0130]
其中，该第二位置可以是一个，也可以是多个，本方案对此不做具体限定。
[0131]
上述目标路径为所述第一位置的评价值以及所述第二位置的评价值中评价值最优的位置所在的路径。
[0132]
例如，该最优可以是评价值最高，或者评价值最低，或者超出预设阈值，不大于预设阈值等，本方案对此不做具体限定。
[0133]
需要说明的是，本技术实施例中步骤204和步骤205可以替换为：当所述车辆位于
所述k条路径中的第一位置时，根据所述每个参考区域到达目的点的全局评价值得到所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，进而基于第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径。上述仅为一种示例，本方案对此不做具体限定。
[0134]
其中，在步骤205之前，当第二位置的全局评价值优于第一位置的全局评价值时，所述方法还包括：
[0135]
根据所述车辆的单次换道行为惩罚值，确定所述第二位置的连续换道惩罚评价值以及折返换道惩罚评价值；
[0136]
根据所述第二位置的连续换道惩罚评价值、折返换道惩罚评价值，以及所述第二位置到达目的点的全局评价值确定所述第二位置到达目的点的全局参考评价值；
[0137]
所述根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，包括：
[0138]
根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局参考评价值确定所述目标路径。
[0139]
上述第二位置的参考评价值，可以理解为，在第二位置的全局评价值优于第一位置的全局评价值时，即最优动作是换道到第二位置时，会存在潜在的连续换道惩罚或者折返换道惩罚。因此，通过将该部分换道后可能引起的代价考虑进去，然后再次评估第一位置的全局评价值、第二位置的全局参考评价值中的最优评价值，进而最终确定目标路径。
[0140]
也就是说，在进行最优路径选择时，还包括对该最优动作动态引起的连续换道、折返换道等潜在行为带来的惩罚评价值进行计算，然后基于上述计算得到的第一位置的评价值、第二位置的评价值，综合评估最终的最优路径，即目标路径。
[0141]
具体地，当第二位置的评价值优于第一位置的评价值，当前最优动作是向左换道时，所述第二位置的连续换道惩罚评价值可以理解为自车从右侧车道换道到该第二位置所在的目标车道，且该目标车道可能会再次向左换道而带来的连续换道惩罚，其可以表示为：
[0142]
changefromright＝α*(ω*actionlccost)+β*actioncost(continous)；
[0143]
所述第二位置的折返换道惩罚评价值可以理解为自车从右侧车道换道到该第二位置所在的目标车道后，又从该目标车道向右换回去所带来的连续换道惩罚，其可以表示为：
[0144]
changefromleft＝α*(ω*actionlccost)+β*actioncost(turnback)。
[0145]
当第二位置的评价值优于第一位置的评价值，当前最优动作是向右换道时，所述第二位置的连续换道惩罚评价值可以理解为自车从左侧车道换道到该第二位置所在的目标车道，且该目标车道可能会再次向右换道而带来的连续换道惩罚，其可以表示为：
[0146]
changefromleft＝α*(ω*actionlccost)+β*actioncost(continous)；
[0147]
所述第二位置的折返换道惩罚评价值可以理解为自车从左侧车道换道到该第二位置所在的目标车道后，又从该目标车道向左换回去所带来的连续换道惩罚，其可以表示为：
[0148]
changefromright＝α*(ω*actionlccost)+β*actioncost(turnback)。
[0149]
当第二位置的评价值与第一位置的评价值之间的差值在预设范围内时，此时最优动作为沿着第一位置保持直行，则考虑到可能存在潜在的一次向左/向右换道动作，则计算
连续换道惩罚评价值以及折返换道惩罚评价值：
[0150][0151][0152]
采用该手段，在意图仲裁决策时，基于车辆的单次换道行为惩罚值确定可换道备选车道中第二位置的连续换道惩罚评价值以及折返换道惩罚评价值，进而确定第二位置的参考评价值，以此来确定第一位置和第二位置中的最优评价值，即目标路径。通过考虑假设自动驾驶车辆从第一位置换道到第二位置之后的最优动作，使自动驾驶车辆尽量减少短距离连续换道和折返换道，提升自动驾驶车辆在行驶过程中的安全性和舒适性。
[0153]
本技术实施例，通过根据k条路径中每个参考区域的换道时机以及换道行为计算每个参考区域的导航评价值；基于每个参考区域的导航评价值确定所述每个参考区域到达目的点的评价值，进而得到每个位置到达目的点的评价值，当车辆位于该k条路径中的第一位置时，可确定第一位置的评价值，以及在可换道备选车道中的第二位置的评价值，进而确定目标路径，以引导车辆按照所述目标路径行驶。采用该手段，基于每个参考区域的导航评价值来评估每个参考区域到达目的点的评价值，进而在实时导航时将车辆的前瞻范围扩大到全局视野，提供完备的选择空间和连续可比较的车道评价值，从而引导车辆进行多源换道意图仲裁，选择合理的路径进行行驶，实现比人类司机更智能的自动驾驶决策。
[0154]
参照图6所示，是本技术实施例提供的另一种引导车辆行驶的方法流程示意图。其中，该实施例中k条路径中的参考区域包括至少一个风险区域，所述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区域中的至少一种。该方法可包括步骤601-606，具体如下：
[0155]
601、根据路径规划结果获取车辆从出发点到目的点之间的k条路径；
[0156]
优选地，根据道路级全局路径规划结果获取车辆从出发点到目的点之间的k条路径，其中，该k条路径为车道级全局规划路径结果对应的路径。
[0157]
具体地，根据高精度地图以及出发点、途经点和目的点可获取道路级全局路径规划结果和车道级全局路径规划结果。
[0158]
602、根据每个风险区域的长度以及风险大小计算所述至少一个风险区域的风险评价值；
[0159]
上述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区域中的至少一种。
[0160]
当然，上述仅以部分为例来说明风险区域，其还可以是其他区域等，本方案对此不做具体限定。
[0161]
其中，在实际道路场景中，最左侧车道或者最右侧车道经常会有违停车辆，还会有电动车和行人等突然出现，且右边道出现这些危险场景的概率大于左边道。当自车经过这一区域时，经常需要大幅度避让、借相邻车道避让甚至发生危险等。因此引入边道风险，迫
使自车尽量远离边道，且右边道风险大于左边道风险。
[0162]
在城区道路中，公交专用道是一种常见的车道类型。为了让自车不在公交车专用时间段驶入公交车道，本方案引入公交车道风险。该风险能迫使自车不在非必须情况下占用公交车道行驶。
[0163]
在城区道路有很多公交车站，经常会有公交车在停靠车道临时停车。若是自车也行驶于有停靠车道的车道就会经常被公交车逼停，影响自车通行效率和乘车体验，因此引入停靠车道风险，以迫使自车尽量不行驶在有停靠车道的车道上。
[0164]
自车行驶于高架上或高速道路时，车速很快。在匝道汇入或汇出的地方，会有他车需要加速汇入或者减速汇出。若自车车道前方有匝道口，为保证安全需要频繁减速加速，影响驾驶安全和乘车体验，所以引入匝道口风险，使得自车尽量避开匝道口行驶。
[0165]
在车道数量变化点、道路数量变化点等处易于他车交互，有碰撞风险。
[0166]
可选的，上述边道的风险大小、公交车道的风险大小、停靠车道的风险大小、匝道口的风险大小、车道数量变化区域的风险大小和道路数量变化区域的风险大小，可以为不同大小的预设值等。例如，左边道风险为0.6/m，右边道风险为1.2/m，豁口风险为3/m，停靠车道风险为10/m，道路分裂风险为0.3/m，道路合并中主路风险为1.5/m，辅路为6/m等，本方案对此不做具体限定。
[0167]
其中，若某区域对应的风险有多种时，可以根据预设权重进行计算。
[0168]
上述风险区域的长度可以不大于对应的参考区域的长度。当然，当风险区域的长度较大时，风险区域还可以对应至少两个参考区域等。
[0169]
采用该手段，基于风险区域的长度以及风险大小计算每个风险区域的风险评价值，并基于导航评价值和该风险评价值来计算每个参考区域到达目的点的评价值，通过充分利用高精度地图的先验信息，提前感知自动驾驶任务出发点到目的点之间所有的风险区域，引导自动驾驶车辆在风险区域做出提前合理的决策，保证自动驾驶车辆的安全性。
[0170]
603、根据所述k条路径中每个参考区域的换道时机以及换道行为计算所述每个参考区域的导航评价值；
[0171]
其中，该参考区域可以是根据预设间隔进行划分得到的。
[0172]
可替代的，可基于上述风险区域来确定参考区域。例如，可直接将风险区域确定为参考区域，同时，对于该车道中不包含风险区域的部分，则可按照预设间隔进行划分，进而得到该车道的所有参考区域。
[0173]
其中，风险区域的大小可任意设定，例如，风险区域包括在该风险区域开始之前的10m，以及在该风险区域结束之后的10m内的区域，当然还可以基于其他方式确定风险区域的大小，本方案对此不做具体限定。
[0174]
步骤603具体可包括：
[0175]
根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；
[0176]
根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值，得到所述每个参考区域的换道行为评价值；
[0177]
根据所述每个参考区域的换道时机评价值和所述换道行为评价值，得到所述每个参考区域的导航评价值。
[0178]
其中，该实现方式可参阅前述实施例的介绍，在此不再赘述。
[0179]
604、根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，计算所述每个参考区域到达目的点的全局评价值；
[0180]
其中，通过确定风险区域所处的参考区域，进而基于该参考区域的导航评价值，以及风险评价值，得到该参考区域到达目的点的全局评价值。
[0181]
具体地，所述参考区域可包括第一参考区域、第二参考区域，所述第一参考区域为所述目的点对应在各车道中的区域，所述第二参考区域为与所述第一参考区域相邻、且位于所述目的点向出发点的方向的区域，所述根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，计算所述每个参考区域到达目的点的全局评价值，包括：
[0182]
根据每个第一参考区域的导航评价值和所述至少一个风险区域的风险评价值，计算所述每个第一参考区域向左换道到达所述目的点的全局评价值、向右换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；
[0183]
根据所述每个第一参考区域向左换道到达所述目的点的全局评价值、向右换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第一参考区域到达所述目的点的全局评价值；
[0184]
根据每个第二参考区域的导航评价值和所述至少一个风险区域的风险评价值，以及所述每个第一参考区域到达所述目的点的全局评价值，得到所述每个第二参考区域向左换道到达所述目的点的全局评价值、向右换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；
[0185]
根据所述每个第二参考区域向左换道到达所述目的点的全局评价值、向右换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第二参考区域到达所述目的点的全局评价值，其中，所述每个参考区域到达目的点的全局评价值包括所述每个第一参考区域到达目的点的全局评价值和所述每个第二参考区域到达目的点的全局评价值。
[0186]
也就是说，基于每个参考区域的导航评价值和其对应的风险区域的风险评价值，以及该参考区域的前一参考区域(近目的点方向)到达所述目的点的全局评价值，综合得到该参考区域到达所述目的点的全局评价值。其中，每个参考区域到达所述目的点的全局评价值为每个参考区域向左换道到达所述目的点的全局评价值、向右换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值中的最优值。
[0187]
具体结合图4，以第一参考区域a1为例进行说明。第一参考区域a1仅可以直行和向右换道。由于直行无法到达目的点q，因此，最优动作是向右换道。根据第一参考区域a1向右换道的导航评价值以及第一参考区域a1对应的风险评价值(由于该区域不是风险区域，其风险评价值为0)可得到第一参考区域a1向右换道到达目的点的全局评价值；由于第一参考区域a1直行无法到达所述目的点，且第一参考区域a1无法向左换道，因此第一参考区域a1向右换道到达所述目的点的全局评价值，即为第一参考区域a1到达所述目的点的全局评价值。
[0188]
对于第二参考区域b1的全局评价值，由于第二参考区域b1可以直行到达目的点或者向右换道到达目的点，因此：
[0189]
第二参考区域b1直行到达目的点q的全局评价值，可以基于该第二参考区域b1直
行的导航评价值，以及第二参考区域b1对应的风险评价值(由于该区域不是风险区域，其风险评价值为0)，以及基于第二参考区域b1相邻的第一参考区域a1的全局评价值，得到第二参考区域b1直行到达所述目的点的全局评价值。
[0190]
第二参考区域b1向右换道到达目的点q的全局评价值，可以通过计算该第二参考区域b1向右换道的导航评价值，以及第二参考区域b1对应的风险评价值、换道后相邻的第一参考区域a2的风险评价值(由于该区域不是风险区域，其风险评价值为0)、换道后相邻的第一参考区域a2的全局评价值，得到第二参考区域b1向右换道到达所述目的点的全局评价值。
[0191]
基于第二参考区域b1直行到达所述目的点的全局评价值和向右换道到达所述目的点的全局评价值，将最优值对应的评价值作为该第二参考区域b1的全局评价值。
[0192]
然后，再根据每个第二参考区域的全局评价值以及每个第三参考区域的导航评价值、以及相应风险区域的风险评价值，来得到每个第三参考区域的全局评价值。以此类推，直到得到每个参考区域的全局评价值。
[0193]
采用该手段，通过迭代计算不同车道位置、采取不同决策行为到达目的点的最优累计评价，不仅保证了最大实时决策空间，还可同时提供所有车道的最优路径引导信息，使自车在行驶时能结合动态信息进行合理决策，提升自动驾驶车辆的类人性。
[0194]
605、根据所述每个参考区域到达目的点的全局评价值得到每个位置的全局评价值；
[0195]
优选地，可以基于该位置所处的参考区域的导航评价值以及与其相邻的位于目的点方向的参考区域的全局评价值来确定该位置的全局评价值。
[0196]
具体地，将该位置所处的参考区域相邻的近目的点方向的参考区域的评价值作为第一位置所处的参考区域的终点位置(近目的点位置)的评价值，将该位置所处的参考区域的评价值作为该参考区域的起点位置(近出发点位置)的评价值，然后将该两个评价值之间的数值平滑分配到每个路点上，进而可得到每个位置的评价值。
[0197]
当然，还可以采用其他手段确定每个位置的评价值。本方案对此不做具体限定。
[0198]
606、当所述车辆位于所述k条路径中的第一位置时，根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，其中，所述第二位置为所述第一位置对应在可换道备选车道中的位置。
[0199]
具体地，通过获取第一位置对应的可换道备选车道，并确定第一位置对应在可换道备选车道中的位置，进而基于上述得到的每个位置的全局评价值来确定第一位置的全局评价值以及第二位置的全局评价值。
[0200]
其中，该第二位置可以是一个，也可以是多个，本方案对此不做具体限定。
[0201]
所述目标路径为所述第一位置的全局评价值以及所述第二位置的全局评价值中评价值最优的位置所在的路径。
[0202]
例如，该最优可以是全局评价值最高，或者全局评价值最低，或者超出预设阈值，不大于预设阈值等，本方案对此不做具体限定。
[0203]
需要说明的是，本技术实施例中步骤605和步骤606可以替换为：当所述车辆位于所述k条路径中的第一位置时，根据所述每个参考区域到达目的点的全局评价值得到所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，进而
基于第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径。上述仅为一种示例，本方案对此不做具体限定。
[0204]
本技术实施例，通过根据k条路径中每个参考区域的换道时机、换道行为确定每个参考区域的导航评价值，基于每个风险区域的长度以及风险大小计算所述至少一个风险区域的风险评价值，进而基于每个参考区域的导航评价值和对应的风险评价值得到每个参考区域到达目的点的全局评价值，进一步得到每个位置的全局评价值；当车辆位于该k条路径中的第一位置时，根据第一位置的全局评价值，以及在可换道备选车道中的第二位置的全局评价值，进而确定目标路径，以引导车辆按照所述目标路径行驶。采用该手段，基于每个参考区域的换道时机、换道行为确定的导航评价以及风险区域的风险评价来评估每个参考区域到达目的点的全局评价值，更加全面，进而在实时导航时将车辆的前瞻范围扩大到全局视野，提供完备的选择空间和连续可比较的车道评价值，从而引导车辆进行多源换道意图仲裁，选择合理的路径进行行驶。
[0205]
实施例一
[0206]
如图7所示，为本技术实施例提供的一种车道场景示意图。该场景中路径2和路径3可以到达目的点q。路径3中有停靠车道，路径1、2和3中均有豁口。基于上述风险区域，将该三条路径进行了划分，均包括片段1、片段2、片段3、片段4、片段5和片段6。可以理解，本实施例的片段即为前述实施例中的参考区域。
[0207]
设定左边道风险＝0.6/m，右边道风险＝1.2/m。
[0208]
其中，路径2和路径3对应的片段6中具有右边道风险。假设片段6的长度为33.6m，对于片段6的评价值可以表示为：
[0209]
curoptimalcost＝nextoptimalcost(keep)+navicost(keep)+rcost(keep)
[0210]
＝0+0+1.2/m*33.6m＝40.32：
[0211]
其中，navicost(keep)为片段6的导航评价值，rcost(keep)为片段6的风险评价值，nextoptimalcost(keep)为片段6的下一片段的评价值(该实施例中片段6的下一片段不存在，因此其评价值为0)。
[0212]
对于片段5，当自车行驶在路径1时，由于左边没有可换道车道，故自车有两种动作，保持直行和向右换道。由于需要到达目的点q，且片段5只有24.67m，而设定该车完成一次平滑的换道需要25m，因此对于路径1的片段5，无法完成一次换道，只能保持直行，而保持直行无法抵达目的点，因此设定自车行驶到该车道的该片段时评价值无穷大，以便抑制自车行驶到该车道的该片段。
[0213]
对于路径2和路径3，其评价值可以表示为：
[0214]
curoptimalcost＝nextoptimalcost(keep)+navicost(keep)+rcost(keep)
[0215]
＝40.32+0+1.2/m*24.67m＝69.92；
[0216]
对于片段4，路径1对应的长度为37.5m，自车行驶在该路径时，可以保持直行和向右换道。由于片段4中保持直行直到片段5，仍然无法抵达目的点，因此对于路径1，仅考虑向右换道的导航评价值为：
[0217]
curoptimalcost(right)＝nextoptimalcost(right)+navicost(right)+rcost(right)＝69.92+1329.83+0.6/m*37.5m/2+1.2/m*37.5m/2＝1433.5；
[0218]
其中，navicost＝calclrcost(lane)+calclccost(lane)＝1123.03+4.136m/
3.0m*150.0＝1329.83；
[0219]
上述换道时机评价值calclrcost(lane)为1123.03，其是基于当前离路径1终点较近，换道时机较差而计算得到的；上述换道行为评价值calclccost(lane)是基于路径1中的车道中心线与路径2中的车道中心线之间的距离4.136m，以及平均车道宽度3.0m、平均换道代价150.0得到的。
[0220]
需要说明的是，本实施例中设定自车在当前片段的中心瞬间完成换道动作到达目标片段的中心，因此风险评价值的计算包含当前片段的风险评价值的1/2以及目标片段的风险评价值的1/2。
[0221]
相应地，自车行驶在路径2、3的片段4上时，可以保持直行、向左换道。由于向左换道无法到达目的点，因此，路径2、3在片段4的最优动作均为保持直行。
[0222]
curoptimalcost(keep)＝nextoptimalcost(keep)+navicost(keep)+rcost(keep)＝69.92+0+1.2/m*37.5m＝114.92；
[0223]
以此类推，依次可计算得到片段3、片段2和片段1的评价值。
[0224]
基于上述得到每个片段的导航评价值后，本方案将每条路径插值生成若干路点，并将片段的评价值平滑分配到每个路点上。
[0225]
如图8所示，为路径2、3的片段5对应的路点评价值部分结果示意图。其中，该片段5的第一个路点的评价值为上一片段(片段6)的评价值40.32，该片段5的最后一个路点的评价值是片段5的评价值69.92，中间每个路点按线性变化，例如基于该片段5的长度设定平均分配n个点，则基于该n个点在该片段中的位置，以及上述评价值40.32和69.92，计算该n个点中每个点对应的评价值。
[0226]
进一步地，基于上述计算得到每个片段的每一个路点的全局评价值。在自车行驶时，首先匹配离自车最近的路点，再确定自车同行驶方向的其他可换道车道的路点，这样就得到自车行驶方向横向所有路点的信息。基于某一路点的全局评价值来代替该位置处车道的评价值，也就是说，基于得到的横向所有路点的信息即得到了横向所有车道的评价值。根据横向所有车道的评价值，可以实时计算自车换道到其他车道的收益，即导航换道意图。再叠加其他的换道意图，如驾驶员拨杆换道意图或者紧急换道意图，同时加上动态评价值，即自车从右边换道到目标车道则加上从右边换道的代价changefromright，反之则加上从左边换道的代价changefromleft(可参照图2所述实施例中的介绍)，综合比较各种换道意图优先级的大小，可确定目标车道。
[0227]
本技术实施例，从目的点开始，依次评估每条路径中每个片段对应的向左换道，向右换道和保持直行的评价值，进而得到每条路径中每个片段对应的最优评价值；其中，通过不断迭代，可得到从出发点到目的点的每条路径中每个片段对应的在静态无车流情况下的最优动作和对应评价值。
[0228]
实施例二
[0229]
参照图9所示，为本技术实施例提供的另一种引导车辆行驶的场景示意图。本实施例的场景包括小s弯。对于小s弯，将从点a到点b的轨迹称之为顺小s弯换道，将从点a到点c的轨迹称之为逆小s弯换道，保持直行称为小s弯保持。
[0230]
对于同样一次换道，逆小s弯换道比起正常的向右换道，其轨迹更平滑，变道过程中自车方向姿态变化小；而顺小s弯换道幅度明显大于正常的一次向左变道；对于保持直
行，普通道路结构保持直行方向基本不变，而小s弯保持则需要调整方向。也就是说，顺小s弯的一次换道代价大于普通换道代价，逆小s弯的一次换道代价小于普通换道代价，小s弯保持的代价大于正常的保持直行。
[0231]
其中，片段中是否包含小s弯，对于风险评价值的计算并不影响，而对于导航评价navicost＝calclrcost(lane)+calclccost(lane)，其中：
[0232]
换道行为评价值calclccost(lane)＝α*(ω*actionlccost)+β*continuouslccost；
[0233]
对于小s弯场景，ω＝f(ep，sl)/lw；
[0234]
其中，ep表示当前动作的目标位置，sl表示当前车道中心线所在的位置，lw表示车道宽度；f(ep，sl)用于表征当前动作的目标位置到当前车道中心线的距离，ω是当前动作的目标位置到当前车道中心线的距离与车道宽度的比值。
[0235]
作为一种示例，基于上述计算公式，可计算得到图9中的小s弯向左换道的ω1为1.676；小s弯保持的ω2为0.676；小s弯向右换道的ω3为0.324。也就是说，逆小s弯换道的代价很小，在曲率较大的时候甚至比保持直行还小。
[0236]
除此之外，将小s弯保持直行分为小s弯向左保持直行和小s弯向右保持直行，即将小s弯保持直行既看做直行，也等效成一种特殊的换道，考虑连续换道的惩罚。也就是说，如果自车先向右换道再沿小s弯向左保持直行，则认为这是一次不推荐的换道，因为用户体验上会感觉到车在来回变道。本实施例引入小s弯换道代价和小s弯连续换道惩罚代价的目的是为了抑制在小s弯附近发起来回换道，促进借助小s弯的曲线发起一次平滑的换道。
[0237]
假设目的点设置在无穷远处，且当前的路径中至少有一条可以到达目的点。同时令α＝1.0，actionlccost＝150，仅考虑边道风险，左边道风险为0.2，右边道风险为0.4，每0.3m生成一个路点，考虑下一片段的长度为50m，离下一个路口为400m。
[0238]
当自车在a点，下一路口为直行时，假设下一片段向左换道到达目的点的评价值、向右换道到达目的点的评价值以及直行到达目的点的评价值相同，则：
[0239]
此时向左换道的导航评价为：
[0240]
小s弯向左换道navicost1＝calclrcost(lane)+calclccost(lane)＝0+1.676*150＝251.4；
[0241]
小s弯保持navicost2＝calclrcost(lane)+calclccost(lane)＝0+0.676*150＝101.4；
[0242]
小s弯向右换道navicost3＝calclrcost(lane)+calclccost(lane)＝0+0.324*150＝58.6；
[0243]
基于上述导航评价，考虑到由于中间车道没有风险，因此只需比较保持直行和向右换道。
[0244]
向右换道的风险评价为rcost(right)＝50/0.3*0.4＝66.7；
[0245]
则向右换道的总评价为58.6+66.7＝125.3＞101.4，即此处的最优动作为保持直行。
[0246]
当自车在a点，下一路口为左转时，自车需要向左换道。该向左换道可以分为在小s弯之前向左换道(假设在小s弯前100m)，在小s弯向左换道，以及在小s弯之后(假设在小s弯后100m)向左换道。
[0247]
其中，如果在小s弯之前400米内发起换道，且换道方向与小s弯方向相同，则认为在小s弯附近完成了一次连续换道，惩罚评价与换道点距小s弯距离成反比，最大为80。如果换道方向与小s弯方向相反，则认为在小s弯附近完成了一次折返换道，惩罚代价与换道点距小s弯距离成反比，最大为400。
[0248]
此时的导航评价为：
[0249]
navicost1＝calclrcost(lane)+calclccost(lane)＝50+1.0*150+300/400*80＝260；
[0250]
navicost2＝calclrcost(lane)+calclccost(lane)＝100+1.676*150＝351.4；
[0251]
navicost3＝calclrcost(lane)+calclccost(lane)＝200+1.0*150＝350；
[0252]
此时风险评价可以认为是相同的。其中，在小s弯之前更早地向左发起换道是最优选择，在小s弯发起换道是最差的选择，甚至比过了小s弯换道更差(此时换道时机评价明显增大)。这是因为顺着小s弯换道横向偏移更大，通行优先级对应的路权较低，更容易换道失败导致人为干预，因此要抑制这种换道行为。
[0253]
当自车在a点，下一路口为右转时，自车要通过右转，需要向右换道。该向右换道可以分为在小s弯之前向右换道(假设在小s弯前100米)，在小s弯向右换道，以及在小s弯之后(假设在小s弯后100米)向右换道。
[0254]
同样考虑连续换道惩罚和折返换道惩罚，此时导航评价为：
[0255]
navicost1＝calclrcost(lane)+calclccost(lane)＝50+1.0*150+300/400*400＝500；
[0256]
navicost2＝calclrcost(lane)+calclccost(lane)＝100+0.324*150＝158.6；
[0257]
navicost3＝calclrcost(lane)+calclccost(lane)＝200+1.0*150＝350；
[0258]
此时风险评价可以认为是相同的。其中，借助小s弯发起一次换道是最优选择，在小s弯前发起换道是最差的选择，甚至比过了小s弯换道更差，因为此时体验上会感觉到明显的来回换道。而逆小s弯换道横向偏移小，通行优先级对应的路权较高，比普通的换道更容易，因此鼓励这种换道行为。
[0259]
当然，本实施例未考虑各种风险的影响，且没有考虑动态车流，实际中还需要考虑小s弯的大小(以横向偏移量来评估)来仲裁意图，但是从上述实施例可以理解本方案如何通过一次代价的横向偏移权重以及连续换道惩罚、折返换道惩罚来实现在小s弯附近发起一次时机和意图合理的换道。
[0260]
本实施例中，自动驾驶车辆在行驶过程中考虑了轨迹的平顺性，对小s弯处的换道动作时机的选择有较好的效果，结合动态意图仲裁可以提高换道成功率，降低接管率。
[0261]
与现有技术相比，本方案在导航评价设计时，考虑换道前后的姿态(即横向偏移量)和后续可能发生的换道行为对本次换道的影响，引导自车在最合适的位置换道，避免了运动规划频繁大幅避让，保证了车辆运动动作的连续性和平顺性。
[0262]
参照图10所示，为本技术实施例提供的一种引导车辆行驶的装置的示意图。该装置包括获取模块1001、第一计算模块1002、第二计算模块1003、第一确定模块1004以及第二确定模块1005，具体如下：
[0263]
获取模块1001，用于通过路径规划获取车辆从出发点到目的点之间的k条路径；
[0264]
第一计算模块1002，用于根据所述k条路径中每个参考区域计算所述每个参考区
域的导航评价值；
[0265]
第二计算模块1003，用于根据所述每个参考区域的导航评价值确定所述每个参考区域到达目的点的全局评价值；
[0266]
第一确定模块1004，用于根据所述每个参考区域到达目的点的全局评价值确定所述k条路径中每个参考区域的每个位置到达目的点的全局评价值；
[0267]
第二确定模块1005，用于当所述车辆位于所述k条路径中的第一位置时，根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局评价值，确定目标路径，其中，所述第二位置为所述第一位置对应在可换道备选车道中的位置。
[0268]
其中，所述第一计算模块1002，用于：
[0269]
根据所述k条路径中每个参考区域对应的剩余可行驶距离，得到所述每个参考区域的换道时机评价值；
[0270]
根据所述车辆的单次换道行为惩罚值、连续换道行为惩罚值以及折返换道行为惩罚值中的至少一种惩罚值，得到所述每个参考区域的换道行为评价值；
[0271]
根据所述每个参考区域的换道时机评价值和所述每个参考区域的换道行为评价值得到所述每个参考区域的导航评价值。
[0272]
可选的，所述k条路径中的参考区域包括至少一个风险区域，所述风险区域包括边道、公交车道、停靠车道、匝道口、车道数量变化区域和道路数量变化区域中的至少一种，所述装置还包括第三计算模块，用于：
[0273]
根据所述每个风险区域计算所述至少一个风险区域的风险评价值；
[0274]
所述第二计算模块1003，还用于：
[0275]
根据所述每个参考区域的导航评价值以及所述至少一个风险区域的风险评价值，确定所述每个参考区域到达目的点的全局评价值。
[0276]
可选的，所述参考区域包括第一参考区域、第二参考区域，所述第一参考区域为所述目的点对应在各车道中的区域，所述第二参考区域为与所述第一参考区域相邻、且位于所述目的点向出发点的方向的区域，所述第二计算模块1003，还用于：
[0277]
根据每个第一参考区域的导航评价值和所述至少一个风险区域的风险评价值，计算所述每个第一参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；
[0278]
根据所述每个第一参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第一参考区域到达所述目的点的全局评价值；
[0279]
根据每个第二参考区域的导航评价值和所述至少一个风险区域的风险评价值，以及所述每个第一参考区域到达所述目的点的全局评价值，得到所述每个第二参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值；
[0280]
根据所述每个第二参考区域换道到达所述目的点的全局评价值以及直行到达所述目的点的全局评价值，确定所述每个第二参考区域到达所述目的点的全局评价值，其中，所述每个参考区域到达目的点的全局评价值包括所述每个第一参考区域到达目的点的全局评价值和所述每个第二参考区域到达目的点的全局评价值。
[0281]
所述装置还包括第四计算模块，用于：
[0282]
根据所述车辆的单次换道行为惩罚值，确定所述第二位置的连续换道惩罚评价值
以及折返换道惩罚评价值；
[0283]
根据所述第二位置的连续换道惩罚评价值、折返换道惩罚评价值，以及所述第二位置到达目的点的全局评价值确定所述第二位置到达目的点的全局参考评价值；
[0284]
所述第二确定模块1005，用于：
[0285]
根据所述第一位置到达所述目的点的全局评价值以及第二位置到达所述目的点的全局参考评价值确定所述目标路径。
[0286]
需要说明的是，上述图10所示的各模块的具体实现可参阅前述实施例中方法的相关步骤的介绍，在此不再赘述。
[0287]
在本实施例中，该引导车辆行驶的装置是以模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specific integrated circuit，asic)，执行一个或多个软件或固件程序的处理器和存储器，集成逻辑电路，和/或其他可以提供上述功能的器件。
[0288]
此外，以上获取模块1001、第一计算模块1002、第二计算模块1003、第一确定模块1004以及第二确定模块1005可通过图11所示的引导车辆行驶的装置的处理器1102来实现。
[0289]
图11是本技术实施例提供的引导车辆行驶的装置的硬件结构示意图。图11所示的引导车辆行驶的装置1100(该装置1100具体可以是一种计算机设备)包括存储器1101、处理器1102、通信接口1103以及总线1104。其中，存储器1101、处理器1102、通信接口1103通过总线1104实现彼此之间的通信连接。
[0290]
存储器1101可以是只读存储器(read only memory，rom)，静态存储设备，动态存储设备或者随机存取存储器(random access memory，ram)。
[0291]
存储器1101可以存储程序，当存储器1101中存储的程序被处理器1102执行时，处理器1102和通信接口1103用于执行本技术实施例的引导车辆行驶的方法的各个步骤。
[0292]
处理器1102可以采用通用的中央处理器(central processing unit，cpu)，微处理器，应用专用集成电路(application specific integrated circuit，asic)，图形处理器(graphics processing unit，gpu)或者一个或多个集成电路，用于执行相关程序，以实现本技术实施例的引导车辆行驶的装置中的单元所需执行的功能，或者执行本技术方法实施例的引导车辆行驶的方法。
[0293]
处理器1102还可以是一种集成电路芯片，具有信号的处理能力。在实现过程中，本技术的引导车辆行驶的方法的各个步骤可以通过处理器1102中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1102还可以是通用处理器、数字信号处理器(digital signal processing，dsp)、专用集成电路(asic)、现成可编程门阵列(field programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1101，处理器1102读取存储器1101中的信息，结合其硬件完成本技术实施例的引导车辆行驶的装置中包括的单元所需执行的功能，或者执行本技术方法实施例的引导车辆行
驶的方法。
[0294]
通信接口1103使用例如但不限于收发器一类的收发装置，来实现装置1100与其他设备或通信网络之间的通信。例如，可以通过通信接口1103获取数据。
[0295]
总线1104可包括在装置1100各个部件(例如，存储器1101、处理器1102、通信接口1103)之间传送信息的通路。
[0296]
应注意，尽管图11所示的装置1100仅仅示出了存储器、处理器、通信接口，但是在具体实现过程中，本领域的技术人员应当理解，装置1100还包括实现正常运行所必须的其他器件。同时，根据具体需要，本领域的技术人员应当理解，装置1100还可包括实现其他附加功能的硬件器件。此外，本领域的技术人员应当理解，装置1100也可仅仅包括实现本技术实施例所必须的器件，而不必包括图11中所示的全部器件。
[0297]
本技术实施例提供一种芯片系统，所述芯片系统应用于电子设备；所述芯片系统包括一个或多个接口电路，以及一个或多个处理器；所述接口电路和所述处理器通过线路互联；所述接口电路用于从所述电子设备的存储器接收信号，并向所述处理器发送所述信号，所述信号包括所述存储器中存储的计算机指令；当所述处理器执行所述计算机指令时，所述电子设备执行上述方法。
[0298]
本技术实施例提供一种智能驾驶车辆，包括行进系统、传感系统、控制系统和计算机系统，其中，所述计算机系统用于执行上述方法。
[0299]
本技术实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机或处理器上运行时，使得计算机或处理器执行上述任一个方法中的一个或多个步骤。
[0300]
本技术实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机或处理器上运行时，使得计算机或处理器执行上述任一个方法中的一个或多个步骤。
[0301]
所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应步骤过程的具体描述，在此不再赘述。
[0302]
应理解，在本技术的描述中，除非另有说明，“/”表示前后关联的对象是一种“或”的关系，例如，a/b可以表示a或b；其中a，b可以是单数或者复数。并且，在本技术的描述中，除非另有说明，“多个”是指两个或多于两个。“以下至少一项(个)”或其类似表达，是指的这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b，或c中的至少一项(个)，可以表示：a，b，c，a-b，a-c，b-c，或a-b-c，其中a，b，c可以是单个，也可以是多个。另外，为了便于清楚描述本技术实施例的技术方案，在本技术的实施例中，采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定，并且“第一”、“第二”等字样也并不限定一定不同。同时，在本技术实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念，便于理解。
[0303]
在本技术所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以
通过其它的方式实现。例如，该单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0304]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0305]
在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照本技术实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-only memory，rom)，或随机存取存储器(random access memory，ram)，或磁性介质，例如，软盘、硬盘、磁带、磁碟、或光介质，例如，数字通用光盘(digital versatile disc，dvd)、或者半导体介质，例如，固态硬盘(solid state disk，ssd)等。
[0306]
以上所述，仅为本技术实施例的具体实施方式，但本技术实施例的保护范围并不局限于此，任何在本技术实施例揭露的技术范围内的变化或替换，都应涵盖在本技术实施例的保护范围之内。因此，本技术实施例的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙凯;张叶青;陈宇航
技术所有人：华为技术有限公司
我是此专利的发明人

上一篇：一种微波化冻尸体冷藏装置的制作方法
上一篇：一种糖苷化反应催化剂、糖苷化方法和应用与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、林老师：1.智能驾驶技术研究 2.智能汽车人机交互研究 3.自动驾驶预期功能安全及可靠性 4.驾驶功能与车辆动力学数据融合 5.驾驶场景大数据分析技术 6.车辆性能研究
2、朱老师：1.新能源汽车电驱动技术 2.轮毂电机驱动与控制 3.开关磁阻电机驱动系统控制 4.智能电动汽车
3、徐老师：1.内燃机节能及排放控制技术 2.汽车节能与新能源汽车技术 3. 车辆现代设计理论与方法
4、王老师：1.机械设计原理与方法 2.生理系统耦合及生物力学 3.康复工程学
5、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
如您是高校老师，可以点此联系我们加入专家库。