不确定性检测模型的训练、不确定性的检测方法及装置与流程

文档序号:28592063发布日期:2022-01-22 08:55阅读:162来源:国知局
不确定性检测模型的训练、不确定性的检测方法及装置与流程

1.本发明实施例涉及自动驾驶的技术领域,尤其涉及一种不确定性检测模型的训练、不确定性的检测方法及装置。


背景技术:

2.自动驾驶技术在近年来随着通信技术的发展更进一步成为引人注目的项目之一,智慧交通智慧城市等概念的兴起更是给人们的思维带来了更多的突破。
3.自动驾驶技术的整个系统框架从功能性上可以分为以下几大部分:车外环境及道路感知部分、路径规划部分、车内系统行为决策部分。可以看出,自动驾驶技术很多部分依赖车外环境及道路感知部分,在车辆单体感知外部环境的部分,又可以分为前车运动状态检测、行人与障碍物检测、和可行驶区域检测等等。
4.由于自动驾驶感知的障碍物多是路上处于运动状态,受限于传感器的精度、检测的算法等因素,使得检测这些障碍物的误差较大,从而影响自动驾驶的决策,自动驾驶的风险性较高。


技术实现要素:

5.本发明实施例提出了一种不确定性检测模型的训练、不确定性的检测方法及装置,以解决自动驾驶检测障碍物的误差较大、导致自动驾驶的风险性较高的问题。
6.第一方面,本发明实施例提供了一种不确定性检测模型的训练方法,包括:
7.获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据;
8.针对每帧所述感知数据检测所述障碍物的多个属性;
9.根据多个所述属性计算检测所述障碍物时存在的不确定性,作为真实值;
10.加载不确定性检测模型,所述不确定性检测模型用于计算检测所述障碍物单个所述属性时存在的不确定性;
11.以单个所述属性形成的时间序列作为样本、所述真实值作为标签,训练所述不确定性检测模型。
12.第二方面,本发明实施例还提供了一种不确定性的检测方法,应用于车辆,所述方法包括:
13.对处于运动状态的障碍物采集多帧感知数据;
14.针对每帧所述感知数据检测所述障碍物的单个属性;
15.加载如第一方面所述的方法训练的不确定性检测模型,所述不确定性检测模型用于计算检测所述障碍物单个所述属性时存在的不确定性;
16.将单个所述属性形成的时间序列输入所述不确定性检测模型中,计算检测所述障碍物单个所述属性时存在的不确定性。
17.第三方面,本发明实施例还提供了一种不确定性检测模型的训练装置,包括:
18.感知数据获取模块,用于获取车辆在行驶时,对处于运动状态的障碍物采集的多
帧感知数据;
19.多属性检测模块,用于针对每帧所述感知数据检测所述障碍物的多个属性;
20.真实值计算模块,用于根据多个所述属性计算检测所述障碍物时存在的不确定性,作为真实值;
21.模型加载模块,用于加载不确定性检测模型,所述不确定性检测模型用于计算检测所述障碍物单个所述属性时存在的不确定性;
22.模型训练模块,用于以单个所述属性形成的时间序列作为样本、所述真实值作为标签,训练所述不确定性检测模型。
23.第四方面,本发明实施例还提供了一种不确定性的检测装置,应用于车辆,所述装置包括:
24.感知数据采集模块,用于对处于运动状态的障碍物采集多帧感知数据;
25.单属性检测模块,用于针对每帧所述感知数据检测所述障碍物的单个属性;
26.模型加载模块,用于加载如第一方面所述的方法训练的不确定性检测模型;
27.不确定性检测模块,用于将单个所述属性形成的时间序列输入所述不确定性检测模型中,计算检测所述障碍物单个所述属性时存在的不确定性。
28.第五方面,本发明实施例还提供了一种计算机设备,所述计算机设备包括:
29.一个或多个处理器;
30.存储器,用于存储一个或多个程序,
31.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的不确定性检测模型的训练方法或者如第二方面所述的不确定性的检测方法。
32.第六方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的不确定性检测模型的训练方法或者如第二方面所述的不确定性的检测方法。
33.在本实施例中,获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据,针对每帧感知数据检测障碍物的多个属性,根据多个属性计算检测障碍物时存在的不确定性,作为真实值,加载不确定性检测模型,不确定性检测模型用于计算检测障碍物单个属性时存在的不确定性,以单个属性形成的时间序列作为样本、真实值作为标签,训练不确定性检测模型,本实施例综合多个属性可计算精确的不确定性的真实值,提供了训练的标签,实现了自监督训练不确定性检测模型的模式,使得加载不确定性检测模型的车辆可以在自动驾驶的过程中准确地计算检测障碍物单个属性时存在的不确定性,为自动驾驶的决策提供新的信息,提高自动驾驶的安全性。
附图说明
34.图1为本发明实施例一提供的一种不确定性检测模型的训练方法的流程图;
35.图2是本发明实施例二提供的一种不确定性的检测方法的流程图;
36.图3为本发明实施例二提供的一种车辆的结构示意图;
37.图4为本发明实施例三提供的一种不确定性检测模型的训练装置的结构示意图;
38.图5为本发明实施例四提供的一种不确定性的检测装置的结构示意图;
39.图6为本发明实施例五提供的一种计算机设备的结构示意图。
具体实施方式
40.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
41.实施例一
42.图1为本发明实施例一提供的一种不确定性检测模型的训练方法的流程图,本实施例可适用于训练用于计算检测障碍物时的不确定性检测模型的情况,该方法可以由不确定性检测模型的训练装置来执行,该不确定性检测模型的训练装置可以由软件和/或硬件实现,可配置在计算机设备中,例如,服务器、工作站、个人电脑,等等,具体包括如下步骤:
43.步骤101、获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据。
44.本实施例中的车辆可支持自动驾驶(含远程控制),所谓自动驾驶,可以指车辆本身拥有环境感知、路径规划并且自主实现车辆控制的能力,也就是用电子技术控制车辆进行的仿人驾驶。
45.根据对车辆操控任务的把握程度,自动驾驶车辆可以分为l0非自动化(no automotion)、l1驾驶人辅助(driver assistance)、l2部分自动化(partial automation)、l3有条件自动化(conditional automation)、l4高自动化(high automation)、l5全自动化(full automation)。
46.本实施例中自动驾驶的车辆,可以指满足l1-l5中任一要求的车辆,其中,系统在l1-l3起辅助功能,当到达l4,车辆驾驶将交给系统,因此,自动驾驶的车辆可选为满足l4、l5中任一要求的车辆。
47.车辆在自动驾驶的过程中,可以调用安装在该车辆上的传感器(如相机、激光雷达、毫米波雷达、麦克风等)持续采集感知数据,形成一系列的感知数据。
48.一般情况下,多种不同的传感器可以通过特定的同步器同时采集一帧感知数据,即,一个周期中采集到大数据,以便多种感知数据同时检测同一个障碍物(其他车辆、行人等),提高检测的精确度。
49.示例性地,车辆安装有激光雷达lidar,车辆在自动驾驶的过程中,可以持续驱动激光雷达旋转,在旋转的过程中扫描车辆周围环境的点云,点云与图像数据可同时用于感知,那么,激光雷达旋转一周的时间可视为同一周期,在激光雷达扫描到第一相机的可视范围时,由特定的同步器触发第一相机曝光采集得到第一图像数据,在激光雷达扫描到第二相机的可视范围时,由特定的同步器触发第二相机曝光采集得到第二图像数据。
50.步骤102、针对每帧感知数据检测障碍物的多个属性。
51.在实际应用中,自动驾驶使用每帧感知数据对处于运动状态的障碍物进行感知,可以检测得到障碍物的多个属性,包括但并不限于检测障碍物的类型(或称类别)、形状、位置(即定位)、速度、加速度、朝向角度,等等。
52.在一个示例中,对于激光雷达(lidar)点云感知,点云障碍物感知的主要任务是感知障碍物的位置、大小、类别、朝向、轨迹、速度等,核心是点云检测分割技术,感知的算法可以包括如下至少一种:
53.1、启发式ncut
54.将点云转化为拓扑图分割问题,利用图聚类的方法(ncut)解决问题,每一簇即为一个障碍物。
55.2、深度学习方法:cnnseg
56.利用卷积神经网络来处理激光雷达捕获的点云数据,并对点云中的目标进行识别;关键词:数据驱动、特征学习。
57.在某个实现方式中,可以包括如下部分:
58.s1、前视图(front-view):将所有点云都投到前视图(front-view)(投影面是一个圆柱面)来构造特征,将点云问题转化为矩阵问题,进而使用深度学习进行处理。通过构建全卷积神经网络对前向视图进行处理。
59.s2、制作俯视图:借助自采集车队,采集更多的实际数据,并且扩展数据视角,制作俯视图,通过将俯视图+前视图相结合的方式进行训练。同时,修改loss函数,包括使用3d回归和segmentation的损失函数。
60.但是,俯视图没有高度信息,于是把前视图和相机camera图像加进来进行辅助检查,综合了激光雷达lidar测距准和相机camera识别准的优点,应用middle-level fusion方法(multi-view 3d object detection network for autonomous driving),该方法使用俯视图提取proposal,利用前视图和光学图像辅助进行更加精准的位置回归。
61.在另一个示例中,对于相机camera图像的视觉感知,视觉感知最早从adas(高级驾驶辅助系统)发展而来(adas采用人工构造的特征,使用浅层分类器),目前的方式已经变为深度学习与后处理计算,其特点是计算硬件要求升级、数据需求量大增、安全性评估的变化。
62.面向自动驾驶的深度学习的特点:2d感知向3d感知渗透,模型输出更丰富(后处理需要的3d信息、跟踪信息、属性信息等都会放在cnn(卷积神经网络)中进行学习);环视能力构建(传统方法靠一个camera完成前向检测、碰撞检测、车道线检测。无人驾驶需要环视);感知、定位与地图紧密结合。
63.感知的算法可以包括如下至少一种:
64.1、自动驾驶领域的cnn检测
65.场景有几何约束(规则道路),可以辅助检测。
66.模型输出需要更加丰富,从detectation(检测),2d to 3d(二维转三维)至tracking(追踪)。
67.多任务学习(学习多种障碍物特征),网络结构适配。
68.属性识别,不仅限于障碍物级别的输出。
69.2、cnn分割
70.分割与检测有相似之处,但是分割粒度更细,相比于检测的“画框”,它要求边缘分割。
71.3、后处理
72.2d-to-3d的几何计算:需要考虑相机位姿的影响、接地点、稳定性
73.时序信息计算(针对跟踪处理):相机帧率与延时的要求、跟踪不能耗费太多时间、利用检测模块的输出进行跟踪;考虑轻量级的metric learning(度量学习)。
74.多相机的环视融合:相机布局决定融合策略,要做好视野重叠。
75.步骤103、根据多个属性计算检测障碍物时存在的不确定性,作为真实值。
76.不确定性,可以指对障碍物检测的属性在数值上的相对熵,对于不同状态量的属性而言,不确定性的表现形式有所不同,例如,对于一维状态量是一个单独的方差数字,二维的状态量是一个协方差,等等。
77.针对单一属性的检测,其不确定性的波动较大,综合多个属性的检测,可以降低不确定性的波动,从而提高度量不确定性的准确性,记为不确定性的真实值。
78.在本发明的一个实施例中,步骤103可以包括如下步骤:
79.步骤1031、按照每个属性与检测障碍物时存在的不确定性之间的相关性,将每个属性映射为相关值。
80.障碍物不同的属于对于不确定性存在不同程度的相关性,因此,可以按照既定的映射关系,将每个属性映射为相关值,以表征其对于不确定性的相关性。
81.在具体实现中,障碍物的属性包括如下的至少一种:
82.感知数据的帧数,障碍物的长度,障碍物与车辆之间的距离,障碍物的速度。
83.其中,帧数与不确定性负相关,即,感知数据的帧数越多,各个属性的不确定性越低,反之,感知数据的帧数越少,各个属性的不确定性越高。
84.长度与不确定性正相关,即,长度越长,各个属性的不确定性越高,反之,长度越短,各个属性的不确定性越低。
85.距离与不确定性正相关,即,距离越长,各个属性的不确定性越高,反之,距离越短,各个属性的不确定性越低。
86.速度与不确定性正相关,即,速度越快,各个属性的不确定性越高,反之,速度越慢,各个属性的不确定性越低。
87.在一个示例中,对于感知数据的帧数,可以计算帧数与预设的第一常数之间的第一比值,以自然数为底、第一比值的负数为指数,计算相关值。
88.对于障碍物的长度,可以计算长度与预设的第二常数之间的第二比值,以自然数为底、第二比值为指数,计算相关值。
89.对于障碍物与车辆之间的距离,可以计算距离与预设的第三常数之间的第三比值,以自然数为底、第三比值为指数,计算相关值。
90.对于障碍物的速度,可以计算速度与预设的第四常数之间的第四比值,以自然数为底、第四比值为指数,计算相关值。
91.当然,上述属性及其相关性的计算方法只是作为示例,在实施本发明实施例时,可以根据实际情况设置其它属性及其相关性的计算方法,本发明实施例对此不加以限制。另外,除了上述属性及其相关性的计算方法外,本领域技术人员还可以根据实际需要采用其它属性及其相关性的计算方法,本发明实施例对此也不加以限制。
92.步骤1032、对相关值进行融合,获得检测障碍物时存在的不确定性,作为真实值。
93.不同属性的相关值可以作为计算不确定性真值的参数,因此,针对不同属性的相关值可以按照其对于不确定性的相关性进行融合,从而得到检测障碍物的属性(数值)时存在的、整体性的不确定性,作为真实值,本实施例综合参考多个属性,考虑的情况更加全面,可以计算精确度更高的不确定性。
94.在具体实现中,该融合可以为线性融合,即,对每个属性对应的相关值乘以与属性对应的权重,作为调权相关性。
95.对于不同类型的障碍物,检测的属性一般有所不同,因此,为平衡这种情况,可以预先设置基准系数,作为计算不确定性的背景值,以此提高度量不确定性的精确度,此时,将所有调权相关性与预设的基准系数之间的和值设置检测障碍物时存在的不确定性,作为真实值。
96.此时,不确定性的真实值的计算过程如下表示:
[0097][0098]
其中,σ为不确定性的真实值,n
seq
为感知数据的帧数,r
seq
为帧数对应的权重,k
seq
为第一常数,length为障碍物的长度,r
lenth
为长度对应的权重,k
lenth
为第二常数,dist为障碍物与车辆之间的距离,r
dist
为距离对应的权重,k
dist
为第三常数,vel为障碍物的速度,r
vel
为速度对应的权重,k
vel
为第四常数,r
base
为基准系数。
[0099]
步骤104、加载不确定性检测模型。
[0100]
在本实施例中,可以预先构建不确定性检测模型,该不确定性检测模型用于计算检测障碍物单个属性时存在的不确定性。
[0101]
在自动驾驶的过程中,通常是持续检测障碍物的属性,障碍物的属性通常为时间序列,因此,不确定性检测模型为可处理时间序列的网络,从而实现跨帧的特征融合和注意力机制,将检测障碍物单个属性时的不确定性检测出来。
[0102]
示例性地,该不确定性检测模型为rnn(recurrent neural network,循环神经网络),尤其为rnn中的lstm(long short-term memory,长短期记忆网络)、gru(gate recurrent unit,门控循环单元),等等。
[0103]
此外,不确定性检测模型的结构不局限于人工设计的神经网络,也可以通过模型量化方法优化的神经网络,通过nas(神经网络结构搜索)方法针对检测属性的特性搜索的神经网络,等等,本实施例对此不加以限制。
[0104]
将不确定性检测模型加载至内存运行,以便对其进行训练。
[0105]
步骤105、以单个属性形成的时间序列作为样本、真实值作为标签,训练不确定性检测模型。
[0106]
在本实施例中,按照时间将单个属性进行排列,形成时间序列,该时间序列可以作为训练不确定性检测模型的样本(即训练集),在训练的过程中,将真实值记为标签tag,在标签tag(真实值)的监督下,训练不确定性检测模型。
[0107]
进一步地,训练不确定性检测模型的过程可以是重新训练不确定性检测模型,也可以使用在先训练的不确定性检测模型的基础上进行微调fine-tuning,本实施例对此不加以限制。
[0108]
此外,可以针对单个属性训练一个不确定性检测模型,此时,多个属性对应多个不确定性检测模型,也可以依次针对多个属性训练同一个不确定性检测模型,每次针对单个属性训练同一个不确定性检测模型,本实施例对此不加以限制。
[0109]
在本发明的一个实施例中,步骤105可以包括如下步骤:
[0110]
步骤1051、将单个属性形成的时间序列输入不确定性检测模型中,计算检测障碍物单个属性时的不确定性,作为预测值。
[0111]
将单个属性形成的时间序列输入不确定性检测模型中,不确定性检测模型按照自身的逻辑进行处理,输出检测障碍物该单个属性时的不确定性,记为预测值。
[0112]
步骤1052、计算预测值与真实性之间的差异,作为损失值。
[0113]
将不确定性的预测值与不确定性的真实值进行比较,从而计算预测值与真实性之间的差异,记为损失值loss。
[0114]
对于不同状态量的属性而言,其计算差异的方式也有所不同,本实施例对此不加以限制。
[0115]
在一个示例中,若真实值与预测值符合概率分布(尤其为随机分布),则对真实值与预测值之间的比值取对数,获得第一参考值,对计算真实值与第一参考值之间的乘积,作为第二参考值,以检测障碍物单个属性时的不确定性作为变量,对第二参考值求积分,作为损失值。
[0116]
在本示例中,该损失值可以衡量真实值与预测值这两个随机分布之间的距离,当真实值与预测值这两个随机分布相同时,它们的损失值为零,当真实值与预测值这两个随机分布的差别增大时,它们的损失值也会增大。
[0117]
进一步地,该损失值表示如下:
[0118][0119]
其中,p(x)为真实值,q(x)为预测值。
[0120]
在另一个示例中,若真实值与预测值符合拉普拉斯分布,则计算真实值在拉普拉斯分布中的第一平均值,计算预测值在拉普拉斯分布中的第二平均值。
[0121]
对第二平均值与第一平均值之间的比值取对数,获得第三参考值。
[0122]
计算第一平均值与第二平均值之间的比值,获得第四参考值。
[0123]
将第三参考值减去一,以及,加上第四参考值,获得损失值。
[0124]
在本示例中,可以在不用去估计属性的错误值的前提下,预测出当前属性的不确定性。
[0125]
进一步地,该损失值表示如下:
[0126][0127]
其中,b1为真实值在拉普拉斯分布中的第一平均值,b2为预测值在拉普拉斯分布中的第二平均值。
[0128]
在又一个示例中,若真实值与预测值符合高斯分布,则计算真实值在高斯分布中的第一协方差、第一最大似然值,则计算预测值在高斯分布中的第二协方差、第二最大似然值。
[0129]
对第二协方差的绝对值与第一协方差的绝对值之间的比值取对数,获得第五参考值。
[0130]
对第二协方差的逆矩阵与第一协方差之间的乘积乘以预设的第一系数,获得第六参考值。
[0131]
将第二最大似然值减去第一最大似然值的差值的转置矩阵、第二协方差的逆矩阵、第二最大似然值减去第一最大似然值的差值相乘,获得第七参考值。
[0132]
对第五参考值、预设的第二系数、第六参考值与第七参考值之间的和值取一半,作为损失值。
[0133]
在本示例中,对于部分高纬度的属性,可以通过协方差的方式计算不确定性之间的差异。
[0134]
进一步地,该损失值表示如下:
[0135][0136]
其中,∑1为真实值在高斯分布中的第一协方差,μ1为真实值在高斯分布中的第一最大似然值,∑2为预测值在高斯分布中的第二协方差,μ2为预测值在高斯分布中的第二最大似然值。
[0137]
步骤1053、根据损失值更新不确定性检测模型。
[0138]
在本实施例中,可以对不确定性检测模型进行反向传播,将损失值代入sgd(stochastic gradient descent,随机梯度下降)、adam(adaptive momentum,自适应动量)等算法中,计算不确定性检测模型中模型参数的更新幅度,从而按照该更新幅度更新不确定性检测模型中的模型参数。
[0139]
步骤1054、判断是否满足预设的停止条件;若是,则执行步骤1055,若否,则返回执行步骤1051。
[0140]
步骤1055,确定不确定性检测模型训练完成。
[0141]
在本实施例中,可以预先设置停止条件,例如,损失值小于第一阈值,迭代的次数到达第二阈值,等等,在每轮迭代训练中,可以检测是否满足该停止条件。
[0142]
如果满足停止条件,则可以认为不确定性检测模型训练完成,此时,记录不确定性检测模型中的模型参数。
[0143]
如果未满足停止条件,则可以进入下一轮迭代训练,如此循环迭代训练,直至不确定性检测模型训练完成。
[0144]
在本实施例中,获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据,针对每帧感知数据检测障碍物的多个属性,综合参考多个属性计算检测障碍物时存在的不确定性,作为真实值,加载不确定性检测模型,不确定性检测模型用于计算检测障碍物单个属性时存在的不确定性,以单个属性形成的时间序列作为样本、真实值作为标签,训练不确定性检测模型,本实施例综合多个属性可计算精确的不确定性的真实值,提供了训练的标签,实现了自监督训练不确定性检测模型的模式,使得加载不确定性检测模型的车辆可以在自动驾驶的过程中准确地计算检测障碍物单个属性时存在的不确定性,为自动驾驶的决策提供新的信息,提高自动驾驶的安全性。
[0145]
实施例二
[0146]
图2为本发明实施例一提供的一种不确定性的检测方法的流程图,本实施例可适
用于训练用于调用不确定性检测模型对检测障碍物属性时的不确定性的情况,该方法可以由不确定性的计算装置来执行,该不确定性的计算装置可以由软件和/或硬件实现,可配置在计算机设备中,具体包括如下步骤:
[0147]
步骤201、对处于运动状态的障碍物采集多帧感知数据。
[0148]
本实施例可应用于车辆,如图3所示,车辆300可以包括驾驶控制设备301,车身总线302,ecu(electronic control unit,电子控制单元)303、ecu 304、ecu 305,传感器306、传感器307、传感器308和执行器件309、执行器件310、执行器件311。
[0149]
驾驶控制设备(又称为车载大脑)301负责整个车辆300的总体智能控制。驾驶控制设备301可以是单独设置的控制器,例如,cpu、异构处理器(如gpu、tpu、npu等)可编程逻辑控制器(programmable logiccontroller,plc)、单片机、工业控制机等;也可以是由其他具有输入/输出端口,并具有运算控制功能的电子器件组成的设备;还可以是安装有车辆驾驶控制类应用的计算机设备。驾驶控制设备可以对从车身总线302上接收到的各个ecu发来的数据和/或各个传感器发来的数据进行分析处理,作出相应的决策,并将决策对应的指令发送到车身总线。
[0150]
车身总线302可以是用于连接驾驶控制设备301,ecu 303、ecu 304、ecu305,传感器306、传感器307、传感器308以及车辆300的其他未示出的设备的总线。由于can(controller areanetwork,控制器局域网络)总线的高性能和可靠性已被广泛认同,因此目前机动车中常用的车身总线为can总线。当然,可以理解的是车身总线也可以是其他类型的总线。
[0151]
车身总线302可以将驾驶控制设备301发出的指令发送给ecu 303、ecu 304、ecu 305,ecu 303、ecu 304、ecu 305再将上述指令进行分析处理后发给相应的执行器件执行。
[0152]
传感器306、传感器307、传感器308包括但不限于激光雷达、相机、毫米波雷达、麦克风,等等。
[0153]
应该理解,图3中的车辆、驾驶控制设备、车身总线、ecu、执行器件和传感器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的车辆、驾驶控制设备、车身总线、ecu和传感器。
[0154]
车辆在自动驾驶的过程中,可调用传感器对处于运动状态的障碍物采集数据,记为感知数据。
[0155]
步骤202、针对每帧感知数据检测障碍物的单个属性。
[0156]
在自动驾驶的过程中,为支持自动驾驶的决策,可以使用每帧感知数据对处于运动状态的障碍物进行感知,分别可以检测得到障碍物的单个属性,包括但并不限于检测障碍物的类型(或称类别)、形状、位置(即定位)、速度、加速度、朝向角度,等等。
[0157]
步骤203、加载不确定性检测模型。
[0158]
在本实施例中,可以预先训练不确定性检测模型,该不确定性检测模型用于计算检测障碍物单个属性时存在的不确定性。
[0159]
在具体实现中,不确定性检测模型的训练方法如下:
[0160]
获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据。
[0161]
针对每帧感知数据检测障碍物的多个属性。
[0162]
根据多个属性计算检测障碍物时存在的不确定性,作为真实值。
[0163]
加载不确定性检测模型,不确定性检测模型用于计算检测障碍物单个属性时存在的不确定性。
[0164]
以单个属性形成的时间序列作为样本、真实值作为标签,训练不确定性检测模型。
[0165]
在本实施例中,由于不确定性检测模型的训练方法与实施例一的应用基本相似,所以描述的比较简单,相关之处参见实施例一的部分说明即可,本实施例在此不加以详述。
[0166]
车辆在自动驾驶的过程中,可以将不确定性检测模型及其模型参数加载至内存运行,以便实时对不确定性进行计算。
[0167]
步骤204、将单个属性形成的时间序列输入不确定性检测模型中,计算检测障碍物单个属性时存在的不确定性。
[0168]
将单个属性形成的时间序列输入不确定性检测模型中,不确定性检测模型按照自身的逻辑进行处理,输出检测障碍物该单个属性时的不确定性。
[0169]
进一步地,不确定性的提出可以为自动驾驶的决策提供了新的可能,对此,可以按照属性的类别设置适于自动驾驶的业务操作,从而基于不确定性执行适于自动驾驶的业务操作。
[0170]
其中,不同类型的属性可能影响自动驾驶的决策中不同的环节,在这些环节中可以设计不用的业务操作,从而使得该业务操作为对车辆的直接控制和/或间接控制。
[0171]
示例性地,业务操作包括如下的至少一者:
[0172]
基于障碍物的形状的不确定性,可以设计新的缓冲值的定义,该缓冲值可为车辆变道至障碍物的缓冲区域。
[0173]
基于障碍物的速度的不确定性,可以设计新的预测位置的可能存在区域,在规划路线时提供更多的heuristic(启发性)的输入。
[0174]
基于障碍物的类型的不确定性,可以模糊难以定义或者分类容易出错的类型。
[0175]
基于障碍物的位置的不确定性,可以设计提前反应、近处验证的规划控制算法。
[0176]
当然,上述属性及其业务操作只是作为示例,在实施本发明实施例时,可以根据实际情况设置其它属性及其业务操作,本发明实施例对此不加以限制。另外,除了上述属性及其业务操作外,本领域技术人员还可以根据实际需要采用其它属性及其业务操作,本发明实施例对此也不加以限制。
[0177]
在本实施例中,对处于运动状态的障碍物采集多帧感知数据,针对每帧感知数据检测障碍物的单个属性,加载不确定性检测模型,不确定性检测模型用于计算检测障碍物单个属性时存在的不确定性,将单个属性形成的时间序列输入不确定性检测模型中,计算检测障碍物单个属性时存在的不确定性,本实施例综合多个属性可计算精确的不确定性的真实值,提供了训练的标签,实现了自监督训练不确定性检测模型的模式,使得加载不确定性检测模型的车辆可以在自动驾驶的过程中准确地计算检测障碍物单个属性时存在的不确定性,为自动驾驶的决策提供新的信息,提高自动驾驶的安全性。
[0178]
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
[0179]
实施例三
[0180]
图4为本发明实施例三提供的一种不确定性检测模型的训练装置的结构框图,具体可以包括如下模块:
[0181]
感知数据获取模块401,用于获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据;
[0182]
多属性检测模块402,用于针对每帧所述感知数据检测所述障碍物的多个属性;
[0183]
真实值计算模块403,用于根据多个所述属性计算检测所述障碍物时存在的不确定性,作为真实值;
[0184]
模型加载模块404,用于加载不确定性检测模型,所述不确定性检测模型用于计算检测所述障碍物单个所述属性时存在的不确定性;
[0185]
模型训练模块405,用于以单个所述属性形成的时间序列作为样本、所述真实值作为标签,训练所述不确定性检测模型。
[0186]
在本发明的一个实施例中,所述真实值计算模块403包括:
[0187]
相关值计算模块,用于按照每个所述属性与检测所述障碍物时存在的不确定性之间的相关性,将每个所述属性映射为相关值;
[0188]
相关值融合模块,用于对所述相关值进行融合,获得检测所述障碍物时存在的不确定性,作为真实值。
[0189]
在本发明的一个实施例中,所述属性包括如下的至少一种:
[0190]
所述感知数据的帧数,所述障碍物的长度,所述障碍物与所述车辆之间的距离,所述障碍物的速度;
[0191]
其中,所述帧数与所述不确定性负相关,所述长度与所述不确定性正相关,所述距离与所述不确定性正相关,所述速度与所述不确定性正相关。
[0192]
在本发明的一个实施例中,所述相关值计算模块包括:
[0193]
第一比值计算模块,用于计算所述帧数与预设的第一常数之间的第一比值;
[0194]
第一相关值计算模块,用于以自然数为底、所述第一比值的负数为指数,计算相关值;
[0195]
第二比值计算模块,用于计算所述长度与预设的第二常数之间的第二比值;
[0196]
第二相关值计算模块,用于以自然数为底、所述第二比值为指数,计算相关值;
[0197]
第三比值计算模块,用于计算所述距离与预设的第三常数之间的第三比值;
[0198]
第三相关值计算模块,用于以自然数为底、所述第三比值为指数,计算相关值;
[0199]
第四比值计算模块,用于计算所述速度与预设的第四常数之间的第四比值;
[0200]
第四相关值计算模块,用于以自然数为底、所述第四比值为指数,计算相关值。
[0201]
在本发明的一个实施例中,所述相关值融合模块包括:
[0202]
调权相关性计算模块,用于对每个所述相关值乘以与所述属性对应的权重,作为调权相关性;
[0203]
调权相关性求和模块,用于将所有所述调权相关性与预设的基准系数之间的和值设置检测所述障碍物时存在的不确定性,作为真实值。
[0204]
在本发明的一个实施例中,所述模型训练模块405包括:
[0205]
预测值计算模块,用于将单个所述属性形成的时间序列输入所述不确定性检测模
型中,计算检测所述障碍物单个所述属性时的不确定性,作为预测值;
[0206]
损失值计算模块,用于计算所述预测值与所述真实性之间的差异,作为损失值;
[0207]
不确定性检测模型更新模块,用于根据所述损失值更新所述不确定性检测模型;
[0208]
停止条件判断模块,用于判断是否满足预设的停止条件;若是,则调用训练完成确定模块,若否,则调用所述预测值计算模块。
[0209]
训练完成确定模块,用于确定所述不确定性检测模型训练完成。
[0210]
在本发明的一个实施例中,所述损失值计算模块包括:
[0211]
第一参考值计算模块,用于若所述真实值与所述预测值符合概率分布,则对所述真实值与所述预测值之间的比值取对数,获得第一参考值;
[0212]
第二参考值计算模块,用于计算所述真实值与所述第一参考值之间的乘积,作为第二参考值;
[0213]
积分模块,用于以检测所述障碍物单个所述属性时的不确定性作为变量,对所述第二参考值求积分,作为损失值。
[0214]
在本发明的另一个实施例中,所述损失值计算模块包括:
[0215]
拉普拉斯分布计算模块,用于若所述真实值与所述预测值符合拉普拉斯分布,则计算所述真实值在拉普拉斯分布中的第一平均值,计算所述预测值在拉普拉斯分布中的第二平均值;
[0216]
第三参考值计算模块,用于对所述第二平均值与所述第一平均值之间的比值取对数,获得第三参考值;
[0217]
第四参考值计算模块,用于计算所述第一平均值与所述第二平均值之间的比值,获得第四参考值;
[0218]
拉普拉斯损失计算模块,用于将所述第三参考值减去一,以及,加上所述第四参考值,获得损失值。
[0219]
在本发明的又一个实施例中,所述损失值计算模块包括:
[0220]
高斯分布分布计算模块,用若所述真实值与所述预测值符合高斯分布,则计算所述真实值在高斯分布中的第一协方差、第一最大似然值,则计算所述预测值在高斯分布中的第二协方差、第二最大似然值;
[0221]
第五参考值计算模块,用于对所述第二协方差的绝对值与所述第一协方差的绝对值之间的比值取对数,获得第五参考值;
[0222]
第六参考值计算模块,用于对所述第二协方差的逆矩阵与所述第一协方差之间的乘积乘以预设的第一系数,获得第六参考值;
[0223]
第七参考值计算模块,用于将所述第二最大似然值减去所述第一最大似然值的差值的转置矩阵、所述第二协方差的逆矩阵、所述第二最大似然值减去所述第一最大似然值的差值相乘,获得第七参考值;
[0224]
高斯损失计算模块,用于对所述第五参考值、预设的第二系数、所述第六参考值与所述第七参考值之间的和值取一半,作为损失值。
[0225]
本发明实施例所提供的不确定性检测模型的训练装置可执行本发明任意实施例所提供的不确定性检测模型的训练方法,具备执行方法相应的功能模块和有益效果。
[0226]
实施例四
[0227]
图5为本发明实施例四提供的一种不确定性的检测装置的结构框图,应用于车辆,所述装置具体可以包括如下模块:
[0228]
感知数据采集模块501,用于对处于运动状态的障碍物采集多帧感知数据;
[0229]
单属性检测模块502,用于针对每帧所述感知数据检测所述障碍物的单个属性;
[0230]
模型加载模块503,用于加载不确定性检测模型,所述不确定性检测模型用于计算检测所述障碍物单个所述属性时存在的不确定性;
[0231]
不确定性检测模块504,用于将单个所述属性形成的时间序列输入所述不确定性检测模型中,计算检测所述障碍物单个所述属性时存在的不确定性。
[0232]
在本发明的一个实施例中,还包括:
[0233]
业务操作设置模块,用于按照所述属性的类别设置适于自动驾驶的业务操作;
[0234]
业务操作执行模块,用于基于所述不确定性执行适于自动驾驶的所述业务操作;所述业务操作为对所述车辆的直接控制和/或间接控制。
[0235]
在本发明的一个实施例中,所述不确定性检测模型的训练方法包括:
[0236]
获取车辆在行驶时,对处于运动状态的障碍物采集的多帧感知数据;
[0237]
针对每帧所述感知数据检测所述障碍物的多个属性;
[0238]
根据多个所述属性计算检测所述障碍物时存在的不确定性,作为真实值;
[0239]
加载不确定性检测模型,所述不确定性检测模型用于计算检测所述障碍物单个所述属性时存在的不确定性;
[0240]
以单个所述属性形成的时间序列作为样本、所述真实值作为标签,训练所述不确定性检测模型。
[0241]
本发明实施例所提供的不确定性的检测装置可执行本发明任意实施例所提供的不确定性的检测方法,具备执行方法相应的功能模块和有益效果。
[0242]
实施例五
[0243]
图6为本发明实施例五提供的一种计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性计算机设备12的框图。图6显示的计算机设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0244]
如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
[0245]
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0246]
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0247]
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以
提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0248]
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
[0249]
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0250]
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的不确定性检测模型的训练方法或者不确定性的检测方法。
[0251]
实施例六
[0252]
本发明实施例六还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述不确定性检测模型的训练方法或者不确定性的检测方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0253]
其中,计算机可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0254]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1