有关学习测量数据对神经网络的数值上更稳定的训练的制作方法

文档序号:33291240发布日期:2023-02-28 19:44阅读:49来源:国知局

1.本发明涉及对神经网络的训练,这些神经网络例如可以被用于评估借助于雷达、激光雷达和/或超声对车辆环境的观察。


背景技术:

2.为了车辆可以至少部分地自动化地在道路交通中移动,需要检测车辆的环境并且如果即将发生与车辆的环境中的对象的碰撞则引入应对措施。对于安全的自动化驾驶来说也需要创建环境表示和本地化。
3.借助于雷达对对象的检测与照明条件无关并且例如即使在夜晚在较大的距离上也是可能的,而对向交通不会被远光灯炫目。此外,从雷达数据中直接得出对象的距离和速度。这些信息对于评估是否可能发生与这些对象的碰撞来说是重要的。然而,从雷达信号中无法直接识别涉及何种类型的对象。
4.除了从数字信号处理中计算属性之外,越来越多地使用神经网络,以便依据使用雷达进行的对车辆环境的观察来对对象进行分类。de 10 2019 220 069 a1公开了一种示例性的方法。


技术实现要素:

5.在本发明的范围内,开发出了一种用于对神经网络进行监督训练的方法。该神经网络将测量数据映射到一个或多个输出参量上。这些测量数据给二维或三维空间中的不一定有关联的位置分配一个或多个测量参量的值。即,这些测量数据可以被视为分布在空间中的、具有测量参量的标量值或矢量值的点云。
6.为了进行训练,提供由学习测量数据和相关的学习输出参量构成的学习示例。即,学习示例将由分别被分配给空间中的位置的测量数据构成的点云与该神经网络在经训练的状态下当给该神经网络输送来自该点云中的学习测量数据时在理想情况下应该提供的学习输出参量相结合。
7.包含通过学习示例的学习测量数据所说明的位置的至少一部分的空间区域被划分成由彼此相邻的单元格构成的网格。针对每个单元格,将在关于该单元格中的所有位置的学习示例的学习测量数据中所包含的测量参量的值聚合成与该单元格相关的所述测量参量的值。也就是说,然后在该学习示例的学习测量数据中说明的每个位置都被检查该位置是否处在该网格的特定单元格内,并且如果情况如此,则属于该位置的所述一个或多个输出参量的值参与该聚合。对于包含在学习测量数据中的位置并没有落入其中的单元格来说,关于所述一个或多个测量参量的该聚合的结果分别保持为零。
8.被分配给该网格的单元格的测量参量的聚合值由该神经网络映射到一个或多个输出参量上。正是对该网格的单元格的引用能够将这些值组合在矩阵或张量中,以便将这些值以这种形式输送给该神经网络。大多数的神经网络期望输入为矩阵或张量,并且无法直接处理作为点云存在的测量数据。
9.所提及的测量参量的聚合值由该神经网络映射到一个或多个输出参量上。这些输出参量与学习输出参量的偏差利用指定的成本函数来被评价,该成本函数提供针对该训练的反馈。不同于以前公知的神经网络训练,现在,该成本函数由该网格的各个单元格的贡献以加权的方式组成,其中每个贡献的权重α都取决于包含在学习示例的学习测量数据中的位置对相对应的单元格的占用。
10.即,在具有索引i和j的二维网格的情况下,成本函数例如可具有如下形式。其中,g
nn
(i,j)是具有索引i和j的网格单元格对该神经网格整体上提供的结果的贡献。g
gt
表示“ground truth(正确答案)”,即该神经网络名义上应该提供的学习输出参量。函数f测量贡献g
nn
(i,j)与在给定“ground truth”g
gt
的情况下该贡献的目标值的偏差程度。函数f例如可以说明均方误差或者l1范数。
11.表征该神经网络的行为的参数被优化,目的在于:在进一步处理学习示例时,通过成本函数的评价预期得到改善。
12.在该上下文中,术语“预期”应这样被理解,即迭代的数值优化算法基于迭代历史来为下一次迭代选择新的参数值,期望通过成本函数的评价借此得到改善。然而,不必针对每次迭代都满足这种期望,即迭代也可能被证实是“倒退”。然而,该优化算法也可以使用这种类型的反馈,以便这样最终达到对其来说使通过成本函数的评价得到改善的参数值。
13.在将作为点云存在的学习测量数据转变成分别被分配给网格的单元格的被聚合的测量参量时,究竟对于多少个单元格来说该聚合导致非零值并且对于多少个单元格来说该聚合保持在零主要取决于网格的网孔尺寸。如果在极端示例中空间区域仅会被划分成四个象限,则在这些象限中的每个象限内都会存在这些学习测量数据将测量参量的值分配给的位置。如果在另一个极端,该空间区域会被划分成1 cm2(或者在三维情况下是1 cm3)的单元格,则该聚合仅会对于网格的与相对应的学习示例的点云中的位置一样多的单元格来说不等于零。这与未被学习示例中的位置占据并且因而对其来说该聚合的结果为零的绝大多数单元格形成对比。
14.现在已经认识到:该网格的对其来说该聚合的结果为零的单元格的百分比影响该训练的数值稳定性。如果该比例超过某个临界值,则作为输出参量的仅为零的简单输出由成本函数到目前为止非常有利地评价。从成本函数的角度来看,由于少量不为零的聚合“落到桌子下面”而形成的小误差是可接受的。这有点类似于在有买停车票义务的市区内的停车情况:如果每天只有极少数的停车位被交通监控所控制并且在没有停车票时会被处以罚款,则平均而言不是每天寻找适合的硬币并且将这些硬币投入停车票自动机中更有利且更方便,而是平均而言通过转账来每三周一次性支付5欧元罚款更有利且更方便。
15.这正是成本函数的加权发挥作用的地方。该加权确保了:网格的未被学习示例的位置占据的单元格被赋予比该网格的被这些位置中的多个或者甚至大量位置占据的单元格明显更弱的声音(stimme)。由此,从成本函数的角度来看,将所有输出参量都设置到零的简单解决方案不再是最有利的解决方案。为了实现通过成本函数的良好的评价,神经网络别无选择,只能详细处理被该学习示例的位置占据的那些单元格的测量参量的聚合值。在所描述的停车情况的示例中,这对应于对违规行为的制裁威胁的显著增加。如果平均而言每三周不再只须支付5欧元罚款,而是需要去邻近城市的拖车公司进行一次耗时的旅行并
且必须在那里缴纳300欧元来使车辆放行,则完全弃用停车票就突然不再是最有利的解决方案。相反,学习过程将很快集中于晚上整理好适合的硬币并且在早上将这些硬币投入自动机的解决方案。
16.在一个有利的设计方案中,至少一个单元格的贡献的关于成本函数的权重α
•ꢀ
当学习示例的学习测量数据未说明在该单元格中的位置时被规定到第一正值a,而且
•ꢀ
当学习示例的学习测量数据说明了在该单元格中的至少一个位置时被规定到更高的第二正值b。
17.接着,根据当前学习示例在其中没有在测量数据中所说明的位置的单元格的数目不会被完全忽略。然而,根据当前示例在其中存在在测量数据中说明的位置的稀少的单元格明显更加重要。
18.在这种情况下,尤其例如第二正值b可以在第一正值a的八倍与二十倍之间。尤其是,在发明人的实验中已经表明:利用大约为值a的十倍的值b,可以实现有关测试或验证数据的最终经训练的神经网络的明显更稳定的训练过程和明显更好的性能。在极端情况下,只有通过引入权重α才完全能实现:神经网络在训练时会考虑被学习示例的测量数据的位置占据的单元格。
19.在另一有利的设计方案中,这些权重α在网格内的分布被选择为使得在其内部该学习示例的学习测量数据没有说明位置的单元格总体上关于该成本函数做出与在其内部该学习示例的学习测量数据说明至少一个位置的单元格相同的贡献。以这种方式,尤其例如可以通过多个学习示例来使加权归一化。即,权重α的分布可以针对每个单独的学习示例来被适配。这例如在处理作为测量数据的雷达或激光雷达反射时特别有利。根据使用相对应的询问辐射对对象进行照明的视角,可以使相对应的反射分布在整个空间区域内要不然只集中在该空间区域的一小部分中。
20.在另一有利的设计方案中,至少一个权重α被优化,目的同样在于:在进一步处理学习测量数据时,通过成本函数的评价预期得到改善。该优化尤其例如可以与神经网络的参数的优化衔接。这些参数尤其包括权重,利用这些权重来计算被输送给神经元或其它处理单元的输入,用于激活该神经元或该处理单元。基于参数与权重α的这种关系,成本函数的评价不仅可以良好地被反向传播到神经网络的参数的变化,而且可以良好地被反向传播到权重的变化α。
21.如上所述,通过成本函数中的权重α来补偿如下影响:网格的网孔尺寸的缩写会迫使该网格的根据当前学习示例在其中存在学习测量数据的位置的那些单元格在成本函数中没有意义。由此,网孔尺寸再次成为字面意义上的自由度:该网孔尺寸可以关于神经网络的尽可能好的性能方面自由地被优化。
22.因而,在另一有利的设计方案中,重复该训练以对空间区域进行多次划分以形成具有不同网孔尺寸的网格。对其来说该训练收敛于通过成本函数的最好评价的那个网孔尺寸被规定为用于神经网络的有效运行的最佳网孔尺寸。
23.特别有利地,可以选择具有如下测量参量的学习测量数据,这些测量参量表征雷达辐射、激光辐射和/或超声波在空间中的位置处的反射。具有以这种方式获得的测量数据的学习示例通常包含如下点云,这些点云只填充空间的一小部分并且在转变成网格时产生
多个单元格,在这些单元格中,聚合分别为零。
24.可以以所描述的方式被训练的神经网络的一个有利的应用在于将测量数据从第一测量配置转变到第二测量配置。借此,已经存在的测量数据可以被映射到当所使用的传感器已经以不同方式被安装时会形成的那些测量数据上。
25.因此,在一个有利的设计方案中,选择如下学习测量数据,这些学习测量数据是通过使用第一测量结构和/或从第一视角对场景的观察来被获得的。同时,选择如下学习输出参量,这些学习输出参量是通过使用第二测量结构和/或从第二视角对同一场景的观察来被获得的。
26.另一有利的应用在于针对已经存在的测量配置产生新的综合测量数据。例如,以这种方式可以模拟在使用同一测量配置对同一场景的依次记录的雷达测量时形成的波动。
27.因此,在另一有利的设计方案中,选择如下学习测量数据和学习输出参量,这些学习测量数据和学习输出参量是通过使用同一测量结构和/或从同一视角对场景的观察来被获得的。
28.特别是在其中应产生新的测量数据的这些应用中,成本函数可以特别简单地以网格的各个单元格的贡献来被表达。接着,输出参量尤其可以首先被表达为带有值的新网格,该新网格具有与最初被输送给神经网络的网格相同的维度。接着,例如可以从该新网格中采样新的测量数据的点云。接着,被成本函数“谴责”的新的测量数据的“缺乏”可以直接追溯到在最初被输送的网格中的特定单元格上。
29.在另一有利的设计方案中,其中选择如下学习输出参量,这些学习输出参量包含学习输入参量的与指定分类的一个或多个类别有关的分类分数。这是尤其用于驾驶辅助系统以及至少部分自动化驾驶系统的神经网络的最重要的应用之一。
30.如上所述,上述训练改善了神经网络在后期的有效运行时的性能。因而,本发明还涉及另一种方法。
31.在该方法中,使用上述方法来对神经网络进行训练。然后,给经训练的神经网络输送测量数据,这些测量数据是使用至少一个由车辆所携带的传感器来被记录的。根据由神经网络提供的输出参量,确定操控信号。接着,车辆可以利用操控信号来被操控。
32.接着,由于通过该新型训练所改善的神经网络的性能,提高了通过该操控信号所触发的车辆的反应适合于由至少一个传感器所检测到的交通情况的概率。
33.这些方法尤其可以完全或部分地计算机实现。因而,本发明也涉及一种计算机程序,该计算机程序具有机器可读指令,当这些机器可读指令在一个或多个计算机上被执行时,这些机器可读指令促使所述一个或多个计算机实施所描述的方法之一。就此而言,同样能够执行机器可读指令的用于车辆的控制设备以及用于技术设备的嵌入式系统也应被视为计算机。
34.同样,本发明也涉及一种具有该计算机程序的机器可读数据载体和/或下载产品。下载产品是能通过数据网络来传输的、也就是说能由该数据网络的用户来下载的数字产品,该数字产品例如可以在网上商店被出售以立即下载。
35.此外,计算机可以装备该计算机程序、该机器可读数据载体或该下载产品。
附图说明
36.在下文,其它改善本发明的措施共同利用依据附图对本发明的优选的实施例的描述来更详细地予以呈现。
37.其中:图1示出了用于训练神经网络1的方法100的实施例;图2示出了对将作为点云存在的测量数据2转变成网格5的阐明;图3示出了具有直至操控车辆50为止的完整作用链的方法200的实施例。
具体实施方式
38.图1示出了用于对神经网络1进行训练的方法100的实施例的示意性流程图。神经网络1将测量数据2映射到一个或多个输出参量3上。这些测量数据2给二维或三维空间中的位置2b分配一个或多个测量参量的值2c。
39.在步骤110中,提供由学习测量数据2a和相关的学习输出参量3a构成的学习示例4。学习测量数据2a分别包括被分配给位置2b的测量参量的值2c。
40.在这种情况下,按照方框111,尤其例如可以选择具有如下测量参量2c的学习测量数据2a,这些测量参量表征雷达辐射、激光辐射和/或超声波在空间中的位置2b处的反射。
41.按照方框111a,尤其例如可以选择如下学习测量数据2a,这些学习测量数据是通过使用第一测量结构和/或从第一视角对场景的观察来被获得的。接着,按照方框111b,可以选择如下学习输出参量3a,这些学习输出参量是通过使用第二测量结构和/或从第二视角对同一场景的观察来被获得的。
42.按照方框111c,尤其例如可以选择如下学习输出参量3a,这些学习输出参量是通过使用同一测量结构和/或从同一视角对场景的观察来被获得的。
43.按照方框112,尤其例如可以选择如下学习输出参量3a,这些学习输出参量包含学习输入参量2a的与指定分类的一个或多个类别有关的分类分数。
44.在步骤120中,将空间区域划分成由彼此相邻的单元格5a构成的网格5,该空间区域包含通过学习示例4的学习测量数据2a所说明的位置2b的至少一部分。
45.在步骤130中,针对每个单元格5a,将在关于该单元格5a中的所有位置2b的学习示例4的学习测量数据2a中所包含的测量参量的值2c聚合成与该单元格5a相关的所述测量参量的值5b。这在图2中更详细地被阐述。
46.在步骤140中,测量参量的这些聚合值5b由神经网络1映射到一个或多个输出参量3上。
47.在步骤150中,使用指定的成本函数6来评价这些输出参量3与学习输出参量3a的偏差,使得形成评价6b。该评价6b由网格5的各个单元格5a的贡献6a以加权的方式组成。每个贡献6a的权重α都取决于在学习示例4的学习测量数据2a中所包含的位置2a对相对应的单元格5a的占据。
48.按照方框151,当学习示例4的学习测量数据2a未说明在该单元格5a中的位置2b时,至少一个单元格5a的贡献6a的关于成本函数5的权重α可以被规定到第一正值a。按照方框152,当学习示例4的学习测量数据2a说明了在该单元格5a中的至少一个位置2b时,该权重α可以被规定到更高的第二正值b。
49.按照方框153,这些权重α在网格5内的分布可以被选择为使得在其内部该学习示例4的学习测量数据2a没有说明位置2b的单元格5a总体上关于该成本函数5做出与在其内部该学习示例4的学习测量数据2a说明至少一个位置2b的单元格5a相同的贡献。例如,第一正值a可以被规定到,其中是通过学习示例4的测量数据2a所说明的位置2b没有落入的那些单元格5a的数目。接着,第二正值b可以被规定到,其中是至少一个通过学习示例4的测量数据2a所说明的位置2b落入的那些单元格5a的数目。
50.在步骤160中,表征神经网络1的行为的参数1a被优化,目的在于:在进一步处理学习示例4时,通过成本函数6的评价6b预期得到改善。用附图标记1a*来表示参数的训练完成的状态。这些参数1a*表征训练完成的神经网络1*的行为。
51.按照方框161,在这种情况下,至少一个权重α可以被优化,目的同样在于:在进一步处理学习测量数据2a时,通过成本函数6的评价6b预期得到改善。
52.在步骤170中,重复该训练以对空间区域进行多次划分以形成具有不同网孔尺寸5c的网格5。
53.在步骤180中,对其来说该训练收敛于通过成本函数6的最好评价6b的那个网孔尺寸5c被规定为用于神经网络1的有效运行的最佳网孔尺寸5c*。
54.图2阐明了将作为点云存在的测量数据2转变成网格5。在该示例中使用由车辆50携带的雷达传感器51来记录测量数据2。雷达传感器51在其检测范围51a内检测来自位置2b的具有测量参量2c的雷达反射。
55.如果包含该检测范围51的至少一部分的空间区域被划分成具有单元格5a的网格5,则雷达反射所来自的各一个位置2b落入一些单元格5a中。在图2中所示出的示例中,雷达反射分别来自的两个位置2b落入一个单元格5a中。对于每个单元格5a来说,针对在相应单元格5a中的位置2b的所有雷达反射形成来自测量参量2c的聚合值5b。对于其中缺乏雷达反射的位置2b的大多数单元格5a来说,该聚合值5b为零。这里,在成本函数6中的加权按照上述方法100来发挥作用。
56.图3是具有直至操控车辆50为止的完整作用链的方法200的实施例的示意性流程图。
57.在步骤210中,使用上述方法100来训练神经网络1。
58.在步骤220中,给经训练的神经网络1*输送测量数据2,这些测量数据是使用至少一个由车辆50所携带的传感器51来被记录的。
59.在步骤230中,从由神经网络1*提供的输出参量3中确定操控信号230a。
60.在步骤240中,利用该操控信号230a来操控车辆50。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1