轨迹预测模型生成方法及装置、模型训练方法及装置与流程

文档序号:34307866发布日期:2023-05-31 19:39阅读:45来源:国知局
轨迹预测模型生成方法及装置、模型训练方法及装置与流程

本公开涉及智能驾驶,具体地涉及一种轨迹预测模型生成方法及装置、模型训练方法及装置、设备、介质和程序产品。


背景技术:

1、自动驾驶中,轨迹预测位于感知模块的下游,规划控制的上游,在整个自动驾驶算法模块中起着承上启下的作用。自动驾驶车辆在行驶过程中,需要综合考虑车道信息、环境信息、高精地图、其他车辆行人(障碍物)轨迹意图、路径规划等重要信息,以确保自身行车安全。

2、在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:目前用于轨迹预测的预测模型都是针对特殊场景或者特定障碍物设计的轨迹预测模型,但在实际运用当中,当场景切换之后,此类模型难以很好的适用,模型泛化性较低,无法适用于其他场景。


技术实现思路

1、鉴于上述问题,本公开提供了一种轨迹预测模型生成方法及装置、模型训练方法及装置、设备、介质和程序产品。

2、本公开的一个方面,提供了一种轨迹预测模型生成方法,包括:

3、根据与第一驾驶场景关联的第一场景信息,确定与第一驾驶场景对应的目标任务类别;

4、在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下,从模型库中调用调参模型,以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型;

5、基于第一场景信息对调参模型的参数进行更新,得到目标调参模型;

6、利用目标调参模型对基础轨迹预测模型的参数进行调整,生成目标轨迹预测模型。

7、根据本公开的实施例,上述方法还包括:

8、将生成的目标轨迹预测模型新增存储至模型库中;

9、接收与第二驾驶场景关联的第二场景信息,第二场景信息包括:在第二驾驶场景下,第二主障碍物的第二运动特性信息、第二主障碍物所在车道的第二交通指示信息、第二环境障碍物的第二相对运动信息,其中,第二驾驶场景对应目标任务类别;

10、从多个轨迹预测模型中调用与目标任务类别对应的目标轨迹预测模型;

11、将第二场景信息输入目标轨迹预测模型,通过目标轨迹预测模型输出:在第二驾驶场景下第二主障碍物的预测轨迹信息。

12、根据本公开的实施例,其中,基于第一场景信息对调参模型的参数进行更新,得到目标调参模型包括:

13、将第一场景信息输入基础轨迹预测模型,输出第一主障碍物的参考轨迹信息;

14、获取第一主障碍物的采样轨迹信息;

15、根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息,计算得到目标任务类别对应的损失值;

16、基于目标任务类别对应的损失值,对调参模型的参数进行更新,得到目标调参模型。

17、根据本公开的实施例,其中,根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息,计算得到目标任务类别对应的损失值包括:

18、根据第一主障碍物的参考轨迹信息以及第一主障碍物的采样轨迹信息,计算得到第一主障碍物的平均位移误差和终点位移误差;

19、根据第一驾驶场景对应的驾驶场景类别,确定平均位移误差对应的第一权重,以及确定终点位移误差对应的第二权重;

20、根据平均位移误差、终点位移误差、第一权重、第二权重,计算得到目标任务类别对应的损失值。

21、根据本公开的实施例,其中:

22、第一场景信息包括:在第一驾驶场景下,第一主障碍物的第一运动特性信息、第一主障碍物所在车道的第一交通指示信息、第一环境障碍物的第一相对运动信息;

23、第一主障碍物的第一运动特性信息包括:第一主障碍物的类别,以及第一主障碍物在目标时间节点之前的参考速度信息和参考位置信息;

24、第一主障碍物所在车道的第一交通指示信息包括:第一主障碍物所在车道的车道线指向信息,以及第一主障碍物所在车道的交通信号灯状态信息;

25、第一环境障碍物的第一相对运动信息包括:第一环境障碍物与第一主障碍物的之间的相对距离,以及第一环境障碍物相对于第一主障碍物的相对速度。

26、本公开的另一个方面提供了一种模型训练方法模型训练,包括:

27、获取与多个任务类别对应的多个任务样本集,其中,各任务样本集包括与多个历史驾驶场景关联的多组历史样本信息;

28、基于元学习算法,利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新,得到训练得到的调参模型和多个轨迹预测模型,其中,多个轨迹预测模型与多个任务类别一一对应,其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

29、根据本公开的实施例,其中,各任务样本集中的多组历史样本信息被分类为训练样本组和测试样本组,利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新包括:

30、基于第n个任务样本集中的训练样本组,以及第n-1次更新后的待训练调参模型,对待训练轨迹预测模型的参数进行更新,得到与第n个任务类别对应的第n个轨迹预测模型;

31、基于第n个任务样本集中测试样本组和第n个轨迹预测模型,确定第n个任务类别对应的损失值;

32、基于第n个任务类别对应的损失值,对待训练调参模型的参数进行第n次更新;

33、迭代执行:基于第n+1个任务样本集中的训练样本组,以及第n次更新后的待训练调参模型,对待训练轨迹预测模型的参数进行更新得到第n+1个轨迹预测模型、基于第n+1个任务样本集中测试样本组和第n+1个轨迹预测模型确定第n+1个任务类别对应的损失值、基于第n+1个任务类别对应的损失值对待训练调参模型的参数进行第n+1次更新的操作,直至多个任务类别对应的损失值之和小于预设阈值,得到训练得到的调参模型和多个轨迹预测模型。。

34、根据本公开的实施例,其中:

35、各组历史样本信息包括在各自历史驾驶场景下,主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、主障碍物历史轨迹信息、环境障碍物历史相对运动信息;

36、多个历史驾驶场景分类为历史训练驾驶场景和历史测试驾驶场景,历史训练驾驶场景和训练样本组关联,历史测试驾驶场景和测试样本组关联;

37、基于第n个任务样本集中测试样本组和第n个轨迹预测模型,确定第n个任务类别对应的损失值包括:

38、将第n个任务样本集中测试样本组的主障碍物历史运动特性信息、主障碍物所在车道的历史交通指示信息、环境障碍物历史相对运动信息,输入第n个轨迹预测模型,输出第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息,其中第n组历史测试驾驶场景为:与第n个任务样本集中测试样本组关联的多个历史训练驾驶场景;

39、根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息,以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息,计算得到第n个任务类别对应的损失值。

40、根据本公开的实施例,其中,根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息,以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息,计算得到第n个任务类别对应的损失值包括:

41、根据第n组历史测试驾驶场景下的主障碍物预测轨迹样本信息,以及与第n组历史测试驾驶场景下的主障碍物历史轨迹信息,计算得到与第n个任务类别关联的样本平均位移误差和样本终点位移误差;

42、根据第n组历史测试驾驶场景对应的驾驶场景类别,确定样本平均位移误差对应的样本第一权重,以及确定样本终点位移误差对应的样本第二权重;

43、根据与第n个任务类别关联的样本平均位移误差、样本终点位移误差、样本第一权重、样本第二权重,计算得到第n个任务类别对应的损失值。

44、本公开的另一个方面提供了一种轨迹预测模型生成装置,包括:

45、确定模块,用于根据与第一驾驶场景关联的第一场景信息,确定与第一驾驶场景对应的目标任务类别;

46、第一调用模块,用于在确定模型库中预存的多个轨迹预测模型中不包含与目标任务类别对应的目标轨迹预测模型情况下,从模型库中调用调参模型,以及从多个轨迹预测模型中调用至少一个轨迹预测模型作为基础轨迹预测模型;

47、第一调参模块,用于基于第一场景信息对调参模型的参数进行更新,得到目标调参模型;

48、第二调参模块,用于利用目标调参模型对基础轨迹预测模型的参数进行调整,生成目标轨迹预测模型。

49、本公开的另一个方面提供了一种模型训练装置,包括:

50、获取模块,用于获取与多个任务类别对应的多个任务样本集,其中,各任务样本集包括与多个历史驾驶场景关联的多组历史样本信息;

51、训练模块,用于基于元学习算法,利用多个任务样本集对待训练调参模型和待训练轨迹预测模型的参数进行更新,得到训练得到的调参模型和多个轨迹预测模型,其中,多个轨迹预测模型与多个任务类别一一对应,其中与目标任务类别对应的目标轨迹预测模型用于对目标任务类别下多个驾驶场景中的主障碍物进行轨迹预测。

52、本公开的另一个方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述轨迹预测模型生成方法或模型训练方法。

53、本公开的另一个方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述轨迹预测模型生成方法或模型训练方法。

54、本公开的另一个方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述轨迹预测模型生成方法或模型训练方法。

55、根据本公开的实施例,针对相关技术中的轨迹预测模型场景局限性比较大的缺陷,本公开实施例的方法,通过预训练好调参模型以及多个轨迹预测模型存储在模型库中,同一个轨迹预测模型可针对同一种任务类别下的多种场景中的障碍物的轨迹进行预测,调参模型用于根据不同的场景对轨迹预测模型进行调参,以适应不同的任务场景下的轨迹预测。因此,在确定与当前驾驶场景对应的任务类别,并以此确定当前模型库中不存在适用于当前驾驶场景的预测模型后,通过利用调参模型根据新的场景信息对轨迹预测模型进行调参,可以适应新任务场景下的轨迹预测。如此,可解决相关技术中轨迹预测模型场景局限性比较大的缺陷,可快速适用不同场景下的轨迹预测,使得轨迹预测不受场景的限制,不受障碍物类型的限制,具有较强的场景泛化能力。

56、进一步地,本公开实施例中,利用调参模型根据新的场景信息对轨迹预测模型进行调参的过程不同于传统的深度学习,调参模型的参数经过预训练,在面对新的任务场景时,无需从头开始调参,也无需大量标签数据重新进行训练,只需要新场景下的少量数据对模型参数自动微调即可,无需如相关技术中针对每一个驾驶场景都从头开始进行调参,然后耗费大量的时间去训练并测试效果,较大程度上缩短了模型训练的周期,提高了模型调整的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1