物体围捕方法和装置

文档序号:34999797发布日期:2023-08-04 00:44阅读:52来源:国知局
物体围捕方法和装置

本技术涉及人工智能,特别是涉及一种物体围捕方法和装置。


背景技术:

1、随着无人潜航器的广泛应用,无人潜航器(autonomous underwater vehicle,auv)被广泛用于执行海底复杂任务,以增强海洋感知能力与防御能力。

2、以物体围捕任务为例,相关技术中,对物体围捕的方法通常是在已知环境下,确定物体的位置,或者提前预知物体进入海底时的运动轨迹,以其位置或运动轨迹为指导进行物体围捕。

3、然而,水下作业环境复杂多变,相关技术中无法准确预知物体的位置或运动轨迹,导致auv执行物体围捕任务的成功率较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种物体围捕方法和装置,以提升物体围捕的成功率。

2、第一方面,本技术提供了一种物体围捕方法,该方法包括:

3、基于待围捕物体的当前位置和多个潜航器的当前部署位置,确定多个候选围捕策略;不同的候选围捕策略中参与围捕的潜航器不同,且不同的候选围捕策略中待围捕物体和各潜航器在未来多个时刻的运动位置均不同;

4、从多个候选围捕策略中确定目标围捕策略;

5、向目标围捕策略中参与围捕的潜航器下发目标围捕策略,以对待围捕物体进行围捕。

6、在其中一个实施例中,基于待围捕物体的当前位置和多个潜航器的当前部署位置,确定多个候选围捕策略,包括:

7、对多个潜航器进行划分,获取多个潜航器组合;

8、根据待围捕物体的当前位置和每个潜航器组合中各潜航器的当前部署位置,确定多个候选围捕策略;每个潜航器组合对应一种候选围捕策略。

9、在其中一个实施例中,根据待围捕物体的当前位置和每个潜航器组合中潜航器的当前部署位置,确定多个候选围捕策略,包括:

10、对于任一潜航器组合,基于待围捕物体的当前位置和潜航器组合中各潜航器的当前部署位置,确定至少一个目标潜航器;

11、基于待围捕物体的当前位置和各目标潜航器的当前部署位置,获取各目标潜航器在未来多个时刻的围捕动作以及待围捕物体在未来多个时刻的逃逸动作;

12、将各目标潜航器在未来多个时刻的围捕动作以及待围捕物体在未来多个时刻的逃逸动作,确定为潜航器组合对应的候选围捕策略。

13、在其中一个实施例中,基于待围捕物体的当前位置和潜航器组合中各潜航器的当前部署位置,确定至少一个目标潜航器,包括:

14、获取各潜航器与待围捕物体的距离;

15、根据各潜航器与待围捕物体的距离、各潜航器的攻击半径以及各潜航器的感知半径,确定潜航器组合中的目标潜航器。

16、在其中一个实施例中,基于待围捕物体的当前位置、各目标潜航器的当前部署位置,获取各目标潜航器在未来多个时刻的围捕动作以及待围捕物体在未来多个时刻的逃逸动作,包括:

17、获取当前时刻的平均通信时延;

18、根据当前时刻和当前时刻的平均通信时延,获取实际围捕时刻;

19、若实际围捕时刻超出预设围捕时刻,则从动作空间集合中,确定当前时刻各目标潜航器的围捕动作以及待围捕物体的逃逸动作;动作空间集合是根据各目标潜航器的避碰约束条件、通信约束条件以及终止约束条件得到的。

20、在其中一个实施例中,获取当前时刻的平均通信时延,包括:

21、根据各目标潜航器的当前部署位置和待围捕物体的当前位置确定多个位置向量;

22、根据水下声音传播速度与待围捕物体的逃逸速度,确定各目标潜航器的围捕速度时延;并将各位置向量与围捕速度时延的比值确定为各目标潜航器的围捕通信时延;

23、根据水下声音传播速度与各目标潜航器的围捕速度,确定待围捕物体相对各目标潜航器的逃逸速度时延;并将各位置向量与逃逸速度时延的比值确定为待围捕物体相对各目标潜航器的逃逸通信时延;

24、根据各目标潜航器的围捕通信时延和待围捕物体相对各目标潜航器的逃逸通信时延,确定为平均通信时延。

25、在其中一个实施例中,从多个候选围捕策略中确定目标围捕策略,包括:

26、获取各候选围捕策略的平均奖励值;

27、将满足预设围捕条件的候选围捕策略,确定为目标围捕策略。

28、在其中一个实施例中,获取各候选围捕策略的平均奖励值,包括:

29、对于任一候选围捕策略,将候选围捕策略输入预设策略评估模型中,输出候选围捕策略中各潜航器的奖励值,以及候选围捕策略中待围捕物体的奖励值;

30、将候选围捕策略中各潜航器的奖励值和候选围捕策略中待围捕物体的奖励值的均值,确定为候选围捕策略的平均奖励值。

31、在其中一个实施例中,候选围捕策略包括候选收敛阈值,将满足预设围捕条件的候选围捕策略,确定为目标围捕策略,包括:

32、根据各候选围捕策略的平均奖励值构建平均奖励曲线;

33、若平均奖励曲线满足预设收敛阈值,则将平均奖励曲线上末端平均奖励值对应的候选围捕策略确定为目标围捕策略。

34、第二方面,本技术还提供了一种物体围捕装置,该装置包括:

35、策略获取模块,用于基于待围捕物体的当前位置和多个潜航器的当前部署位置,确定多个候选围捕策略;不同的候选围捕策略中参与围捕的潜航器不同,且不同的候选围捕策略中待围捕物体和各潜航器在未来多个时刻的运动位置均不同;

36、策略选择模块,用于从多个候选围捕策略中确定目标围捕策略;

37、策略发送模块,用于向目标围捕策略中参与围捕的潜航器下发目标围捕策略,以对待围捕物体进行围捕。

38、第三方面,本技术还提供了一种计算机设备。该计算机设备包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述第一方面中任一项实施例中的方法的步骤。

39、第四方面,本技术还提供了一种计算机可读存储介质。该计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。

40、第五方面,本技术还提供了一种计算机程序产品。该计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面中任一项实施例中的方法的步骤。

41、上述物体围捕方法和装置,首先基于待围捕物体的当前位置和多个潜航器的当前部署位置,确定多个候选围捕策略,然后从多个候选围捕策略中确定目标围捕策略,最后向目标围捕策略中参与围捕的潜航器下发目标围捕策略,以对待围捕物体进行围捕。其中,不同的候选围捕策略中参与围捕的潜航器不同,且不同的候选围捕策略中待围捕物体和各潜航器在未来多个时刻的运动位置均不同。由于该方法中的候选围捕策略是在获取待围捕物体的当前位置和多个潜航器的当前部署位置的基础上确定的,并且候选围捕策略中待围捕物体和各潜航器在未来多个时刻的运动位置均不同,也就是说,本方法在获取候选围捕策略的过程中,考虑了待围捕物体与潜航器的相对位置,以及待围捕物体与各潜航器在围捕过程中未来多个时刻产生的对抗行为,这样获取的候选围捕策略更贴合待围捕物体与潜航器的实际围捕过程。另外,候选围捕策略有多个,且各候选围捕策略中参与围捕的潜航器不同,这就意味着,本方法确定的候选围捕策略的数量是可以依据潜航器的数量、组合方式等多维因素而确定的。自然地,候选围捕策略的数量也包括多个。由于候选围捕策略的组合是依据多个维度组成的,目标围捕策略也是综合多维度因素考量的。综上,该方法确定的候选围捕策略具备全面性以及多样性,那么根据多个候选围捕策略确定的目标围捕策略是也是综合了多个维度的考量,能够提升目标围捕策略的准确性。进一步地,向目标围捕策略中参与围捕的潜航器下发目标围捕策略,以对待围捕物体进行围捕的成功率也就更高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1