本发明涉及水下机器人规划技术领域,特别涉及一种仿生滑翔机器海豚的实时路径规划方法及系统。
背景技术:
近年来,水下仿生机器人在海上巡游、搜救、探索等任务方面起着愈加重要的作用,引起了许多科研人员的广泛关注。仿生机器人凭借其优越的机动性和高速性,成功实现了前后滚翻、连续跃水等高难度杂技动作,但随之而来的是巨大的能量消耗。因此,通过借鉴水下滑翔器的浮力调节机制,科研人员研制了仿生滑翔机器海豚,使其兼具滑翔运动和仿海豚波动运动,从而同时获得高机动与强续航的能力,极大扩展了实际应用的领域和范围。
而路径规划问题一直以来都是水下机器人的研究热点,其目标是规划出从初始点到目标点的一条最优路径,并且充分考虑路径长度、安全性和光滑性,对水下机器人的自主作业意义重大。近年来,路径规划的环境适应性问题越来越受到研究者的关注,其主要分为传统规划方法和智能规划方法。其中,传统规划方法主要依靠全局地图信息获取障碍位置,提前规划路径。因此该方法往往对应静态且障碍位置已知的环境,难以满足实时性要求。智能规划方法通过学习规划策略,对路径进行优化,从而提高环境适应性。但既往研究的环境大多较为简单且静态,不适用于实际应用。
技术实现要素:
为了解决现有技术中的上述问题,即为了能够根据动态变化环境规划路径,本发明的目的在于提供一种仿生滑翔机器海豚的实时路径规划方法及系统。
为解决上述技术问题,本发明提供了如下方案:
一种仿生滑翔机器海豚的实时路径规划方法,包括:
基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
可选地,所述路径规划方法还包括:
根据所述仿生滑翔机器海豚在水下的当前位置、目标点、障碍位置及模拟地图,建立多目标优化函数;
根据所述多目标优化函数,修正所述路径规划网络。
可选地,根据所述仿生滑翔机器海豚在水下的当前位置、目标点、障碍位置及模拟地图,建立多目标优化函数,具体包括:
根据所述仿生滑翔机器海豚在水下的当前位置、目标点、障碍位置及模拟地图,确定所述仿生滑翔机器海豚在水下当前的状态量;
所述状态量包括:
仿生滑翔机器海豚的当前位置与障碍物之间的距离dobs;当仿生滑翔机器海豚在设定阈值范围内没有探测到障碍物时,则dobs为常数;当探测到多个障碍物时,dobs为仿生滑翔机器海豚的当前位置与各障碍物之间的最小距离;
仿生滑翔机器海豚当前位置与距离最近障碍物之间的方位夹角
仿生滑翔机器海豚当前位置与目标点之间的方位夹角
第一布尔值bwall;当仿生滑翔机器海豚在规划过程中碰到墙壁,bwall为1,反之为0;
第二布尔值bgoal;当仿生滑翔机器海豚到达目标点时,bgoal为1,反之为0;
根据以下公式,确定所述多目标优化函数r:
其中,ri表示子奖励项,ωi表示各项奖励的权重正常数,i=1,2,3,4,5,6;
(1)r1=-dg/dmax;其中,dg表示仿生滑翔机器海豚当前位置与目标点之间的距离,dmax表示模拟地图的最大距离;
(2)r2=-f(dobs);其中,f(x)为势场函数:
(3)
(4)
(5)r5=-cwall/ω5;如果仿生滑翔机器海豚越过地图的边界,则cwall为正常数,否则为0;
(6)r6=cgoal/ω6;如果仿生滑翔机器海豚到达目标点,则cgoal为正常数,否则为0。
可选地,dmax为模拟地图的对角距离。
可选地,所述路径规划方法还包括:
根据所述当前状态量、动作量及路径规划网络,确定最小化损失函数;
通过迭代最小化损失函数,更新状态量。
可选地,根据以下公式确定最小化损失函数l(θj):
其中,sj表示状态量,θj表示价值网络的参数,aj表示动作量,j表示目标趋近阶段tas或障碍避碰阶段oas,qj(sj,aj;θj)为行为值函数,e(·)表示求期望,γ表示折扣因子,sj′表示下一步状态,aj′表示下一步状态,θj′表示目标网络的参数。
可选地,根据以下公式,确定前进步长l:
其中,
为解决上述技术问题,本发明还提供了如下方案:
一种仿生滑翔机器海豚的实时路径规划系统,包括:
第一确定单元,用于基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
建模单元,用于根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
计算单元,用于根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
第二确定单元,用于根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
为解决上述技术问题,本发明还提供了如下方案:
一种仿生滑翔机器海豚的实时路径规划系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
为解决上述技术问题,本发明还提供了如下方案:
一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
根据本发明的实施例,本发明公开了以下技术效果:
本发明首先确定多种转向模态及对应的最小转向半径,并实时根据仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,调整路径规划网络,所述路径规划网络包括趋近网络和避障网络,进而确定前进方向及前进步长,以控制仿生滑翔机器海豚的前进动作,从而可实现对仿生滑翔机器海豚的实时路径的有效规划。
附图说明
图1是本发明仿生滑翔机器海豚的实时路径规划方法的流程图;
图2是本发明仿生滑翔机器海豚的实时路径规划方法的一具体实施例流程图;
图3是本发明仿生滑翔机器海豚的实时路径规划系统的模块结构示意图。
符号说明:
第一确定单元—1,建模单元—2,计算单元—3,第二确定单元—4。
具体实施方式
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。
本发明的目的是提供一种仿生滑翔机器海豚的实时路径规划方法,首先确定多种转向模态及对应的最小转向半径,并实时根据仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,调整路径规划网络,所述路径规划网络包括趋近网络和避障网络,进而确定前进方向及前进步长,以控制仿生滑翔机器海豚的前进动作,从而可实现对仿生滑翔机器海豚的实时路径的有效规划。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明仿生滑翔机器海豚的实时路径规划方法包括:
步骤100:基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径。
步骤200:根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络。
步骤300:根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长。
步骤400:根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
其中,仿生滑翔机器海豚主要由腰尾装置和胸鳍装置构成,腰尾关节均由电机驱动,两侧胸鳍由舵机驱动。其中,腰尾装置的身体、尾鳍模式(body-caudalfin,bcf)主要用于提供推力,胸鳍装置的中间鳍、对鳍模式(medianpairedfin,mpf)则用来产生转向力矩。
在步骤100中,以右转向为例,构建四种基于bcf和mpf的转向模态(在本发明中,为了追求转向力矩最大化,设置固定角度为90°):模态一,利用bcf模态产生前进推力,并保持一侧胸鳍为90°,以此产生转向力矩;模态二,保持尾鳍静止,利用单侧胸鳍实现mpf运动;模态三,在模态二的基础上使另一侧胸鳍保持偏置90°;模态四,首先将一侧胸鳍偏置180°,然后双侧胸鳍同时拍动以产生转向差动力矩。
将所述转向模态应用于仿生滑翔机器海豚,在实际水池中进行转向半径测试,确定模态四获取到最小转向半径,大约0.2米。
优选地,本发明仿生滑翔机器海豚的实时路径规划方法还包括:
s1:根据所述仿生滑翔机器海豚在水下的当前位置、目标点、障碍位置及模拟地图,建立多目标优化函数。
具体包括:
s11:根据所述仿生滑翔机器海豚在水下的当前位置、目标点、障碍位置及模拟地图,确定所述仿生滑翔机器海豚在水下当前的状态量。
其中,所述状态量包括:
仿生滑翔机器海豚的当前位置与障碍物之间的距离dobs,主要保证仿生滑翔机器海豚在障碍物周围能够安全移动;当仿生滑翔机器海豚在设定阈值范围内没有探测到障碍物时,则dobs为常数;当探测到多个障碍物时,dobs为仿生滑翔机器海豚的当前位置与各障碍物之间的最小距离;
仿生滑翔机器海豚当前位置与距离最近障碍物之间的方位夹角
仿生滑翔机器海豚当前位置与目标点之间的方位夹角
第一布尔值bwall;当仿生滑翔机器海豚在规划过程中碰到墙壁,bwall为1,反之为0;
第二布尔值bgoal;当仿生滑翔机器海豚到达目标点时,bgoal为1,反之为0。
s12:根据以下公式,确定所述多目标优化函数r:
其中,ri表示子奖励项,ωi表示各项奖励的权重正常数,i=1,2,3,4,5,6;
(1)r1=-dg/dmax;其中,dg表示仿生滑翔机器海豚当前位置与目标点之间的距离,dmax表示模拟地图的最大距离;在本实施例中,dmax为模拟地图的对角距离;
(2)r2=-f(dobs);其中,f(x)为势场函数:
(3)
(4)
(5)r5=-cwall/ω5;如果仿生滑翔机器海豚越过地图的边界,则cwall为正常数,否则为0;
(6)r6=cgoal/ω6;如果仿生滑翔机器海豚到达目标点,则cgoal为正常数,否则为0。
s2:根据所述多目标优化函数,修正所述路径规划网络。
进一步地,本发明仿生滑翔机器海豚的实时路径规划方法还包括:
根据所述当前状态量、动作量及路径规划网络,确定最小化损失函数;
通过迭代最小化损失函数,更新状态量。
其中,根据以下公式确定最小化损失函数l(θj):
其中,sj表示状态量,θj表示价值网络的参数,aj表示动作量,j表示目标趋近阶段tas或障碍避碰阶段oas,qj(sj,aj;θj)为行为值函数,e(·)表示求期望,γ表示折扣因子,sj′表示下一步状态,aj′表示下一步状态,θj′表示目标网络的参数。
针对路径规划问题,本发明提出一种离散动作空间法,即朝某一方向移动一个步长为l的距离,其中方向角的范围为±30°,方向角步长为2°。所述方向角步长越小,动作空间越大,路径平滑度越好,但网络训练难度也越大,越难收敛。
本发明利用多边形来近似圆,然后运用余弦定理可以得到前进步长l、仿生滑翔机器海豚运动方向
当l取最小值,
本发明仿生滑翔机器海豚的实时路径规划方法首先设计滑翔海豚的多种平面转向模态,并基于此求取滑翔海豚的运动学约束条件(即最小转向半径)。然后,将路径规划问题转化为一个多目标优化问题,并基于此设计状态量、动作量、多目标优化函数以及分层网络结构。最后,通过运用分层深度强化学习算法,设计目标趋近阶段和障碍避碰阶段并分别规划,从而得到兼具平滑性与安全性的平面路径。
此外,本发明还提供一种仿生滑翔机器海豚的实时路径规划系统,能够根据动态变化环境规划路径。
如图3所示,本发明仿生滑翔机器海豚的实时路径规划系统包括第一确定单元1、建模单元2、计算单元3及第二确定单元4。
具体地,所述第一确定单元1用于基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
所述建模单元2用于根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
所述计算单元3用于根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
所述第二确定单元4用于根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
此外,本发明还提供了一种仿生滑翔机器海豚的实时路径规划系统,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
进一步地,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:基于仿生滑翔机器海豚的尾鳍模式和对鳍模式,确定多种转向模态及对应的最小转向半径;
根据所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,得到路径规划网络,所述路径规划网络包括趋近网络和避障网络;
根据所述最小转向半径、所述仿生滑翔机器海豚在水下的当前位置、目标点及障碍位置,确定所述仿生滑翔机器海豚的动作量,所述动作量包括前进方向及前进步长;
根据所述动作量及路径规划网络,确定所述仿生滑翔机器海豚的当前动作。
相对于现有技术,本发明仿生滑翔机器海豚的实时路径规划系统、计算机可读存储介质与上述仿生滑翔机器海豚的实时路径规划方法的有益效果相同,在此不再赘述。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。