本发明涉及机器人测评,具体为一种机器人运动轨迹的时空测评方法及系统。
背景技术:
1、随着自主机器人技术的飞速发展,机器人在执行任务过程中的自主导航能力日益成为评价其性能的关键指标。在自主机器人领域,其性能的衡量涉及感知、决策、操作和运动等多个复杂环节。在众多评估指标中,机器人的运动轨迹分析被广泛认为是反映自主导航性能的重要方法。
2、传统方法主要关注机器人如何以最高效的方式,如在最短时间、最少距离内、并且消耗最小量的能量,到达预定目的地,然而却无法连续监测机器人运动轨迹在整个时间内的综合性能。采用连续监测不仅可以帮助团队实时发现并进行及时纠偏,优化机器人的行为和路径规划,提高环境感知能力,从而提高机器人在各种任务和环境中的整体表现水平,在机器人测评领域重要性显著提高。
3、运用信号时序逻辑可以描述机器人的连续位置信息和时序信息。信号时序逻辑(stl,signal temporal logic)是一种用于描述和分析系统在时间维度上的行为的形式化语言,它允许用户以数学上严谨的方式定义系统行为的时间约束和条件。且现有技术中的评估体系多以无人系统智能性等级的一般性分类标准为参考,但这些分类标准并未提供一个明确、可量化的评价运动轨迹优劣的方法。
4、现有技术中,专利公开号为cn114489055a的发明专利,公开一种基于时序逻辑的机器人多任务运动实现方法、介质及设备,文中基于时序逻辑,将复杂操作任务规范编码为可解释的wtltl公式,能够快速规划具有用户偏好的复杂操作任务的运动轨迹,计算复杂度低,规划效率高。现有技术,只是时序逻辑在机器人系统的运动规划的一种应用,用于运动轨迹规划。
技术实现思路
1、本发明所要解决的技术问题在于:解决现有运动轨迹的测评结果缺乏具体等级量化指标来描述,且现有测评方法仅仅通过总距离和总时长来进行测评,不能从时序特征和连续信号来区分运动轨迹在某一时间段的好坏,无法全面客观地判断机器人在执行任务时运动轨迹的优劣的问题。
2、为解决上述技术问题,本发明提供如下技术方案:
3、一种机器人运动轨迹的时空测评方法,包括以下步骤:
4、s100,将机器人运动轨迹的测评等级,利用信号时序逻辑规则划分不同的级别,并对每个级别进行区分和描述;
5、s200,从时序指标和空间指标两个维度下,分别对机器人运动轨迹进行测评,获取时序指标下,每个级别的最优时序级别stl参数模型,以及获取空间指标下,每个级别的最优空间级别stl参数模型;
6、s300,利用逻辑连接符,将每个级别下的最优时序级别stl参数模型和最优空间级别stl参数模型组合进行融合,获取每个级别下多个级别融合stl参数模型;
7、s400,从每个级别下的多个级别融合stl参数模型中,选取准确率最高的模型,作为这个级别下的,最优级别融合stl参数模型;
8、s500,将同一条机器人运动轨迹分别放入不同级别下的最优级别融合stl参数模型,对机器人运动轨迹进行测评;并将测评结果按照不同的级别进行分类,以全面反应机器人运动轨迹的优劣。
9、优点:本发明利用stl描述机器人的连续位置信息和时序信息,进而构建一种机器人运动轨迹的时空融合测评方法,并将测评结果按照不同等级分类,能够全面反应机器人运动轨迹的优劣。
10、在本发明的一实施例中,通过以下公式表示机器人运动轨迹的测评等级:
11、hi:stl[ai,bi](yj≤index≤yk);
12、式中,hi为机器人运动轨迹的第i级,其中,i=1,2,3,...,n,n为级别的等级;stl为信号时序逻辑规则符号,包括“□”、“◇”、“∧”和“∨”;其中,“□”表示全局性质,在要求在设定范围内必须始终满足设定stl公式约束;“◇”表示最终性质,在要求设定范围内存在某个时刻满足设定stl公式约束;“∧”表示逻辑与,表示两个条件必须同时满足;“∨”表示逻辑或,两个条件中至少有一个满足即可;[ai,bi]为级别区域;index为指标值,yj和yk分别为指标值的上、下界限值。
13、在本发明的一实施例中,使用传感器、视觉系统或模拟器获取机器人的时序指标和空间指标;其中,时序指标用“投影距离-投影时长”表示;空间指标用笛卡尔坐标系的“x-y”表示。
14、在本发明的一实施例中,获取步骤s200中,时序指标下,每个级别的最优时序级别stl参数模型,包括以下步骤:
15、s211,定义时序级别stl初始模型;
16、s212,初始化时序级别stl初始模型的参数;
17、s213,计算鲁棒度:应用鲁棒度表征轨迹信号点与满足时序级别stl初始模型轨迹的偏离距离;
18、s214,定义激励函数:对于每个级别下,时序级别stl初始模型的训练目标函数,以鲁棒度计算结果值最小的函数作为奖励函数;
19、s215,建立强化学习模型:使用强化学习算法,建立初始时序级别stl参数模型,以时序指标作为输入,以初始时序级别stl参数模型的stl模型参数作为输出;
20、s216,训练和获取模型:使用数据集,对初始时序级别stl参数模型进行训练;在每次训练迭代中,根据当前状态和模型的输出,执行相应的动作,并观察环境的反馈;通过奖励函数,对模型参数进行更新和优化,以逐步学习,获取每个级别的最优时序级别stl参数模型。
21、在本发明的一实施例中,在时序指标下,多个鲁棒度由以下公式获取:
22、
23、其中,x(t)为t时刻的监测信号,l(x(t)为t时刻x信号的评价结果,l(x)为x信号的时序评价结果,c是常量,为不同的信号时序逻辑,表示为时序指标下任务的“交”,表示为时序指标下任务的“并”,[a,b)为时间区间;其中,根据每个级别下,有多个不同的时序级别stl初始模型,每个时序级别stl初始模型分别对应不同的鲁棒度进行计算;通过信号时序逻辑规则符号,确认每个时序级别stl初始模型,对应的鲁棒度进行计算。
24、在本发明的一实施例中,空间指标下获取每个级别的最优空间级别stl参数模型的步骤与获取时序指标下每个级别的最优时序级别stl参数模型的步骤相同;区别在于:空间指标下的多个鲁棒度由以下公式获取:
25、
26、式中,x(t)为t位置的监测信号,l(x(t)为t位置x信号的评价结果,l(x)为x信号的空间评价结果,c是常量,φ、φ1、φ2为不同的信号空间逻辑,φ1∧φ2表示为空间指标下任务的“交”,φ1∨φ2表示为空间指标下任务的“并”,[a,b)为位置点区间;其中,根据每个级别下,有多个不同的空间级别stl初始模型,每个空间级别stl初始模型分别对应不同的鲁棒度进行计算;通过信号时序逻辑规则符号,确认每个空间级别stl初始模型,对应的鲁棒度进行计算。
27、在本发明的一实施例中,空间指标下,建立的强化学习模型,以空间指标作为输入,以初始空间级别stl参数模型的stl模型参数作为输出。
28、在本发明的一实施例中,空间指标下,获取每个级别下的最优时序级别stl参数模型和最优空间级别stl参数模型时的训练集,包括时序训练集和空间训练集;且时序训练集中包括用于不同级别训练的时序训练子集,以及空间训练集包括用于不同级别训练的空间训练子集。
29、在本发明的一实施例中,逻辑连接符为“and”连接符和“or”连接符。
30、本发明还提供一种基于上述所述的机器人运动轨迹的时空测评方法的系统,包括:
31、等级划分模块,用于将机器人运动轨迹的测评等级,利用信号时序逻辑规则划分不同的级别,并对每个级别进行区分和描述;
32、最优参数模型模块,用于从时序指标和空间指标两个维度下,分别对机器人运动轨迹进行测评,获取时序指标下,每个级别的最优时序级别stl参数模型,以及获取空间指标下,每个级别的最优空间级别stl参数模型;
33、级别融合模块,用于利用逻辑连接符,将每个级别下的最优时序级别stl参数模型和最优空间级别stl参数模型组合进行融合,获取每个级别下多个级别融合stl参数模型;
34、最优级别融合模块,用于从每个级别下的多个级别融合stl参数模型中,选取准确率最高的模型,作为这个级别下的,最优级别融合stl参数模型;
35、测评级别分类模块,用于将同一条机器人运动轨迹分别放入不同级别下的最优级别融合stl参数模型,对机器人运动轨迹进行测评;并将测评结果按照不同的级别进行分类,以全面反应机器人运动轨迹的优劣。
36、与现有技术相比,本发明的有益效果是:提出了一种基于机器人连续轨迹信号的时间-空间(时空)测评方法,通过设定可量化的等级区间辨识机器人运动轨迹,从而可精确地量化机器人在连续作业期间的优劣程度。然后构建stl公式,分别从时序指标和空间位置两个维度来提取机器人轨迹特征,运用强化学习算法来获取最优的空间和时间stl公式参数,并将两个公式进行连接,实现时间和空间的融合评估。本发明不仅提升了评价准确性,同时为机器人自主导航性能的优化和提高提供了新的理论依据和实践手段。