技术特征:
1.一种多人零和博弈可重构机器人最优控制方法,其特征在于,包括:根据可重构机器人的转动惯量、加速比、摩擦力和所述可重构机器人子系统之间的交联耦合项构建子系统的动力学模型;根据全局位置误差和所述动力学模型利用多人零和博弈方法构建性能指标函数;所述全局位置误差包括所述可重构机器人子系统的位置误差以及速度误差;根据所述性能指标函数和所述动力学模型利用贝尔曼最优性原理得到哈密顿-雅克比-埃塞克方程;通过所述哈密顿-雅克比-埃塞克方程和所述动力学模型确定补偿控制律;利用神经网络对所述性能指标函数进行处理,得到近似权值;利用所述近似权值和所述哈密顿-雅克比-埃塞克方程得到优化控制律;根据所述补偿控制律和所述优化控制律确定所述可重构机器人的最优控制律。2.根据权利要求1所述的多人零和博弈可重构机器人最优控制方法,其特征在于,所述根据全局位置误差和所述动力学模型利用多人零和博弈方法构建性能指标函数,具体包括:根据所述动力学模型、可重构机器人子系统的位置分量及速度分量确定子系统的状态空间;基于多人零和博弈方法利用漂移动力学对所述状态空间进行扩张,得到扩张函数;根据所述扩张函数和所述全局位置误差构建性能指标函数。3.根据权利要求1所述的多人零和博弈可重构机器人最优控制方法,其特征在于,所述根据所述性能指标函数和所述动力学模型利用贝尔曼最优性原理得到哈密顿-雅克比-埃塞克方程,具体包括:将所述动力学模型进行转换,得到机器人速度动力学模型;根据所述性能指标函数对所述机器人速度动力学模型进行最小化处理,得哈密顿函数;根据所述哈密顿函数利用贝尔曼最优性原理得到哈密顿-雅克比-埃塞克方程。4.根据权利要求3所述的多人零和博弈可重构机器人最优控制方法,其特征在于,所述通过所述哈密顿-雅克比-埃塞克方程和所述动力学模型确定补偿控制律,具体包括:根据所述哈密顿-雅克比-埃塞克方程和可重构机器人子系统的鞍点确定子系统的第一控制律;根据所述第一控制律和所述动力学模型中的子系统的设定模型确定补偿控制律。5.根据权利要求4所述的多人零和博弈可重构机器人最优控制方法,其特征在于,所述利用所述近似权值和所述哈密顿-雅克比-埃塞克方程得到优化控制律,具体包括:利用所述神经网络对所述性能指标函数的梯度进行处理,得到近似梯度;根据所述近似权值和所述性能指标函数建立评判神经网络;根据所述评判神经网络和所述第一控制律得到第二控制律;根据所述第二控制律、所述哈密顿-雅克比-埃塞克方程、所述性能指标函数和所述近似梯度得到优化控制律。6.根据权利要求1所述的多人零和博弈可重构机器人最优控制方法,其特征在于,所述根据所述补偿控制律和所述优化控制律确定所述可重构机器人的最优控制律,具体包括:
对所述补偿控制律和所述优化控制律进行求和,得到所述可重构机器人的最优控制律。7.一种多人零和博弈可重构机器人最优控制系统,其特征在于,包括:子系统的动力学模型构建模块,用于根据可重构机器人的转动惯量、加速比、摩擦力和所述可重构机器人子系统之间的交联耦合项构建子系统的动力学模型;性能指标函数构建模块,用于根据全局位置误差和所述动力学模型利用多人零和博弈方法构建性能指标函数;所述全局位置误差包括所述可重构机器人子系统的位置误差以及速度误差;哈密顿-雅克比-埃塞克方程构建模块,用于根据所述性能指标函数和所述动力学模型利用贝尔曼最优性原理得到哈密顿-雅克比-埃塞克方程;补偿控制律确定模块,用于通过所述哈密顿-雅克比-埃塞克方程和所述动力学模型确定补偿控制律;近似权值确定模块,用于利用神经网络对所述性能指标函数进行处理,得到近似权值;优化控制律确定模块,用于利用所述近似权值和所述哈密顿-雅克比-埃塞克方程得到优化控制律;最优控制律确定模块,用于根据所述补偿控制律和所述优化控制律确定所述可重构机器人的最优控制律。8.根据权利要求7所述的多人零和博弈可重构机器人最优控制系统,其特征在于,所述性能指标函数构建模块,具体包括:子系统的状态空间确定单元,用于根据所述动力学模型、可重构机器人子系统的位置分量及速度分量确定子系统的状态空间;扩张单元,用于基于多人零和博弈方法利用漂移动力学对所述状态空间进行扩张,得到扩张函数;性能指标函数构建单元,用于根据所述扩张函数和所述全局位置误差构建性能指标函数。9.根据权利要求7所述的多人零和博弈可重构机器人最优控制系统,其特征在于,所述哈密顿-雅克比-埃塞克方程构建模块,具体包括:转换单元,用于将所述动力学模型进行转换,得到机器人速度动力学模型;最小化处理单元,用于根据所述性能指标函数对所述机器人速度动力学模型进行最小化处理,得哈密顿函数;哈密顿-雅克比-埃塞克方程确定单元,用于根据所述哈密顿函数利用贝尔曼最优性原理得到哈密顿-雅克比-埃塞克方程。10.根据权利要求9所述的多人零和博弈可重构机器人最优控制系统,其特征在于,所述补偿控制律确定模块,具体包括:第一控制律确定单元,用于根据所述哈密顿-雅克比-埃塞克方程和可重构机器人子系统的鞍点确定子系统的第一控制律;补偿控制律确定单元,用于根据所述第一控制律和所述动力学模型中的子系统的设定模型确定补偿控制律。
技术总结
本发明涉及一种多人零和博弈可重构机器人最优控制方法及系统,包括:根据可重构机器人的转动惯量、加速比、摩擦力和可重构机器人子系统之间的交联耦合项构建子系统的动力学模型;根据全局位置误差和动力学模型利用多人零和博弈方法构建性能指标函数;根据性能指标函数和动力学模型利用贝尔曼最优性原理得到哈密顿-雅克比-埃塞克方程;通过哈密顿-雅克比-埃塞克方程和动力学模型确定补偿控制律;利用神经网络对性能指标函数进行处理,得到近似权值;利用近似权值和哈密顿-雅克比-埃塞克方程得到优化控制律;根据补偿控制律和优化控制律确定可重构机器人的最优控制律。本发明能够提高机器人系统的准确性和稳定性。够提高机器人系统的准确性和稳定性。够提高机器人系统的准确性和稳定性。
技术研发人员:朱新野 安天骄 董博 李元春
受保护的技术使用者:白城师范学院
技术研发日:2021.11.11
技术公布日:2022/1/11