基于群体博弈的卫星群任务分配方法

文档序号：32215213发布日期：2022-11-16 07:19阅读：281来源：国知局

1.本发明涉及卫星群任务分配方法，具体地应用于卫星的任务分配中，可以实现星群对卫星任务的分布式执行。

背景技术：

2.随着航天技术的发展及卫星任务的复杂化，单一卫星很难或不能完成空间特定任务，需要由多个卫星协同完成。人们对由多颗卫星构成的卫星集群产生了浓厚的兴趣。这种卫星集群可以由有着不同结构及功能的卫星组成也可由具有相同物理电气通信接口的细胞卫星构成，每一个卫星都是一个独立的个体。卫星集群可以根据任务的需要进行在轨组合和变构。由这些小卫星组成集群执行相应的任务，可以增加卫星执行任务的灵活性，如何在星群中进行任务分配成为实现这一功能的重要问题。
3.博弈论已经成为许多不同研究领域中用来解决不同问题的应用工具，群体博弈被引入来描述大量群体之间的策略选择分布。不同于一般博弈，群体博弈不研究单个博弈参与者的策略选择，而是研究整个群体中的策略选择分布。近年来它的重要研究领域是优化控制器设计和资源分配问题。策略限制的群体博弈模型可以对选择不同策略的玩家间的互动进行限制，可以解决分布式分配问题。

技术实现要素：

4.本发明的目的是为了解决现有卫星群任务分配的问题，而提出基于群体博弈的卫星群任务分配方法。
5.基于群体博弈的卫星群任务分配方法具体过程为：
6.s1：设定固连细胞星群的任务指标；
7.设定初始姿态四元数和初始角速度；
8.设定期望姿态四元数和期望角速度；
9.s2：基于s1设定的固连细胞星群的任务指标和卫星间的连接拓扑关系，建立t时刻的有策略限制的群体博弈模型；
10.所述t时刻为当前时刻；
11.s3：利用动力学求解s2中建立的有策略限制的群体博弈模型，得到t+step时刻的有策略限制的群体博弈模型的nash均衡解和对应的t+step时刻内的姿态四元数及角速度；
12.所述nash均衡解即为各细胞星指标分配分布状况；
13.判断t+step时刻的姿态四元数、角速度与期望姿态四元数、期望角速度是否满足误差范围；
14.若满足误差范围，则得到最终的t+step时刻的有策略限制的群体博弈模型的nash均衡解；
15.若不满足误差范围，则执行s4；
16.s4：令t＝t+step，获得此时的星群质量即分配指标重复s2-s3得到该周期内的有策略限制的群体博弈模型的nash均衡解和对应的姿态四元数及角速度；直至该周期内的姿态四元数、角速度与期望姿态四元数、期望角速度满足误差范围；
17.所述pi表示分配到此细胞星的力矩值的绝对值，i表示星群中卫星的编号，每个卫星代表一个策略，所有卫星构成策略集s；i＝1,2，
…
，n，i∈s；p＝[p1,p2,...,pn]表示星群状态集。
[0018]
本发明的有益效果：
[0019]
本发明可以选择不同的任务指标和对每个卫星收益函数的设计，实现卫星不同任务的分配。本发明不用集中计算每个卫星分配到的任务指标，对卫星的数量变化及结构变化不敏感，降低了计算量及复杂程度。本发明不用卫星与其它所有卫星之间有通信，只要知道与其可以通信的卫星的策略，即可完成任务分配，是一种分布式的任务分配方法。
附图说明
[0020]
图1为本发明流程图；
[0021]
图2为卫星拓扑连接图；
[0022]
图3为星群组合体四元数随时间变化图；
[0023]
图4a为星群期望控制力矩图；
[0024]
图4b为星群实际控制输出控制力矩图；
[0025]
图5a为1号卫星输出力矩图；
[0026]
图5b为2号卫星输出力矩图；
[0027]
图5c为3号卫星输出力矩图；
[0028]
图5d为4号卫星输出力矩图；
[0029]
图6为细胞卫星连接示意图；
[0030]
图7为姿态控制及力矩分配过程示意图，qd为期望四元数，ωd为期望角速度，q为实际四元数，ω为实际角速度，u为控制力矩，un为每个细胞卫星的控制力矩。
具体实施方式
[0031]
具体实施方式一：本实施方式基于群体博弈的卫星群任务分配方法具体过程为：
[0032]
由于星群是由不同种类的卫星构成，每个卫星适合执行的任务种类不相同，且由于星群中卫星数量多，不是所有卫星之间都有通信，这给任务分配提供了很大的难度。本方案使用的群体博弈的方法，可以很好的解决这些问题。在进行任务分配时，要首先确定所要分配的任务指标，把这个任务指标作为群体博弈模型的群体质量，且再一次分配过程中，这个指标是不变的。
[0033]
将每一个卫星作为群体博弈模型中的策略，所有卫星的集合即为博弈模型中的策略集。任务指标的最小度量为在博弈中的博弈参与者即代理。群体质量的策略分布为群体状态。根据任务的不同，每个卫星有其不同的收益函数，这个收益函数要与当前分配到的任务指标相关。
[0034]
由于卫星之间通信限制，我们把卫星之间的通信拓扑关系转化为策略限制的群体
博弈模型，也就是说，只有能通信的卫星之间才会有博弈者进行互动策略选择。那么任务分配问题就是群体质量在策略集中选择分布问题，也就是任务指标分配到不同卫星的分配问题。最终分布的求解利用群体动力学求解，最终的分布是一个nash均衡解。
[0035]
考虑的背景为由不同细胞星组成的固连星群，可以利用星群对失效卫星进行接管控制，由于每个细胞卫星都带有执行机构，那么对整个星群的姿态控制就变为了冗余执行机构的力矩分配问题。任务指标选取为所需要的力矩，采用所需要力矩的绝对值作为群体质量，每个细胞星为策略进行群体博弈模型的建立。采用有策略限制的群体博弈理论，构建卫星分布式力矩分配方法。
[0036]
在设计收益函数的时候，考虑力矩输出能力，能量消耗，以及飞轮角动量裕度的收益。
[0037]
由于姿态控制过程中要有控制力矩大小的更新。设计包含姿态控制力矩计算层与力矩分配层的双层姿态控制力矩分配方法。顶层为控制力矩计算层，由一个计算能力较强的卫星计算出控制所需力矩，将期望力矩交由力矩分配层进行分配。任务指标更新时提出计算卫星的虚拟星的概念，为收益始终为0的虚拟区域，其通信拓扑连接与计算卫星相同，用来更新群体博弈模型中的群体质量。将所需力矩交由虚拟星再进行动态博弈分配。利用群体动力学对博弈均衡解进行求解。
[0038]
使用该种方法，设计收益函数的时候可以综合考虑三种不同的角度：力矩输出能力，能量消耗，以及飞轮角动量裕度，考虑全面。在使用策略限制群体动力学求解时，只要知道与该卫星相连的卫星的策略收益即可，可以实现分布式。对卫星结构变换及数目增减剧有很好的适应性
[0039]
s1：设定固连细胞星群的任务指标；
[0040]
设定初始姿态四元数和初始角速度；
[0041]
设定期望姿态四元数和期望角速度；
[0042]
在分配过程中任务指标是连续且不变的；
[0043]
s2：基于s1设定的固连细胞星群的任务指标和卫星间的连接拓扑关系，建立t时刻的有策略限制的群体博弈模型；
[0044]
所述t时刻为当前时刻；
[0045]
s3：利用动力学求解s2中建立的有策略限制的群体博弈模型，得到t+step(step为控制周期)时刻的有策略限制的群体博弈模型的nash均衡解和对应的t+step(step为控制周期)时刻内的姿态四元数及角速度；
[0046]
所述nash均衡解即为各细胞星指标分配(为各卫星所提供的力矩配分布状况)分布状况；
[0047]
判断t+step时刻的姿态四元数、角速度与期望姿态四元数、期望角速度是否满足误差范围；
[0048]
t+step时刻的姿态四元数与期望姿态四元数进行判断；
[0049]
t+step时刻的角速度与期望角速度进行判断；
[0050]
若满足误差范围，则得到最终的t+step时刻的有策略限制的群体博弈模型的nash均衡解；
[0051]
若不满足误差范围，则执行s4；
[0052]
s4：令t＝t+step(step为控制周期)，获得此时的星群质量即分配指标重复 s2-s3得到该周期内的有策略限制的群体博弈模型的nash均衡解和对应的姿态四元数及角速度；直至该周期内的姿态四元数、角速度与期望姿态四元数、期望角速度满足误差范围；
[0053]
所述pi表示分配到此细胞星的力矩值的绝对值(星群中选择策略i的参与者人数)， i表示星群中卫星的编号，每个卫星代表一个策略，所有卫星构成策略集s；i＝1,2，
…
，n， i∈s；p＝[p1,p2,...,pn]表示星群状态集。
[0054]
具体实施方式二：本实施方式与具体实施方式一不同的是，所述s1中任务指标(固连细胞星群的力矩分配)为对固连细胞星群进行姿态控制所需要的总力矩的绝对值。
[0055]
其它步骤及参数与具体实施方式一相同。
[0056]
具体实施方式三：本实施方式与具体实施方式一或二不同的是，所述s1中固连细胞星群由多颗细胞星构成；
[0057]
所述多颗为大于等于两颗。
[0058]
其它步骤及参数与具体实施方式一或二相同。
[0059]
具体实施方式四：本实施方式与具体实施方式一至三之一不同的是，所述s2中基于 s1选取的固连细胞星群的任务指标和卫星间的连接拓扑关系，建立t时刻的有策略限制的群体博弈模型；所述t时刻为当前时刻；
[0060]
具体过程为：
[0061]
基于设定的初始姿态四元数和初始角速度，通过控制率计算获得星群质量即分配指标即控制所需总力矩；
[0062]
基于分配指标获得星群状态集，星群状态集表示为：
[0063][0064]
其中，p表示星群状态集，δ表示星群状态集，表示n维实数，m表示星群质量即任务指标；
[0065]
在一个博弈中选择不同的策略会给参与者带来不同的收益，收益被收益函数 fi:表示，收益与选择当前策略的参与者数目多少有关；
[0066]
其中，fi表示选择策略i的收益，同fi(p)；
→
表示映射，表示实数；
[0067]
给定一个星群状态集p，fi(p)表示在星群状态集p下选择策略i∈s的收益，那么一个群体博弈的收益向量表示为f:写成f(p)＝[f1(p),...,fi(p),
…
,fn(p)]
t
；
[0068]
其中，f表示收益函数向量，表示n维实数，f(p)表示一个群体博弈的收益向量， t表示求转置；
[0069]
策略限制的群体博弈模型表示并不是选择任何策略的参与者都可以进行交互，只有选择特定策略的参与者可以进行策略交互；
[0070]
策略限制的群体博弈模型中策略的限制用无向图g＝{ν,ε}来表示；
[0071]
其中，节点集合v表征着可用的策略集，v＝s；边的集合描述了可以进行策略互动的的策略；如果(i,j)∈ε表示选择策略i的参与者可以与选择策略j的参与者相遇并进行博弈；相反，如果表示选择策略i的参与者不能与选择策略j的参与者相遇进行博弈；
[0072]
其中，i＝1,2，
…
，n，j＝1，2，
…
，n。
[0073]
其它步骤及参数与具体实施方式一至三之一相同。
[0074]
具体实施方式五：本实施方式与具体实施方式一至四之一不同的是，所述收益函数考虑细胞星力矩输出能力，细胞星能量消耗以及细胞星飞轮角动量裕度；具体过程为：
[0075]
考虑细胞星力矩输出能力：
[0076][0077][0078]
其中，pi为分配到此细胞星的力矩值的绝对值(星群中选择策略i的参与者人数)，为此细胞星坐标系到固连细胞星群本体坐标系下的坐标转换矩阵，λ为分配增益系数，u
max
为此细胞星力矩器能够提供的最大力矩值，ui为此细胞星在本体坐标系下分配到的力矩分量，f
i1
(ui)为收益函数第一部分即考虑细胞星力矩输出能力的收益函数；
[0079]
考虑细胞星能量消耗的角度：
[0080][0081]
其中，k为一个足够大的常数，保证f
i2
(ui)的值始终大于0；λ2表征细胞星能量转换效率，u
ix
为此细胞星在本体坐标系(此细胞星坐标系)x轴下分配到的力矩分量，u
iy
为此细胞星在本体坐标系y轴下分配到的力矩分量，u
iz
为此细胞星在本体坐标系z轴下分配到的力矩分量，f
i2
(ui)为考虑细胞星能量消耗的收益函数；
[0082]
考虑细胞星飞轮角动量裕度：
[0083][0084]
其中，l表示控制力矩更新时的角动量的绝对值，区间[ld,lu]是卫星角动量期望所处区间，l
max
代表飞轮最大的角动量；c、c0为确定常数；为考虑飞轮角动量裕度的增益系数；
[0085]
令每个策略的收益函数为：
[0086][0087]
其中，f
i1
(pi)为收益函数第一部分即考虑细胞星力矩输出能力的收益函数，f
i2
(pi)为考虑细胞星能量消耗的收益函数，fi(pi)为策略i的收益函数；
[0088]
由策略i的收益函数fi(pi)获得fi(p)，由fi(p)获得一个群体博弈的收益向量f
(p)。
[0089]
星群质量选择为星群所需力矩的绝对值；每个卫星作为一个策略，所有卫星构成一个策略集；群体博弈参与者为卫星间力矩执行最小单位，星群状态为每个卫星分得的力矩大小；在收益函数的设置中考虑细胞星力矩输出能力，细胞星能量消耗以及细胞星飞轮角动量裕度。
[0090]
其它步骤及参数与具体实施方式一至四之一相同。
[0091]
具体实施方式六：本实施方式与具体实施方式一至五之一不同的是，所述s3中利用动力学求解s2中建立的有策略限制的群体博弈模型，得到t+step(step为控制周期)时刻的有策略限制的群体博弈模型的nash均衡解和对应的t+step(step为控制周期)时刻内的姿态四元数及角速度；
[0092]
所述nash均衡解即为各细胞星指标分配(为各卫星所提供的力矩配分布状况)分布状况；
[0093]
具体过程为：
[0094]
利用动力学求解s2中建立的有策略限制的群体博弈模型时引入修订协议的概念，修订协议可以看作是一组允许参与者做出决定的规则，或者说，修订协议确定了个体改变其策略的条件，修订协议用ρ＝[ρ
ij
]表示，ρ
ij
为策略i与策略j之间修订协议，ρ为修订协议的集合，[ρ
ij
]为不同策略之间的修订协议的集合；
[0095]
给定一个星群状态集p和一个群体博弈的收益向量f(p)，ρ
ij
(f(p),p)表示由策略i到策略j的条件转化率；
[0096]
利用动力学求解没有策略限制的群体博弈模型，表达式为：
[0097]
星群状态变化的动力学方程描述为：
[0098][0099]
其中，为策略i的星群状态变化量，pj为策略j的星群状态，ρ
ji
为策略j与策略 i之间的修订协议，f(p)为收益，p为星群状态，ρ
ji
(f(p),p)为策略j到策略i的修订协议，pi为策略i的星群状态，ρ
ij
(f(p),p)为策略i到策略j的修订协议；
[0100]
其中，第一项表示了流入策略i的参与者(从其他策略转化为策略i)，第二项表示从策略i中流出的总参与者；与两者之差表示了策略i的星群状态变化量；
[0101]
利用动力学求解s2中建立的有策略限制的群体博弈模型，表示为：
[0102]
[0103]
其中，ni＝{j∈s:(i,j)∈ε}表示在拓扑图中与策略i可以进行互动的策略；为可以与策略j互动的星群状态，为可以与策略i互动的星群状态，为策略j 的收益函数，为策略i的收益函数；为策略i的星群状态变化量(为pi的一阶导数)，pi为分配到此细胞星的力矩值的绝对值(星群中选择策略i的参与者人数)， pj为分配到此细胞星的力矩值的绝对值(星群中选择策略i的参与者人数)，ρ
ji
为策略 j与策略i之间的修订协议，ρ
ij
为策略i与策略j之间修订协议；
[0104]
所述修订协议为ρ
ij
＝[fj(p)-fi(p)]
+
；
[0105]
将修订协议ρ
ij
＝[fj(p)-fi(p)]
+
带入公式(7)得到：
[0106][0107]
其中，fj(p)表示策略j的收益函数，fi(p)表示策略i的收益函数，[
·
]
+
＝max(
·
,0)；
[0108]
求解公式(8)得到有策略限制的群体博弈模型的nash均衡解(求解公式(8)得到 nash均衡解)，即为各细胞星指标分配(为各卫星所提供的力矩配分布状况)分布状况。
[0109]
其它步骤及参数与具体实施方式一至五之一相同。
[0110]
采用以下实施例验证本发明的有益效果：
[0111]
实施例一：
[0112]
考虑如图2的拓扑图的4颗细胞星构成的星群，f为虚拟区卫星；
[0113]
设定星群总体转动惯量为：
[0114][0115]
各个卫星的安装矩阵为：
[0116][0117][0118]
给定初始姿态四元数为q0＝[0.8013 0.2727 0.5145
ꢀ‑
0.1369]，初始角速度 ω0＝[0.01 0.02
ꢀ‑
0.03]
°
/s。
[0119]
给定期望四元数qd＝[1 0 0 0]，期望角速度ωd＝[0 0 0]。
[0120]
力矩计算层每0.5s更新一次所需力矩值给力矩分配层。分配层各星之间通信间隔 0.02s。给定各卫星最大输出力矩分别为6，5.5，6.5，6.1n
·m[0121]
所得结果如下，组合体姿态四元数变化如图3，可以看出组合体可以达到姿态机动
的目的。组合体期望输出力矩图与实际输出力矩图如图3。
[0122]
星群期望控制力矩与实际控制力矩如图4a、4b：
[0123]
星群实际控制输出控制力矩图为组合体期望控制力矩图是连续的，实际上采用0.5s 作为采样周期的周期控制。并且，在周期开始时，由于计算卫星在采样时间开始时将计算所得的力矩放入虚拟区内，其它卫星输出力矩为0，但由于虚拟区没有力矩执行机构，所以此时星群总力矩输出为0；随着博弈的进行，力矩选择不同的细胞星，在细胞星之间传递。形成输出力矩。此时各个细胞星输出力矩如图5a、5b、5c、5d。
[0124]
本发明还可有其它多种实施例，在不背离本发明精神及其实质的情况下，本领域技术人员当可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶东刘浩然陈畅文肖岩张刚
技术所有人：哈尔滨工业大学
我是此专利的发明人

上一篇：一种用于苹果套网装箱机的一级姿态调整机构
上一篇：一种用于印刷品制造的污水回收机构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.精密/超精密加工技术 2.超声波特种加工 3.超声/电火花复合加工 4.超声/激光复合加工 5.复合能量材料表面改性 6.航空航天特种装备研发
2、郝老师：1. 先进材料制备 2. 环境及能源材料的制备及表征 3. 功能涂层的设计及制备 4. 金属基复合材料制备
3、彭老师：1.轻合金适配交通、航天、医疗器械、LED灯架、散热器、结构功能一体化
4、李老师：1.先进材料及特种连接技术 2.金属、非金属同种或异种先进材料的焊接研究和新产品开发，特别是有关航空新材料的研究与开发
如您是高校老师，可以点此联系我们加入专家库。