车队调控方法、装置、电子设备及存储介质

文档序号:28492582发布日期:2022-01-15 03:07阅读:107来源:国知局
车队调控方法、装置、电子设备及存储介质

1.本发明涉及车队自组织网络技术领域,尤其涉及一种基于神经自分泌机制的车队调控方法、装置、电子设备及存储介质。


背景技术:

2.随着通信技术的发展,尤其是无线通信和智能车辆方向,车联网已成为物联网最活跃的分支,在智能交通领域备受关注,是当今国际公认的提高行车安全、提升运输效率和实现节能减排的最佳手段。
3.而目前,车辆网在协作任务中主要是用于显示车队中各主体的相互沟通,从而在一定程度上提高了协作配合度,但是对于协作任务中同时存在多个任务时,则协作配合度会有明显的下降。对此设计了主体容量上报的方案,通过上报的容量对各主体进行分布式运控,但是现有的主体容量上报中,主要是有主体自主触发上报,而上报的信息并不能保证详细,这就导致最后在任务分配时或者计划协作方案时,存在主体利用率和协作配合度较低,难以实现对各主体资源等信息极致利用突破。


技术实现要素:

4.本发明的主要目的在于提供了一种基于神经自分泌机制的车队调控方法、装置、电子设备及存储介质,以解决现有车队调控方案在多协助任务中对车队的编队和调控精准度较低的技术问题。
5.本发明第一方面提供了一种基于神经自分泌机制的车队调控方法,所述车队调控方法包括:
6.根据多协作任务确定车队的集聚位、目标位和至少一个第一车辆主体,并规划各所述第一车辆主体移动至所述集聚位的移动路径;
7.以各所述第一车辆主体为中心,构建各所述第一车辆主体的信息素的扩散区域,并基于所述神经自分泌机制在所述扩散区域内产生第一信息素集,其中,所述第一信息素集包括至少一个第一信息素;
8.各所述第一车辆主体在其对应的移动路径上向所述集聚位移动过程中,通过所述第一信息素集实时感知进入所述扩散区域内的第二车辆主体所传播的第二信息素集是否存在满足预设的邻近条件,其中所述第二信息素集包括至少一个第二信息素;
9.若存在满足所述邻近条件,则根据所述第一信息素集和所述第二信息素集确定两者之间的亲和度;
10.判断所述亲和度是否满足预设的调控条件;
11.若满足所述调控条件,则获取所述第一车辆主体和第二车辆主体的移动参数,根据所述移动参数对所述第一车辆主体和第二车辆主体进行队形编排,并以编排的队形向所述集聚位继续移动;
12.在所有的第一车辆主体和第二车辆主体到达所述集聚位后,根据所述移动参数对
所有的第一车辆主体和第二车辆主体重新编排队形,并基于重新编排后的队形向所述目标位移动。
13.可选的,所述以各所述第一车辆主体为中心,构建各所述第一车辆主体的信息素的扩散区域,并基于所述神经自分泌机制在所述扩散区域内产生第一信息素集包括:
14.判断各所述第一车辆主体是否存在预合作车辆主体;
15.若存在,则以所述移动路径为筛选条件,从对应的所述预合作车辆主体中选择具体位置在所述移动路径上的车辆主体,得到预合作车辆主体集合;
16.确定所述第一车辆主体的实时位置,并基于所述实时位置计算出其与对应的预合作车辆主体集合中各预合作车辆主体的信息传播方向;
17.以所述第一车辆主体为传播起点,在所述信息传播方向上构建所述第一车辆主体的信息素的定向扩散区域;
18.调用所述神经自分泌机制驱使所述第一车辆主体在所述定向扩散区域内产生第一信息素集,并配置所述第一信息素集在所述定向扩散区域内按照所述信息传播方向进行定向传播。
19.可选的,所述以各所述第一车辆主体为中心,构建各所述第一车辆主体的信息素的扩散区域,并基于所述神经自分泌机制在所述扩散区域内产生第一信息素集,还包括:
20.若判断各所述第一车辆主体不存在预合作车辆主体时,根据各所述第一车辆主体确定其自身的信息最大传播距离;
21.以所述信息的最大转播距离为半径,构建所述第一车辆主体的信息素的四周扩散区域;
22.调用所述神经自分泌机制驱使所述第一车辆主体在所述四周扩散区域内产生第一信息素集,并配置所述第一信息素集的传播方向为全方位,将所述第一信息素集在所述四周扩散区域内进行多方向同时传播。
23.可选的,所述通过所述第一信息素集实时感知进入所述扩散区域内的第二车辆主体所传播的第二信息素集是否存在满足预设的邻近条件包括:
24.通过所述第一信息素集中的各第一信息素感知所述扩散区域内是否有新的车辆主体进入;
25.若有新的车辆主体进入,则获取新的车辆主体在所述扩散区域内传播的第二信息素集、意图和目标;
26.选择所述目标和意图与所述多协作任务相同的车辆主体,并读取选择到的所述车辆主体的第二信息素集,得到第二信息素序列;
27.计算所述第二信息素序列的信息素浓度,并进行修正;
28.判断所述第二信息素集修正后的信息浓度是否大于所述第一信息素集的信息浓度;
29.若否,则确定所述新的车辆主体为所述第一车辆主体邻近的第二车辆主体。
30.可选的,所述根据所述第一信息素集和所述第二信息素集确定两者之间的亲和度包括:
31.分别提取所述第一信息素集和第二信息素集中各信息素的所有信息属性;
32.根据各信息素的所有信息属性,计算出对应的信息素向量,得到第一信息素向量
和第二信息素向量;
33.根据所述第一信息素向量和第二信息素向量计算出第一信息素集和第二信息素集之间的相似度,得到对应的亲和度。
34.可选的,所述根据各所述第一信息素向量和各第二信息素向量计算出第一信息素集和第二信息素集之间的相似度,得到对应的亲和度包括:
35.将所述第一信息素集与第二信息素集中两个相同或者相近的信息素的所有信息素向量相减后平方求和,得到两个相同或者相近的信息素的相似度;
36.根据所述多协作任务中的各信息素的权重比,计算出各所述信息素的相似度权重,并将计算的相似度权重求总和,得到第一信息素集和第二信息素集之间的亲和度。
37.可选的,所述移动参数至少包括移动速度、移动加速度、移动方向和信息素的扩散距离,所述根据所述移动参数对所有的第一车辆主体和第二车辆主体重新编排队形,并基于重新编排后的队形向所述目标位移动包括:
38.根据所述移动速度、移动加速度、移动方向和扩散距离进行融合计算,得到各第一车辆主体和各第二车辆主体的动态性能;
39.根据所述动态性能对所有的第一车辆主体和第二车辆主体按照预设的编队策略进行位置编排,得到协作队形;
40.基于所述协作队形,创建车队自调节反馈机制,其中所述车队自调节反馈机制用于监控各第一车辆主体和第二车辆在所述协作队形中的所有移动参数的动态平衡;
41.控制所有的第一车辆主体和第二车辆主体,按照所述协作队形保持移动队列,并以所述车队自调节反馈机制对队列中的各车辆主体进行实时监控调整,以实现向所述目标位移动,其中,所述实时监控调整为基于所述车队自调节反馈机制捕捉所述第一车辆主体或所述第二车辆主体在所述协作队形中的实时动态性能,判断所述实时动态性能是否满足协作队形的平衡系数,若不满足,则控制对应的车辆主体对自身的动态性能进行调整,以及通知其他车辆主体进行配合调整。
42.本发明第二方面提供了一种基于神经自分泌机制的车队调控装置,所述车队调控装置包括:
43.信息采集模块,用于根据多协作任务确定车队的集聚位、目标位和至少一个第一车辆主体,并规划各所述第一车辆主体移动至所述集聚位的移动路径;
44.构建模块,用于以各所述第一车辆主体为中心,构建各所述第一车辆主体的信息素的扩散区域,并基于所述神经自分泌机制在所述扩散区域内产生第一信息素集,其中,所述第一信息素集包括至少一个第一信息素;
45.感知模块,用于各所述第一车辆主体在其对应的移动路径上向所述集聚位移动过程中,通过所述第一信息素集实时感知进入所述扩散区域内的第二车辆主体所传播的第二信息素集是否存在满足预设的邻近条件,其中所述第二信息素集包括至少一个第二信息素;
46.亲和度计算模块,用于在感知到满足所述邻近条件的第二车辆主体时,根据所述第一信息素集和所述第二信息素集确定两者之间的亲和度;
47.判断模块,用于判断所述亲和度是否满足预设的调控条件;
48.调控模块,用于在判断所述亲和度满足所述调控条件时,获取所述第一车辆主体
和第二车辆主体的移动参数,根据所述移动参数对所述第一车辆主体和第二车辆主体进行队形编排,并以编排的队形向所述集聚位继续移动;以及在所有的第一车辆主体和第二车辆主体到达所述集聚位后,根据所述移动参数对所有的第一车辆主体和第二车辆主体重新编排队形,并基于重新编排后的队形向所述目标位移动。
49.可选的,所述构建模块包括:
50.第一判断单元,用于判断各所述第一车辆主体是否存在预合作车辆主体;
51.选择单元,用于在判断存在预合作车辆主体时,以所述移动路径为筛选条件,从对应的所述预合作车辆主体中选择具体位置在所述移动路径上的车辆主体,得到预合作车辆主体集合;
52.第一计算单元,用于确定所述第一车辆主体的实时位置,并基于所述实时位置计算出其与对应的预合作车辆主体集合中各预合作车辆主体的信息传播方向;
53.第一构建单元,用于以所述第一车辆主体为传播起点,在所述信息传播方向上构建所述第一车辆主体的信息素的定向扩散区域;
54.第一扩散单元,用于调用所述神经自分泌机制驱使所述第一车辆主体在所述定向扩散区域内产生第一信息素集,并配置所述第一信息素集在所述定向扩散区域内按照所述信息传播方向进行定向传播。
55.可选的,所述构建模块还包括:
56.距离确定单元,用于在判断各所述第一车辆主体不存在预合作车辆主体时,根据各所述第一车辆主体确定其自身的信息最大传播距离;
57.第二构建单元,用于以所述信息的最大转播距离为半径,构建所述第一车辆主体的信息素的四周扩散区域;
58.第二扩散单元,用于调用所述神经自分泌机制驱使所述第一车辆主体在所述四周扩散区域内产生第一信息素集,并配置所述第一信息素集的传播方向为全方位,将所述第一信息素集在所述四周扩散区域内进行多方向同时传播。
59.可选的,所述感知模块包括:
60.感知单元,用于通过所述第一信息素集中的各第一信息素感知所述扩散区域内是否有新的车辆主体进入;
61.获取单元,用于在感知有新的车辆主体进入时,获取新的车辆主体在所述扩散区域内传播的第二信息素集、意图和目标;
62.读取单元,用于选择所述目标和意图与所述多协作任务相同的车辆主体,并读取选择到的所述车辆主体的第二信息素集,得到第二信息素序列;
63.第二计算单元,用于计算所述第二信息素序列的信息素浓度,并进行修正;
64.第二判断单元,用于判断所述第二信息素集修正后的信息浓度是否大于所述第一信息素集的信息浓度;
65.浓度确定单元,用于在判断判断所述第二信息素集修正后的信息浓度不大于所述第一信息素集的信息浓度,则确定所述新的车辆主体为所述第一车辆主体邻近的第二车辆主体。
66.可选的,所述亲和度计算模块包括:
67.提取单元,用于分别提取所述第一信息素集和第二信息素集中各信息素的所有信
息属性;
68.向量计算单元,用于根据各信息素的所有信息属性,计算出对应的信息素向量,得到第一信息素向量和第二信息素向量;
69.亲和度计算单元,用于根据所述第一信息素向量和第二信息素向量计算出第一信息素集和第二信息素集之间的相似度,得到对应的亲和度。
70.可选的,所述亲和度计算单元具体用于:
71.将所述第一信息素集与第二信息素集中两个相同或者相近的信息素的所有信息素向量相减后平方求和,得到两个相同或者相近的信息素的相似度;
72.根据所述多协作任务中的各信息素的权重比,计算出各所述信息素的相似度权重,并将计算的相似度权重求总和,得到第一信息素集和第二信息素集之间的亲和度。
73.可选的,所述移动参数至少包括移动速度、移动加速度、移动方向和信息素的扩散距离,所述调控模块包括:
74.融合单元,用于根据所述移动速度、移动加速度、移动方向和扩散距离进行融合计算,得到各第一车辆主体和各第二车辆主体的动态性能;
75.编排单元,用于根据所述动态性能对所有的第一车辆主体和第二车辆主体按照预设的编队策略进行位置编排,得到协作队形;
76.创建单元,用于基于所述协作队形,创建车队自调节反馈机制,其中所述车队自调节反馈机制用于监控各第一车辆主体和第二车辆在所述协作队形中的所有移动参数的动态平衡;
77.调控单元,用于控制所有的第一车辆主体和第二车辆主体,按照所述协作队形保持移动队列,并以所述车队自调节反馈机制对队列中的各车辆主体进行实时监控调整,以实现向所述目标位移动,其中,所述实时监控调整为基于所述车队自调节反馈机制捕捉所述第一车辆主体或所述第二车辆主体在所述协作队形中的实时动态性能,判断所述实时动态性能是否满足协作队形的平衡系数,若不满足,则控制对应的车辆主体对自身的动态性能进行调整,以及通知其他车辆主体进行配合调整。
78.本发明第三方面提供了一种电子设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述第一方面提供的基于神经自分泌机制的车队调控方法中的各个步骤。
79.本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面提供的基于神经自分泌机制的车队调控方法中的各个步骤。
80.有益效果:
81.本发明的技术方案中,通过从多协作任务中确定车队的集聚位、目标位和第一车辆主体后,以第一车辆主体为中心构建信息素的扩散区域,并利用第一车辆主体产生的第一信息素集感知与其相遇的第二车辆主体的第二信息素集,从中选择满足邻近条件和两者信息素的亲和度满足调控条件的第二车辆主体进行调控,并且在调控时,根据第一车辆主体和第二车辆主体的移动参数进行队形的编排,基于编排的队形控制第一车辆主体和第二车辆主体向目标位移动。通过上述方法的实施,在调控时可以充分地利用车辆主体基于神经自分泌机制向外产生的信息素来选择满足调控条件的车辆,实现了多协作任务中多车辆
主体的亲密配合,并且对各车辆主体的运输能力进行充分安排,大大提高了运输效率以及调控的精准度。
附图说明
82.图1为本发明提供的基于神经自分泌机制的车队调控方法的第一个实施例示意图;
83.图2为本发明提供的基于神经自分泌机制的车队调控方法的第二个实施例示意图;
84.图3为本发明提供的神经自分泌机制的原理与基本思路的示意图;
85.图4为本发明提供的一字形和方阵形的车辆队形的示意图;
86.图5为本发明提供的车队自调节反馈机制原理的示意图;
87.图6为本发明提供的基于神经自分泌机制的车队调控装置的一个实施例示意图;
88.图7为本发明提供的基于神经自分泌机制的车队调控装置的另一个实施例示意图;
89.图8为本发明提供的电子设备的一个实施例示意图。
具体实施方式
90.针对于现有的车队调控方案存在的问题,提出了一种基于神经自分泌机制的车队调控方案,该方案主要是针对在没第三方外力驱动或集中控制的情况下,多个车辆主体各自基于其内在意图和利益目标,如何自发、自主地动态形成一个利益体以共同获得机会、分工协作、协同工作完成多协作任务的过程,具体的采用以下两种方式实现:
91.第一种,可通过向车辆主体agent自身的若干友元agent(已知其物理地址和/或网络地址)利用通信网络定向传递承载多种信息的信息素而达到彼此交换信息的目的以建立起初步的关联关系,并通过友元agent的友元继续接力将已经建立关联关系的若干个agent的信息素以同样方式进行传递和扩散至更多的agent,实现多个agent的集聚;
92.第二种,通过向自己近旁四周各项同性、均匀地释放、扩散信息素以使得其能够被其他agent感知而获得其相关信息,该agent会进一步向被感知到的agent移流以确保它的信息素能够被对方感知,从而实现双方关系的关联;
93.进一步地,建立初步关联和集聚的的若干个agent每两两之间要进行信息素序列(若干个信息素片段构成)之间的结合、比对和亲和度/相似度计算,以淘汰各个方面差异性比较大的agent而留下相似度接近的若干个agent自组织形成有共同目标的动态联盟或动态系统;该动态系统将根据其自身的自组织、协商谈判、风险共担、利益分享、资源共享、分工协作、协同工作、运行控制自我调节的机制和方法进行运作以实现其目标,以解决现有车队调控方案在多协助任务中对车队的编队和调控精准度较低的技术问题。
94.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚
地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
95.为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1所示,本发明实施例中基于神经自分泌机制的车队调控方法的第一个实施例包括:
96.101、根据多协作任务确定车队的集聚位、目标位和至少一个第一车辆主体,并规划各第一车辆主体移动至集聚位的移动路径;
97.在本实施例中,在确定多协作任务后,提取多协作任务中指定的目标位和任务所在的区域,基于区域构建二维平面空间,计算出目标位在该二维平面空间中坐标值,其中该二维平面空间可以描述为长度(x轴)和宽度(y轴)两个要素所组成的平面空间,有4个象限。平面上的每一个点都用坐标值(x,y)或极坐标值(ρ,γ)来表示,其中
98.进一步地,筛选任务所在的区域中可用的车辆主体,具体的基于多协作任务中的货物来确定可用的车辆主体,也可以是通过直接筛选车辆主体的状态来确定,在确定后还包括从可用的车辆主体中筛选出至少一个第一车辆主体。在实际应用中,该申请选择以两个以上,而其他的可用的车辆主体则作为后续规划路径时需进行匹配的车辆主体,从这些车辆主体中匹配出第二车辆主体。
99.而对于集聚位的提取,可以是直接以任务中规定的位置作为集聚位,也可以是基于筛选出来的第一车辆主体计算出折中点作为集聚位,但是不管是选择哪种,其第一车辆主体都需要到达集聚位进行任务的处理,依次需要规划各第一车辆主体移动至集聚位的移动路径,在规划路径时,具体是根据寻求其他车辆主体合作的原则规划,即是以筛选出的所有可用车辆主体作为路径规划池规划出一条能遇见最多车辆主体的线路,以形成最终的移动路径,在实际因应用中,在规划移动路径时还需要考虑区域内的障碍物。
100.在实际应用中,对于第一车辆主体的选择,优选的是以随机产生的方式选择,选择其具有不同的能力(功能、性能)、资源、工作状态(忙/空闲/故障等)、运动状态(速度、加速度等)、意愿/意图与目标,且彼此独立、相互平等的车辆主体agent。
101.102、以各第一车辆主体为中心,构建各第一车辆主体的信息素的扩散区域,并基于神经自分泌机制在扩散区域内产生第一信息素集,其中,第一信息素集包括至少一个第一信息素;
102.该步骤中,对于构建的扩散区域,具体是以各第一车辆主体自身的能力进行构建,每个第一车辆主体的扩散区域的距离不一定相同,具体以第一车辆主体的最远通信距离设定标准。
103.在实际应用中,每个第一车辆主体的扩散区域的信息传播方向均设定为全方位,这样可提高第一车辆主体被其他车辆主体感知的能力,同时也提高自身对其他车辆主体的感知能力。
104.本实施例中,在构建完扩散区域后,根据神经自分泌机制控制第一车辆主体产生信息素,该信息素指的是车辆主体自身的其个体素及其相关属性(值)、合作协同素及其相关属性(值)、任务与状态素及其相关属性(值)和资源能力(含价格)素及其相关属性(值)等等。
105.在本实施例中,除了对第一车辆主体构建扩散区域之外,还需要对任务所在的区
域内的所有可用的车辆主体构建扩散区域和信息素。
106.103、各第一车辆主体在其对应的移动路径上向集聚位移动过程中,通过第一信息素集实时感知进入扩散区域内的第二车辆主体所传播的第二信息素集是否存在满足预设的邻近条件,其中第二信息素集包括至少一个第二信息素;
107.该步骤中,在构建完所有车辆主体的扩散区域和信息素之后,控制各第一车辆主体按照移动路径向集聚位移动,在移动过程中,实时执行上述步骤,保持第一车辆主体的扩散区域的不变,并实时利用神经自分泌机制通过扩散区域传播信息素,利用传播的信息素实时感知其自身经过的位置的一定范围内是否存在车辆主体,若存在,则将感知到的车辆主体作为备选的第二车辆主体。
108.在实际应用中,在感知到车辆主体后,利用第一车辆主体的所有信息素感知被感知到的车辆主体的信息素的浓度,具体的通过以下感知计算公式确定被感知到的车辆主体的信息素浓度,公式如下:
[0109][0110]
其中,p
ik
表示ai感知到ak的信息素浓度,τk是(0,1)的修正系数,是ak释放的能够被其他车辆主体感知到的最小浓度值,且其所携带信息素片段上的信息不丢失。
[0111]
104、若存在满足邻近条件,则根据第一信息素集和第二信息素集确定两者之间的亲和度;
[0112]
在该步骤中,所述亲和度可理解为是相似度,如在捕捉、感知和判断在其近旁有其他车辆主体的存在,就需要对两者的信息素进行结合、匹配、比较和亲和计算,以排除意愿意图目标不一致、行为状态冲突或者其他方面差异性绝大的车辆主体作为潜在的合作者,可以简单地用l2范数欧氏距离来计算。
[0113]
在实际应用中,每个车辆主体都会基于神经自分泌机制产生多个信息素,每个信息素又携带着各种信息,而在计算亲和度(即是相似度)时,首先通过计算每个信息素中携带的各种信息组成的向量,基于向量与其对应的相似或者相同的信息素计算差异值,基于差异值得到两者的相似度,例如第一车辆主体agenti(ai)和第二车辆主体agentk(ak)。
[0114]
下面以第一辆主体agenti(ai)包括其对应的信息素向量为第二车辆主体agentk(ak)包括其对应的信息素向量根据两个信息素向量计算出第一信息素集中第一信息素和第二信息素集中第二信息素的相似度,从而得到两者的亲和度,公式如下:
[0115][0116]
105、判断亲和度是否满足预设的调控条件;
[0117]
具体的,在判断亲和度是否满足调控条件时,若第一信息素集和第二信息素集中均存在多个信息素时,在判断亲和度是否满足条件之前,还包括确定每个信息素的权重比例,基于权重比例确定每个信息素的相似度的权重比例,根据每个信息素的权重比例计算
出两个信息素集中组合相似度,即是总相似度,其公式为
[0118]
106、若满足调控条件,则获取第一车辆主体和第二车辆主体的移动参数,根据移动参数对第一车辆主体和第二车辆主体进行队形编排,并以编排的队形向集聚位继续移动;
[0119]
本实施例中,所述移动参数至少包括移动速度、移动加速度、移动方向和信息素的扩散距离,在根据移动参数对第一车辆主体和第二车辆主体进行队形编排时,首先确定队形的目标移动方向,该移动方向具体以集聚位为终点,计算第一车辆主体和第二车辆主体的中心位置与集聚位之间的最短距离,基于最短距离的连接线中朝向集聚位的方向为目标移动方向,基于该目标移动方向调整各第一车辆主体和第二车辆主体的移动方向,并根据移动速度、移动加速度和扩散距离综合分析,将第一车辆主体和第二车辆主体进行排序,得到队形,基于该队形进行移动控制。
[0120]
在实际应用中,按信息素浓度从大到小顺序进行队形编队,因rv》ru》rw,其中,r代表信息素扩散的最远距离,也就意味着其车辆主体产生的信息素浓度最高,则有vv(t)》vu(t)》vw(t),以确保av、au、aw依序先后达到集结点的同时集结成队列,但须保证相互间的安全距离1.5rw≤r
sd
≤2rw,其中,r
sd
表示两个之间的安全距离,以使得集结成编队的所有车辆主体之间既不至于过大(可能会导致队列中的车辆主体不能及时感知到产生信息素浓度最小的主体,如aw)可以通过就近扩散信息素的方式传递、交换彼此信息,以确保整个编队向集聚位方向的有序运行。
[0121]
107、在所有的第一车辆主体和第二车辆主体到达集聚位后,根据移动参数对所有的第一车辆主体和第二车辆主体重新编排队形,并基于重新编排后的队形向目标位移动。
[0122]
本实施例中,在所有的第一车辆主体和第二车辆主体按照上述步骤106的队形移动至集聚位后,检测各第一车辆的移动参数,判断所述移动参数是否满足保持队形的条件,若不满足,则获取各第一车辆主体和第二车辆主体到达集聚位时的实时移动参数,基于实时移动参数对各第一车辆主体和第二车辆主体的队形重新调整,基于调整后的队形向目标位移动。
[0123]
在实际应用中,其调整具体是基于速度、速度变化、加速度、方向和扩散距离对各第一车辆主体和第二车辆主体进行调整,优选的,这里的调整选择对移动参数进行调整,对各第一车辆主体和第二车辆主体在整体编队中的位置或者排位不做调整,而对于移动参数的调整则根据基于内分泌系统自分泌机制的车辆主体队列队形保持机制进行调整。
[0124]
进一步的,还可以通过计算前后的移动参数的差异来生成控制量,基于控制量实现调整,具体的,计算出到达集聚位前后的移动参数的偏差的比例、积分和微分通过线性组合构成控制量,用以控制被控对象、纠正其偏差以使其达到一个稳定状态的线性、负反馈闭环调节器,该线性、负反馈闭环调节器通过实时监控各第一车辆主体和第二车辆主体来实现调整。
[0125]
本发明实施例中,通过从多协作任务中确定车队的集聚位、目标位和第一车辆主体后,以第一车辆主体为中心构建信息素的扩散区域,并利用第一车辆主体产生的第一信息素集感知与其相遇的第二车辆主体的第二信息素集,从中选择满足邻近条件和两者信息素的亲和度满足调控条件的第二车辆主体进行调控,并且在调控时,根据第一车辆主体和
第二车辆主体的移动参数进行队形的编排,基于编排的队形控制第一车辆主体和第二车辆主体向目标位移动;也即是各车辆主体相互建立关联,其根据各自的意图目标与其他车辆主体的意图目标是否一致或接近,自身资源、动态能力和工作状态是否满足对方提出的合作请求相匹配(亲和度越高达成合作的可能性越大),以及因此而获取的利益是否符合自身预期来决定是否建立合作关系,从而自发、自主地形成一个利益体。通过这样的方法的实施,可动态形成利益整体/系统/联盟或增减成员或解散,以灵活、快捷因应外界环境的多样性、快速多变和高度不确定性和复杂性,且基于各主体分散分布自治的控制机制,使得系统的自组织性、鲁棒性、可靠性相较于集中控制的系统要高。
[0126]
请参阅图2,本发明实施例中基于神经自分泌机制的车队调控方法的第二个实施例包括:
[0127]
201、根据多协作任务确定车队的集聚位、目标位和至少一个第一车辆主体,并规划各第一车辆主体移动至集聚位的移动路径;
[0128]
该步骤中,其集聚位和目标位具体是直接从多协作任务的请求中提取到,而对于至少一个第一车辆主体则是从多协作任务的任务区域内的所有可用的车辆主体中确定,然后从所有可用的车辆主体中随机选定部分作为第一车辆主体,这里的第一车辆主体指的是用于执行寻求合作完成多协作任务的触发主体,也即是说该任务所在的区域中的所有可用的车辆主体均为第一车辆主体,只是本技术为了便于说明整个处理流程,将用于执行寻求合作完成多协作任务的触发主体称为第一车辆主体,而被第一车辆主体在寻求过程中选定的车辆主体称为第二车辆主体。
[0129]
在实际应用中,对于上述的第一车辆主体和可用的车辆主体可以通过以下步骤实现:
[0130]
1)构建二维空间;
[0131]
这里的二维空间具体是基于多协作任务的地理位置来构建,一个二维平面空间可以描述为长度(x轴)和宽度(y轴)两个要素所组成的平面空间,有4个象限。平面上的每一个点都用坐标值(x,y)或极坐标值(ρ,γ)来表示,其中即是每个车辆主体都可以表示为(x,y)或(ρ,γ)。
[0132]
2)确定障碍物及集聚位与目标位;
[0133]
在实际应用中,除了提取车辆主体之外还包括车辆主体在移动过程中的所有的障碍物,在如图3所示,通过x轴和y轴构建出具有4个象限的二维平面,在该平面上逐一对应设置车辆主体和障碍物,如图所示,在二维平面中有m

个已知静态障碍物和m

个随机生成的障碍物,障碍物用bw(x(t),y(t))来表示;集聚位与目标位可分别表示为gi(x(t),y(t))和o(x(t),y(t))。
[0134]
3)随机选择多个车辆主体;
[0135]
在搜索出多协作任务中的所有可用的车辆主体后,随机选择一群具有不同的能力(功能、性能)、资源、工作状态(忙/空闲/故障等)、运动状态(速度、加速度等)、意愿/意图与目标,且彼此独立、相互平等的车辆主体agent(见图3左区域的若干车辆主体),可以描述如下:
[0136]
x
(t),y(t))表示ai的位置,md(t)、g(t)、p(t)、sen(t)、s(t)分别表示的速度、加速度、方向、意愿目标、信息素(序列)浓度、感知器和状态;
[0137]
车辆主体agenti(ai)的速度、加速度可计算为方向md(t)以其与x轴正向的夹角θ来表示,和分别为速度矢量在y轴和x轴上投影);
[0138]ai
的目标gi(t)可设为s(t)∷=《{0,1,2,3,4,5,6,7,8,9,10,

n}》,其中0,1,2,3,4,5,6,7,8,9,10,

n可分别对应于不同目标的编号,如在自动化仓储或无人超市或无人码头中智能agv的主要目标可假设为“要组成多任务协作车队搬运更多和/体积更大/更重的获取”、“要与其某友元agv协作搬运”、“采取合作策略与友元agv合作”、“独自取运某种货物”、“搬运多少个货物”、“希望沿着什么路径运行”、“搬运某种货物1次可以获利多少”、“如何尽可能在1次遍历中完成不同存放地点货物的取货”、“停靠在位置”、“什么时间维保”、“如何绕开障碍物”等等;也可以采用字符串的格式用自然语言来描述每个agent的意愿意图及目标,在多agent进行自组织形成动态系统(如具有不同队形的车队)以完成某项任务的时候,彼此之间的意愿意图及目标可以通过语义识别和匹配的方式来使能具有相同或相近目标的车辆主体聚集在一起。
[0139]
4)计算ai释放的信息素浓度pi(t),其可简单计算为:
[0140][0141]
其中,psi表示ai释放的信息素序列;和分别表示的是其个体素及其相关属性(值)、合作协同素及其相关属性(值)、任务与状态素及其相关属性(值)和资源能力(含价格)素及其相关属性(值),这些属性值需要进行归一化处理;
[0142][0143]
5)seni(t)表示的是ai的感知器,用于ai去感知、测度其周旁其他主体的信息素浓度以判断是在其近邻是否存在其他(智能)主体在,如ai通过其感知器感知agentk(ak)的信息素浓度p
ik
(t)以判断ak是否在的ai周边,记为seni(t,pk(t)),可按如下公式计算:
[0144]
p
ik
表示ai感知到ak的信息素浓度,τk是(0,1)的修正系数,是ak释放的能够被其他主体感知到的最小浓度值,且其所携带信息素片段上的信息不丢失;
[0145]
si(t)∷=《{-1,0,1,2}》,其中-1、0、1、2分别表示故障、停止工作、正在工作、空闲可以工作。
[0146]
202、以各第一车辆主体为中心,构建各第一车辆主体的信息素的扩散区域,并基于神经自分泌机制在扩散区域内产生第一信息素集;
[0147]
在本实施中,对于扩散区域的构建可以采用两种方式构建,一种是定向构建,另一种是全方位构建,即是定向是从360度方向中选择一个方向构建,全方位则是360度都包含,具体的可以根据实际需求来选择构建方式,首先要确定第一车辆主体是否有确定的合作车辆主体,基于确定结果从以下方式中选择,一是可通过向自身的若干友元agent(已知其物理地址和/或网络地址)利用通信网络定向传递承载多种信息的信息素而达到彼此交换信息的目的以建立起初步的关联关系;二是可通过向自己近旁四周各项同性、均匀地释放、扩散信息素以使得其能够被其他agent感知而获得其相关信息,该agent会进一步向被感知到的agent移流以确保它的信息素能够被对方感知,从而实现双方关系的关联,从而构建扩散区域。
[0148]
在本实施例中,该步骤具体实现为:
[0149]
判断各第一车辆主体是否存在预合作车辆主体;
[0150]
若判断各所述第一车辆主体存在预合作车辆主体时,则以移动路径为筛选条件,从对应的预合作车辆主体中选择具体位置在移动路径上的车辆主体,得到预合作车辆主体集合;确定第一车辆主体的实时位置,并基于实时位置计算出其与对应的预合作车辆主体集合中各预合作车辆主体的信息传播方向;以第一车辆主体为传播起点,在信息传播方向上构建第一车辆主体的信息素的定向扩散区域;调用神经自分泌机制驱使第一车辆主体在定向扩散区域内产生第一信息素集,并配置第一信息素集在定向扩散区域内按照信息传播方向进行定向传播;
[0151]
若判断各所述第一车辆主体不存在预合作车辆主体时,根据各所述第一车辆主体确定其自身的信息最大传播距离;以所述信息的最大转播距离为半径,构建所述第一车辆主体的信息素的四周扩散区域;调用所述神经自分泌机制驱使所述第一车辆主体在所述四周扩散区域内产生第一信息素集,并配置所述第一信息素集的传播方向为全方位,将所述第一信息素集在所述四周扩散区域内进行多方向同时传播。
[0152]
在实际应用中,车辆主体在环境或系统中可以根据自身意图、意愿、目标及环境压力与刺激来产生信息素,为为最大限度和可能来实现自身的利益目标、生存与发展,大多数情况下必然通过产生、释放包含但不限于如个体素、合作协同素、任务与状态素和资源能力素等合作所需要的最基本相关信息。
[0153]
各车辆主体的扩散可以有两种方式:
[0154]
其一,在能够确定合作主体的具体地址、位置的时候可以利用通信网络(见图3中的agenti和agent
l
)或者在无网络或合作主体就在近旁的情况下通过环境扩散的方式定向传递信息素;
[0155]
其二,不知晓、也不确定任何主体的位置的情况下,则可以自身为中心各项同性向其四周近旁环境释放信息素(见图3中的agentj),在中心处信息素浓度最大(记为),距离中心越远、浓度越低,被其他车辆主体感知到的可能性就越小,在这种情况下,扩散各点信息素浓度可按下式计算:
[0156][0157]
其中,表示距aj中心距离为d(记为)的点处的信息素浓度,μ为(0,1)的修正系数,rj为信息素扩散的最远距离(也即信息素浓度为0处),r为信息素存在的平均寿命。
[0158]
203、各第一车辆主体在其对应的移动路径上向集聚位移动过程中,通过第一信息素集中的各第一信息素感知扩散区域内是否有新的车辆主体进入;
[0159]
环境中每一个车辆主体都不断地在基于如上步骤202所述信息素传播扩散方式,并利用其各自的感知器采用公式5.5.2去捕捉、感知和测度其他agent释放的信息素,以判断其近旁(可能是物理位置上的近邻、也可能是合作友好、关系比较近的友元,或者是网络地址上的近邻)是否存在有其他车辆主体。
[0160]
204、若有新的车辆主体进入,则获取新的车辆主体在扩散区域内传播的第二信息素集、意图和目标;
[0161]
具体的,感知到车辆主体的信息素浓度满足则确定有新的车辆主体进入,并通过感知器(即是各信息素)采集新的车辆主体所散发出来的第二信息素,得到第二信息素集。
[0162]
205、选择目标和意图与多协作任务相同的车辆主体,并读取选择到的车辆主体的第二信息素集,得到第二信息素序列;
[0163]
206、计算第二信息素序列的信息素浓度,并进行修正;
[0164]
207、判断第二信息素集修正后的信息浓度是否大于所述第一信息素集的信息浓度;
[0165]
208、若否,则确定新的车辆主体为所述第一车辆主体邻近的第二车辆主体;
[0166]
本实施例中,具体是通过判断其是否属于第一车辆主体的邻近主体来确定是否有新的车辆主体进入,也即说这里的进入应该满足属于邻近主体,具体的通过感知靠近的车辆主体的信息素浓度来判断,其实现过程为:
[0167]
第一车辆主体利用其自身的感知器,对周围的车辆主体或者已知信息素传播方向上的车辆主体进行感知,感知车辆主体的信息素浓度,其中各车辆主体散发的信息素浓度可标识为:
[0168][0169]
其中,psi表示ai释放的信息素序列;和分别表示的是其个体素及其相关属性(值)、合作协同素及其相关属性(值)、任务与状态素及其相关属性(值)和资源能力(含价格)素及其相关属性(值)。
[0170]
如果第一车辆主体ai通过其感知器感知各车辆主体agentk(ak)的信息素浓度p
ik
(t),以判断ak是否在的ai周边,记为seni(t,pk(t)),可按如下公式计算:
[0171]
[0172]
其中,p
ik
表示ai感知到ak的信息素浓度,τk是(0,1)的修正系数,是ak释放的能够被其他主体感知到的最小浓度值,且其所携带信息素片段上的信息不丢失;
[0173]
si(t)∷=《{-1,0,1,2}》,其中-1、0、1、2分别表示故障、停止工作、正在工作、空闲可以工作。
[0174]
209、分别提取第一信息素集和第二信息素集中各信息素的所有信息属性;
[0175]
210、根据各信息素的所有信息属性,计算出对应的信息素向量,得到第一信息素向量和第二信息素向量;
[0176]
211、根据第一信息素向量和第二信息素向量计算出第一信息素集和第二信息素集之间的相似度,得到对应的亲和度;
[0177]
该步骤中,具体是通过将所述第一信息素集与第二信息素集中两个相同或者相近的信息素的所有信息素向量相减后平方求和,得到两个相同或者相近的信息素的相似度;
[0178]
根据所述多协作任务中的各信息素的权重比,计算出各所述信息素的相似度权重,并将计算的相似度权重求总和,得到第一信息素集和第二信息素集之间的亲和度。
[0179]
在实际应用中,如在捕捉、感知和判断在其近旁有其他车辆主体的存在,就需要对两者的信息素进行结合、匹配、比较和亲和计算,以排除意愿意图目标不一致、行为状态冲突或者其他方面差异性绝大的车辆主体作为潜在的合作者,可以简单地用l2范数欧氏距离来计算。以车辆主体agenti(ai)和车辆主体agentk(ak)为例进行说明:
[0180]
1)ai的信息素是由个体素、合作协同素、任务与状态素和资源能力素等主要信息素(片段)所构成的信息素序列,每一个信息素(片段)又是携带各种信息,由不同的信息属性进行表述。因此可以将每个信息素片段看成是多个信息属性构成的向量,向量如下所示:
[0181][0182][0183]
2)同样地,对于agentk(ak)的信息素序列及其向量如下:
[0184][0185][0186]
3)分别求相应向量之间的相似度(亲和度):
[0187][0188][0189]
[0190][0191]
以上信息素(片段)向量各元素要进行归一化处理。
[0192]
4)主体agenti(ai)和主体agentk(ak)的总的相似度可计算为:
[0193][0194]
其中且可根据实际合作的需要来确定个体素、合作协同素、任务与状态素和资源能力素的重要性、主导性作用等策略来确定权系数的大小。
[0195]
212、判断亲和度是否满足预设的调控条件;
[0196]
213、若满足调控条件,则获取第一车辆主体和第二车辆主体的移动参数,根据移动参数对第一车辆主体和第二车辆主体进行队形编排,并以编排的队形向集聚位继续移动;
[0197]
该步骤中,若不满足调控条件,则重复以上201-212的步骤,计算出这n个车辆主体的相关属性值及参数,特别是按照206-211中计算出每个车辆主体agent的信息素浓度,感知计算和寻找t时刻ai周旁若干个agent,并每两两之间计算出其信息素的相似度(亲和度)。
[0198]
以图3为例,最终寻找出agenti(ai)、agentk(ak)、agent
l
(a
l
)、agentu(au)、agentv(av)、agentw(aw)等的信息素相似度较高、差异较小,可以在逻辑上组织在一起成为初始编组队列,为下一步队列编组奠定基础。
[0199]
214、在所有的第一车辆主体和第二车辆主体到达集聚位后,根据移动参数对所有的第一车辆主体和第二车辆主体重新编排队形,并基于重新编排后的队形向目标位移动。
[0200]
在本实施例中,所述移动参数至少包括移动速度、移动加速度、移动方向和信息素的扩散距离,在编队时具体实现为:
[0201]
根据所述移动速度、移动加速度、移动方向和扩散距离进行融合计算,得到各第一车辆主体和各第二车辆主体的动态性能;
[0202]
根据所述动态性能对所有的第一车辆主体和第二车辆主体按照预设的编队策略进行位置编排,得到协作队形;
[0203]
基于所述协作队形,创建车队自调节反馈机制,其中所述车队自调节反馈机制用于监控各第一车辆主体和第二车辆在所述协作队形中的所有移动参数的动态平衡;
[0204]
控制所有的第一车辆主体和第二车辆主体,按照所述协作队形保持移动队列,并以所述车队自调节反馈机制对队列中的各车辆主体进行实时监控调整,以实现向所述目标位移动,其中,所述实时监控调整为基于所述车队自调节反馈机制捕捉所述第一车辆主体或所述第二车辆主体在所述协作队形中的实时动态性能,判断所述实时动态性能是否满足协作队形的平衡系数,若不满足,则控制对应的车辆主体对自身的动态性能进行调整,以及通知其他车辆主体进行配合调整。
[0205]
在实际应用中,在第一车辆主体向集聚位移动过程中,包括两种方式寻求合作车辆主体,一种是,在环境或系统中没有明确的目标对象,也无任何目的地,则初始编组队列
中各agent的运动速度和方向均向这群agent中信息素浓度最高者(如图3中的agenti)靠齐,并以此速度计算和调整与前面agent之间需要保持的安全距离大小;重复201之4)-5),202-213步骤,聚集更多的agent加入编组直到达到限制数量为止;因为没有运动目标方向,则这群agent在制定集合地点按照上述方法编好队形后,则以一定概率选择运动方向,以试图发现目标;目标也在不断地释放信息素,以吸引编队靠近;这样不断反复尝试,直到编队找到目标和运动到目标位置为止;期间某些agent出现的运动及轨迹偏差也可以按照上述第一种情况的方法进行自我调整,以保持整个队形。
[0206]
另一种是,在环境或系统中有明确的目标对象及其地址,各agent的运动速度和方向均向目标位置移动(xo(t),yo(t));在移动过程中重复201之4)至5),202-213步骤以发现和聚集更多的信息素相似和/或接近的agent逐步、渐次加入队列,直到达到限制个数为止;指定一个集合和队形编组的地点(x
gi
(t),y
gi
(t)),基于离目标对象最近的agent排在队列最前面(如三角形队形),以此类推;再以这群agent中信息素浓度最大者的速度大小为所有agent的速度,并以此速度计算和调整与前面agent之间需要保持的安全距离大小;在运动过程中,可能会出现某些agent在速度、位置(运动轨迹)上出现波动导致偏差,这需要使得每个agent具有自我进行速度、位置自适应调节的能力(见图3中的agent
l
),自身具有一个速度环(内环)、位置环(外环)所构成的一个速度、位置负反馈全闭环调节系统,不断地对自身的速度、位置(轨迹)进行感知,并作出相应的调节,调节控制器可以是模糊控制器或自适应pid控制器,或基于神经内分泌免疫调节优化的智能控制器。这样可以确保每个agent按照规定的速度、轨迹运行,直到达到目标对象的位置为止。
[0207]
在本实施例中,所述队形包括一字形和方阵形,对于一字形来说,无论聚集在一起的车辆主体是偶数个还是奇数个都可以按照一定顺序排成一行或一列。如图4所示,其编队过程如下:
[0208]

在时刻t-1,三个agentv(av)、agentu(au)、agentw通(aw)过信息素传递或扩散,实现彼此感知和结合;
[0209]

时刻t,按信息素浓度从大到小顺序进行队形编队,因rv》ru》rw,(r代表信息素扩散的最远距离,也就意味着其主体产生的信息素浓度最高)则有vv(t)》vu(t)》vw(t),以确保av、au、aw依序先后达到集结点的同时集结成队列,但须保证相互间的安全距离1.5rw≤r
sd
≤2rw;(其中,r
sd
表示两个之间的安全距离),以使得集结成编队的所有主体之间既不至于过大(可能会导致队列中的主体不能及时感知到产生信息素浓度最小的主体,如aw)可以通过就近扩散信息素的方式传递、交换彼此信息,以确保整个编队的有序运行;
[0210]

时刻t+1,agentv←
agentu←
agentw依先后顺序形成一字型编队,且均以相同的速度vv(t+1)、vu(t+1)、vw(t+1)在运动,相互之间保持安全距离r
sd

[0211]

时刻t+2,领头主体av能感知遇到障碍物,整个编队须调整速度以绕开障碍物,并朝向目标位置运动;
[0212]

在编队形成时起的每一时刻,每个主体都能够感知自身及其他主体的速度和位置(能够通过紧邻主体之间信息素的弥散、传递相互间的信息而可获取编队全局信息而不是局部信息,这对于每个主体及编队群体运动规划及自适应调控、协调和协同是必不可少的),如与队列整体速度、轨迹有偏差或相互之间的安全距离有偏差,就基于相应的自我调控机制进行调整,以确保队形和安全整体达到目标位置。
[0213]
对于方阵形来说,所有主体按一定顺序排成m
×
n,且m≠n或n
×
n。如图4所示,其编队过程如下:
[0214]
在时刻t-1,四个agenti(ai)、agentv(av)、agentu(au)、agents(as)信息素传递(如au和as由于距离比较远,但由于是相互之间是友元,可以通过通信网络定向互相传递和交换各自的信息素)或扩散(其他两两之间由于都在近旁,可以通过信息素扩散而互相被感知而聚集在一起),实现彼此感知和结合;
[0215]

时刻t,首先根据聚集在一起的主体个数来决定是何种阵型,如是偶数个则可按m
×
n或n
×
n来编队,并根据信息素浓度从大到小顺序依行序号逐行进行队形编队;ai、av、au、as可按2
×
2编队。因r
vi
》rv》ru》rs,则应有vi(t)》vv(t)》vu(t)》vs(t),以确保ai、av、au、as依序先后达到集结点的同时集结成队列,但须保证每行两两主体之间、每列两两主体之间的安全距离1.5rs≤r
sd
≤2rs;
[0216]

时刻t+1,所形成的2
×
2型编队且均以相同的速度vi(t+1)、vv(t+1)、vu(t+1)、vs(t+1)在运动,每个主体与其四周个主体之间保持安全距离r
sd

[0217]

时刻t+2,领头主体ai、av能感知遇到2个障碍物障碍物,整个编队须调整速度以绕开障碍物,并朝向目标位置运动;
[0218]

同“一字队形”编队的第

,不再赘述。
[0219]
三角队形,即所有主体按一定顺序组成不同的三角形队列(正等腰三角形、等边三角形等)。需要强调的是,在三角形队形中每个主体都须与其四周紧邻的主体保持安全距离1.5r
min
≤r
sd
≤2r
min
以保证两两主体间能够及时通过信息素传递信息,从而可以适时获得全局信息,以防止主体之间运动时的碰撞和队形均匀性、对称性的保持;而且每个主体都有基于内分泌自分泌调节和/或其他自我智能调控功能。
[0220]
在实际应用中,所述车队自调节反馈机制具体为基于内分泌系统自分泌机制的车辆主体队列队形保持机制,自分泌是机体内内分泌系统对细胞对自我生理功能与活动状态进行自主调节(抑制、兴奋或调控)的一种重要功能。所谓的自分泌即是为自我进行功能、活动水平的调整控制,一些内分泌细胞将其产生的激素(或调节肽)先分泌到自己外部的组织液中,再利用其自身表面的激素受体与这些激素/调节肽结合,使自己产生化学生物反应,达到自我调整的目的。在该过程中,激素或调节肽本身并参与调控过程,只起到信使作用。利用这一简单而又高效的调节机制可对基于mas的智能系统中车辆主体个体的功能、行为、活动状态等进行自我调节以因应其周边环境的变化,如可将这一机制用于无序状态下的多个车辆主体如何移动、聚集,如何到集结位置进行队形编队,如何在整个编队运动过程中对其自身产生的速度、轨迹(位置)偏差或因遇到障碍物如何改变运动状态而进行自我的速度和位置调控。
[0221]
在队列中的每个agent都有获取队列中其他所有agent速度、位置及其他信息素上锁携带相关信息的能力,即具有获得全局信息的能力。队列中的所有agent都可以按照信息素浓度最大者的速度(也可根据与目标及障碍物之间的距离大小基于人工势场法等方法进行计算和调整此速度的大小和方向)和向着确定目标位置运动。
[0222]
每个智能主体agent都能感知自身速度和位置的变化,并对历史数据具有记忆功能,以如图4中的agentu为(au)例说明其每隔时间δt对其速度和方向变化的自我感知:
[0223]
在t+2时刻,au的位置、速度和方向分别是(x(t+2),y(t+2))、vu(t+2)、θu(t+2),在时刻t+2+δt的位置为(x(t+2+δt),y(t+2+δt)),则其速度、速度变化、加速度和方向分别为
[0224][0225]
则速度变化δvu=vu(t+2+δt)-vu(t+2),加速度为
[0226]
(xo,yo)为目标的位置坐标;
[0227]au
的在时刻t+2+δt的方向为md(t+2+δt),是以其与x轴正向的夹角的在时刻t+2+δt的方向为md(t+2+δt),是以其与x轴正向的夹角和分别为速度矢量在y轴和x轴上的投影)来表示,则au所偏离的方向大小则为δθu=θu(t+2+δt)-θu(t+2);
[0228]
如|δθu|》0和/或|δvu|,则表明agentu为的速度和运动方向发生了变化,则会促使其产生自我调控激素作,作用于agentu自身使其δvu→
0且δθu→
0,为维持agentu调整过程中的运动稳定,速度和方向分别按照如下公式调节
[0229]vu
(t+2+2δt)=vu(t+2+δt)-kv*δvu[0230]
θu(t+2+2δt)=θu(t+2+δt)-k
θ
*δθu[0231]
其中,速度调整系数kv∈(0,1),方向调整系数k
θ
∈(0,1),按以下方式计算
[0232][0233]
前一时刻自我调整激素的调整系统α∈(0,1),计算衰减的调整系数β∈(0,1),r为激素存在寿命,γ为与速度与方向改变大小有关的调整系数、且r》α和r》β;当(m为自我调节激素的阈值),自我调节激素发挥兴奋作用则使kv∈(0.5,1)、k
θ
∈(0.5,1),反之则发挥抑制作用使kv∈(0,0.5)、k
θ
∈(0,0.5)。
[0234]
在本实施例中,所述车队自调节反馈机制还可以是新型的基于神经内分泌免疫调节机制的智能pid控制系统,如图5所示,主要包括神基于免疫进化的pid调节器、免疫进化算法模块、超短反馈单元、检测单元以及被控对象等。在该控制系统中,r(t)是系统期望输入,y(t)是系统实际输出,e(t)为系统由于扰动而产生的动态控制偏差,u(t)是基于免疫进化的pid控制器的输出;k
p
是pid的比例系数,对偏差e(t)敏感,能有效减少偏差;ki是积分系数,有消除静差、维持系统稳定性和记忆的功能;kd是微分系数,可体现当前偏差变化趋势,减少系统调节时间。
[0235]
对于pid控制算法,pid控制实质是将偏差的比例、积分和微分通过线性组合构成控制量,用以控制被控对象、纠正其偏差以使其达到一个稳定状态的线性、负反馈闭环调节器。由于pid控制器结构简单、稳定性好、运行可靠、易于操作、调整便捷而成为几十年来在工业自动化中被广泛应用的一种经典成熟控制方法。
[0236]
pid控制器的微分方程如下:
[0237]
且e(t)=r(t)-y(t);
[0238]
数字式pid控制器(位置控制型)差分方程为
[0239]
ts为采样周期
[0240]
为满足不同应用领域实际的需要和进一步特高pid控制的性能,基于以上标准pid控制器,在调节参数的自适应调整、整定和优化,不完全微分与完全微分及先微分再滤波,抗积分饱和(积分限幅、积分分离、变速积分)、消除积分不灵敏区,采样周期的合理选择与优化等方面对其进行改进。有关的研究工作和实际应用非常多,在此不再赘述。
[0241]
对于免疫进化算法,其在pid调节器的基础上提供的基于免疫进化算法的pid参数调节与整定方法,虽然pid控制器有上述诸多优点,但是其功能、性能的好坏完全取决于其比例系数、积分系数、微分系数的选择、确定和优化,而这也是比较复杂和需要考虑很多因素才能进行合理调节与整定的,是极其关键和重要的。一般而言,可以从各参数间的相互关系、参数对系统动态和稳态性能的作用机理、先比例后积分和微分、参数值开始时保守设置,响应时间、超调量、调整时间、抗扰动性和稳态误差之间的兼顾与平衡等方面考虑pid相关参数等调节与优化。近年来,将专家系统、遗传算法、菌群算法、免疫算法、模糊逻辑、神经网络、机器学习、神经内分泌调节、蚁群算法等等智能方法在pid控制器及其参数整定中应用、交叉融合和衍生以实现pid控制的智能化和对被控对象的最有控制效果,也进一步扩大其应用范围。
[0242]
鉴于借鉴和模仿人体免疫系统及其调控机理而产生的免疫算法在自组织性、自主学习与记忆能力、可适应性、可识别性、鲁棒性、可扩展性、自调节性等方面的优势,本文将利用免疫反馈控制机理用于在线自适应调节、整定pid的3个参数—k
p
、ti和td。,以提高控制系统的自适应能力和控制效果。
[0243]
免疫是机体对病毒、细菌、外来入侵异己物质及突变细胞等进行识别、活化、分化和清除等等自我生理保护机制,主要利用起主导作用的淋巴细胞中的b细胞上的抗体通过与入侵抗原进行结合以识别、清除抗原,而其t细胞在首先接收到抗原入侵的消息后所分化出的th细胞、ts细胞分别刺激和抑制b细胞的产生和免疫反应。抗原增多,则th细胞迅速增加、ts细胞则减少;随着抗原逐渐减少,则th细胞较少、ts细胞增多并抑制th细胞的产生,b细胞也将随之减少而使得免疫反馈系统逐渐恢复平衡,达到保护机体功能稳定和健康的目的。
[0244]
借鉴以上免疫反馈调节机理对pid的k
p
、ti和td进行调节和整定:
[0245]
在第n代,有数量为ag(n)的抗原入侵,因此而刺激产生的th细胞、ts细胞的数量分别为th(n)、ts(n),th细胞和ts细胞共同刺激b细胞的产生和发生免疫反应,b细胞所受到的总刺激数为
[0246]
b(n)=th(n)-ts(n)
[0247]
其中,th(n)=k1ag(n),(表示抗原增加、则ts减少、b细胞增多);
[0248]
作为控制系统输入的偏差e(n)也可以看作是对系统的“刺激”,这于抗原对于免疫系统的作用类似,因而可将e(n)对等于抗原数量ag(n);作为控制系统输出的uc(n)则可对应于免疫系统在抗原入侵下对b细胞的刺激,在这个意义上也可将uc(n)对等于b细胞的总
刺激数b(n);因此,则可有如下反馈机制和参数可变的调节器:
[0249]
uc(n)=b(n)=th(n)-ts(n)=k1ag(n)-k2ag(n)f(δag(n))=(k
1-k2f(δe(n)))e(n)
[0250]
其中,如令δ=k2/k1,则有
[0251]
uc(n)=(k
1-k2f(δe(n)))e(n)=k1(1-δ*f(δe(n)))e(n)=k
μ
(1-δ*f(δe(n)))e(n);
[0252]
将上式与pid的差分方程比较,即可对pid的k
p
、ti和td可分别按如下方式调节
[0253]kp
=k
μp
(1-δ
p
*f(δe
p
(n)));ti=k
μi
(1-δi*f(δei(n)));td=k
μd
(1-δd*f(δed(n)))。
[0254]
对于超短反馈算法,在神经内分泌系统存在如下丘脑

垂体

甲状腺分泌激素浓度这样的超短反馈闭环,以抑制其自身分泌活动,从而快速、稳定地调节、补偿腺体分泌活动,使能系统具有较高的自适应能力和稳定性。本文利用这一机制来提升系统快速自适应性和稳定性,把pid控制器输出u(n)在采样周期ts中的变化率作为超短反馈单元的输入,利用hill函数原理产生修正调节信号,则超短反馈算法如下:
[0255][0256]
其中,幅度调节参数α∈(0,1)可根据系统运行的实际干扰程度情况等而进行分段设置,
[0257]
β∈(0,1)为调节因子系数,阈值λ∈[0,1](适度减小微调超调量,该因子系数可取小一些的值),hill系数m(m≥1),激素激励信号δuc(n)=uc(n)-uc(n-1)。
[0258]
对于控制系统算法,该算法是结合了pid控制算法、免疫进化算法、超短反馈算法三种算法提出的,基于第三种算法结合得到的控制系统算法,其增量输出表达式为:
[0259]
δu(n)=δuc(n-1)-f(δuc,e(n))
[0260]
通过度上述方法的实施,在调控时可以充分地利用车辆主体基于神经自分泌机制向外产生的信息素来选择满足调控条件的车辆,实现了多协作任务中多车辆主体的亲密配合,并且对各车辆主体的运输能力进行充分安排,大大提高了运输效率以及调控的精准度,同时通过上述方法形成的车队各成员在系统中的灵活性、自主性高,可充分激发成员的积极性和主动性,以便各成员共同面对和应对复杂问题和复杂环境,而传统系统中各组成成员的灵活性、自主性相对较低而不利于发挥各自的积极性主动性以实现1+1》》1的效果,同时也使得车队的自组织性、鲁棒性、可靠性相较于集中控制的系统要高。
[0261]
上面对本发明实施例中基于神经自分泌机制的车队调控方法进行了描述,下面对本发明实施例中基于神经自分泌机制的车队调控装置进行描述,请参阅图6,本发明实施例中基于神经自分泌机制的车队调控装置一个实施例包括:
[0262]
信息采集模块601,用于根据多协作任务确定车队的集聚位、目标位和至少一个第一车辆主体,并规划各所述第一车辆主体移动至所述集聚位的移动路径;
[0263]
构建模块602,用于以各所述第一车辆主体为中心,构建各所述第一车辆主体的信
息素的扩散区域,并基于所述神经自分泌机制在所述扩散区域内产生第一信息素集,其中,所述第一信息素集包括至少一个第一信息素;
[0264]
感知模块603,用于各所述第一车辆主体在其对应的移动路径上向所述集聚位移动过程中,通过所述第一信息素集实时感知进入所述扩散区域内的第二车辆主体所传播的第二信息素集是否存在满足预设的邻近条件,其中所述第二信息素集包括至少一个第二信息素;
[0265]
亲和度计算模块604,用于在感知到满足所述邻近条件的第二车辆主体时,根据所述第一信息素集和所述第二信息素集确定两者之间的亲和度;
[0266]
判断模块605,用于判断所述亲和度是否满足预设的调控条件;
[0267]
调控模块606,用于在判断所述亲和度满足所述调控条件时,获取所述第一车辆主体和第二车辆主体的移动参数,根据所述移动参数对所述第一车辆主体和第二车辆主体进行队形编排,并以编排的队形向所述集聚位继续移动;以及在所有的第一车辆主体和第二车辆主体到达所述集聚位后,根据所述移动参数对所有的第一车辆主体和第二车辆主体重新编排队形,并基于重新编排后的队形向所述目标位移动。
[0268]
本实施例提供的装置,通过上述的装置实现车队的构建和调控,可以充分地利用车辆主体基于神经自分泌机制向外产生的信息素来选择满足调控条件的车辆,实现了多协作任务中多车辆主体的亲密配合,并且对各车辆主体的运输能力进行充分安排,大大提高了运输效率以及调控的精准度。
[0269]
进一步地,请参阅图7,图7为基于神经自分泌机制的车队调控装置各个模块的细化示意图.
[0270]
在本实施例另一实施例中,所述构建模块602包括:
[0271]
第一判断单元6021,用于判断各所述第一车辆主体是否存在预合作车辆主体;
[0272]
选择单元6022,用于在判断存在预合作车辆主体时,以所述移动路径为筛选条件,从对应的所述预合作车辆主体中选择具体位置在所述移动路径上的车辆主体,得到预合作车辆主体集合;
[0273]
第一计算单元6023,用于确定所述第一车辆主体的实时位置,并基于所述实时位置计算出其与对应的预合作车辆主体集合中各预合作车辆主体的信息传播方向;
[0274]
第一构建单元6024,用于以所述第一车辆主体为传播起点,在所述信息传播方向上构建所述第一车辆主体的信息素的定向扩散区域;
[0275]
第一扩散单元6025,用于调用所述神经自分泌机制驱使所述第一车辆主体在所述定向扩散区域内产生第一信息素集,并配置所述第一信息素集在所述定向扩散区域内按照所述信息传播方向进行定向传播。
[0276]
在本实施例另一实施例中,所述构建模块602还包括:
[0277]
距离确定单元6026,用于在判断各所述第一车辆主体不存在预合作车辆主体时,根据各所述第一车辆主体确定其自身的信息最大传播距离;
[0278]
第二构建单元6027,用于以所述信息的最大转播距离为半径,构建所述第一车辆主体的信息素的四周扩散区域;
[0279]
第二扩散单元6028,用于调用所述神经自分泌机制驱使所述第一车辆主体在所述四周扩散区域内产生第一信息素集,并配置所述第一信息素集的传播方向为全方位,将所
述第一信息素集在所述四周扩散区域内进行多方向同时传播。
[0280]
在本实施例另一实施例中,所述感知模块603包括:
[0281]
感知单元6031,用于通过所述第一信息素集中的各第一信息素感知所述扩散区域内是否有新的车辆主体进入;
[0282]
获取单元6032,用于在感知有新的车辆主体进入时,获取新的车辆主体在所述扩散区域内传播的第二信息素集、意图和目标;
[0283]
读取单元6033,用于选择所述目标和意图与所述多协作任务相同的车辆主体,并读取选择到的所述车辆主体的第二信息素集,得到第二信息素序列;
[0284]
第二计算单元6034,用于计算所述第二信息素序列的信息素浓度,并进行修正;
[0285]
第二判断单元6035,用于判断所述第二信息素集修正后的信息浓度是否大于所述第一信息素集的信息浓度;
[0286]
浓度确定单元6036,用于在判断判断所述第二信息素集修正后的信息浓度不大于所述第一信息素集的信息浓度,则确定所述新的车辆主体为所述第一车辆主体邻近的第二车辆主体。
[0287]
在本实施例另一实施例中,所述亲和度计算模块604包括:
[0288]
提取单元6041,用于分别提取所述第一信息素集和第二信息素集中各信息素的所有信息属性;
[0289]
向量计算单元6042,用于根据各信息素的所有信息属性,计算出对应的信息素向量,得到第一信息素向量和第二信息素向量;
[0290]
亲和度计算单元6043,用于根据所述第一信息素向量和第二信息素向量计算出第一信息素集和第二信息素集之间的相似度,得到对应的亲和度。
[0291]
在本实施例另一实施例中,所述亲和度计算单元6043具体用于:
[0292]
将所述第一信息素集与第二信息素集中两个相同或者相近的信息素的所有信息素向量相减后平方求和,得到两个相同或者相近的信息素的相似度;
[0293]
根据所述多协作任务中的各信息素的权重比,计算出各所述信息素的相似度权重,并将计算的相似度权重求总和,得到第一信息素集和第二信息素集之间的亲和度。
[0294]
在本实施例另一实施例中,所述移动参数至少包括移动速度、移动加速度、移动方向和信息素的扩散距离,所述调控模块606包括:
[0295]
融合单元6061,用于根据所述移动速度、移动加速度、移动方向和扩散距离进行融合计算,得到各第一车辆主体和各第二车辆主体的动态性能;
[0296]
编排单元6062,用于根据所述动态性能对所有的第一车辆主体和第二车辆主体按照预设的编队策略进行位置编排,得到协作队形;
[0297]
创建单元6063,用于基于所述协作队形,创建车队自调节反馈机制,其中所述车队自调节反馈机制用于监控各第一车辆主体和第二车辆在所述协作队形中的所有移动参数的动态平衡;
[0298]
调控单元6064,用于控制所有的第一车辆主体和第二车辆主体,按照所述协作队形保持移动队列,并以所述车队自调节反馈机制对队列中的各车辆主体进行实时监控调整,以实现向所述目标位移动,其中,所述实时监控调整为基于所述车队自调节反馈机制捕捉所述第一车辆主体或所述第二车辆主体在所述协作队形中的实时动态性能,判断所述实
时动态性能是否满足协作队形的平衡系数,若不满足,则控制对应的车辆主体对自身的动态性能进行调整,以及通知其他车辆主体进行配合调整。
[0299]
通过上述装置的实施,根据各自的意图目标与其他车辆主体的意图目标是否一致或接近,自身资源、动态能力和工作状态是否满足对方提出的合作请求相匹配,以及因此而获取的利益是否符合自身预期来决定是否建立合作关系,从而自发、自主地形成一个利益体,这样的利益体可动态形成利益整体/系统/联盟或增减成员或解散,以灵活、快捷因应外界环境的多样性、快速多变和高度不确定性和复杂性,且基于各主体分散分布自治的控制机制,使得系统的自组织性、鲁棒性、可靠性相较于集中控制的系统要高。
[0300]
上面图6和图7从模块化功能实体的角度对本发明实施例中的基于神经自分泌机制的车队调控装置进行详细描述,下面从硬件处理的角度对本发明实施例中电子设备进行详细描述。
[0301]
图8是本发明实施例提供了一种电子设备的结构示意图,该电子设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)810(例如,一个或一个以上处理器)和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器820和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对电子设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在电子设备800上执行存储介质830中的一系列指令操作。在实际应用中,该应用程序833可以被分割成信息采集模块601、构建模块602、感知模块603、亲和度计算模块604、判断模块605和调控模块606(虚拟装置中的模块)的功能。
[0302]
电子设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作系统831,例如:windowsserve,macosx,unix,linux,freebsd等等。本领域技术人员可以理解,图8示出的电子设备结构还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0303]
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令或计算机程序,当所述指令或计算机程序被运行时,使得计算机执行上述实施例提供的基于神经自分泌机制的车队调控方法的各个步骤。
[0304]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统或装置、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0305]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,
rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0306]
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1