基于人群混乱度的机器人辅助疏散最优干预方法及系统

文档序号:32161230发布日期:2022-11-12 02:37阅读:93来源:国知局
基于人群混乱度的机器人辅助疏散最优干预方法及系统

1.本发明涉及人群疏散干预技术领域,尤其涉及一种基于人群混乱度的机器人辅助疏散最优干预方法及系统。


背景技术:

2.随着城市化的不断发展,人群事故越来越多,造成了相当大的人员伤亡和经济损失。在人群事故中,人们表现出复杂的个人和群体行为,如恐慌、推搡和踩踏等,这些行为的相互作用会增加人群运动的混乱程度,给人群疏散带来二次伤亡。因此,研究人群疏散调控方法有助于减少甚至避免人群混乱,节省疏散时间,具有重要意义。
3.近年来,智能机器人技术的迅速崛起激发了机器人辅助应用的发展。机器人辅助人群疏散因其省力、风险适应性强、易于部署等诸多优点而成为热门应用之一。疏散导航、行人流量控制、疏散路线发现等方面的研究已经得到了广泛的研究。在疏散导航方法中,移动机器人引导疏散人员前往不太拥挤的出口,行人流量控制通过声音、视觉信号或机器人的移动为疏散人员提供活动方式,以避免出口附近的拥挤。在疏散路线发现中,机器人通过与预先部署的传感器之间的通信,探索紧急情况发生的区域,并发现从事故现场到紧急出口的最佳疏散路径。
4.然而,现有的机器人辅助疏散人群的方法均未考虑人群混乱对人群疏散的影响,而这对于有效疏散至关重要。当发生人群事故时,人们试图尽快逃离危险场所,这可能导致混乱行为甚至踩踏。一般来说,人群越混乱,疏散就越慢。因此,考虑人群混乱对疏散的影响可以为人群疏散过程中的机器人干预提供新的策略。


技术实现要素:

5.为解决上述现有技术的不足,本发明提供了一种基于人群混乱度的机器人辅助疏散最优干预方法及系统,通过引入人群混乱度来量化人群运动的混乱程度,并对人群混乱演化过程建模,将机器人辅助干预描述为一个随机最优控制问题,通过求解该问题确定最优干预个体和干预时间,以此机器人识别出最重要的个体进行干预,而非控制整个非理性人群,实现机器人的最优干预。
6.第一方面,本公开提供了一种基于人群混乱度的机器人辅助疏散最优干预方法:
7.一种基于人群混乱度的机器人辅助疏散最优干预方法,包括以下步骤:
8.构建人群网络模型,通过人群混乱度量化人群运动的混乱程度;
9.利用随机微分方程和标记时间点过程的方法对人群混乱的演化过程进行建模,构建人群混乱度演化模型;
10.基于人群混乱度演化模型,将机器人辅助干预规划为随机最优控制问题,通过求解得到机器人的最优干预率,进而确定最优干预个体和干预时间。
11.进一步的技术方案,所述构建人群网络模型,通过人群混乱度量化人群运动的混乱程度,具体包括:
12.通过无向图构建人群网络模型;
13.基于人群网络模型,构建相邻个体之间的局部混乱度;
14.基于相邻个体之间的局部混乱度,构建任意两个个体之间的全局混乱度;
15.基于任意两个个体之间的全局混乱度,构建任意个体的个体混乱度。
16.进一步的技术方案,所述人群混乱度演化模型描述有序状态和混乱状态的动态跃迁过程,包括无干预的人群混乱度演化模型和干预下的人群混乱度演化模型。
17.进一步的技术方案,所述无干预的人群混乱度演化模型的构建过程包括:
18.根据初始时刻个体的个体混乱度,将个体划分为混乱状态或有序状态;
19.基于初始时刻个体的状态,利用标记时间点过程的方法,结合随机微分方程,模拟设定时间段内个体状态的转变过程,构建无干预的人群混乱度演化模型。
20.进一步的技术方案,所述标记时间点过程是指统计设定时间段内事件发生次数的计数过程;利用标记时间点过程的方法,结合随机微分方程,构建无干预的人群混乱度演化模型,具体过程包括:
21.定义混乱状态和有序状态的转换事件,即有序状态转换为混乱状态的转换事件以及混乱状态转换为有序状态的转换事件;
22.利用强度描述设定时间内两个转换事件发生次数的计数过程,基于随机微分方程,计算设定时间段内两个转换事件发生的预期次数,构建无干预的人群混乱度演化模型。
23.进一步的技术方案,所述干预下的人群混乱度演化模型的构建过程包括:
24.基于无干预的人群混乱度演化模型,引入机器人干预的状态变量,构建干预下的人群混乱度演化模型。
25.进一步的技术方案,所述随机最优控制问题是指求解使得累计干预收益在设定时间段内期望值最大化的机器人干预率。
26.第二方面,本公开提供了一种基于人群混乱度的机器人辅助疏散最优干预系统,包括:
27.数据处理模块,用于构建人群网络模型,通过人群混乱度量化人群运动的混乱程度;
28.模型构建模块,用于利用随机微分方程和标记时间点过程对人群混乱的演化过程进行建模,构建人群混乱度演化模型;
29.优化求解模块,用于基于人群混乱度演化模型,将机器人辅助干预规划为随机最优控制问题,通过求解得到机器人的最优干预率,进而确定最优干预个体和干预时间。
30.第三方面,本公开还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成第一方面所述方法的步骤。
31.第四方面,本公开还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成第一方面所述方法的步骤。
32.以上一个或多个技术方案存在以下有益效果:
33.1、本公开提供了一种机器人辅助的人群疏散随机最优干预方法及系统,考虑了人群混乱对疏散的影响,为人群疏散过程中的机器人干预提供新的策略,有效确定混乱的干预个体和干预时间,实现有针对性的机器人干预。
34.2、本公开提供了一种机器人辅助的人群疏散随机最优干预方法及系统,通过引入人群混乱度来量化人群运动的混乱程度,并对人群混乱演化过程建模,将机器人辅助干预描述为一个随机最优控制问题,通过求解该问题确定最优干预个体和干预时间,以此机器人识别出最重要的个体进行干预,而非控制整个非理性人群,实现机器人的最优干预。
附图说明
35.构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
36.图1为本发明实施例一所述方法的整体流程图。
具体实施方式
37.应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
38.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
39.疏散干预可以防止人群发生事故并提供安全保障。机器人干预是当前研究的热点,而如何依据紧急情况下人群疏散的实时状况提供有效的机器人干预方案是一个极具挑战性的问题。然而,现有的研究都没有考虑人群混乱的影响,这是决定人群疏散效率的基本因素。本发明提出了一种基于人群混乱度的随机最优干预方法,为机器人辅助人群疏散提供最优策略。首先,引入人群混乱度来量化人群运动的混乱程度;然后,利用随机微分方程和标记时间点过程研究了人群混乱状态的演化模型;随后,将机器人辅助干预描述为一个随机最优控制问题,寻求最大化干预回报;最后,通过求解该问题可以得到随机最优控制问题的解析解。
40.实施例一
41.本实施例提供了一种基于人群混乱度的机器人辅助疏散最优干预方法,如图1所示,包括以下步骤:
42.构建人群网络模型,通过人群混乱度量化人群运动的混乱程度;
43.利用随机微分方程和标记时间点过程的方法对人群混乱的演化过程进行建模,构建人群混乱度演化模型;
44.基于人群混乱度演化模型,将机器人辅助干预规划为随机最优控制问题,通过求解得到机器人的最优干预率,进而确定最优干预个体和干预时间。
45.首先,通过无向图构建人群网络模型。人群网络由无向图g(v,e)建模得到,其中v表示人群中n个个体的集合,e表示个体之间的边集合。人群网络由监控视频中捕捉到的个体位置和速度构成,只有当一对个体之间的几何距离小于固定范围r时,这对个体之间才存在一条边,具有边的两个个体相邻,称为邻居。
46.在此基础上,通过人群混乱度量化人群运动的混乱程度。由于个体的行为往往会
受到他人的影响,而不是独立的行为,因此很难准确地测量人群混乱。为此,本实施例引入了局部混乱度和全局混乱度的定义,用以准确地量化人群混乱。
47.局部混乱度ε(i,j)表示相邻个体i和j之间的混乱程度,定义如下:
[0048][0049]
其中,θ(i,j)∈[0,π]是个体i和j的运动方向之间的角度,ε(i,j)的值随混乱程度的增加而单调增加,具体来说,当角度θ(i,j)较小时,两个个体的运动方向更加一致,局部混乱度接近0,相反,当角度θ(i,j)较大时,局部混乱度接近1。
[0050]
而个体的混乱不但会受到相邻个体的影响,还会受到远处其他个体的影响,不相邻的两个个体之间可以通过混乱的传播而产生相互影响,用任意两个个体之间的混乱定义个体i和个体j之间的全局混乱度。全局混乱度可以通过初始化步骤和迭代过程计算得到:
[0051]
在初始化步骤中,首先构造一个对称矩阵a∈rn×n,矩阵a是n行n列的矩阵,由n
×
n个数构成,其中a
ij
=ε(i,j)表示矩阵a的第i行第j列数,a
ii
=0,以避免自增强效应;然后,对矩阵a进行归一化,以确保后续迭代的收敛性,归一化矩阵为:
[0052][0053]
其中,d是度矩阵,d=diag{d1,d2,

,dn}=diag{σ
ja1j

ja2j
,


janj
}。
[0054]
在迭代过程中,计算混乱随时间通过人群网络g(ν,ε)的传播,将时间分为多个步骤,用t表示,以y(t)表示时间t的混乱影响矩阵,即表示第t阶邻域的混乱影响。最初,y(0)=βb表示第一阶邻域的影响,β是权重参数,类似地,by(0)表示第二阶邻域等的影响,随着个体的混乱传播到其邻域,y(t)可以通过下述等式逐步计算,直到收敛:
[0055]
y(t+1)=βby(t)+(1-β)y(0)
[0056]
在上式中,节点i和j之间的混乱影响由两个分量组成,即来自其高阶邻居(第一项)的影响和来自第一阶邻域(初始混乱度,第二项)的影响。此外,由于b是对称矩阵,因此影响通过网络对称传播。通过迭代,混乱最终传播到整个网络,得到一个收敛的混乱度矩阵:
[0057][0058]
上述公式中,矩阵i为单位矩阵,即主对角线上的数值都为1,其余都为0的矩阵。
[0059]
由于全局成对混乱通过拓扑关系累积了所有其他个体混乱的影响,因此其更准确地表示了成对混乱。
[0060]
接下来,定义每个个体的混乱并计算其上界,以确定个体状态,以便进一步处理。任何个体i的个体混乱εg(i)定义为i和其余节点之间的全局混乱度的累积:
[0061]
εg(i)=[y
*
1]i[0062]
上式中,1是所有元素都等于1的向量。
[0063]
在通过人群混乱度量化人群个体的混乱程度后,考虑到在人群疏散过程中,人群混乱是动态演化的,然而,由于摄像机覆盖范围的限制和遮挡问题,利用监控视频跟踪人群
运动的混乱是不现实的,观察人群中的每个人都有两个显著的状态:混乱和有序,一个状态可以动态过渡到另一个状态,因此,在本实施例中,构建一个混乱演化模型,从理论上描述了人群混乱的基本动力学。在该模型中,用两种状态来表示,将混乱演化归结为状态的动态跃迁。
[0064]
首先,构建无干预的人群混乱度演化模型。当人群移动时,混乱可能会自行演变,例如,有序状态可能由于其他混乱运动的影响而转变为混乱状态,而混乱状态可能通过自序再次变为有序状态。在人群混乱演化模型中,首先定义个体的状态,然后研究状态转换的动力学。
[0065]
在时间t,个体i的状态由zi(t)表示,其中zi(t)=1/0表示混乱/有序状态。使用状态二值化方法,根据全局混乱度将个体分为混乱和有序两种状态。
[0066]
各节点在初始时刻t0的状态为:
[0067][0068]
其中,a是折扣参数。ε*为人群混乱与否的判断阈值。
[0069]
个体的状态可能会随着时间的推移而改变,设定一个小的时间间隔dt,即时间段,状态转移的演化通过以下公式进行描述:
[0070]
zi(t+dt)=zi(t)+dzi(t)
[0071]
式中,dzi(t)∈{0,1,-1}是zi(t)的微分,0表示状态保持不变,1表示状态从有序变为混乱,以及-1表示状态从混乱变为有序。
[0072]
由于微分dzi(t)取决于dt期间发生状态转变的次数,因此,本实施例提出了基于标记时间点过程的方法来模拟状态转变过程。标记时间点过程由一系列在时间上定位的离散事件组成,它通常由一个计数过程来表示,该计数过程统计时间t之前事件发生的次数。计数过程用强度λ(t|h(t))来表征,表示给定历史h(t)的事件发生率,即该强度值等于单位时间内事件发生的次数。为简洁起见,将λ(t|h(t))称为λ(t)。
[0073]
基于标记时间点过程的方法包括以下两个步骤。首先,定义两类状态转换事件:1)oc,有序状态转换为混乱状态;2)co,混乱状态转变为有序状态。当个体i在时间t从有序状态过渡到混乱状态时,事件e(i,oc,t)发生,同样,当个体i在时间t从混乱状态过渡到有序状态时,则会发生事件e(i,co,t)。
[0074]
其次,定义强度为和的两个计数过程li(t)和mi(t),以计算任意个体i在t之前发生e(i,oc,t)和e(i,co,t)事件的次数。为了量化强度,本实施例使用η和μ来表示链路的混乱扩散率和人群网络g(ν,ε)中节点的混乱恢复率,具体而言,η表示具有混乱状态的节点随时间影响其邻域的速度,μ表示具有混乱状态的节点自发转变为有序状态的速度。具有有序状态的节点在其处于混乱状态的邻域的影响下可能会过渡到混乱状态,即:
[0075][0076]
其中,表示混乱状态的邻域数量,z(t)=(z1(t),

,zn(t))
t
,是有向图的邻接矩阵的第i行,其结果值乘以1-zi(t),这是因为事件仅在节点有序时发生。
[0077]
同理,具有混乱状态的节点以μ的速率过渡到有序状态,即:
[0078][0079]
根据强度的定义,在dt内e(i,oc,t)和e(i,co,t)事件发生的期望次数,可通过以下公式得出:
[0080][0081][0082]
其中,e[dli(t)]和e[dmi(t)]分别表示求解dli(t)和dmi(t)期望次数,微分dli(t)=li(t+dt)-li(t)和dmi(t)=mi(t+dt)-mi(t)表示dt内oc/co事件发生的次数,其中,dli(t)∈{0,1},dmi(t)∈{0,1}。考虑到dzi(t)由oc和co事件数量的差异决定,因此,状态转移的动力学可以用以下带跳跃的随机微分方程(sde)来描述:
[0083]
dzi(t)=dli(t)-dmi(t)
[0084]
进而,无干预下的人群混乱度演化模型具体表现为:
[0085]
zi(t+dt)=zi(t)+dli(t)-dmi(t)
[0086]
其次,基于无干预的人群混乱度演化模型,引入机器人干预的状态变量,构建干预下的人群混乱度演化模型。
[0087]
目前,智能机器人广泛应用于公共场所,机器人可以帮助引导人们更有序地疏散,因此,在机器人的干预下,个体可以更快地从混乱状态过渡到有序状态。本实施例中引入一个新的状态变量来表示节点是否受到干预,然后研究机器人干预下的状态变化过程。
[0088]
设wi(t)为机器人干预的状态变量,其中wi(t)=1/0表示个体i是否处于机器人干预下,状态变化过程通过以下方式进行描述:
[0089]
wi(t+dt)=wi(t)+dwi(t)
[0090]
其中,dwi(t)∈{0,1,-1}是w的微分,0/1/-1分别表示状态保持不变、状态从不干预变为干预、状态从干预变为不干预。
[0091]
为了推导微分dwi(t),定义两种新类型的状态转移事件和一个新的计数过程:1)ni,非干预状态转变为干预状态;2)in,干预状态转变为非干预状态;3)ni(t),干预强度为的计数过程,计算事件e(i,ni,t)在t之前发生的次数。由于事件e(i,ni,t)仅在i的状态为混乱(即zi(t)=1)和无干预(即wi(t)=0)时发生,因此干预强度可以描述为:
[0092][0093]
其中,νi(t)是机器人对个体i的干预率。
[0094]
接下来,事件e(i,ni,t)在设定时间段即时间间隔dt内发生的预期次数可以计算为:
[0095][0096]
其中,微分dni(t)=ni(t+dt)-ni(t)表示时间间隔dt期间事件发生的次数。
[0097]
在机器人干预的帮助下,节点的状态可以更快地从混乱过渡到有序。设δ为节点在机器人辅助干预下恢复率的增加,因此个体i的co事件强度变为:
[0098][0099]
只有当节点i在机器人干预的帮助下从混乱过渡到有序时,才会发生事件e(i,ni,t),在这种情况下,也发生了事件e(i,co,t),因此,事件e(i,ni,t)在dt内发生的次数为wi(t)dmi(t)。
[0100]
最后,微分dwi(t)可以用以下带跳跃的随机微分方程(sde)来描述:
[0101]
dwi(t)=dni(t)-wi(t)dmi(t)
[0102]
进而,干预下的人群混乱度演化模型具体表现为:
[0103]
wi(t+dt)=wi(t)+dni(t)-wi(t)dmi(t)
[0104]
最后,人群混乱度演化模型为如何调控机器人干预程度提供依据:如果干预率较高,能够减少人群混乱和踩踏风险,同时消耗更高的成本;相反,如果干预率小,能够有效地节约成本,但可能会导致无法控制人群的混乱,并增加踩踏的风险。
[0105]
为了平衡上述情景,本发明给出了最优干预策略。具体的,将机器人辅助干预表述为一个随机最优控制问题,找到最优的机器人干预率,使累积干预收益在时间窗口内的期望值最大化:
[0106][0107]
其中,期望值x表示从t0到tf的计数过程的所有可能实现的结果,u(t)是在时间t测量机器人干预回报的收益函数:
[0108][0109]
其中,干预收益项由初始时刻到设定时间段后的时刻,人群中处于混乱状态的个体的加权减少量来描述,ωi=ηa
i*
1是节点i(即个体i)的权重,表示邻域越多的节点对降低混乱的贡献越大;干预成本与干预每个个体的成本ωi和相应的机器人干预率νi(t)成比例;在不失一般性的情况下,将每个个体的干预成本表示为
[0110]
之后,解决最优随机控制问题,以获得时间窗口t∈(t0,tf]中的每个个体的最优干预率,即n个最优干预率λ(t)=(ν1(t),

,νn(t))
t

[0111]
由于初始混乱度σiωizi(t0)是一个常数,在寻找最优解时可以忽略它,因此上述优化问题可以简化为:
[0112][0113]
s.t.νi(t)≥0,i∈ν,t∈(t0,tf]
[0114]
其中,
[0115]
然后,通过求解上述问题,得到机器人辅助人群疏散时的干预率的闭式最优解,即得到每个个体的最优干预率。
[0116]
结合上述干预强度的计算公式,利用求解的最优干预率去计算每个个体的最优干预强度进而可以计算得到所有干预事件的总强度为:
[0117][0118]
之后,计算每个个体干预事件发生的概率并依照轮盘赌机制
选择出当前时刻发生干预事件的个体,即最优干预个体。
[0119]
本实施例提供了一种机器人辅助的人群疏散随机最优干预方法及系统,考虑了人群混乱对疏散的影响,为人群疏散过程中的机器人干预提供新的策略,有效确定混乱的干预个体和干预时间,实现有针对性的机器人干预。
[0120]
实施例二
[0121]
本实施例提供了一种基于人群混乱度的机器人辅助疏散最优干预系统,包括:
[0122]
数据处理模块,用于构建人群网络模型,通过人群混乱度量化人群运动的混乱程度;
[0123]
模型构建模块,用于利用随机微分方程和标记时间点过程对人群混乱的演化过程进行建模,构建人群混乱度演化模型;
[0124]
优化求解模块,用于基于人群混乱度演化模型,将机器人辅助干预规划为随机最优控制问题,通过求解得到机器人的最优干预率,进而确定最优干预个体和干预时间。
[0125]
实施例三
[0126]
本实施例提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成如上所述的基于人群混乱度的机器人辅助疏散最优干预方法中的步骤。
[0127]
实施例四
[0128]
本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成如上所述的基于人群混乱度的机器人辅助疏散最优干预方法中的步骤。
[0129]
以上实施例二至四中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
[0130]
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
[0131]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0132]
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1