专利名称:基于多智能体仿真的地下道路线形及横向净距设计方法
技术领域:
本发明涉及道路交通安全与设计,具体讲涉及基于多智能体仿真的地下道路线形及横向净距设计方法。
背景技术:
现实表明,地下道路由于其封闭性和躲避空间的局限性,交通安全事故的发生频率是一般道路的几倍,严重程度很高且极易引起后继事故的发生,而把人、车、路和环境等几个方面综合进行考虑的地下道路交通工程设计,被认为是解决公路地下道路交通安全问题的重要措施之一。在地下道路交通工程涉及的各种手段和方法中,地下道路线形和横向净距的优化设计能够帮助驾驶员做出更有效的驾驶行为决策,减少驾驶焦虑和压力,是真正能够保证地下道路交通安全、提高通行能力的手段之一。荷兰应用科学研究组织(TNO)认为,隧道的特殊设计包括隧道的长度、类型、宽度,隧道路线曲线的数目、曲度及波动等,在很大程度上影响着驾驶员的行为以及主观安全感。但是这些研究都是针对公路隧道的研究,对地下道路的研究主要集中在横断面的设计、 出入口变速车道长度以及交通安全的定性分析等,较少对城市地下道路的驾驶行为进行研究。
发明内容
本发明旨在解决克服现有技术的不足,提供一种较理想的地下道路线形及横向净距设计方法。为达到上述目的,本发明采取的技术方案是,基于多智能体仿真的地下道路线形及横向净距设计方法,采用SOAR认知框架对地下道路行车中的驾驶员智能体进行建模, 包括智能体工作记忆、长期记忆、程序性算子选择方法及学习机制子模块;SOAR认知框架工作记忆包括SOAR智能体的所有关于世界和内部推理的动态信息,它包括感知信息,中间计算,分级的状态以及相关的算子和目标等,智能体所有的推理和决策都在工作记忆中进行;SOAR认知框架长期记忆经过地下道路驾驶行为程序性记忆用产生式规则来进行表征,首先,用每个规则的“if”部分去匹配工作记忆里的元素,如果规则的“if”部分与工作记忆元素完全匹配,这个规则就会被触发,然后通过发送一条到运动系统的信息或产生改变当前状态的建议,引起“then”部分触发,即任何与当前目标、状态和算子匹配的规则会改变当前的目标和状态;程序式算子选择经过地下道路的SOAR认知框架中采用数值偏好,长期记忆规则库中的每条规则包括匹配条件和匹配条件满足下可以建议的算子,以及此条件下建议该算子的数值偏好值,每添加一条新规则需要判断该规则中算子的初始数值偏好大小,并在决策过程中根据外界的反馈对该值的大小进行更新以使其更接近真实情况;学习机制在子状态的处理过程中学习组块规则。当一个困境产生时意味着当期系统的长期记忆中没有可以利用的算子使得问题求解过程在问题空间中向前移动,需要自动创建一个新的规则来解决当前困境,组块规则的建立需要分析长期记忆中与达到结果相关的产生式规则及情节记忆线索。SOAR认知框架长期记忆初始长期记忆规则
权利要求
1.一种基于多智能体仿真的地下道路线形及横向净距设计方法,其特征是,采用SOAR 认知框架对地下道路行车中的驾驶员智能体进行建模,包括智能体工作记忆、长期记忆、程序性算子选择方法及学习机制子模块SOAR认知框架工作记忆包括SOAR智能体的所有关于世界和内部推理的动态信息,它包括感知信息,中间计算,分级的状态以及相关的算子和目标等,智能体所有的推理和决策都在工作记忆中进行;SOAR认知框架长期记忆经过地下道路驾驶行为程序性记忆用产生式规则来进行表征, 首先,用每个规则的“if”部分去匹配工作记忆里的元素,如果规则的“if”部分与工作记忆元素完全匹配,这个规则就会被触发,然后通过发送一条到运动系统的信息或产生改变当前状态的建议,引起“then”部分触发,即任何与当前目标、状态和算子匹配的规则会改变当前的目标和状态;程序式算子选择经过地下道路的SOAR认知框架中采用数值偏好,长期记忆规则库中的每条规则包括匹配条件和匹配条件满足下可以建议的算子,以及此条件下建议该算子的数值偏好值,每添加一条新规则需要判断该规则中算子的初始数值偏好大小,并在决策过程中根据外界的反馈对该值的大小进行更新以使其更接近真实情况;学习机制在子状态的处理过程中学习组块规则,当一个困境产生时意味着当期系统的长期记忆中没有可以利用的算子使得问题求解过程在问题空间中向前移动,需要自动创建一个新的规则来解决当前困境,组块规则的建立需要分析长期记忆中与达到结果相关的产生式规则及情节记忆线索。
2.如权利要求I所述的基于多智能体仿真的地下道路线形及横向净距设计方法,其特征是S0AR认知框架长期记忆初始长期记忆规则如下表
3.如权利要求I所述的基于多智能体仿真的地下道路线形及横向净距设计方法,其特征是,程序式算子选择具体为1)令O(S)表示状态s下的候选算子集合,如果其基数|0(S)I等于1,则选择ο e O(S) 进入工作记忆,否则继续;2)如果|0(s)I > I, P[omax(S)]-p[osec(S)]≥τ (s),则以轮盘赌机制从O(s)中选择当前算子进入工作记忆,否则继续;其中P [omax (s)]、p [O· (S)]表示状态s下最优算子和次优算子的偏好,τ (s)表示状态s下算子直接选择阈值;3)如果O(S) = Φ 或 |0(S) I > I, P [Offlax(S)]-P [osec(s)] < τ (S),则不能直接进行算子选择,则产生困境,进入组块学习阶段。
4.如权利要求I所述的基于多智能体仿真的地下道路线形及横向净距设计方法,其特征是,学习机制包括困境的解决和组块规则子模块当程序式记忆不能对当前状态选择算子时,采用如下步骤解决困境1)令从初始状态Stl经过i次状态转移得到的当前状态Ssi,如果O(Si)= Φ或IO(Si) > I,P [Omax(Si)]-p [Osee(Si)] < τ (s),则符合组块学习条件,令j = i+1,继续;否则采用程序式记忆进行算子选择;2)如果j= 0,转5);否则j = j-1 ;3)在所有情节记忆库中寻找状态转移路径中包含的情节性记忆的算子集合,记为 Oq (Sj),^^ Oq (Sj) = Φ,转 2),否则继续;4)在Oq(sJ中选择最优算子进入工作记忆,解决当前困境;5)如果O(Si)= Φ,以步长O. I改变当前状态的匹配精度,直到满足当前状态的算子集合0(s' J出现,其中s' i表示改变匹配精度后的新状态;6)在O(Si)或O (s' J中采用轮盘赌机制选择算子进入工作记忆,解决当前困境;组块规则如果智能体在状态转移中遇到过困境,则说明决策过程中有部分状态没有算子或者不能直接选择,那么智能体此次决策后,需要采用组块学习方法创建规则及偏好更新,如果 G(Se)-Ge(Se) ( ηζ,则对解决困境的算子进行一次组块更新,其中Ge(Se)表示智能体在状态\下的期望驾驶目标,G(Se)表示智能体动作的实际驾驶目标,\为规则组块更新阈值; 如果相同规则连续两次被组块更新,则将对应算子添加到决策过程中遇到困境状态,组块成功;无论是组块形成还是已经存在的规则,智能体后都要对此次决策涉及的算子进行反馈学习,由于决策过程涉及多个状态和算子,因此采用各状态与目标状态的距离来分配对应算子的反馈偏好,决策周期t的状态转移路径中第k个状态对应的算子O(Sk)的反馈偏好值为λ [d(sk, Se)] Pr(Se),其中Pr(Se) = [G(se)-Ge(Se)Ja为最终状态Se下的总偏好反馈值,参数Ct取O. 5 ; λ [d (sk, Se), r (Sk)]为Pr (Se)分配到o (sk)上的权重,它是状态Sk到Se的距离d(sk,se)及Sk所在的状态转移路径r(sk)的函数,取I IrOt )1 I= —-/ X-其中|r(Sk) I为Sk所在路径包含的状态数量。^\Sk,Se ) /-I 以 \Si,Se )
全文摘要
本发明涉及道路交通安全与设计。为提供一种较理想的地下道路线形及横向净距设计方法。为达到上述目的,本发明采取的技术方案是,基于多智能体仿真的地下道路线形及横向净距设计方法,采用SOAR认知框架对地下道路行车中的驾驶员智能体进行建模,包括智能体工作记忆、长期记忆、程序性算子选择方法及学习机制子模块。本发明主要应用于地下道路线形及横向净距设计。
文档编号G06F17/50GK102609599SQ20121010496
公开日2012年7月25日 申请日期2012年4月11日 优先权日2012年4月11日
发明者严西华, 冯炜, 周骊巍, 张占领, 张国梁, 徐建平, 李明剑, 段绪斌, 王晓华, 王海燕, 白子建, 赵巍, 邢锦, 郑利, 钟石泉 申请人:天津市市政工程设计研究院