一种三维高仿真兵棋推演平台与方法

文档序号:30976020发布日期:2022-08-02 23:18阅读:277来源:国知局
一种三维高仿真兵棋推演平台与方法

1.本发明涉及兵棋推演系统领域,更具体的说是涉及一种三维高仿真兵棋推演平台与方法。


背景技术:

2.目前,兵棋推演系统是一种重要的国防安全支持工具,主要功能是模拟多方参与的海陆空及特种联合作战行动样式,并对各推演方的指挥决策所导致的战争态势变化进行裁决。计算机兵棋推演系统主要分为军用与商用两类。
3.但是,这两种推演系统的仿真环境基本一致,都是基于二维平面地理图像模拟局部战场环境,无法实现三维态势的实时展现,对高度信息利用不充分,对作战细节如作战单元击打部位等进行忽略,功能单一,对于空间作战模拟极为不利,进而影响指挥下达作战命令。此外,对战双方主要为人人交互,其交战模型开发主要以二维作战空间和数字化作战单位为基础,作战空间缺乏真实性,作战单位缺乏相关复杂建模,整体可视化能力较差与实际交战过程差距较大;现有仿真平台的作战想定数量有限且不易修改,搭建新想定环境过程较为繁琐,这不利于现代联合作战体系对于突发事件的快速仿真。
4.因此,如何提供一种三维的、高精度的、更细节化的、战场还原度高的、利于快速编辑的兵棋推演平台与方法是本领域技术人员亟需解决的问题。


技术实现要素:

5.有鉴于此,本发明提供了一种基于虚幻引擎的三维高仿真兵棋推演平台,
6.为了实现上述目的,本发明采用如下技术方案:
7.包括:想定模块、数据库模块、推演模块、传输模块、显示模块、算法模块和群进化训练模块;
8.所述想定模块基于对战设想对作战单元、武器性能、对战战力、对战环境和任务进行编辑得到初始化参数。其中,所述想定模块中想定是指对战双方的基本态势、作战企图和作战发展情况的设想。
9.所述数据库模块包括:三维实例模型、环境库、想定数据库、推演记录数据库、博弈规则数据库和种群学习算法库;
10.所述推演模块通过虚幻四物理引擎驱动,用于根据初始化参数进行动作响应、碰撞响应、天气响应、通信响应和裁决响应的触发以及对抗指标的统计得到态势信息;
11.即,虚幻引擎对仿真领域的优势不仅在于支持高精度的三维模型与物理规则运算,还能够支持更加复杂的整体环境的构建,这有利于搭建复杂的联合作战系统;
12.所述显示模块用于对态势信息进行可视化显示;
13.所述算法模块用于对战训练,包括通过所述态势信息得到决策指令输给所述传输模块使其做出相应的动作,得到每轮对战过后的优秀策略;
14.所述传输模块将所述推演模块中的态势信息传递给所述算法模块并接受来自所
述算法模块的决策指令,同时将态势信息传输给显示模块供显示输出;
15.所述种群进化训练模块使用种群学习算法用于以每轮对战优秀策略形成一个种群训练策略,所述种群训练策略作为内嵌战略供算法模块训练。
16.优选的,所述想定模块中初始化参数任务编辑内容为将进攻方任务设置为摧毁防守方所有兵力或摧毁防守方守卫目标。
17.优选的,所述传输模块传输的信息包括:作战单元信息、可见光视觉信息、红外感知信息和三维环境信息。
18.优选的,所述推演模块中对抗指标统计内容包括:作战中的战损比、资源消耗、误伤比和任务完成进度,其中误伤比是指战场中随机出现的中立方损毁量占总损毁量的比例。
19.优选的,所述显示模块包括:主视角显示、跟随视角显示、自由视角显示、小地图显示和对抗指标显示;所述主视角显示为固定全局视角显示;所述主视角显示和所述自由视角显示为主窗口;所述跟随视角显示、小地图显示和对抗指标显示为小窗口,附着在主窗口上。
20.优选的,所述想定模块、推演模块、和显示模块通过客户端实现;所述客户端包括windows客户端和linux客户端,人类玩家或ai算法通过客户端控制平台内各作战单元的动作。
21.优选的,包含可供所述客户端进入的服务器,所述服务器放置在linux系统镜像中并将整体打包为docker镜像文件;所述服务器从数据库模块中获得数据。
22.本发明还提供了一种基于虚幻引擎的三维高仿真兵棋推演方法,包括以下步骤:
23.s1:初始化作战单元、武器性能、对战战力、对战环境和任务的参数,如果不手动设置则采用默认参数;
24.s2:分别构建对战双方方智能体算法或人工设置规则算法并运行,将推演平台输出的态势信息输入算法得到决策指令,并将决策指令输入到平台,决策指令改变态势信息;
25.s3:把态势信息实时可视化显示出来;
26.s4:达到任务结束条件时对战结束,重复s2;
27.s5:对战双方算法达到收敛时,输出智能体算法的对战决策策略。
28.优选的,在s2步骤中,单独使用一台主机构建对战双方算法或使用两台主机分别构建对战双方算法。
29.优选的,还包括步骤:s6:根据收敛的对战算法调用平台的种群学习算法进行训练得到种群训练策略。
30.经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种一种三维的、高精度的、更细节化的、战场还原度高的、利于快速编辑的兵棋推演平台与方法,其作战环境与作战单位模型的可编辑性提高了该平台的想定重编辑效率,支持多层次、大规模的现代联合作战推演。可通过观察某局对战获取该算法的对战思路以供现实指挥参照。该平台显著提高了对战过程中的人类观察者的视觉体验,通过碰撞检测有效降低了交战过程中毁伤裁决误差,提升了对抗结果的准确性。
附图说明
31.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
32.图1为本发明提供的结构示意图。
具体实施方式
33.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
34.本发明实施例公开了一种一种三维高仿真兵棋推演平台,包括:想定模块、数据库模块、推演模块、传输模块、显示模块、算法模块和群进化训练模块;
35.在一个具体实施例中,所述想定模块基于对战设想对作战单元、武器性能、对战战力、对战环境和任务进行编辑得到初始化参数。其中,所述想定模块中想定是指对战双方的基本态势、作战企图和作战发展情况的设想。在想定模块中,我们可对作战单元进行编辑,如可从数据库中选取不同机型的飞机,不同型号的雷达,不同射程的导弹;可对武器性能进行编辑,如可修改作战单位速度,携带的导弹数,导弹射程等;对战战力编辑,如双方各种不同类型的作战单元设置不同的数量;对地形的编辑,如可在已有地形中增加湖泊,岛屿,沙丘等地形;对天气的编辑,如可设置战场环境为晴天,雨天,沙尘暴,雪天等等。
36.数据库模块包括:三维实例模型、环境库、想定数据库、推演记录数据库、博弈规则数据库和种群学习算法库;数据库中资料均为搜集网上公开资料所得。三维实例模型包括各种地形资源如海洋,沙丘,岛屿的模型,各种战斗单元模型如轰6k,su-33,护卫舰,导弹的模型,各种建筑物如指挥所,雷达等的模型;环境库中为从虚幻商城中获取,包括晴天,雨天,雪天等场景;想定数据库中储存了每次构建的想定,如无需再次使用此想定可将其从想定数据库中删除;推演记录数据库中储存了每次推演的结果以及过程,或中途暂停的推演,可将其进行加载进行再次推演;博弈规则数据库中储存了不同的战场积分规则,胜负裁决规则等,也可自己定义规则将其加入到博弈规则数据库中;种群学习算法库,在平台中内嵌了种群进化算法,可在某一规则下通过种群进化算法进行训练得到决策策略,并将训练后得到的种群储存进种群学习算法库中,可供作为内嵌战略供算法模块训练。
37.推演模块通过虚幻四物理引擎驱动,用于根据初始化参数进行动作响应、碰撞响应、天气响应、通信响应和裁决响应的触发以及对抗指标的统计得到态势信息;动作响应触发,指推演平台接受外部指令输入后触发作战场景中相应作战单元执行动作指令,具体有起飞、降落、区域巡逻、攻击、干扰,开关雷达等;碰撞响应触发为仿真战场中单位实体的碰撞检测,当三维模型之间发生交叠时会触发碰撞动作,即形成阻挡,且结合平台算法给予发生碰撞的单位实体不同程度的损坏;天气响应触发为不同天气情况下对作战环境的影响,如雾天导致能目视探测距离减少,以及极端恶劣天气雷暴对飞机的损毁等;通信响应触发指使获取己方或对方信息的条件,双方只能获取自身探测范围内的作战单位、编队、地面设
施、导弹等信息,需注意的是当有干扰机行使干扰指令时,处在干扰半径范围内的信息不可被探测;裁决响应触发指达到裁决条件使针对整局是否结束、作战单元地面设施等是否损伤的裁决,我们将裁决规则初始化为:作战单元中飞机、地面防空,雷达被导弹击中一次即为损毁,护卫舰中发动机处受到袭击则失去移动能力,武器处受到袭击失去防空能力,累计收到三枚导弹袭击后损毁沉没,指挥所跑道均为累计受到两枚导弹袭击后损毁;任务完成度即双方任务完成的进度。
38.显示模块包括:主视角显示、跟随视角显示、自由视角显示、小地图显示和对抗指标显示;用于把态势信息可视化显示出来。显示模块即客户端显示输出。
39.算法模块用于对战训练,包括通过所述态势信息得到决策指令输给所述传输模块使其做出相应的动作,得到每轮对战过后的优秀策略;算法模块为基于该平台设计的对战训练算法,可自行设计,也可使用现有算法。目前,针对决策问题的算法都是基于强化学习的智能体算法,代表性算法包含有dqn算法、ddpg算法、actor-critic算法、vdn算法、qplex算法、qtran算法,算法模块通过仿真平台输出的态势信息决策出对战指令输给仿真平台使其做出相应的动作。一个成熟算法的形成需要训练使其达到收敛,此时做出的决策为在该算法下的最优解。事实上,我们最后观察ai对战思路也即算法收敛时后的决策输出思路。
40.传输模块将推演模块中的态势信息传递给算法模块并接受来自算法模块的决策指令,同时将态势信息传输给显示模块供显示输出;
41.所述种群进化训练模块使用种群学习算法用于以每轮对战优秀策略形成一个种群训练策略,所述种群训练策略作为内嵌战略供算法模块训练。种群进化训练模块使用种群学习算法进行算法模块自己与自己的对战。该算法思路为:每轮对战过后都会在之前的数个较强版本的基础上进行更新,更新之前的版本也会被保存下来也参与之后的对战中,以避免优秀策略相互克制的问题,每轮最优策略形成一个种群,最后得到若干种群策略储存在种群学习算法库中。储存的种群训练策略可作为与外部算法进行对抗的算法以供外部算法的训练。
42.在另一个实施例中,想定模块中初始化参数任务编辑内容为将进攻方任务设置为摧毁防守方所有兵力或摧毁防守方守卫目标。
43.在一个具体实施例中,传输模块传输的信息包括:作战单元信息、可见光视觉信息、红外感知信息和三维环境信息。作战单元信息即作战单元的位置、航向、速度、剩余油量、剩余弹药数量、损伤情况、编队信息等信息;可见光感知即可见光视觉信息,包括天气信息,视觉感受信息等,主要供显示模块使用;红外感知即红外模式下的感知信息,可获取额外的热量信息以供精准定位;三维环境信息主要包括地形信息与地面设施信息。
44.在一个具体实施例中,推演模块中对抗指标统计内容包括:作战中的战损比、资源消耗、误伤比和任务完成进度,其中误伤比是指战场中随机出现的中立方损毁量占总损毁量的比例。资源消耗即导弹消耗数量和油量消耗量等,误伤比即战场中随机出现的民船,民航等中立方损毁占损毁量的比例,即,考虑了更多的现实因素,提高推演准确性。
45.在另一个实施例中,显示模块包括:主视角显示、跟随视角显示、自由视角显示、小地图显示和对抗指标显示;主视角显示为固定全局视角显示;主视角显示和自由视角显示为主窗口;跟随视角显示、小地图显示和对抗指标显示为小窗口,附着在主窗口上。即,主视角显示即全局视角显示,我们设置了一种固定视角可观察到全局作战情况,并将其作为主
窗口;跟随视角显示为小窗口显示,其附着在主窗口上,在仿真过程中观察者可选中某单元实体,在跟随视角窗口中会显示出附着在该单元实体上的摄像机的视角,该平台中至多支持同时查看三个单元实体的跟随视角;自由视角显示,即当不想采用固定的主视角时可采用自由视角,开启此功能后观察者可通过控制键盘与鼠标实现视角的移动;小地图显示,即该战场的二维信息表示,其为战场的俯视视角,并将不同方作战单位使用红色与蓝色分别标出,该窗口同样作为小窗口附着在主窗口上;对抗指标显示作为小窗口附着在主窗口上部,主要行使类似于计分板的功能,实时显示出对战双方的兵力情况,任务完成度,战损比,资源消耗等信息。
46.在一个具体实施例中,想定模块、推演模块、和显示模块通过客户端实现;所述客户端包括windows客户端和linux客户端,人类玩家或ai算法通过客户端控制平台内各作战单元的动作。
47.在一个具体实施例中,包含可供客户端进入的服务器,服务器放置在linux系统镜像中并将整体打包为docker镜像文件;服务器从数据库模块中获得数据。
48.本发明中算法模块属于外部操作者自行设计的,平台输入态势信息给算法,算法输出决策指令来控制平台中各单元执行的动作。种群进化训练模块中即为种群学习算法,是内嵌在该平台中的一种训练算法,其可利用已有策略训练到一个更优秀的策略,其已构建好并嵌入到平台中,可直接调用。即通过种群训练算法可以使已有策略算法进化为一个更优秀的策略算法种群。
49.一种三维高仿真兵棋推演方法,包括以下步骤:
50.s1:初始化作战单元、武器性能、对战战力、对战环境和任务的参数,如果不手动设置则采用默认参数;
51.s2:分别构建对战双方方智能体算法或人工设置规则算法并运行,将推演平台输出的态势信息输入算法得到决策指令,并将决策指令输入到平台,决策指令改变态势信息;
52.s3:把态势信息实时可视化显示出来;
53.s4:达到任务结束条件时对战结束,重复s2;
54.s5:对战双方算法达到收敛时,输出智能体算法的对战决策策略。
55.在一个具体实施例中,在s2步骤中,单独使用一台主机构建对战双方算法或使用两台主机分别构建对战双方算法。
56.在另一个实施例中,还包括步骤:
57.s6:根据收敛的对战算法调用平台的种群学习算法进行训练得到种群训练策略。
58.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
59.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1