一种基于语音识别和人体姿态的人机交互式游戏引擎的制作方法

文档序号:13073984阅读:490来源:国知局

本发明属于语音识别技术领域,特别是涉及一种基于语音识别和人体姿态的人机交互式游戏引擎。



背景技术:

互动式游戏引擎,就是在现有的游戏引擎中加入捕捉游戏镜头内运动体的动作以及声音这项功能。现有的游戏大多是采用键盘或操纵杆完成游戏操作,不仅会使玩家容易产生疲劳感,长时间的疲劳感又会造成玩家对游戏逐渐丧失趣味性,而且久坐玩游戏会导致玩家因缺乏锻炼而使身体健康状况下降。因此,本发明提供一种交互式游戏引擎,使玩家很方便的通过语音和人体姿态进行游戏娱乐,以达到身心娱乐的效果。



技术实现要素:

本发明的目的在于提供一种基于语音识别和人体姿态的人机交互式游戏引擎,通过输入语音和获取人体姿态,提高了游戏玩家的操控便捷性和游戏的趣味性,解决了现有的游戏需要手动操作键盘或操纵杆进行游戏操作、趣味性较低、易导致疲劳、导致玩家普遍缺乏身体锻炼体质下降的问题。

为解决上述技术问题,本发明是通过以下技术方案实现的:

本发明为一种基于语音识别和人体姿态的人机交互式游戏引擎,包括3d场景加载模块、3d渲染模块、语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块;所述3d场景加载模块用于完成游戏静态场景的初始化并将初始化的游戏静态场景发送至3d渲染模块;所述语音输入模块用于输入语音信息并将其发送至语音预处理模块;所述语音预处理模块用于接收语音信息,然后完成对语音信息的预处理,并将预处理后的语音信息发送至端点检测模块;所述端点检测模块用于接收预处理后的语音信息、完成对语音信息的起止点的判断,并将判断后的语音信息输入到特征提取模块;所述特征提取模块用于接收端点检测模块判断后的语音信息、完成语音特征参数的提取,并将特征提取后的语音信息发送至模式匹配模块;所述模式匹配模块用于接收特征提取后的语音信息、完成对该语音信息与模板数据匹配距离的计算,并输出匹配的模板编号至3d渲染模块;所述3d渲染模块用于接收匹配模板编号和初始化的游戏静态场景,然后根据该模板编号加载人物场景的转移矩阵以及人物坐标数据。

进一步地,所述静态场景包括地面、树木、天空、人物的坐标、材质、皮肤、骨骼。

进一步地,所述语音信息的预处理包括对语音信息的预加重处理、加窗处理、分帧处理。

本发明具有以下有益效果:

本发明基于互动式游戏引擎开发游戏将会颠覆现有的游戏模式,游戏玩家不需要通过鼠标、键盘或游戏杆来操纵角色,而只要通过自己的肢体动作和声音,就可以驱动游戏中的角色做出符合玩家意愿的动作,并带动游戏情节向前发展,可以极大的增加游戏的趣味性,以及充分调动游戏玩家的积极性,互动式游戏引擎最重要的就是要使得计算机能够自动识别人的语音命令和动作,并以此来驱动游戏中模型做出相应的动作,大大提高了游戏游戏的娱乐性和宜人性;同时,在游戏玩家娱乐的同时还能放松身心、活动筋骨,达到有益身心健康的娱乐效果。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

图1为本发明的一种基于语音识别和人体姿态的人机交互式游戏引擎的工作流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,本发明为一种基于语音识别和人体姿态的人机交互式游戏引擎,包括3d场景加载模块、3d渲染模块、语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块,其中3d场景加载模块与3d渲染模块相连,语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块、3d渲染模块依次连接。

语音输入模块用于输入语音信息并将其发送至语音预处理模块。

语音预处理模块用于接收语音信息,然后完成对语音信息的预加重、加窗、分帧等预处理,并将预处理后的语音信息发送至端点检测模块。

端点检测模块用于接收预处理后的语音信息、完成对语音信息的起止点的判断,并将判断后的语音信息输入到特征提取模块。

特征提取模块用于接收端点检测模块判断后的语音信息、完成语音特征参数的提取,并将特征提取后的语音信息发送至模式匹配模块。

模式匹配模块用于接收特征提取后的语音信息、完成对该语音信息与模板数据匹配距离的计算,并输出匹配的模板编号至3d渲染模块。

3d场景加载模块用于完成游戏静态场景的初始化,静态场景包括地面、树木、天空、人物等的坐标、材质、皮肤、骨骼等。

3d渲染模块用于接收匹配模板编号和初始化的游戏静态场景,然后根据该模板编号加载人物场景的转移矩阵以及人物坐标等数据。

最后需要说明的是,以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。



技术特征:

技术总结
本发明公开了本发明为一种基于语音识别和人体姿态的人机交互式游戏引擎,包括3D场景加载模块、3D渲染模块、语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块,其中3D场景加载模块与3D渲染模块相连,语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块、3D渲染模块依次连接。本发明通过获取玩家的肢体动作和声音,驱动游戏中的角色做出符合玩家意愿的动作,并带动游戏情节向前发展,极大的增加游戏的趣味性,以及充分调动游戏玩家的积极性,互动式游戏引擎使得计算机能够自动识别人的语音命令和动作,并以此来驱动游戏中模型做出相应的动作,大大提高了游戏游戏的娱乐性和宜人性。

技术研发人员:张庆
受保护的技术使用者:合肥泽诺信息科技有限公司
技术研发日:2017.05.25
技术公布日:2017.12.01
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1