一种基于智能机顶盒的人机交互管理系统的制作方法

文档序号：36783678发布日期：2024-01-23 11:57阅读：36来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及机顶盒人机交互，特别涉及一种基于智能机顶盒的人机交互管理系统。

背景技术：

1、数字视频变换盒，通常称作机顶盒或机上盒，是一个连接电视机与外部信号源的设备，它可以将压缩的数字信号转成电视内容，并在电视机上显示出来。

2、现有的智能机顶盒在使用过程中通常具备人机交互管理系统，用户发出语音指令对电视进行相应的调节，但现有的智能机顶盒人机交互管理系统在使用过程中还存在以下问题：

3、在唤醒用户语音指令匹配失败时，不能对智能机顶盒所处周围环境的影响因素进行分析，包括唤醒用户外的其他人员噪声以及智能机顶盒所处区域内的室外噪声；判断当前语音指令匹配结果的准确程度，导致用户的语音指令被错误的识别，准确性较低；

4、在唤醒用户语音指令匹配失败时，只考虑周围环境因素影响，没有进一步分析唤醒用户自身语音指令的影响程度，考虑较为片面；

5、为此，推出一种基于智能机顶盒的人机交互管理系统。

技术实现思路

1、有鉴于此，本发明提供一种基于智能机顶盒的人机交互管理系统，可以实现对智能机顶盒所处周围环境的影响因素进行分析，判断当前唤醒用户语音指令的准确性，以解决上述背景技术提出的问题。

2、本发明的目的可以通过以下技术方案实现：包括语音交互模块、语音分析模块、误差判断模块、中央管理模块以及语音模型构建模块；

3、语音交互模块通过用户在对智能机顶盒进行唤醒后，通过语音对智能机顶盒发出指令，对连接电视进行调节；

4、语音指令包括但不局限于“打开电视”、“关闭电视”、“调高音量”以及“播放某某电影”。

5、语音分析模块在用户对机顶盒进行唤醒时，对唤醒用户的音色进行识别和确认，确认完成后，智能机顶盒进行语音指令识别，并在此过程中排除其他说话用户的语音指令，只关注唤醒用户的语音指令；

6、智能机顶盒对接收到的语音指令进行预处理，预处理包括去噪和增强；并使用语音识别技术将预处理后的语音指令转换为文本，对于识别得到的文本结果，使用文本匹配算法与语音模型内预设的语音指令进行匹配，若匹配失败，则获取语音模型内与该文本结果匹配的可能结果并发送至误差判断模块；

7、误差判断模块内设置有环境分析单元与指令分析单元；

8、环境分析单元在唤醒用户语音指令出现匹配失败时，对机顶盒周围的环境影响参数进行分析，得到环境误差评估指数yzc；具体为：

9、将智能机顶盒被唤醒到开始识别语音指令的过程标记为分析时区；

10、在智能机顶盒上设置一个麦克风阵列，并在设定的几何形状中布置；通过麦克风阵列同时采集当前分析时区内除唤醒者外多个人员的声音信号；

11、利用声源定位算法处理麦克风阵列采集到得到人员声音信号，并进行估算得到当前各人员声源与智能机顶盒之间的方向和距离，同时统计当前定位方向或距离的数量，得到人声数量rx；

12、将各人员声源与智能机顶盒之间的距离值标记为ry；

13、以当前智能机顶盒语音接收端为起始点向外作水平延长线；基于各人员声源与智能机顶盒之间的方向，以智能机顶盒语音接收端为起始点沿着各人员声源方向作延长线得到角度构建线；

14、分别计算各条角度构建线与水平延长线之间的角度，得到各人员声源的角度偏离值；

15、将各人员声源的角度偏离值与设定的多个取值范围进行匹配，得到当前分析时区内各人员的角度影响值rp；设定每个取值范围分别匹配一个人员声源的角度影响值；

16、声音在传播过程中会受到空气、物体等的阻挡和反射，因此声音从不同角度到达机顶盒的接收端时可能存在衰减、混响或其他变化。

17、通过声源分离技术将当前分析时区内不同人员声源的声音进行分离和提取，并利用声音处理算法，得到当前分析时区内不同方向人员对应的分贝值rs；

18、将对应人员的距离值ry、角度影响值rp以及分贝值rs代入公式，进行计算得到当前分析时区内各人员的人声评估值rt；其中a1、a2以及a3分别为对应人员距离值ry、角度影响值rp以及分贝值rs的影响权重因子；

19、将当前分析时区内除唤醒者外各人员的人声评估值rt进行累加计算，得到当前分析时区内人声影响值rm；

20、将当前分析时区内的人声影响值rm与人声数量rx代入公式，进行计算得到当前分析时区的人声环境评估指数rsp；其中rm参考和rx参考分别表示对应型号智能机顶盒的参考人声影响值和参考人声数量；gh1和gh2分别为人声影响值rm与人声数量rx的影响权重因子；

21、利用门窗状态检测器获取当前分析时区内智能机顶盒所处区域窗户开窗的大小，并标记为kh，单位为厘米；

22、将当前窗户开窗大小kh与对应的多个取值范围进行匹配，得到开窗影响值cd；设定每个取值范围分别对应一个开窗影响值；

23、利用风速仪和风向传感器获取当前分析时区内窗户外的风速以及风向；

24、计算当前分析时区窗户外风向与窗户水平面之间的夹角，得到风向偏离角度；并将当前分析时区内窗户的风向偏离角度与对应的多个取值范围进行匹配，得到当前分析时区内窗户的风向偏离值cr；设定每个取值范围分别对应一个风向偏离值；

25、将当前分析时区内窗户外的风速值标记为cu；

26、将当前分析时区内智能机顶盒所处区域窗户的开窗影响值cd、风向偏离值cr以及风速值cu代入公式，进行计算得到当前分析时区内的户外环境评估指数rty；其中cd参考、cr参考以及cu参考分别为开窗影响值cd、风向偏离值cr以及风速值cu的影响权重因子；

27、当窗户开放范围较广且外面风速较大时，风会产生较大的噪声，这种风噪声可能会对语音识别造成干扰。风噪声通常具有较高的频率成分，而语音信号的频率范围主要集中在较低的频率范围内，这使得风噪声更容易干扰语音信号；

28、开窗大小以及外面的风速风向也会影响室内的空气流通和质量。较强的风会加速空气流动，可能会扰乱室内的声学环境，在一定程度上影响语音信号的传播和接收。

29、将当前分析时区内的人声环境评估指数rsp和户外环境评估指数rty代入公式，进行计算得到当前分析时区的环境误差评估指数yzc；其中rsp允许和rty允许分别表示对应型号智能机顶盒的人声环境允许指数和户外环境允许指数；ue1和ue2分别为人声环境评估指数rsp和户外环境评估指数rty的影响权重因子；

30、指令分析单元在唤醒用户语音指令出现匹配失败时，对唤醒用户的语音指令进行分析，得到指令误差评估指数zlp；具体为：

31、提取预处理后的唤醒用户语音指令的音频时长，单位为秒，同时获取当前唤醒用户语音指令所对应的识别文本结果；统计文本结果的识别字数，并与唤醒用户语音指令的音频时长进行整合，得到当前唤醒用户语音指令数据包；

32、将当前分析时区内唤醒用户的语音指令数据包与对应的多个预设数据包进行匹配；得到唤醒用户语音指令数据包匹配结果以及语速估值ys；设定每个预设数据包分别对应一个匹配结果和语速估值ys；其中匹配结果包括语速较快、语速过快、语速正常、语速较慢以及语速过慢；

33、唤醒用户的语速较快可能会影响语音识别的准确性，而语速较慢表示用户说话连续性与流畅性较低；语速估值ys越大代表当前语音指令过快或过慢。

34、将当前分析时区内唤醒用户的语音指令识别文本结果与该文本结果匹配的可能结果之间进行比对，得到两者之间的差异字数量yt；

35、基于当前分析时区内唤醒用户的语音指令识别文本总字数与可能结果的总字数之间的比对结果，将上述参数代入公式，进行计算得到当前分析时区内唤醒用户的指令误差评估指数zlp；其中z1和z2分别表示语音指令识别文本总字数与可能结果的总字数；表示语音指令识别文本总字数与可能结果总字数之间的允许差值；ys允许和yt允许分别表示语速允许估值和差异字允许数量；

36、将当前分析时区内的环境误差评估指数yzc和指令误差评估指数zlp代入公式，进行计算得到当前分析时区的结果误差评估指数jgv；其中yzc阈值和zlp阈值分别表示环境误差阈值指数和指令误差阈值指数；uy1和uy2分别为环境误差评估指数yzc和指令误差评估指数zlp的影响权重因子；

37、将当前分析时区内得到的结果误差评估指数jgv与预设的阈值范围进行比对，具体为：

38、当结果误差评估指数jgv低于预设的阈值范围时，则直接执行智能模型内与该文本结果匹配的可能结果；

39、当结果误差评估指数jgv处于预设的阈值范围时，则向唤醒用户播报智能模型内与该文本结果匹配的可能结果，唤醒用户反馈“确认”指令后执行该结果，若唤醒用户否定该文本结果匹配的可能结果，则对当前分析时区内的结果误差评估指数jgv进行解析后，基于解析结果执行以下结果：

40、s1：通过语音向唤醒用户播报“当前语音指令识别环境较为嘈杂，请在正常环境下使用语音指令，或直接通过手机app进行调节”；

41、s2：通过智能机顶盒控制当前机顶盒所处区域内智能窗户的开窗大小或直接关闭，或通过语音向唤醒用户播报“当前窗外风噪影响较大，请调节窗户开窗大小或直接关闭”；

42、s3：通过语音向唤醒用户播报“对不起，您的语速较快或较慢，请再说一次”；

43、当结果误差评估指数jgv高于预设的阈值范围时，则直接对当前分析时区内的结果误差评估指数jgv进行解析，并基于解析结果执行s1、s2或s3操作后，提示唤醒用户再次说出语音指令；

44、将上述分析结果与执行结果发送至语音模型构建模块进行整合更新；

45、中央管理模块用于智能机顶盒连接和控制室内各类智能设备，包括智能家居设备和安全设备；

46、语音模型构建模块用于接收各次语音指令的分析和执行结果，并进行整合更新；

47、若当前用户的误差评估指数jgv处于预设的阈值范围时，则向唤醒用户播报智能模型内与该文本结果匹配的可能结果，唤醒用户反馈“确认”指令，则对该次分析结果进行整合，当该唤醒用户下次语音指令分析过程与匹配程度高于对应阈值，则直接执行，提高了智能化。

48、与现有技术相比，本发明的有益效果是：

49、本发明通过使用文本匹配算法与语音模型内预设的语音指令进行匹配，若匹配失败，则获取语音模型内与该文本结果匹配的可能结果；并通过对分析时区内智能机顶盒所处周围环境的人声环境评估指数和户外环境评估指数进行综合分析，得到当前分析时区内环境误差评估指数，由此评估当前唤醒用户发送语音指令时的周围环境影响程度，基于当前分析时区的周围环境影响程度判断当前语音指令匹配结果的准确程度，提高了用户的语音指令识别的准确性，避免误解用户的意思从而错误的执行。

50、本发明通过在唤醒用户语音指令匹配失败时，基于智能机顶盒所处周围环境的环境误差评估指数，对唤醒用户的语音指令进行分析，得到当前分析时区内唤醒用户的指令误差评估指数，由此评估当前唤醒用户发送该条语音时说话的语速和流畅性，将当前分析时区内的环境误差评估指数与指令误差评估指数之间进行综合分析，得到当前分析时区的结果误差评估指数，基于结果误差评估指数的比对结果，判断当前唤醒用户语音指令所匹配可能结果的准确性，并基于上述分析过程进行整合更新，提高了智能化程度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：庄怀耀
技术所有人：深圳市恒利数码科技有限公司
我是此专利的发明人