本发明涉及一种语音活动检测技术,尤其涉及一种语音转文字的语音活动检测装置及方法。
背景技术:
1、目前大多数内建麦克风实际收音的线路输入皆需透过微软应用程序来进行增益大小的管理。然而,当增益大小设定不当或用户无法确认语音识别算法模型收到的实际麦克风声音,麦克风的实际声音会被预先内建的控制单元处理过(量化增益大小),导致原始的音量大小无法被还原,这将导致算法模型输出的语音的准确性。特别地是,于室外环境并具有背景噪音的情况下,处理后语音进行语音转文字的准确率相对低。
技术实现思路
1、本发明提供一种语音活动检测装置及方法,可以有效提高接收语音时由音量产生的电平信号,以及在有背景噪音的室外环境中语音转文本的准确率。
2、本发明所提供的语音活动检测装置包括收音模块、处理模块、及提示模块,其中处理模块耦接收音模块,以及提示模块耦接处理模块。其中处理模块用以执行语音活动检测方法,包括:通过收音模块接收语音信息;通过处理模块获取语音信息的音量值;通过处理模块判断音量值是否小于或等于第一音量临界值;当判断音量值小于或等于第一音量临界值时,通过提示模块产生音量值提高的第一提示信息;以及当判断音量值大于第一音量临界值时,通过提示模块产生符合音量值标准的第二提示信息。
3、本发明所提供的语音活动检测方法,适用于语音活动检测装置,其中语音活动检测装置包括收音模块、处理模块及提示模块,语音活动检测方法包括:通过收音模块接收语音信息;通过处理模块获取语音信息的音量值;通过处理模块判断音量值是否小于或等于第一音量临界值;当判断音量值小于或等于第一音量临界值时,通过提示模块产生音量值提高的第一提示信息;以及当判断音量值大于第一音量临界值时,通过提示模块产生符合音量值标准的第二提示信息。
4、在本发明的一实施例中,上述之第一音量临界值是介于50~60db。
5、在本发明的一实施例中,上述之语音活动检测方法更包括:通过处理模块判断音量值是否小于或等于第二音量临界值;当判断音量值小于或等于第二音量临界值时,通过提示模块产生音量值提高的第一提示信息;以及当判断音量值大于第二音量临界值时,通过处理模块判断音量值是否小于或等于第一音量临界值。
6、在本发明的一实施例中,上述之第二音量临界值是介于40~50db。
7、在本发明的一实施例中,上述之语音活动检测方法更包括:通过处理模块获取收音模块的音量调整值以产生语音信息的音量值。
8、在本发明的一实施例中,上述之语音活动检测方法更包括:当判断音量值大于第一音量临界值时,通过处理模块判断音量值是否小于或等于第三音量临界值;当判断音量值大于第三音量临界值时,通过处理模块调整音量值至小于第三音量临界值;以及当判断音量值小于或等于第三音量临界值时,通过提示模块产生符合音量值标准的第二提示信息。
9、本发明所提供的语音活动检测装置包括:收音模块、处理模块、及提示模块,其中处理模块耦接收音模块,以及提示模块耦接处理模块。其中处理模块用以执行语音活动检测方法,包括:通过收音模块接收语音信息;通过处理模块获取语音信息的音量值;通过处理模块判断音量值是否介于第一音量临界值与第二音量临界值之间;当判断音量值介于第一音量临界值与第二音量临界值之间时,通过提示模块产生符合音量值标准的第一提示信息;以及当判断音量值不介于第一音量临界值与第二音量临界值之间时,通过处理模块调整音量值至音量预设值。
10、本发明所提供的语音活动检测方法,适用于语音活动检测装置,其中语音活动检测装置包括收音模块、处理模块及提示模块,语音活动检测方法包括:通过收音模块接收语音信息;通过处理模块获取语音信息的音量值;通过处理模块判断音量值是否介于第一音量临界值与第二音量临界值之间;当判断音量值介于第一音量临界值与第二音量临界值之间时,通过提示模块产生符合音量值标准的第一提示信息;以及当判断音量值不介于第一音量临界值与第二音量临界值之间时,通过处理模块调整音量值至音量预设值。
11、在本发明的一实施例中,上述之第一音量临界值大于第二音量临界值,音量预设值介于第一音量临界值与第二音量临界值之间。
12、在本发明的一实施例中,上述之第一音量临界值是90db,第二音量临界值是介于50~60db,音量预设值是介于60~70db。
13、本发明所提供的语音活动检测装置包括:收音模块、处理模块、及提示模块,其中处理模块耦接收音模块,以及提示模块耦接处理模块。其中处理模块用以执行语音活动检测方法,包括:通过收音模块接收语音信息;通过处理模块获取语音信息的音量值;通过处理模块判断音量值是否小于或等于第一音量临界值;当判断音量值小于或等于第一音量临界值时,通过提示模块产生音量值提高的第一提示信息;当判断音量值大于第一音量临界值时,通过处理模块判断音量值是否小于或等于第二音量临界值;当判断音量值小于或等于第二音量临界值时,通过处理模块调整音量值至音量预设值;当判断音量值大于第二音量临界值时,通过处理模块判断音量值是否小于或等于第三音量临界值;当判断音量值小于或等于第三音量临界值时,通过提示模块产生符合音量值标准的第一提示信息;以及当判断音量值大于第三音量临界值时,通过处理模块调整音量值至音量预设值。
14、本发明所提供的语音活动检测方法,适用于语音活动检测装置,其中语音活动检测装置包括收音模块、处理模块及提示模块,语音活动检测方法包括:通过收音模块接收语音信息;通过处理模块获取语音信息的音量值;通过处理模块判断音量值是否小于或等于第一音量临界值;当判断音量值小于或等于第一音量临界值时,通过提示模块产生音量值提高的第一提示信息;当判断音量值大于第一音量临界值时,通过处理模块判断音量值是否小于或等于第二音量临界值;当判断音量值小于或等于第二音量临界值时,通过处理模块调整音量值至音量预设值;当判断音量值大于第二音量临界值时,通过处理模块判断音量值是否小于或等于第三音量临界值;当判断音量值小于或等于第三音量临界值时,通过提示模块产生符合音量值标准的第一提示信息;以及当判断音量值大于第三音量临界值时,通过处理模块调整音量值至音量预设值。
15、在本发明的一实施例中,上述之第三音量临界值大于第二音量临界值,第二音量临界值大于第一音量临界值,音量预设值是介于第三音量临界值与第二音量临界值之间。
16、在本发明的一实施例中,上述之第一音量临界值是90db,第二音量临界值是介于50~60db,第三音量临界值是介于40~50db,音量预设值是介于60~70db。
17、本发明因采用语音活动检测方法,因此可以有效提高接收语音时由音量产生的电平信号,以及在有背景噪音的室外环境中语音转文本的准确率。
18、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。