本发明涉及音频处理领域,尤其涉及获取语音信号的方法及装置。
背景技术:
目前的语音遥控装置只能识别一种语音信号,当外界的噪音较大(如:有多个语音信号)时,语音遥控装置无法准确的识别距离最近的语音信号,识别语音信号的性能低,用户体验效果差。
技术实现要素:
针对上述问题,现提供一种旨在可提高语音信号识别准确性的获取语音信号的方法及装置。
本发明提出了一种获取语音信号的方法,包括下述步骤:
采集音频信号;
解析所述音频信号,获取所述音频信号中每一语音信号的平均幅度;
获取最大平均幅度对应的语音信号。
优选的,解析所述音频信号,获取所述音频信号中每一语音信号的平均幅度的步骤,包括:
对所述音频信号进行计算获取每一语音信号的声波幅度;
分别计算每一语音信号的声波幅度的平均幅度。
优选的,获取最大平均幅度对应的语音信号的步骤,包括:
比较每一语音信号的声波幅度的平均幅度,获取最大平均幅度;
过滤小于最大平均幅度的语音信号,以获取最大平均幅度对应的语音信号。
优选的,还包括:
对最大平均幅度的语音信号进行语音识别。
优选的,对最大平均幅度的语音信号进行语音识别的步骤,包括:
将所述语音信号转换为文字信息,基于所述文字信息进行语义识别。
本发明还提供了一种获取语音信号的装置,包括:
采集单元,用于采集音频信号;
解析单元,用于解析所述音频信号,获取所述音频信号中每一语音信号的平均幅度;
获取单元,用于获取最大平均幅度对应的语音信号。
优选的,所述解析单元用于对所述音频信号进行计算获取每一语音信号的声波幅度,分别计算每一语音信号的声波幅度的平均幅度。
优选的,所述获取单元用于比较每一语音信号的声波幅度的平均幅度,获取最大平均幅度,过滤小于最大平均幅度的语音信号,以获取最大平均幅度对应的语音信号。
优选的,还包括:
识别单元,用于对最大平均幅度的语音信号进行语音识别。
优选的,所述识别单元用于将所述语音信号转换为文字信息,基于所述文字信息进行语义识别。
上述技术方案的有益效果:
本技术方案中,通过对采集到的音频信号进行解析,获取音频信号中每一语音信号的平均幅度;根据该平均幅度可过滤掉音频信号中的噪声信号,以获取距离最近的语音信号(即:最大平均幅度对应的语音信号),从而提升在语音识别阶段对识别语音信号的准确性。
附图说明
图1为本发明所述的获取语音信号的方法的一种实施例的方法流程图;
图2为本发明所述的获取语音信号的方法的另一种实施例的方法流程图;
图3为本发明所述的获取语音信号的装置的一种实施例的模块图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
如图1所示,一种获取语音信号的方法,包括下述步骤:
s1.采集音频信号;
作为距离而非限定,可采用阵列麦克风采集号采集不同空间方向的音频信。
s2.解析所述音频信号,获取所述音频信号中每一语音信号的平均幅度;
进一步地,所述步骤s2解析所述音频信号,获取所述音频信号中每一语音信号的平均幅度的步骤,包括:
s21.对所述音频信号进行计算获取每一语音信号的声波幅度;
由于人声的声波能量(或者幅度)较小,因此在执行步骤s21对所述音频信号进行计算获取每一语音信号的声波幅度之前,可采用放大器对音频信号进行放大(放大倍数可根据实际需要进行调整),以便于后续对音频信号进行计算。
s22.分别计算每一语音信号的声波幅度的平均幅度。
在实际应用中,可将音频信号转换为数字信号,采用功率计算模块计算每一数字采样序列的功率值,并统计获取平均功率值。还可以将音频信号转换为数字信号,采用傅里叶算法获取每一语音信号的声波幅度,并统计获取每一语音信号的平均幅度。
s3.获取最大平均幅度对应的语音信号。
进一步地,所述步骤s3获取最大平均幅度对应的语音信号的步骤,包括:
比较每一语音信号的声波幅度的平均幅度,获取最大平均幅度;
过滤小于最大平均幅度的语音信号,以获取最大平均幅度对应的语音信号。
由于,声波的能量(功率或幅度)与距离的二次方成反比,因此,功率或幅度的平均值越大,说明语音输入距离越小。对比所有语音信号的平均幅度,获得最大平均幅度,把最大平均幅度(即语音距离越小)的一组语音信号作为唯一输入的语音信号,屏蔽其他小于最大平均幅度的语音信号,从而实现屏蔽音频信号中不必要的噪声干扰的目的。
在本实施例中,通过对采集到的音频信号进行解析,获取音频信号中每一语音信号的平均幅度;根据该平均幅度可过滤掉音频信号中的噪声信号,以获取距离最近的语音信号(即:最大平均幅度对应的语音信号),从而提升在语音识别阶段对识别语音信号的准确性。
需要说明的是,获取语音信号的方法主要应用于语音遥控装置中,通过该获取语音信号的方法使语音遥控装置可以准确的识别近距离的语音信号,提升语音识别能力。
参考图2所示,在优选的实施例中,获取语音信号的方法还可包括:
s4.对最大平均幅度的语音信号进行语音识别。
进一步地,步骤s4对最大平均幅度的语音信号进行语音识别的步骤可包括:
将所述语音信号转换为文字信息,基于所述文字信息进行语义识别。
作为举例而非限定,可采用隐性马尔可夫模型进行语义识别。
如图3所示,一种获取语音信号的装置,可包括:采集单元1、解析单元2和获取单元3,其中:
采集单元1,用于采集音频信号;
作为距离而非限定,可采用阵列麦克风采集号采集不同空间方向的音频信。
解析单元2,用于解析所述音频信号,获取所述音频信号中每一语音信号的平均幅度;
进一步地,所述解析单元2用于对所述音频信号进行计算获取每一语音信号的声波幅度,分别计算每一语音信号的声波幅度的平均幅度。
由于人声的声波能量(或者幅度)较小,因此在解析单元2可采用放大器对音频信号进行放大(放大倍数可根据实际需要进行调整),以便于后续对音频信号进行计算。
解析单元2可包括放大器、模数转换器和功率计算模块,通过放大器将音频信号进行放大,通过模数转换器将音频信号转换为数字信号,采用功率计算模块计算每一数字采样序列的功率值,并统计获取平均功率值。还可以将音频信号转换为数字信号,采用傅里叶算法获取每一语音信号的声波幅度,并统计获取每一语音信号的平均幅度。
获取单元3,用于获取最大平均幅度对应的语音信号。
进一步地,所述获取单元3用于比较每一语音信号的声波幅度的平均幅度,获取最大平均幅度,过滤小于最大平均幅度的语音信号,以获取最大平均幅度对应的语音信号。
由于,声波的能量(功率或幅度)与距离的二次方成反比,因此,功率或幅度的平均值越大,说明语音输入距离越小。对比所有语音信号的平均幅度,获得最大平均幅度,把最大平均幅度(即语音距离越小)的一组语音信号作为唯一输入的语音信号,屏蔽其他小于最大平均幅度的语音信号,从而实现屏蔽音频信号中不必要的噪声干扰的目的。
在本实施例中,通过对采集到的音频信号进行解析,获取音频信号中每一语音信号的平均幅度;根据该平均幅度可过滤掉音频信号中的噪声信号,以获取距离最近的语音信号(即:最大平均幅度对应的语音信号),从而提升在语音识别阶段对识别语音信号的准确性。
在优选的实施例中,获取语音信号的装置还可包括:
识别单元,用于对最大平均幅度的语音信号进行语音识别。
进一步地,所述识别单元用于将所述语音信号转换为文字信息,基于所述文字信息进行语义识别。
作为举例而非限定,可采用隐性马尔可夫模型进行语义识别。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。