音频信号处理方法、装置、设备及存储介质与流程

文档序号:25863645发布日期:2021-07-13 16:21阅读:122来源:国知局
音频信号处理方法、装置、设备及存储介质与流程

本公开涉及信号处理领域,尤其涉及一种音频信号处理方法、装置、设备及存储介质。



背景技术:

在对讲机等使用领域,在传输音频信号时,需要对音频信号进行幅度调整,使音频信号达到理想状态,便于该音频信号的后续处理或使用,例如,调整后的音频信号更利于对该音频信号的调制。

现有技术中,对音频信号的幅度进行调整,一般使用两种方式,一种是通过负反馈回路对信号进行调整,该方式能够稳定地调整音频信号的幅度。另外一种是通过信号能量的比较进行调整。音频信号的能量大小代表了该音频信号幅度的整体大小,音频信号的能量与预设能量阈值的比较后,根据比较结果得到增益倍数,进而通过该增益倍数对音频信号的幅度进行调整。



技术实现要素:

目前,通过负反馈对信号进行调整的方式较为稳定,但是信号调整的处理过程耗时较长,尤其在对讲机等的时效性要求较高的环境下非常不适用,会造成音频信号幅度调整效果差。而通过信号能量比较进行调整的方式虽然保证了调整过程的时效性,但其增益倍数直接作用于音频信号的整体幅度,当同一段音频信号幅度起伏较大时,对于幅度较大的信号分量,乘以增益倍数后,信号最大幅度会超出预设的信号幅度阈值。超出信号幅度阈值的部分会作削峰处理,导致音频信号的失真,降低音频信号呈现的音频效果,音频信号幅度调整的效果同样较差。

本公开提供了一种音频信号处理方法、装置、设备及存储介质,用以解决现有技术中对音频信号的幅度调整,不能在保证时效性的同时,避免音频信号失真的问题。

第一方面,本公开实施例提供了一种音频信号处理方法,包括:获取待处理的音频信号;将所述音频信号进行分段,获取至少两个阶段音频信号;分别对每一个阶段音频信号进行如下处理:当所述阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大所述阶段音频信号的幅度,以使放大后的所述最大幅度值大于或等于所述第一预设幅度阈值,且小于或等于所述音频信号的传输通道的传输幅度上限值;当所述阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整所述阶段音频信号的幅度,以使调整后的所述最大幅度值小于或等于所述音频信号的传输通道的传输幅度上限值;其中,所述第一预设幅度阈值小于所述第二预设幅度阈值。

可选地,当所述阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大所述阶段音频信号的幅度,包括:当所述阶段音频信号的所述最大幅度值小于所述第一预设幅度阈值时,将所述第一预设幅度阈值与所述最大幅度值的比值,作为第一幅度增益值;通过所述第一幅度增益值,放大所述阶段音频信号的幅度。

可选地,当所述阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整所述阶段音频信号的幅度,包括:当所述阶段音频信号的所述最大幅度值大于第二预设幅度阈值时,将所述传输幅度上限值与所述最大幅度值的比值,作为第二幅度增益值;通过所述第二幅度增益值,调整所述阶段音频信号的幅度。

可选地,所述当所述阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整所述阶段音频信号的幅度,以使调整后的所述最大幅度值小于或等于所述音频信号的传输通道的传输幅度上限值之后,还包括:获取相邻的两个所述阶段音频信号的边界采样点;从所述相邻的两个所述阶段音频信息中,获取包括所述边界采样点在内的n个连续采样点,n为大于1的整数,所述n个连续采样点中包括至少两个属于不同所述阶段音频信息的采样点;对所述n个连续采样点对应的音频信号进行插值。

可选地,所述获取待处理的音频信号,包括:接收待分析信号;获取所述待分析信号在预设音频频段内的第一信号能量值,以及获取所述待分析信号在预设噪声频段内的第二信号能量值;当所述第一信号能量值和所述第二信号能量值的比值,大于预设能量阈值时,将所述待分析信号在所述预设音频信号频段内的信号,作为所述待处理的音频信号。

可选地,所述将所述音频信号进行分段,获取至少两个阶段音频信号,包括:根据预设采样点个数,对所述音频信号包含的连续采样点进行分组,获取至少两个分组结果,其中,一个所述分组结果中包括至少两个连续采样点;分别将每一个所述分组结果对应的所述音频信号,作为一个所述阶段音频信号,其中,所述阶段音频信号包括的采样点个数等于或小于所述预设采样点个数。

可选地,所述方法还包括:当所述最大幅度值大于所述第一预设幅度阈值,且所述最大幅度值小于第三预设幅度阈值时,根据所述阶段音频信号中每个采样点的幅度值与所述第三预设幅度阈值的比值,放大所述阶段音频信号的幅度,其中,所述第三预设幅度阈值大于所述第一预设幅度阈值、且小于所述第二预设幅度阈值;当所述最大幅度值小于第二预设幅度阈值时,且所述最大幅度值大于第四预设幅度阈值时,根据所述阶段音频信号中每个采样点的幅度值与所述第四预设幅度阈值的比值,缩小所述阶段音频信号的幅度,其中,所述第四预设幅度阈值小于所述第二预设幅度阈值、且大于所述第三预设幅度阈值。

第二方面,本公开实施例提供了一种音频信号处理装置,包括:获取单元,用于获取待处理的音频信号;分段单元,用于将所述音频信号进行分段,获取至少两个阶段音频信号;处理单元,用于分别对每一个阶段音频信号进行如下处理:当所述阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大所述阶段音频信号的幅度,以使放大后的所述最大幅度值大于或等于所述第一预设幅度阈值,且小于或等于所述音频信号的传输通道的传输幅度上限值;当所述阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整所述阶段音频信号的幅度,以使调整后的所述最大幅度值小于或等于所述音频信号的传输通道的传输幅度上限值;其中,所述第一预设幅度阈值小于所述第二预设幅度阈值。

第三方面,本公开实施例提供了一种电子设备,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的音频信号处理方法。

第四方面,本公开实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的音频信号处理方法。

本公开实施例提供的上述技术方案与现有技术相比具有如下优点:本公开实施例提供的该方法,将待处理的音频信号进行分段,获得至少两个阶段音频信号,并分别对每一个阶段音频信号进行处理。当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,以使放大后的最大幅度值大于或等于第一预设幅度阈值,且小于或等于音频信号的传输通道的传输幅度上限值;当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值;其中,第一预设幅度阈值小于第二预设幅度阈值。

该方法相对于现有技术,通过每个阶段音频信号的最大幅度值,与第一预设幅度阈值或第二预设幅度阈值的关系,调整该阶段音频信号整体的幅度。在阶段音频信号的最大幅度值较小,将该阶段音频信号的幅度放大,阶段音频信号的最大幅度值较大,将该阶段音频信号的幅度缩小的同时,保证每一个阶段音频信号的最大幅度值不超过传输通道的传输幅度上限值。

直接对阶段音频信号的幅度进行调整,并未采用负反馈回路的方式,能够保证音频信号处理过程的时效性。同时,采用分段对音频信号的幅度进行分别调整,而不是基于同一个增益倍数对音频信号的幅度整体放大或缩小,避免了小幅度信号放大时,大幅度信号也被放大,进而被削峰处理造成信号失真的情况。而与第一预设幅度阈值或第二预设幅度阈值进行比较的是阶段音频信号的最大幅度值,通过幅度值与幅度阈值的比较结果,调整信号本身的幅度,而不是通过能量比较调整幅度,对音频信号幅度调整的效果更好,提升音频信号呈现的音频效果,进一步提升用户对音频的体验感。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本公开实施例中提供的音频信号处理方法实现流程步骤示意图;

图2为本公开实施例中提供的获取待处理的音频信号的流程步骤示意图;

图3为本公开实施例中提供的将音频信号进行分段的流程步骤示意图;

图4为本公开实施例中提供的平滑处理的流程步骤示意图;

图5为本公开实施例中提供的音频信号处理装置结构连接示意图一;

图6为本公开实施例中提供的音频信号处理装置结构连接示意图二;

图7为本公开实施例中提供的电子设备结构连接示意图;

图8为本公开实施例中提供的一种对讲机的结构连接示意图一;

图9为本公开实施例中提供的一种对讲机的结构连接示意图二;

图10为本公开实施例中提供的一种对讲机的结构连接示意图三;

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。

本公开实施例中提供的音频处理方法,实现于对音频信号进行处理的设备,该设备可以为进行音频处理的专用设备,例如,对讲机等,也可以为集成音频处理功能的智能设备,例如,智能手机等,本公开的保护范围不以实现本方法设备的具体类型为限制。

一个实施例中,如图1所示,音频信号处理方法的实现流程主要包括以下步骤:

步骤101,获取待处理的音频信号。

本实施例中,待处理的音频信号为能够确实呈现音频效果的信号,而不是噪声信号等对呈现音频效果无事实意义的信号。例如,使用对讲机时,需要对讲机传输的语音信号为待处理的音频信号,等。

一个实施例中,设备接收待分析信号时,会将待处理的音频信号和环境产生的噪声信号一起接收。而环境产生的噪声信号是随时存在的,而待处理的音频信号只有在需要时产生,所以需要判断接收的待分析信号中是否含有待处理的音频信号。待处理的音频信号位于特定频段内,而噪声信号是在全频段存在的。可以根据频段的不同,确定接收的待分析信号中是否含有需要的音频信号,然后获取待处理的音频信号。

如图2所示,获取待处理的音频信号的流程包括以下步骤:

步骤201,接收待分析信号。

待分析信号为设备接收的信号,该待分析信号中可能只含有噪声信号,可能同时包含需要处理的音频信号和噪声信号。

步骤202,获取待分析信号在预设音频频段内的第一信号能量值,以及获取待分析信号在预设噪声频段内的第二信号能量值。

根据需要处理的音频信号所在的频段,以及音频信号对应的采样率等,可以确定预设音频频段和预设噪声频段。计算在预设音频频段内的信号能量,获得第一信号能量值;计算在预设噪声频段内的信号能量,获得第二信号能量值。

例如,人类能感受到的语音信号所在频段为300hz至3000hz,而语音信号的采样率为8khz时,将预设音频频段设定为300hz至3000hz,预设噪声频段设定为3000hz至4000hz。通过第一滤波器和第二滤波器实现对同一信号在不同频段的分离,当待分析信号并行通过两个滤波器时,第一滤波器将待分析信号中位于300hz至3000hz的信号分离出来,第二滤波器将待分析信号中位于3000hz至4000hz的信号分离出来。计算300hz至3000hz频段的能量,作为第一信号能量值,计算3000hz至4000hz频段的能量,作为第二信号能量值。

步骤203,当第一信号能量值和第二信号能量值的比值,大于预设能量阈值时,将待分析信号在预设音频信号频段内的信号,作为待处理的音频信号。

预设能量阈值可以为根据实际情况和需要设定的值,也可以为根据实验或经验计算等得出的值,本公开的保护范围不以预设能量阈值的设定方式为限制。

获得第一信号能量值和第二信号能量值的比值后,可以直接与预设能量阈值进行比较,也可以按照预设规则对比值进行处理后,再与预设能量阈值比较。例如,通过以下预设公式对第一信号能量值和第二信号能量值的比值进行处理:

处理结果=10×log10(第一信号能量值/第二信号能量值);

按照上述公式对第一信号能量值和第二信号能量值进行处理后的处理结果,与预设能量阈值比较,若处理结果不大于预设能量阈值,则待分析信号中没有需要的音频信号,不再进行后续的信号处理;若处理结果大于预设能量阈值,则待分析信号中含有需要的音频信号,将待分析信号在预设音频信号频段内的信号,作为待处理的音频信号。

一个实施例中,产生待处理的音频信号时,会在音频信号中添加亚音频信号,该亚音频信号指的是频率小于300hz的信号,为正弦信号,具体频率由上层控制层进行设置。接收到音频信号后,将亚音频信号分离出来,并与预先存储的亚音频信号对应的设置分量进行比较,若比较结果一致,则确定该信号为待处理的音频信号。

一个实施例中,待处理的音频信号需要由发射端对讲机传输给接收端对讲机,本方法实现于发射端对讲机。此时,需要根据对讲机传输通道的特征和发射要求,对待处理的音频信号进行预调整。预调整的过程包括预加重、插值上采样和抗镜频滤波。

预加重指的是对信号的高频分量进行放大,补偿由于信道造成的高频衰减。预加重采用滤波器实现,该滤波器的传递函数为:

y(n)=x(n)-0.92x(n-1),n=0,1,2,…,n-1;

其中,y(n)表示滤波器输出,x(n)表示滤波器输入,n为帧长,n代表每一帧。

插值上采样指的是对信号上采样后进行插值,用于提升信号采样率。具体为在两个采样点之间,再插入(上采样倍数-1)个采样点。

抗镜频滤波指的是滤除镜频干扰,镜频干扰为谐波干扰主频。通过使用一个低通滤波器作为抗镜频滤波器,实现镜频干扰的滤除。

本实施例中,通过预调整的过程,对待处理的音频信号进行预加重、插值上采样和抗镜频滤波等过程,使音频信号的信号特征更加明显,便于后续对信号的继续处理,提升音频信号最后的音频呈现效果。

步骤102,将音频信号进行分段,获取至少两个阶段音频信号。

将音频信号进行分段,也就是将较长的音频信号分为两个以上较短的阶段音频信号进行处理。阶段音频信号的幅度起伏比整个音频信号的幅度起伏程度更小,更有利于幅度的调整。

一个实施例中,如图3所示,将音频信号进行分段,获取至少两个阶段音频信号,具体流程包括以下步骤:

步骤301,根据预设采样点个数,对音频信号包含的连续采样点进行分组,获取至少两个分组结果,其中,一个分组结果中包括至少两个连续采样点;

步骤302,分别将每一个分组结果对应的音频信号,作为一个阶段音频信号,其中,阶段音频信号包括的采样点个数等于或小于预设采样点个数。

具体的,例如,预设采样点个数设定为160,若音频信号中包含1910个采样点,则第1个采样点到第160个采样点作为第一组,第161个采样点到第320个采样点作为第二组,以此类推,将音频信号分为12个组。其中,第12组包含第1761个采样点到第1910个采样点,共150个采样点。

本实施例中,预设采样点个数可以根据实际情况和需要进行设定,该预设采样点个数可以为根据实验获得的数值,也可以为根据经验设定的数值。本公开的保护范围不以预设采样点个数的具体数值为限制。

步骤103,分别对每一个阶段音频信号进行如下处理:

当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,以使放大后的最大幅度值大于或等于第一预设幅度阈值,且小于或等于音频信号的传输通道的传输幅度上限值;

当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值;其中,第一预设幅度阈值小于第二预设幅度阈值。

本实施例中,第二预设幅度阈值小于或等于音频信号的传输通道的传输幅度上限值。

将阶段音频信号的最大幅度值,分别与预设的第一预设幅度阈值和第二预设幅度阈值进行比较,来判断是否需要调整音频信号的幅度,以及如何进行调整。

当阶段音频信号的最大幅度值小于第一预设幅度阈值时,也就是说,阶段音频信号的最大幅度值较小,代表该阶段音频信号的整体幅度均比较小,则将该阶段音频信号的幅度放大。当阶段音频信号的最大幅度值大于第二预设幅度阈值时,也就是说,阶段音频信号的最大幅度值较大,代表该阶段音频信号的整体幅度均比较大,可能会超过音频信号的传输通道的传输幅度上限值,则对该阶段音频信号进行调整,将幅度限制在传输幅度上限值之内,避免出现削峰的情况。当阶段音频信号的最大幅度值大于第一预设幅度阈值,且小于第二预设幅度阈值时,代表该阶段音频信号的整体幅度较为合适,不再进行幅度调整。

本实施例中,当阶段音频信号的最大幅度值小于第一预设幅度阈值时,可以将阶段音频信号的最大幅度值调整至第一预设幅度阈值,也可以将阶段音频信号的最大幅度值调整至第一预设幅度阈值至第二预设幅度阈值的任意一个幅度值。同理,当阶段音频信号的最大幅度值大于第二预设幅度阈值时,可以将阶段音频信号的最大幅度值调整至第二预设幅度阈值,也可以将阶段音频信号的最大幅度值调整至传输幅度上限值,还可以将阶段音频信号的最大幅度值调整至第一预设幅度阈值至第二预设幅度阈值的任意一个幅度值。

本实施例中,第一预设幅度阈值和第二预设幅度阈值可以根据实际情况和需要设定,也可以根据预设规则计算获得。例如,第一预设幅度阈值可以由以下公式获得:

第一预设幅度阈值=0.1×传输幅度上限值;

第二预设幅度阈值可以由以下公式获得:

第二预设幅度阈值=0.9×传输幅度上限值。

一个实施例中,当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,具体实现过程如下:当阶段音频信号的最大幅度值小于第一预设幅度阈值时,将第一预设幅度阈值与最大幅度值的比值,作为第一幅度增益值;通过第一幅度增益值,放大阶段音频信号的幅度。

本实施例中,当阶段音频信号的最大幅度值小于第一预设幅度阈值时,可以该阶段音频信号的最大幅度值放大至第一预设幅度阈值。实现幅度较小的阶段音频信号的调整。

一个实施例中,当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,具体实现过程如下:当阶段音频信号的最大幅度值大于第二预设幅度阈值时,将传输幅度上限值与最大幅度值的比值,作为第二幅度增益值;通过第二幅度增益值,调整阶段音频信号的幅度。

本实施例中,当阶段音频信号的最大幅度值大于第二预设幅度阈值时,可以该阶段音频信号的最大幅度值调整至传输幅度上限值。实现幅度较大的阶段音频信号的调整。

一个实施例中,当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值之后,相邻的两个阶段音频信号的调整方式不同时,可能会造成两个阶段音频信号的边界处幅度差距较大,导致音频信号不连续,进而造成声音断断续续的情况,因此,需要对边界处作平滑处理。如图4所示,具体处理过程如下:

步骤401,获取相邻的两个阶段音频信号的边界采样点;

步骤402,从相邻的两个阶段音频信息中,获取包括边界采样点在内的n个连续采样点,n为大于1的整数,n个连续采样点中包括至少两个属于不同阶段音频信息的采样点;

步骤403,对n个连续采样点对应的音频信号进行插值。

本实施例中,n的取值可以根据实际情况和需要进行设定,可以设定为固定值;也可以根据相邻的两个阶段音频信号的幅度增益值,按照预设规则进行设定,两个幅度增益值差距越大,n的取值越大,当两个幅度增益值差距小于预设差距阈值时,则可以不进行平滑处理。

一个具体的实施例中,两个阶段音频信号包括的采样点均为160个,n的取值为固定值40,两个阶段音频信号的幅度增益值分别为g1和g2,则对第一个阶段音频信号中包含边界采样点的20个采样点,以及第二个阶段音频信号中包含边界采样点的20个采样点进行插值。插值单位的计算公式如下:

插值单位=(g1-g2)/40。

一个实施例中,在上述实施例中,对阶段音频信号幅度进行调整的幅度增益值均为固定值,即实现的是线性调整。此外,还可以设置更多的幅度阈值,并在不同的幅度阈值下,进行非线性调整。具体的调整过程如下:

当最大幅度值大于第一预设幅度阈值,且最大幅度值小于第三预设幅度阈值时,根据阶段音频信号中每个采样点的幅度值与第三预设幅度阈值的比值,放大阶段音频信号的幅度,其中,第三预设幅度阈值大于第一预设幅度阈值、且小于第二预设幅度阈值;

当最大幅度值小于第二预设幅度阈值时,且最大幅度值大于第四预设幅度阈值时,根据阶段音频信号中每个采样点的幅度值与第四预设幅度阈值的比值,缩小阶段音频信号的幅度,其中,第四预设幅度阈值小于第二预设幅度阈值、且大于第三预设幅度阈值。

本实施例中,第三预设幅度阈值和第四预设幅度阈值可以根据实际情况和需要设定,也可以根据预设规则计算获得。例如,第三预设幅度阈值可以由以下公式获得:

第三预设幅度阈值=0.15×传输幅度上限值;

第四预设幅度阈值可以由以下公式获得:

第四预设幅度阈值=0.85×传输幅度上限值。

一个具体的实施例中,根据阶段音频信号中每个采样点的幅度值与第三预设幅度阈值的比值,放大阶段音频信号的幅度,具体的,对阶段音频信号进行调整时,可以由以下公式获得的幅度增益值进行调整:

幅度增益值=log2(x+1),其中,x代表第三预设幅度阈值与第x个采样点的幅度值的比值。

同理,根据阶段音频信号中每个采样点的幅度值与第四预设幅度阈值的比值,放大阶段音频信号的幅度,具体的,对阶段音频信号进行调整时,可以由以下公式获得的幅度增益值进行调整:

幅度增益值=log2(y+1),其中,y代表第四预设幅度阈值与第y个采样点的幅度值的比值。

本实施例中,非线性增益可以理解为减速带的效果,即让增益变得平缓,但是信号仍然有增益的效果。当信号离设定的幅值较远时,通过线性增益可以使其更快得放大,当信号离设定的幅值较近时,通过非线性增益使其缓慢放大。该过程能够提高处理速度,非线性增益也是通过增益函数进行放大,相比较负反馈回路调整的方式仍具有处理速度上的优势,同时减少每段的增益差异,减少了需要平滑的插值个数,进一步防止音频信号的失真。

本公开提供的音频信号处理方法,将待处理的音频信号进行分段,获得至少两个阶段音频信号,并分别对每一个阶段音频信号进行处理。当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,以使放大后的最大幅度值大于或等于第一预设幅度阈值,且小于或等于音频信号的传输通道的传输幅度上限值;当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值;其中,第一预设幅度阈值小于第二预设幅度阈值。

该方法相对于现有技术,通过每个阶段音频信号的最大幅度值,与第一预设幅度阈值或第二预设幅度阈值的关系,调整该阶段音频信号整体的幅度。在阶段音频信号的最大幅度值较小,将该阶段音频信号的幅度放大,阶段音频信号的最大幅度值较大,将该阶段音频信号的幅度缩小的同时,保证每一个阶段音频信号的最大幅度值不超过传输通道的传输幅度上限值。

直接对阶段音频信号的幅度进行调整,并未采用负反馈回路的方式,能够保证音频信号处理过程的时效性。同时,采用分段对音频信号的幅度进行分别调整,而不是基于同一个增益倍数对音频信号的幅度整体放大或缩小,避免了小幅度信号放大时,大幅度信号也被放大,进而被削峰处理造成信号失真的情况。而与第一预设幅度阈值或第二预设幅度阈值进行比较的是阶段音频信号的最大幅度值,通过幅度值与幅度阈值的比较结果,调整信号本身的幅度,而不是通过能量比较调整幅度,对音频信号幅度调整的效果更好,提升音频信号呈现的音频效果,进一步提升用户对音频的体验感。

通过预调整的过程,对待处理的音频信号进行预加重、插值上采样和抗镜频滤波等过程,使音频信号的信号特征更加明显,便于后续对信号的继续处理,提升音频信号最后的音频呈现效果。

对相邻的两个阶段音频信号进行平滑处理,避免两个阶段音频信号的边界处幅度差距较大,导致音频信号不连续,进而造成声音断断续续的问题,提升音频信号的音频呈现效果。

非线性增益通过增益函数进行放大,相比较负反馈回路调整的方式仍具有处理速度上的优势,同时减少每段的增益差异,减少了需要平滑的插值个数,进一步防止音频信号的失真。

基于同一构思,本公开实施例中提供了一种音频信号处理装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述,如图5所示,该装置主要包括:

获取单元501,用于获取待处理的音频信号;

分段单元502,用于将音频信号进行分段,获取至少两个阶段音频信号;

处理单元503,用于分别对每一个阶段音频信号进行如下处理:当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,以使放大后的最大幅度值大于或等于第一预设幅度阈值,且小于或等于音频信号的传输通道的传输幅度上限值;当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值;其中,第一预设幅度阈值小于第二预设幅度阈值。

一个实施例中,所述处理单元503,具体用于当阶段音频信号的最大幅度值小于第一预设幅度阈值时,将第一预设幅度阈值与最大幅度值的比值,作为第一幅度增益值;通过第一幅度增益值,放大阶段音频信号的幅度。

一个实施例中,所述处理单元503,具体用于当阶段音频信号的最大幅度值大于第二预设幅度阈值时,将传输幅度上限值与最大幅度值的比值,作为第二幅度增益值;通过第二幅度增益值,调整阶段音频信号的幅度。

一个实施例中,如图6所示,音频信号处理装置还包括插值单元504。

插值单元504,用于当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值之后,获取相邻的两个阶段音频信号的边界采样点;从相邻的两个阶段音频信息中,获取包括边界采样点在内的n个连续采样点,n为大于1的整数,n个连续采样点中包括至少两个属于不同阶段音频信息的采样点;对n个连续采样点对应的音频信号进行插值。

一个实施例中,获取单元501,具体用于接收待分析信号;获取待分析信号在预设音频频段内的第一信号能量值,以及获取待分析信号在预设噪声频段内的第二信号能量值;当第一信号能量值和第二信号能量值的比值,大于预设能量阈值时,将待分析信号在预设音频信号频段内的信号,作为待处理的音频信号。

一个实施例中,分段单元502,具体用于根据预设采样点个数,对音频信号包含的连续采样点进行分组,获取至少两个分组结果,其中,一个分组结果中包括至少两个连续采样点;分别将每一个分组结果对应的音频信号,作为一个阶段音频信号,其中,阶段音频信号包括的采样点个数等于或小于预设采样点个数。

一个实施例中,所述处理单元503,还用于当最大幅度值大于第一预设幅度阈值,且最大幅度值小于第三预设幅度阈值时,根据阶段音频信号中每个采样点的幅度值与第三预设幅度阈值的比值,放大阶段音频信号的幅度,其中,第三预设幅度阈值大于第一预设幅度阈值、且小于第二预设幅度阈值;当最大幅度值小于第二预设幅度阈值时,且最大幅度值大于第四预设幅度阈值时,根据阶段音频信号中每个采样点的幅度值与第四预设幅度阈值的比值,缩小阶段音频信号的幅度,其中,第四预设幅度阈值小于第二预设幅度阈值、且大于第三预设幅度阈值。

基于同一构思,本公开实施例中还提供了一种电子设备,如图7所示,该电子设备主要包括:处理器701、存储器702和通信总线703,其中,处理器701和存储器702通过通信总线703完成相互间的通信。其中,存储器702中存储有可被处理器701执行的程序,处理器701执行存储器702中存储的程序,实现如下步骤:获取待处理的音频信号;将音频信号进行分段,获取至少两个阶段音频信号;分别对每一个阶段音频信号进行如下处理:当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,以使放大后的最大幅度值大于或等于第一预设幅度阈值,且小于或等于音频信号的传输通道的传输幅度上限值;当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值;其中,第一预设幅度阈值小于第二预设幅度阈值。

上述电子设备中提到的通信总线703可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该通信总线703可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

存储器702可以包括随机存取存储器(randomaccessmemory,简称ram),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器701的存储装置。

上述的处理器701可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等,还可以是数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

上述电子设备可以为本公开中提到的对讲机,也可以为其他能够实现音频信号处理方法的设备,例如,智能手机、平板电脑等。本申请的保护范围不以电子设备的具体类型为限制。

基于同一构思,本公开实施例中提供了一种对讲机,该对讲机的具体实施可参见方法实施例部分的描述,重复之处不再赘述。如图8所示,对讲机包括信号处理模块801和信号传输模块802;

信号处理模块801,用于获取待处理的音频信号;将音频信号进行分段,获取至少两个阶段音频信号;对于每一个阶段音频信号进行如下处理:当阶段音频信号的最大幅度值小于第一预设幅度阈值时,放大阶段音频信号的幅度,以使放大后的最大幅度值大于或等于第一预设幅度阈值,且小于或等于音频信号的传输通道的传输幅度上限值;当阶段音频信号的最大幅度值大于第二预设幅度阈值时,调整阶段音频信号的幅度,以使调整后的最大幅度值小于或等于音频信号的传输通道的传输幅度上限值;其中,第一预设幅度阈值小于第二预设幅度阈值;

信号处理模块801,还用于将每一个阶段音频信号进行处理后的音频信号,传输给信号传输模块802;

信号传输模块802,用于将每一个阶段音频信号进行处理后的音频信号,通过传输通道传输给其他设备。

一个实施例中,信号处理模块801,具体用于当阶段音频信号的最大幅度值小于第一预设幅度阈值时,将第一预设幅度阈值与最大幅度值的比值,作为第一幅度增益值;通过第一幅度增益值,放大阶段音频信号的幅度。

一个实施例中,信号处理模块801,具体用于当阶段音频信号的最大幅度值大于第二预设幅度阈值时,将传输幅度上限值与最大幅度值的比值,作为第二幅度增益值;通过第二幅度增益值,调整阶段音频信号的幅度。

一个实施例中,如图9所示,对讲机还包括信号插值模块803;

信号插值模块803,用于获取信号处理模块801传输的每一个阶段音频信号进行处理后的音频信号之后,获取相邻的两个阶段音频信号的边界采样点;从相邻的两个阶段音频信息中,获取包括边界采样点在内的n个连续采样点,n为大于1的整数,n个连续采样点中包括至少两个属于不同阶段音频信息的采样点;对n个连续采样点对应的音频信号进行插值。

一个实施例中,如图10所示,对讲机还包括信号接收模块804和信号检测模块805;

信号接收模块804,用于接收待分析信号,并传输给信号检测模块805;

信号检测模块805,用于获取待分析信号在预设音频频段内的第一信号能量值,以及获取待分析信号在预设噪声频段内的第二信号能量值;当第一信号能量值和第二信号能量值的比值,大于预设能量阈值时,将待分析信号在预设音频信号频段内的信息,作为待处理的音频信号,并将待处理音频信号传输给信号处理模块801。

一个实施例中,信号处理模块801,具体用于根据预设采样点个数,对音频信号包含的连续采样点进行分组,获取至少两个分组结果,其中,一个分组结果中包括至少两个连续采样点;分别将每一个分组结果对应的音频信号,作为一个阶段音频信号,其中,阶段音频信号包括的采样点个数等于或小于预设采样点个数。

一个实施例中,信号处理模块801,还用于当最大幅度值大于第一预设幅度阈值,且最大幅度值小于第三预设幅度阈值时,根据阶段音频信号中每个采样点的幅度值与第三预设幅度阈值的比值,放大阶段音频信号的幅度,其中,第三预设幅度阈值大于第一预设幅度阈值、且小于第二预设幅度阈值;当最大幅度值小于第二预设幅度阈值时,且最大幅度值大于第四预设幅度阈值时,根据阶段音频信号中每个采样点的幅度值与第四预设幅度阈值的比值,缩小阶段音频信号的幅度,其中,第四预设幅度阈值小于第二预设幅度阈值、且大于第三预设幅度阈值。

在本公开的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的音频信号处理方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本公开实施例的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如dvd)或者半导体介质(例如固态硬盘)等。

需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1