本技术涉及音视频处理技术,尤其涉及一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术:
1、相关技术中,语音编解码主要是基于语音模型的语言编解码方法,例如码激励线性预测语音编码(celp)方法可以应用于不同的场景,包括单人语音、多人语音、人声与其它信号并存等场景,但语音编码器码率较高,需要占用较多的网络带宽或存储空间。
技术实现思路
1、本技术实施例提供一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,减少了码流数据在传输过程中的码率,从而减小占用的网络宽带或存储空间。
2、本技术实施例的技术方案是这样实现的:
3、本技术实施例提供一种音频处理方法,包括:
4、对音频数据进行解析处理,得到每个音频帧的多个采样特征和多个基音周期,其中,所述音频数据包括多个所述音频帧;
5、基于所述每个音频帧的多个基音周期,对所述每个音频帧的多个采样特征进行自相关处理,得到所述基音周期对应的相关特征;
6、基于所述每个音频帧的多个基音周期和所述基音周期对应的相关特征,确定所述每个音频帧对应的目标基音特征;
7、对所述音频帧进行倒谱处理,得到所述每个音频帧的倒谱特征;
8、对所述音频帧的倒谱特征和所述目标基音特征进行压缩编码处理,得到码流数据。
9、本技术实施例提供一种音频处理方法,包括:
10、获取所述码流数据;
11、对所述码流数据进行解压处理,得到所述码流数据包括的每个音频帧的倒谱特征和目标基音特征;
12、基于所述音频帧的目标基音特征对所述音频帧的倒谱特征进行解码处理,得到解码后的音频数据。
13、本技术实施例提供一种音频处理装置,包括:
14、数据解析模块,用于对音频数据进行解析处理,得到每个音频帧的多个采样特征和多个基音周期,其中,所述音频数据包括多个所述音频帧;
15、第一特征计算模块,用于基于所述每个音频帧的多个基音周期,对所述每个音频帧的多个采样特征进行自相关处理,得到所述基音周期对应的相关特征;
16、第二特征计算模块,用于基于所述每个音频帧的多个基音周期和所述基音周期对应的相关特征,确定所述每个音频帧对应的目标基音特征;
17、倒谱处理模块,用于对所述音频帧进行倒谱处理,得到所述每个音频帧的倒谱特征;
18、压缩编码处理模块,用于对所述音频帧的倒谱特征和所述目标基音特征进行压缩编码处理,得到码流数据。
19、本技术实施例提供一种音频处理装置,包括:
20、获取处理模块,用于获取所述码流数据;
21、解压处理模块,用于对所述码流数据进行解压处理,得到所述码流数据包括的每个音频帧的倒谱特征和目标基音特征;
22、解码处理模块,用于基于所述音频帧的目标基音特征对所述音频帧的倒谱特征进行解码处理,得到解码后的音频数据。
23、上述技术方案中,数据解析模块还用于对所述音频数据进行分帧处理,得到所述音频数据包括的多个音频帧;
24、针对所述多个音频帧中的任意一个所述音频帧执行以下处理:
25、基于采样频率对所述音频帧进行采样处理,得到所述音频帧对应的多个采样特征;
26、基于所述音频帧对应的最小基音频率和所述采样频率,确定所述音频帧的多个基音周期。
27、上述技术方案中,数据解析模块还用于对所述音频帧对应的最小基音频率求倒数,得到所述音频帧对应的最大基音值;
28、将所述最大基音值、所述采样频率以及基音周期系数进行乘积,得到所述基音周期的最大周期值;
29、从所述基音周期的最小周期值至所述基音周期的最大周期值的取值范围中,获取所述多个基音周期。
30、上述技术方案中,第一特征计算模块还用于基于所述音频帧的采样点,对所述音频帧的多个采样特征进行升序排序,将升序排序结果中的前l-m个采样特征作为候选采样特征,其中,所述l表示所述音频帧的采样特征的数量,所述m表示所述基音周期的最大周期值;
31、针对任一所述候选采样特征执行以下处理:
32、获取与所述候选采样特征间隔所述基音周期的下一采样特征;
33、将所述候选采样特征与所述下一采样特征的乘积,作为所述候选采样特征的相关特征;
34、将l-m个所述候选采样特征的相关特征的加和,作为所述基音周期对应的相关特征。
35、上述技术方案中,第二特征计算模块,还用于对所述多个基音周期和所述基音周期对应的相关特征进行第一过滤处理,得到第一过滤结果;
36、基于所述第一过滤结果中所述基音周期的最大值,对所述第一过滤结果进行第二过滤处理,得到第二过滤结果;
37、基于所述第二过滤结果中的所述相关特征,对所述第二过滤结果进行降序排序,得到降序排序结果;
38、根据所述降序排序结果,确定所述每个音频帧对应的目标基音特征。
39、上述技术方案中,第二特征计算模块,还用于将未达到第一阈值的所述相关特征进行删除,得到删除后的所述相关特征,并将未达到第一阈值的所述相关特征对应的基音周期进行删除处理,得到删除后的所述基音周期;
40、将删除后的所述基音周期和删除后的所述相关特征作为所述第一过滤结果。
41、上述技术方案中,第二特征计算模块,还用于对所述最大值与设定值的比值进行向下取整处理,得到过滤值;
42、将所述第一过滤处理结果中与所述过滤值相等的所述基音周期进行删除处理,得到删除后的所述基音周期,并将与所述过滤值相等的基音周期对应的相关特征进行删除处理,得到删除后的所述相关特征;
43、将删除后的所述基音周期和删除后的所述相关特征作为所述第二过滤结果。
44、上述技术方案中,第二特征计算模块,还用于当所述降序排序结果中所述基音周期的数量达到数量阈值时,将所述降序排序结果中前n个所述基音周期、以及所述前n个所述基音周期对应的相关特征,作为所述音频帧对应的目标基音特征,所述n表示所述数量阈值;
45、当所述降序排序结果中所述基音周期的数量未达到所述数量阈值时,将设定值补充为所述降序排序结果中排序次序在第k与第n之间的所述基音周期、以及所述排序次序在第k与第n之间的所述基音周期对应的相关特征,其中,所述k表示所述基音周期的数量,并将补充后的所述降序排序结果中所述前n个所述基音周期、以及所述前n个所述基音周期对应的所述相关特征,作为所述音频帧对应的目标基音特征。
46、上述技术方案中,倒谱处理模块,还用于获取所述音频帧的功率谱;
47、将所述功率谱中同频域内的多个频点的功率加权求和处理,得到所述音频帧对应的频带功率;
48、对所述频带功率进行对数处理,得到对数处理结果;
49、对所述对数处理结果进行离散余弦转换处理,得到所述每个音频帧的倒谱特征。
50、上述技术方案中,压缩编码处理模块,还用于将所述音频帧的倒谱特征和所述音频帧对应的目标基音特征进行聚合,得到聚合结果;
51、将所述聚合结果进行量化编码,得到比特流数据,并将所述比特流数据作为码流数据。
52、上述技术方案中,电子设备,用于获取所述码流数据;
53、对所述码流数据进行解压处理,得到所述码流数据包括的每个音频帧的倒谱特征和目标基音特征;
54、基于所述音频帧的目标基音特征对所述音频帧的倒谱特征进行解码处理,得到解码后的音频数据。
55、本技术实施例提供一种用于音频处理的电子设备,所述电子设备包括:
56、存储器,用于存储可执行指令;
57、处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的音频处理方法。
58、本技术实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本技术实施例提供的音频处理方法。
59、本技术实施例提供一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现本技术实施例提供的音频处理方法。
60、本技术实施例具有以下有益效果:
61、根据音频帧的多个基音周期和基音周期对应的相关特征确定出目标基音特征,并对倒谱特征和目标基音特征进行压缩编码得到码流数据,从而实现不需要将大量的编码参数向对端的解码器进行传输,减少了编码数据在传输过程中的码率,进而减小占有的网络宽带或存储空间。