一种音频风格转换方法和系统与流程

文档序号：24051209发布日期：2021-02-23 22:12阅读：来源：国知局

技术特征：
1.一种音频风格转换方法，其特征在于，包括如下内容：获取待转换风格的音频的内容；获取目标音频的风格；对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号；通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息；通过优化算法将内容纹理统计信息和风格纹理统计信息合成，以获取合成音频并输出。2.根据权利要求1所述一种音频风格转换方法，其特征在于，所述对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号，其中，对内容和风格波形分别通过短时傅里叶变换处理，以分别获取内容信号和风格信号的2d频谱图信号。3.根据权利要求1所述一种音频风格转换方法，其特征在于，所述通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息，其中，声音纹理模型为神经网络或工程感知模型。4.根据权利要求1所述一种音频风格转换方法，其特征在于，所述声音纹理模型包括：通过带通耳蜗滤波器将波形分解为声频带；提取每个频带的包络，并对其施加压缩非线性；通过带通调制滤波器分解每个压缩包络。5.根据权利要求4所述一种音频风格转换方法，其特征在于，所述纹理统计信息包括：每个频带的方差，每个包络带的均值、方差、偏度，以及跨带相关性信息。6.一种音频风格转换系统，其特征在于，包括：内容获取模块，用于获取待转换风格的音频的内容；风格获取模块，用于获取目标音频的风格；处理模块，用于对内容和风格波形分别进行预处理，以分别获取内容信号和风格信号；提取模块，用于通过声音纹理模型分别提取内容信号和风格信号的纹理统计信息；合成模块，用于通过优化算法将内容纹理统计信息和风格纹理统计信息合成，以获取合成音频并输出。7.根据权利要求6所述一种音频风格转换系统，其特征在于，所述声音纹理模型，包括：一层结构模型，用于通过带通耳蜗滤波器将波形分解为声频带；二层结构模型，用于提取每个频带的包络，并对其施加压缩非线性；三层结构模型，用于通过带通调制滤波器分解每个压缩包络。

完整全部详细技术资料下载

当前第2页1 2 3