1.一种音频信号的传输处理方法,其特征在于,所述方法包括:
若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
2.如权利要求1所述的方法,其特征在于,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,包括:
基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
3.如权利要求1所述的方法,其特征在于,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,包括:
对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
4.如权利要求1所述的方法,其特征在于,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,包括:
获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。