一种适用于会议系统的无线音频星闪传输噪声管理方法及系统与流程

文档序号：40453472发布日期：2024-12-27 09:18阅读：135来源：国知局

本发明涉及音频，尤其涉及一种适用于会议系统的无线音频星闪传输噪声管理方法及系统。

背景技术：

1、在现代会议系统中，无线音频传输技术的广泛应用提供了极大的便利。然而，无线音频传输中不可避免地会遇到各种噪声干扰问题，这些噪声干扰不仅会影响音频的传输质量，还会对会议的整体体验产生负面影响。常见的无线音频传输噪声来源主要包括环境噪声和人为噪声。环境噪声通常指来自周围环境的背景噪声，如风声、空调声等；而人为噪声则包括由于人员操作、设备故障等原因引起的杂音。

2、在会议场景中，演讲人员在进行演讲的过程中，其演讲者的声音存在不可控性，可能会出现突然间的演讲声音增大的情况，在声音功放设备未能及时控制的情况下，将增大后的演讲声音进行播放，在安静的会议场景下，会给其余人员带来不好的体验，影响会议效果，从而产生人为噪音。因此，如何更好的对人为噪音进行降噪管理，以提高会议效果和参会人员的舒适度，是一个重要问题。

技术实现思路

1、本发明克服了现有技术的缺陷，提供了一种适用于会议系统的无线音频星闪传输噪声管理方法及系统，其重要目的在于提高会议场景下的噪声管理能力以及参会人员的舒适度。

2、为实现上述目的本发明第一方面提供了一种适用于会议系统的无线音频星闪传输噪声管理方法，包括：

3、获取目标会议场景的待传输音频信息，对待传输音频进行编码，基于非负矩阵分解算法对待传输音频进行初步分离，得到分离音频信息；

4、构建音频分类模型，根据所述分离音频信息进行音频分类，将待传输音频分类为环境声音频和人声音频，得到音频分类信息；

5、根据所述音频分类信息获取环境声音频信息，基于环境声音频的时序属性构成环境声音频序列，对环境声音频进行降噪管理；

6、根据所述音频分类信息获取人声音频信息，进行人声音频分析，将人声音频划分为背景人声音频和目标人声音频，对背景人声音频进行降噪，对目标人声音频进行异常检测；

7、基于异常检测结果对目标人声音频进行舒适度评估，判断是否存在人为噪音并进行音频预测，生成降噪调控参数对目标人声音频进行降噪管理。

8、本方案中，所述获取目标会议场景的待传输音频信息，对待传输音频进行编码，基于非负矩阵分解算法对待传输音频进行初步分离，得到分离音频信息，具体包括：

9、通过音频录制设备对目标会议场景进行音频采集，获取目标会议场景的待传输音频信息；

10、预设时间序列，根据所述待传输音频信息对待传输音频进行编码，将编码后的音频数据嵌入至所述时间序列中，进行数据预处理，得到混合音频信息；

11、引入短时傅里叶变换算法对所述混合音频信息进行分帧处理，基于汉宁窗函数对每一帧的音频数据进行加窗，将每一帧音频数据乘以汉宁窗函数，得到加窗后音频信息；

12、根据所述加窗后音频信息对各时间窗口的混合音频数据进行离散傅里叶变化，获取各时间窗口混合音频数据对应频谱，并构成时频矩阵；

13、基于非负矩阵分解算法将所述时频矩阵进行分解，随机初始化基底矩阵和激活系数矩阵，将kl散度作为优化目标，预设损失函数并采用乘法更新规则对基底矩阵和激活系数矩阵进行迭代优化；

14、获取优化后的基底矩阵和激活系数矩阵，分别提取基底向量和激活系数向量，通过数据检索获取环境声和人声对应的频谱特征表示，结合聚类算法分别将基地向量和激活系数向量分类为环境声向量类别和人声向量类别；

15、基于分类结果计算环境声和人声的时频表示矩阵，并进行逆短时傅里叶变换，得到分离音频信息。

16、本方案中，所述构建音频分类模型，根据所述分离音频信息进行音频分类，将待传输音频分类为不同的音频类型，得到音频分类信息，具体包括：

17、获取分离音频信息，采用梅尔滤波器对所述分离音频信息进行特征提取，基于梅尔滤波器获取梅尔频率，对所述分离音频信息进行滤波处理；

18、基于滤波处理后的分离音频信息进行对数压缩获取对数压缩结果后的分离音频信息，进行离散余弦变换并生成音频倒谱系数；

19、将生成的音频倒谱系数与预设阈值进行判断，选取大于预设阈值的音频倒谱系数进行合并，得到分离音频特征信息；

20、预设分类类别，通过大数据检索获取各类别对应的语谱图，并根据各类别语谱图的谱熵进行划分，根据划分结果获取各类别语谱图对应的声纹特征并进行关联，构成第一数据集；

21、构建音频分类模型，通过所述第一数据集进行模型训练获取符合期望的音频分类模型，将所述分离音频特征信息输入至所述音频分类模型中进行音频分类；

22、基于输入的所述分离音频特征信息计算分离音频的谱熵，根据分离音频的谱熵获取对应类别下的语谱图及声纹特征，通过所述分离音频信息生成分离音频语谱图和分离音频声纹特征，进行相似度计算获取相似度值；

23、将计算得到的相似度值与预设阈值进行判断，根据判断结果输出分离音频的分类结果，得到音频分类信息。

24、本方案中，所述根据所述音频分类信息获取环境声音频信息，基于环境声音频的时序属性构成环境声音频序列，对环境声音频进行降噪管理，具体包括：

25、获取音频分类信息，根据所述音频分类信息提取环境声音频信息，基于环境声音频的时序属性构成环境声音频序列，通过所述音频分类信息提取人声音频信息构成人声音频序列；

26、基于所述环境声音频序列计算噪声序列的平均频谱，作为噪声频谱，将所述环境声音频序列与所述人声音频序列进行时序对齐，标记人声与环境声重合的序列，得到标记序列；

27、对所述环境声音频信息进行特征提取，获取频率、振幅和音频波形特征，并进行周期性分析，得到周期性分析信息；

28、根据标记序列计算带噪音频的频谱，与所述噪声频谱进行相减操作，获取相减后的频谱，通过所述周期性分析信息生成修正参数，对相减后的频谱进行修正获取修正后频谱，逆傅里叶变换生成环境声音频降噪结果信息。

29、本方案中，所述根据所述音频分类信息获取人声音频信息，进行人声音频分析，将人声音频划分为背景人声音频和目标人声音频，对背景人声音频进行降噪，对目标人声音频进行异常检测，具体包括：

30、基于历史数据检索获取混合人声音频，根据获取的混合人声音频获取混合人声音频的声谱图，将混合人声音频按照频率进行划分，得到第一划分信息；

31、通过实例统计分析获取说话场景下的背景人声和目标人声的频率及声音特征，结合所述第一划分信息将混合人声音频划分为背景人声和目标人声，构成实例数据集；

32、获取音频分类信息，根据所述音频分类信息获取人声音频信息，对所述人声音频信息进行预加重滤波，并进行特征提取获取人声音频特征信息；

33、基于svm构建人声音频分析模型，通过所述实例数据集进行模型训练获取符合期望的人声音频分析模型，将所述人声音频特征信息输入至所述人声音频分析模型中进行分析，得到人声音频分析信息；

34、所述人声音频分析信息将人声音频划分为背景人声和目标人声，采用频谱减法进行背景人声降噪；

35、基于人声音频分析信息提取目标人声音频，通过生成对抗网络构建异常检测模型，输入目标人声音频并根据目标人声音频特征生成原始人声音频序列，通过生成器获取生成人声音频序列；

36、计算原始人声音频序列和生成人声音频序列之间的重构误差，根据所述重构误差进行异常人声音频检测，得到异常人声音频检测信息。

37、本方案中，所述基于异常检测结果对目标人声音频进行舒适度评估，判断是否存在人为噪音并进行音频预测，生成降噪调控参数对目标人声音频进行降噪管理，具体包括：

38、基于数据检索获取不同会议场景下各功放标准下的说话人声音频，通过专家分析法对各说话人声音频进行舒适度评估，得到不同舒适度的说话人声音频；

39、提取不同舒适度的说话人声音频对应的人声音频特征构建舒适度评估规则，获取异常人声音频检测信息，对异常人声音频进行舒适度评估，得到舒适度评估信息；

40、若所述舒适度评估结果为当前时刻的目标人声音频为舒适，则对当前时刻的目标人声音频进行语音增强；

41、若所述舒适度评估结果为当前时刻的目标人声音频为不舒适，则当前时刻的目标人声音频出现人为噪音，进行噪音管理，根据所述异常人声音频检测信息提取异常人声音频特征；

42、根据所述舒适度评估规则获取舒适音频基准，与提取的异常人声音频特征进行偏差计算获取偏差值，基于计算得到的偏差值对异常人声音频进行降噪调控，生成降噪调控参数；

43、引入马尔可夫算法根据提取的异常人声音频特征进行音频预测，根据异常人声音频特征设定初始状态，并在预设的状态空间中进行检索获取初始状态的状态转移矩阵；

44、根据状态转移矩阵分析当前时刻的异常人声音频下一状态的状态转移概率，生成当前时刻的异常人声音频的状态转移动态序列；

45、获取人声音频分析信息，提取目标人声音频特征并生成目标人声的实际状态变化序列，分析实际音频变化的状态转移概率，结合状态转移动态序列选取符合实际音频变化的状态转移序列，得到最终状态转移序列；

46、根据所述最终状态转移序列生成音频预测结果，对音频预测结果进行异常检测和舒适度评估，并对评估结果为不舒适的音频预测结果进行降噪调控，生成降噪调控预测参数；

47、获取下一时刻的目标人声音频进行特征提取并生成下一时刻的音频状态变化序列，与所述最终状态转移序列进行对比分析，根据对比分析结果对所述降噪调控预测参数进行修正。

48、本发明第二方面提供了一种适用于会议系统的无线音频星闪传输噪声管理系统，该系统包括：存储器、处理器，所述存储器中包含适用于会议系统的无线音频星闪传输噪声管理方法程序，所述适用于会议系统的无线音频星闪传输噪声管理方法程序被所述处理器执行时实现如下步骤：

49、获取目标会议场景的待传输音频信息，对待传输音频进行编码，基于非负矩阵分解算法对待传输音频进行初步分离，得到分离音频信息；

50、构建音频分类模型，根据所述分离音频信息进行音频分类，将待传输音频分类为不同的音频类型，得到音频分类信息；

51、根据所述音频分类信息获取环境声音频信息，基于环境声音频的时序属性构成环境声音频序列，对环境声音频进行降噪管理；

52、根据所述音频分类信息获取人声音频信息，进行人声音频分析，将人声音频划分为背景人声音频和目标人声音频，对背景人声音频进行降噪，对目标人声音频进行异常检测；

53、基于异常检测结果对目标人声音频进行舒适度评估，判断是否存在人为噪音并进行音频预测，生成降噪调控参数对目标人声音频进行降噪管理。

54、本发明公开了一种适用于会议系统的无线音频星闪传输噪声管理方法及系统，包括：获取待传输音频信息，对待传输音频进行编码，基于非负矩阵分解算法对待传输音频进行初步分离，得到分离音频信息；根据所述分离音频信息进行音频分类，将待传输音频分类为不同的音频类型，得到音频分类信息；根据音频分类信息获取环境声音频信息并构成环境声音频序列，进行降噪管理；进行人声音频分析，将人声音频划分为背景人声音频和目标人声音频，对背景人声音频进行降噪，对目标人声音频进行异常检测；对目标人声音频进行舒适度评估，判断是否存在人为噪音并进行音频预测，生成降噪调控参数。提高会议场景的音频传输噪声管理质量和参会人员的舒适度。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：聂劲松,聂正华,颜月娥
技术所有人：深圳国荟数智科技有限公司
我是此专利的发明人

上一篇：一种插件式电解电容电解质生产用干燥装置的制作方法
上一篇：一种异型钢生产用冷弯型钢生产设备的制作方法