语音活动检测方法、系统、语音增强方法以及系统与流程

文档序号：34669125发布日期：2023-07-05 15:49阅读：71来源：国知局

本说明书涉及目标语音信号处理，尤其涉及一种语音活动检测方法、系统、语音增强方法以及系统。

背景技术：

1、在基于波束成形算法的语音增强技术中，特别是最小方差无失真响应(minimumvariance distortionless response，简称mvdr)的自适应波束形成算法中，怎么求解描述不同麦克风之间噪声统计特性关系的参量——噪声协方差矩阵至关重要。现有技术中的主要方法是基于语音存在概率的方法计算噪声协方差矩阵，比如通过语音活动检测方法(voice activitydetection，简称vad)估计语音存在概率，进而计算噪声协方差矩阵。但是现有技术中的语音存在概率估计准确率不够，导致噪声协方差矩阵估计精度较低，进而导致mvdr算法的语音增强效果较差。尤其当麦克风数目较少，比如小于5个时，效果急剧下降。因此，现有技术中的mvdr算法多用于手机、智能音箱等麦克风数量多且间距大的麦克风阵列设备中，而对于耳机这种麦克风数量少且间距小的设备语音增强效果较差。

2、因此，需要提供一种精度更高的语音活动检测方法、系统、语音增强方法以及系统。

技术实现思路

1、本说明书提供一种精度更高的语音活动检测方法、系统、语音增强方法以及系统。

2、第一方面，本说明书提供一种语音活动检测方法，用于呈预设阵列形状分布的m个麦克风，所述m为大于1的整数，包括：获取所述m个麦克风输出的麦克风信号；基于所述麦克风信号，确定所述麦克风信号构成的信号子空间；确定目标语音信号构成的目标子空间；以及基于所述信号子空间与所述目标子空间的线性相关性，确定所述麦克风信号中存在所述目标语音信号的语音存在概率并输出。

3、在一些实施例中，所述基于所述麦克风信号，确定所述麦克风信号构成的信号子空间，包括：基于所述麦克风信号，确定所述麦克风信号的采样协方差矩阵；对所述采样协方差矩阵进行特征分解，确定所述采样协方差矩阵的多个特征向量；以及将所述多个特征向量中的至少部分特征向量组成的矩阵作为所述信号子空间的基矩阵。

4、在一些实施例中，所述基于所述麦克风信号，确定所述麦克风信号构成的信号子空间，包括：基于所述麦克风信号，通过空间估计方法确定所述麦克风信号中的信号源的方位角，从而确定所述麦克风信号的信号导引矢量，所述空间估计方法包括doa估计方法以及空间谱估计方法种的至少一种；以及确定所述信号导引矢量为所述信号子空间的基矩阵。

5、在一些实施例中，所述确定目标语音信号构成的目标子空间，包括：确定与所述目标语音信号对应的预设的目标导引矢量为所述目标子空间的基矩阵。

6、在一些实施例中，所述基于所述信号子空间与所述目标子空间的线性相关性，确定所述麦克风信号中存在所述目标语音信号的语音存在概率并输出，包括：确定所述信号子空间与所述目标子空间的体积相关函数；基于所述体积相关函数，确定所述信号子空间与所述目标子空间的线性相关系数，其中，所述线性相关系数与所述体积相关函数负相关；以及将所述线性相关系数作为所述语音存在概率并输出，其中，所述基于所述体积相关函数，确定所述信号子空间与所述目标子空间的线性相关系数，包括以下情况中的一种：确定所述体积相关函数大于第一阈值，确定所述线性相关系数为0；确定所述体积相关函数小于第二阈值，确定所述线性相关系数为1，其中，所述第二阈值小于所述第一阈值；以及确定所述体积相关函数在所述第一阈值和所述第二阈值之间，确定所述线性相关系数在0至1之间，且所述线性相关系数为所述体积相关函数的负相关函数。

7、第二方面，本说明书还提供一种语音活动检测系统，包括至少一个存储介质以及至少一个处理器，所述至少一个存储介质存储有至少一个指令集用于语音活动检测；以及所述至少一个处理器同所述至少一个存储介质通信连接，其中当所述语音活动检测系统运行时，所述至少一个处理器读取所述至少一个指令集并实施本说明书第一方面所述的语音活动检测方法。

8、第三方面，本说明书还提供一种语音增强方法，用于呈预设阵列形状分布的m个麦克风，所述m为大于1的整数，包括：获取所述m个麦克风输出的麦克风信号；基于本说明书第一方面所述的语音活动检测方法，确定所述麦克风信号中存在所述目标语音信号的语音存在概率；基于所述语音存在概率确定所述麦克风信号对应的滤波系数向量；以及基于所述滤波系数向量对所述麦克风信号进行合并，得到目标音频信号并输出。

9、在一些实施例中，所述基于所述语音存在概率确定所述麦克风信号对应的滤波系数向量，包括：基于所述语音存在概率确定所述麦克风信号的噪声协方差矩阵；以及基于mvdr方法以及所述噪声协方差矩阵，确定所述滤波系数向量。

10、在一些实施例中，所述基于所述语音存在概率确定所述麦克风信号对应的滤波系数向量，包括：将所述语音存在概率作为所述麦克风信号中的目标麦克风信号对应的滤波系数，所述目标麦克风信号包括所述麦克风信号中信噪比最高的一路麦克风信号；以及确定所述麦克风信号中所述目标麦克风信号之外的其余麦克风信号对应的滤波系数为0，所述滤波系数向量包括所述目标麦克风信号对应的滤波系数以及所述其余麦克风信号对应的滤波系数组成的向量。

11、第四方面，本说明书还提供一种语音增强系统，包括至少一个存储介质以及至少一个处理器，所述至少一个存储介质存储有至少一个指令集用于进行语音增强；以及所述至少一个处理器同所述至少一个存储介质通信连接，其中当所述语音增强系统运行时，所述至少一个处理器读取所述至少一个指令集并实施本说明书第二方面所述的语音增强方法。

12、由以上技术方案可知，本说明书提供的语音活动检测方法、系统、语音增强方法以及系统，用于由多个麦克风组成的麦克风阵列。其中，麦克风阵列既可以采集噪声信号，也可以采集目标语音信号，并输出麦克风信号。目标语音信号与噪声信号属于无交连的两种信号。目标语音信号所在的目标子空间与噪声信号所在的噪声子空间属于无交连的两个子空间。当麦克风信号中不存在目标语音信号时，麦克风信号中只包含噪声信号。此时，麦克风信号所在的信号子空间与目标语音信号所在的目标子空间属于无交连的两个子空间，信号子空间与目标子空间的线性相关性低。当麦克风信号中存在目标语音信号时，麦克风信号中既包含目标语音信号，又包含噪声信号。此时，麦克风信号所在的信号子空间与目标语音信号所在的目标子空间属于有交连的两个子空间，信号子空间与目标子空间的线性相关性较高。因此，本说明书提供的语音活动检测方法和系统可以通过计算麦克风信号所在的信号子空间与目标语音信号所在的目标子空间的线性相关性，确定麦克风信号中存在目标语音信号的语音存在概率。所述语音增强方法及系统可以基于语音存在概率计算滤波系数，从而对麦克风信号进行语音增强。所述方法和系统可以提高语音存在概率的计算精度，进而提高语音增强效果。

13、本说明书提供的语音活动检测方法、系统、语音增强方法以及系统的其他功能将在以下说明中部分列出。根据描述，以下数字和示例介绍的内容将对那些本领域的普通技术人员显而易见。本说明书提供的语音活动检测方法、系统、语音增强方法以及系统的创造性方面可以通过实践或使用下面详细示例中所述的方法、装置和组合得到充分解释。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖乐张承乾廖风云齐心
技术所有人：深圳市韶音科技有限公司
我是此专利的发明人

上一篇：用于植物物质的研磨器的制作方法
上一篇：直插式可多角度调节视角的车载摄像头的制作方法