智能设备自然语言交互信息处理方法与流程

文档序号:34212955发布日期:2023-05-17 20:09阅读:54来源:国知局
智能设备自然语言交互信息处理方法与流程

本发明涉及语音增强,具体涉及智能设备自然语言交互信息处理方法。


背景技术:

1、自然语言交互信息处理是人工智能领域中非常重要的一部分,其主要的目的是解决人机对话问题,让智能设备理解人类所表达的内容。而在自然语言交互信息处理过程中,是需要多种学科理论知识且属于交叉学科的处理过程。现如今智能设备自然语言处理仍然达不到“自然”交互要求,一个主要的原因是在交互过程中的音频信息环境混乱且容易受到噪声的干扰,使得语音识别率较低,进而在自然语言交互过程中,造成智能设备误识别进而造成误理解人类所表达的内容;

2、由于音频信息很容易受到噪声的干扰,因此在自然语言交互信息处理过程的预处理过程中,往往需要对识别的语音信息进行去噪处理。emd算法是一种适用于非线性和非平稳信号处理的一种算法,通过将复杂的信号分解为多个表征不同频率的内涵模态分量(imf分量),并对不同的内涵模态分量进行处理达到去噪的目的,也被应用于音频信息的处理过程中。而由于emd算法在分解过程中是以局部极值点进行分解,因此会在端点处出现边缘局部极值点,进而造成端点效应使得分解效果不好造成后续去噪效果较差。其中端点效应最常见的解决方法为通过数据拟合对端点信息进行拓展,并且语谱图是音频信息的信息表征,相比较于采集的声波图像具有更好的信息表征能力,因此本发明通过结合语谱图中的音频信息表达能力以及数据拟合算法来解决emd算法中的端点效应问题,使得获取的分解结果更加准确提高去噪效果。


技术实现思路

1、本发明提供智能设备自然语言交互信息处理方法,以解决现有的问题。

2、本发明的智能设备自然语言交互信息处理方法采用如下技术方案:

3、本发明提供了智能设备自然语言交互信息处理方法,该方法包括以下步骤:

4、根据历史语音信号的语谱图获得基础值,根据交互语音信号的语谱图获得超像素区域;

5、执行交互语音信号的分段操作,获得分段区间,包括:

6、根据预设的交互时间段范围对交互语音信号分段,获得多个交互时间段范围;将超像素区域中频率的最大值和最小值所包含的范围获得每个交互时间段范围包含的频率范围,根据同一时间点下同一频率范围中相邻频率对应的能量值差异获得自身相关性,根据两个交互时间段范围分别包含的相同频率范围内对应的能量值差异获得相邻相关性;利用基础值与时间段范围的范围大小之间的差异对自身相关性和相邻相关性进行权重融合获得选择程度;在预设的多个时间段范围下,获得选择程度最大的第一个交互时间段范围,记为一个分段区间;

7、将第一个分段区间内的交互语音信号截取下来,重复执行对截取后剩余的交互语音信号的分段操作,直至交互语音信号无法再进行分段,获得交互语音信号的多个分段区间;

8、将频率范围均等划分获得的范围记为子频率范围,根据所有分段区间中子频率范围内频率数量和所有分段区间的区间长度之间的最小值获得局部范围,在局部范围内根据相邻时间点的能量值差异大小构建能量曲线,根据能量曲线的极大值点个数与能量曲线数量的比值和局部范围内的能量值均值获得拟合参考权重值;

9、利用最大拟合参考权重值对应能量值进行曲线拟合获得同频曲线,对同频曲线进行变换和扩展得到扩展后的交互语音信号;

10、将扩展后的交互语音信号进行分解和去噪,实现对交互语音信号的去噪增强。

11、进一步的,所述根据历史语音信号的语谱图获得基础值,包括的具体步骤如下:

12、获取历史语音信号的语谱图,并根据语谱图获取时间段分段点,则历史语音信号中第个时间点为时间段分段点的优选程度的获取方法为:

13、

14、式中,表示历史语音信号中第个时间点的最大频率,x表示任意频率区间中的任意频率,表示第个时间点在频率x下对应的能量值,表示第个时间点在频率x下对应的能量值,s(a)表示语谱图上第个时间点对应的频率区间;

15、当任意一个时间点对应的优选程度大于预设的优选程度阈值时,将该时间点作为时间段分段点,利用获得的多个时间段分段点对历史语音信号进行分段处理,获得多个分段后历史语音信号的时间段范围,记为历史时间段范围,获取多个历史时间段范围的范围大小均值,记为基础值。

16、进一步的,所述根据交互语音信号的语谱图获得超像素区域,获取方法如下:

17、利用超像素分割算法对交互语音信号的语谱图进行分割,,将预设好数量的初始种子点平均分布在任意时间段范围所包含的语谱图中,获取多个超像素区域。

18、进一步的,所述自身相关性,获取方法如下:

19、

20、式中,表示第u个交互时间段范围内交互语音信号的自身相关性,表示第u个交互时间段范围内包含的频率范围的数量,表示第u个交互时间段范围内第个频率范围,表示第u个交互时间段范围内第个频率范围的频率数量;表示第u个交互时间段范围的右侧端点下第个频率范围内第j个频率对应的能量值,表示交互时间段范围的右侧第u个交互时间段范围的右侧端点下第个频率范围中第j+1个频率对应的能量值;表示以自然常数为底的指数函数。

21、进一步的,所述相邻相关性,获取方法如下:

22、

23、式中,表示第u个交互时间段范围内交互语音信号的相邻相关性,表示第u个交互时间段范围内包含的频率范围的数量,表示第u个交互时间段范围内第个频率范围,表示第u个交互时间段范围内第个频率范围的频率数量;表示第u个交互时间段范围的右侧端点下第个频率范围内第j个频率对应的能量值,表示第u+1个交互时间段范围的左侧端点下第个频率范围中第j个频率对应的能量值。

24、进一步的,所述选择程度,获取方法如下:

25、预设时间段范围的初始范围大小,以预设的固定步长作为初始范围大小进行逐次迭代的增加值,将初始范围大小迭代增加后所对应的时间段范围作为多个预设的时间段范围,获取多个预设的时间段范围内交互语音信号选择程度的自身相关性和相邻相关性,利用基础值对自身相关性和相邻相关性进行权重融合获得选择程度,所述选择程度为:

26、

27、式中,表示第u个交互时间段范围的范围大小,表示基础值,表示第u个交互时间段范围内的交互语音信号的自身相关性,表示第u个交互时间段范围内交互语音信号的相邻相关性,表示第u个交互时间段范围的范围大小为下的选择程度;表示以自然常数为底的指数函数。

28、进一步的,所述能量曲线,获取方法如下:

29、在局部范围左下角的点为起始点开始,以横坐标为方向,获取与起始点的能量值差异最小、频率最近且小于预设的能量值差异阈值的点,若不满足条件,则不进行连接,重新以左下角的上一个点开始连接,以此类推,获得连接顺序,按照连接顺序以及每个点的能量值获得能量曲线。

30、进一步的,所述拟合参考权重值,获取方法如下:

31、获取任意点所在局部范围的能量曲线的峰值点,即极大值点;将每个频率范围进行均等分为若干个子频率范围,每个范围作为同频进行分析,获取任意分段区间中的第个子频率范围中的第个点的拟合参考权重值:

32、

33、式中,表示第个子频率范围中的第个点在其局部范围内的极大值点对应的不同时间点的个数,表示第个子频率范围中的第个点的局部范围内的能量曲线的曲线数量,表示第个子频率范围中的第个点的局部范围内的能量均值,表示第个子频率范围中的第个点的拟合参考权重值。

34、进一步的,所述实现对交互语音信号的去噪增强,具体包括的步骤如下:

35、计算交互语音信号的语谱图中每个点的拟合参考权重值,选取子频率范围内每个时间点上的最大拟合参考权重值的能量值进行同频曲线拟合,对所有子频率范围内每个时间点上的最大拟合参考权重值的能量值得到拟合后的同频曲线,则将拟合得到的同频曲线向起始的时间点之外进行扩展,进而得到扩展后不同频率下的同频曲线,将得到的扩展后的同频曲线进行反傅里叶变换得到扩展后的交互语音信号;

36、对得到的扩展后的交互语音信号进行emd分解,得到多个语音imf分量,对每个语音imf分量采用小波阈值去噪算法进行去噪,实现对交互语音信号的去噪增强,获得去噪增强后的交互语音信号。

37、本发明的技术方案的有益效果是:采用同频曲线拟合并结合音频信息的语谱图中的分布特征对采集的音频信息进行扩展,使得emd算法分解后的imf分量更加准确。其中结合音频信息在语谱图中的分布特征,在同频曲线拟合过程中先将音频信息划分为多个时间段范围,对每个时间段范围内进行子频率范围的确定,并根据每个子频率范围内能量值分布的规律性特征计算每个点的拟合参考权重值,进而进行同频曲线拟合,并根据得到的拟合曲线进行音频信息的扩展,避免了传统的emd算法中的端点效应问题,使得获取的分解结果更加准确提高语音去噪增强效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1