一种基于语深度神经网络的语言识别方法与流程

文档序号:16906334发布日期:2019-02-19 18:22阅读:454来源:国知局

本发明属于语言识别方法技术领域,具体涉及一种基于语深度神经网络的语言识别方法。



背景技术:

几年来,随着科技的不断发展进步,人们在进行笔记时,已经由最初的纸质记录演变为现在的采用电子产品进行记录,采用单子产品进行记录的方式多数是采用打字记录或者录音记录的方式,然后及时是录音记录的方式,后续也需要将录音转换为文本形式进行存储,这种记录方式无疑也为记录人员造成了工作负担。因此,目前出现了直接将语音转换为本的记录方式,其具体方式是将语音直接转换为文字文本信息,然后将文字文本信息进行存储,然而目前在进行语音转换时,进行语音信息输入时,由于说话者所处周围环境等因素的影响,输入的语音信息多有噪音,从而导致对识别到的语音进行文本信息转换时,出现转换不准确。



技术实现要素:

本发明的目的是克服现有技术的不足而提供一种有效避免高频噪声影响的配电网初始故障定位方法及预警方法。

本发明的技术方案如下:

一种基于语深度神经网络的语言识别方法,具体过程如下:

s11、采用双正交小波变换对输入的语音信息进行滤波处理,去除语音信息中不重要的信息和背景噪音;

s12、采用梅尔频率倒谱系数提取能够反映语音信号特征的关键特征参数所形成的特征序列;

s13、使用训练语音库的特征参数进行声学模型的训练,具体的,将待识别的语音的特征参数与声学模型进行匹配;

s14、使用文本数据库的特征参数进行语言模型训练,具体的,将待识别的语音的特征参数与语言的语法和语义进行匹配;

s15、建立解码器,针对输入的语音信号,根据已经训练好的hmm声学模型、语言模型及字典建立识别网络;

s16、根据步骤s15,解码器在文本库中检索与待识别的语音特征参数匹配的词,并判断该词对应的前后关联常用词,并根据步骤s14中识别的语法和语音进行排序,最终转换为文本信息。

进一步,所述步骤s16的具体做法是,建立关联词文本库,即根据训练的语言文本库中出现频次较高的词语作为特征参数词语,并建立该特征参数词语的常用关联词语。

进一步,所述步骤s12的具体提取过程为:

s31、将经过滤波处理后的语音信息进行预加重处理后进行分帧处理;

s32、对分帧处理后的语音信号的每一帧进行离散fft变换并将时域信号转换为频域信号;

s33、采用mel滤波器组对s32得到的频域信号进行计算得到mel频谱,接着在mel频谱基础上采用dct离散余弦变换进行倒谱分析即取对数、做逆变操作;

s34、应用差分原理去掉步骤s33中dct后信号的直流成分,即获得mel频率到普系数mfcc。

与现有技术相比,本发明的有益效果是:

本发明采用双正交小波变换去除语音信息中不重要的信息和背景噪音,有效提高语音信息中特征参数的分析与提取;并且,本发明建立识别网络,通过解码器在文本库中检索与待识别的语音特征参数匹配的词,并判断该词对应的前后关联常用词,从而提高语音识别的效率;另外,本发明通过梅尔频率倒谱系数对语音信号的关键特征参数进行精确提取,并形成完成的序列,从而便于后续程序中语音信息转换。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于语深度神经网络的语言识别方法,具体过程如下:

s11、采用双正交小波变换对输入的语音信息进行滤波处理,去除语音信息中不重要的信息和背景噪音;

s12、采用梅尔频率倒谱系数提取能够反映语音信号特征的关键特征参数所形成的特征序列;

s13、使用训练语音库的特征参数进行声学模型的训练,具体的,将待识别的语音的特征参数与声学模型进行匹配;

s14、使用文本数据库的特征参数进行语言模型训练,具体的,将待识别的语音的特征参数与语言的语法和语义进行匹配;

s15、建立解码器,针对输入的语音信号,根据已经训练好的hmm声学模型、语言模型及字典建立识别网络;

s16、根据步骤s15,解码器在文本库中检索与待识别的语音特征参数匹配的词,并判断该词对应的前后关联常用词,并根据步骤s14中识别的语法和语音进行排序,最终转换为文本信息。

进一步,所述步骤s16的具体做法是,建立关联词文本库,即根据训练的语言文本库中出现频次较高的词语作为特征参数词语,并建立该特征参数词语的常用关联词语。

进一步,所述步骤s12的具体提取过程为:

s31、将经过滤波处理后的语音信息进行预加重处理后进行分帧处理;

s32、对分帧处理后的语音信号的每一帧进行离散fft变换并将时域信号转换为频域信号;

s33、采用mel滤波器组对s32得到的频域信号进行计算得到mel频谱,接着在mel频谱基础上采用dct离散余弦变换进行倒谱分析即取对数、做逆变操作;

s34、应用差分原理去掉步骤s33中dct后信号的直流成分,即获得mel频率到普系数mfcc。

本实施例中采用双正交小波变换去除高频噪声的依据如下:

傅里叶变换无法对对于心电等非稳定信号中时间特性加以分析;小波变换良好的空间和频域局部化特性,使其可以对信号在时域和频域上进行多尺度细化分析,可以有效地从心电信号中提取信号信息

连续小波变换基本定义如下:

其中a为尺度因子,τ为平移因子,称ψa,τ(t)为小波基函数:

由于a和τ是连续变换的值,所以称其为连续小波变换;但连续小波变换实际运算过程复杂,且二位计算存在大量冗余,所以常将连续小波加以离散,得到离散小波变换,实际应用时采用二进的动态采样网络得到小波:

二进小波由于是对尺度参数进行了离散,而平移参数保持连续变化,它所具有的平移不变性使得其非常适合模式识别和信号检测;

而双正交小波(biorthogonalwavelet)具有低复杂度、高实时性以及多尺度特性,且运算简单,本实施例选择双正交小波变换在心电信号特征提取时对信号进行变换以去除高频噪声。

本发明采用双正交小波变换去除语音信息中不重要的信息和背景噪音,有效提高语音信息中特征参数的分析与提取;并且,本发明建立识别网络,通过解码器在文本库中检索与待识别的语音特征参数匹配的词,并判断该词对应的前后关联常用词,从而提高语音识别的效率;另外,本发明通过梅尔频率倒谱系数对语音信号的关键特征参数进行精确提取,并形成完成的序列,从而便于后续程序中语音信息转换。

尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1