1.本实用新型涉及声音信号识别芯片技术领域,具体为一种基于卷积神经网络的微弱声音信号识别芯片。
背景技术:2.随着神经网络模型的不断发展以及在人工智能领域中的应用,越来越多的微小事件可以通过人工智能的方式进行学习和处理。
3.目前,语音识别一般采用的都是传统的语音识别器来进行识别,传统的语音识别器基本上采用电容式mic声音传感器对声音进行拾取,然后在输入至语音识别芯片得到结果,这种方式的错误率高,且不具有自我学习的功能。
技术实现要素:4.本实用新型的目的在于提供一种基于卷积神经网络的微弱声音信号识别芯片,以解决上述背景技术中提出的问题。
5.为实现上述目的,本实用新型提供如下技术方案:
6.基于卷积神经网络的微弱声音信号识别芯片,包括:
7.多路语音传感器,多路语音传感器获取不同检测端的多路语音信号,并将多路语音信号输入至数据采集器,数据采集器经串口将多路语音信号传递至并列的多个语音放大电路,每一语音放大电路将其中的一路语音信号进行放大,每一语音放大电路的后端设置有一整形电路,每一整形电路的后端设置有带通滤波器,每一所述整形电路将经过语音放大电路放大后语音信号经过整形后再通过带通滤波器进行滤波后传递至神经网络系统,基于所述神经网络系统得到多个语音识别结果以及每一语音识别结果对应的置信度;
8.控制器cpu,具有多个控制开关,每一控制开关的一端耦合在所述神经网络系统的输出端,另一端与语音合成单元连接;
9.至少一组所述控制开关依据外部控制信号在控制器cpu控制下与语音合成单元进行连接,所述语音合成单元根据所述控制开关的导通将至少一组语音识别结果进行融合。
10.进一步地,所述语音传感器选用电容式mic声音传感器,电容式mic声音传感器拾取声音信号转化成电信号,该电信号经过前置放大电路将电信号放大,放大后经ac/dc转换器进行转换并再次放大后发送至数据采集器。
11.进一步地,还包括存储器ram,该存储器ram与所述神经网络系统的输出端连接,以及与语音合成单元连接。
12.进一步地,所述前置放大电路采用ne5532放大电路。
13.进一步地,所述神经网络系统具有卷积层、线性层、lmst层、安全连接层及输出层。
14.进一步地,所述卷积层设置有两层,每一卷积层具有由3x3的卷积核构成的卷积运算阵列;
15.在卷积层之后具有池化层;
16.第一存储单元,用于存储卷积运算所需权重;
17.第二存储单元,用于存储卷积运算所需的特征数据。
18.进一步地,所述线性层具有第三存储单元,该第三存储单元用于设置进行训练的重复参数,
19.以及具有一运算单元,该运算单元连接第三存储单元及第四存储单元,所述第四存储单元与第三存储单元分离设置,第四存储单元用于存储运算函数。
20.进一步地,所述lmst层具有连续的3层。
21.进一步地,所述安全连接层具有连续的4层。
22.由于采集的语音信号微弱,直接使用卷积神经网络系统进行语音识别处理,其得到的效果不是很理想,因此,本实用新型结合了传统语音识别处理和卷积神经网络系统,可以有效的识别微弱的语音信号,具体的,当电容式mic声音传感器拾取声音信号转化成电信号,电信号经过前置放大电路将电信号放大,放大后经ac/dc转换器进行转换并再次放大后发送至数据采集器,数据采集器经串口将语音电信号传递至语音放大电路,语音放大电路将语音电信号再次进行放大,语音放大电路的后端设置有一整形电路,整形电路的后端设置有带通滤波器,所述整形电路将经过语音放大电路放大后语音电信号经过整形后再通过带通滤波器进行滤波后传递至神经网络系统,基于所述神经网络系统得到多个语音识别结果以及每一语音识别结果对应的置信度。
23.在上述中,mic声音传感器至少设置有一个,当然也可以是多个,本实用新型还可以对多个语音电信号进行同步的处理。
附图说明
24.图1为本芯片进行单路语音信号处理的框架原理图;
25.图2为本芯片进行多路语音信号处理的框架原理图;
26.图3为神经网络系统的进行单路语音信号处理框架原理图;
27.图4为神经网络系统的进行多路语音处理的框架原理图。
具体实施方式
28.下面将结合本实用新型实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
29.参照图1至图4,本实用新型提供了一种基于卷积神经网络的微弱声音信号识别芯片,包括:
30.多路语音传感器,所述语音传感器选用电容式mic声音传感器,电容式mic声音传感器拾取声音信号转化成电信号,该电信号经过前置放大电路将电信号放大,放大后经ac/dc转换器进行转换并再次放大后发送至数据采集器。
31.上述中,多路语音传感器获取不同检测端的多路语音信号,并将多路语音信号输入至数据采集器,数据采集器经串口将多路语音信号传递至并列的多个语音放大电路,每一语音放大电路将其中的一路语音信号进行放大,每一语音放大电路的后端设置有一整形
电路,每一整形电路的后端设置有带通滤波器,每一所述整形电路将经过语音放大电路放大后语音信号经过整形后再通过带通滤波器进行滤波后传递至神经网络系统,基于所述神经网络系统得到多个语音识别结果以及每一语音识别结果对应的置信度;
32.控制器cpu,具有多个控制开关,每一控制开关的一端耦合在所述神经网络系统的输出端,另一端与语音合成单元连接;
33.至少一组所述控制开关依据外部控制信号在控制器cpu控制下与语音合成单元进行连接,所述语音合成单元根据所述控制开关的导通将至少一组语音识别结果进行融合;
34.存储器ram,该存储器ram与所述神经网络系统的输出端连接,以及与语音合成单元连接。
35.在上述中,所述前置放大电路采用ne5532放大电路。
36.在上述中,所述神经网络系统具有卷积层、线性层、lmst层、安全连接层及输出层。
37.所述卷积层设置有两层,每一卷积层具有由3x3的卷积核构成的卷积运算阵列;在卷积层之后具有池化层;
38.第一存储单元,用于存储卷积运算所需权重;
39.第二存储单元,用于存储卷积运算所需的特征数据。
40.上述中,每个卷积层使用3x3的卷积核,并在多个卷积之后进行池化,通过积累卷积池化对,来增强语音数据历史和未来信息,可以保证出色的语音表达的长时相关性,具体的,在利用卷积层进行卷积运算时,从第一存储单元调取存储卷积运算所需权重,并从第二存储单元调取卷积运算所需的特征数据,使用3x3的卷积核进行卷积矩阵运算,并在多个卷积之后进行池化,通过积累大量的卷积池化对,来增强语音数据历史及未来信息。
41.在上述中,所述线性层具有第三存储单元,该第三存储单元用于设置进行训练的重复参数,以及具有一运算单元,该运算单元连接第三存储单元及第四存储单元,所述第四存储单元与第三存储单元分离设置,第四存储单元用于存储运算函数。
42.所述线性层的目的在于在经过卷积运算后,对语音样本进行降维处理,一般的,线性层输出为256维,具体的,通过第三存储单元加载进行训练的重复参数,并加入滤波去噪一计算最大的学习率,其中,降维处理采用的是利用train函数训练进行降维。
43.在上述中,所述lmst层具有连续的3层,每个lstm层采用832个cells,512维映射层来降维,通过lstm的循环连接结构来整合长时的信息,输出状态标签延迟5帧,将lstm的输出连接几层安全连接层,所述安全连接层具有连续的4层。
44.本实用新型的原理为:由于采集的语音信号微弱,直接使用卷积神经网络系统进行语音识别处理,其得到的效果不是很理想,因此,本实用新型结合了传统语音识别处理和卷积神经网络系统,可以有效的识别微弱的语音信号,具体的,当电容式mic声音传感器拾取声音信号转化成电信号,电信号经过前置放大电路将电信号放大,放大后经ac/dc转换器进行转换并再次放大后发送至数据采集器,数据采集器经串口将语音电信号传递至语音放大电路,语音放大电路将语音电信号再次进行放大,语音放大电路的后端设置有一整形电路,整形电路的后端设置有带通滤波器,所述整形电路将经过语音放大电路放大后语音电信号经过整形后再通过带通滤波器进行滤波后传递至神经网络系统,所述神经网络系统具有卷积层、线性层、lmst层、安全连接层及输出层。在利用卷积层进行卷积运算时,从第一存储单元调取存储卷积运算所需权重,并从第二存储单元调取卷积运算所需的特征数据,使
用3x3的卷积核进行卷积矩阵运算,并在多个卷积之后进行池化,通过积累大量的卷积池化对,来增强语音数据历史及未来信息。所述线性层的目的在于在经过卷积运算后,对语音样本进行降维处理,一般的,线性层输出为256维,具体的,通过第三存储单元加载进行训练的重复参数,并加入滤波去噪一计算最大的学习率,其中,降维处理采用的是利用train函数训练进行降维。
45.所述lmst层具有连续的3层,每个lstm层采用832个cells,512维映射层来降维,通过lstm的循环连接结构来整合长时的信息,输出状态标签延迟5帧,将lstm的输出连接几层安全连接层,所述安全连接层具有连续的4层。
46.基于所述神经网络系统得到多个语音识别结果以及每一语音识别结果对应的置信度。具体的,mic声音传感器至少设置有一个,当然也可以是多个,本实用新型还可以对多个语音电信号进行同步的处理。具体的,多路语音传感器获取不同检测端的多路语音信号,并将多路语音信号输入至数据采集器,数据采集器具有多个采集通道,对应多个语音信号,经多个采集通道经串口将多路语音信号传递至并列的多个语音放大电路,每一语音放大电路将其中的一路语音信号进行放大,每一所述整形电路将经过语音放大电路放大后语音信号经过整形后再通过带通滤波器进行滤波后传递至神经网络系统,基于所述神经网络系统得到多个语音识别结果以及每一语音识别结果对应的置信度,至少一组所述控制开关依据外部控制信号在控制器cpu控制下与语音合成单元进行连接,所述语音合成单元根据所述控制开关的导通将至少一组语音识别结果进行融合。上述神经网络系统对多路语音处理参照附图4。
47.本实用新型中未涉及部分均与现有技术相同或可采用现有技术加以实现。尽管已经示出和描述了本实用新型的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本实用新型的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本实用新型的范围由所附权利要求及其等同物限定。