动物声音情绪识别系统及其方法_2

文档序号：8382006阅读：来源：国知局

步串行接口，具有很强的可编程能力，可以配置为多种同步串口标准，直接与各种器件高速接口；
负责外部音频处理装置10与数据处理芯片22间的通信。
[0020](2)数据处理芯片22
数据处理芯片22为本发明的核心部分，采用TI公司的TMS320C6713 (主频225 MHz)型DSP芯片；
主要负责对收集到的声音信号进行预处理、端点检测以及语音识别等处理。
[0021 ] 如图2，其语音识别的原理是:
先是收集情绪声音数据作为训练样本230 ；
然后对其提取MFCC参数、共振峰以及过零率三个特征参数并进行特征组合，建立高斯混合模型240 ；
对高斯混合模型按情绪类别分类，形成各个情绪类别223的声学模型222 ；
当采集到未知情绪的动物声音数据200时，对其进行抗混叠滤波、模数变换、分帧和预加重预处理以及端点检测并提取特征参数210，然后与各个情绪类别下的声学模型相匹配，计算后验概率221，选取后验概率最大所对应的情绪类别为识别结果，最后得到动物情绪250。
[0022](3)闪存存储器23闪存存储器23是一块单片16位的闪存存储器，用于扩展外部大容量，保存固件或参数；
数据处理芯片22可直接对其进行读写。
[0023](4)随机存储器24
随机存储器24是一块单片32位的随机存储器，用于扩展外部大容量，保存模型参数或声音数据；
数据处理芯片22可直接对其进行读写。
[0024](5) JTAG 仿真接口 25
JTAG仿真接口 25是一种由数据处理芯片22提供的60芯的JATG仿真器接口，采用间距0.635mm高密度连接器；
数据处理芯片22可通过JATG仿真接口 25与硬件仿真器相连接后再接到计算机主机，实现与计算机的数据通信。
[0025](6) HPI 主机接口 26
HPI主机接口 26是由数据处理芯片22片提供的一个外部与主机通信的并行接口；外部主机可以通过HPI主机接口 26访问数据处理芯片22的存储器映射空间。
[0026](7)外部扩展接口 27
外部扩展接口 27是一种由数据处理芯片22提供的接口；
主要用于连接无线传输装置30，实现数据处理芯片22与外设服务器的通信。
[0027]3)无线传输装置30
无线传输装置30为一种无线收发装置，采用美国DIGI公司的XBee模块，是一种远距离低功耗的数据传输模块，频段有2.4G，900M，868M三种同时可兼容802.15.4协议；
主要负责将数据处理芯片22传送来的数据传送回外设服务器进行模型自增强，同时接收服务器上模型自增强后的模型参数传送回数据处理芯片22。
[0028]二、方法
1、数据处理芯片22的工作流程
如图3，数据处理芯片22的工作流程如下:
A、系统初始化-301；
B、采集动物声音信号-302；
C、对采集到的声音信号进行抗混叠滤波、模数变换、分帧和预加重预处理-303；
D、进行端点检测-304；
E、提取出梅尔-频率倒谱系数、共振峰和过零率三个特征参数-305；
F、与建立好的声音情绪模型相匹配，得到每个模型下对应的后验概率-306；
G、比较每个模型下的后验概率，选取最大后验概率所对应的情绪模型，即为所得的识别结果-307 ；
H、将该后验概率与预设的概率阈值进行比较-308，判断后验概率是否大于设定阈值，是则进入步骤I ;否则，进入步骤J ;
1、将该声音数据连同识别结果通过无线传输网络传送回服务器端进行模型自增强-309，然后进行步骤J ;
J、通过音频输出装置语音输出识别结果-310，再进入步骤B; 循环执行。
[0029] 2、模型自增强的流程
如图4，模型自增强主要在外设服务器上实现，其流程如下:
a、接收由无线传输装置30传输声音数据-401；
b、将接收的声音数据保存到早先建立好的声音数据模板库中-402；
C、对更新后的声音数据模板库中的数据进行抗混叠滤波、模数变换、分帧和预加重预处理以及端点检测-403 ；
d、从更新后的模板库声音数据中提取出梅尔-频率倒谱系数、共振峰和过零率三个特征参数，并按照权重对其进行特征组合-404 ；
e、对提取出来的特征向量建立高斯混合模型，更新原有模型参数-405；
f、将更新后的模型参数传输数据处理装置20并存储-406。
【主权项】
1.一种动物声音情绪识别系统，其特征在于: 包括音频处理装置(10 )、数据处理装置(20 )、无线传输装置(30 )和电源(40 ); 音频处理装置(10 )、数据处理装置(20 )和无线传输装置(30 )依次连接；电源(40 )分别与音频处理装置(10 )和数据处理装置(20 )连接。
2.按权利要求1所述的一种动物声音情绪识别系统，其特征在于: 所述的音频处理装置(10)包括依次连接的音频采集器(11)、音频解码器(12)和音频输出器(13)。
3.按权利要求1所述的一种动物声音情绪识别系统，其特征在于: 所述的数据处理装置20包括通信接口(21)、数据处理芯片(22)、闪存存储器(23)、随机存储器(24)、JTAG仿真接口(25)、HPI主机接口(26)和外部扩展接口(27)；数据处理芯片(22)分别设置有通信接口(21)、JTAG仿真接口(25)、HPI主机接口(26)和外部扩展接口(27)；数据处理芯片(22)分别连接有闪存存储器(23)和随机存储器(24)。
4.基于权利要求1、2、3所述系统的动物声音情绪识别方法，其特征在于: ①声音数据模板库和模型的建立对收集到的国内外开放的动物情绪声音数据，进行端点检测提取出梅尔-频率倒谱系数、共振峰和过零率三个特征参数，对提取的特征参数建立高斯混合模型，训练出动物情感声音的高斯混合模型，并建立动物情感声音数据模板库； ②情绪识别将采集到的声音信号通过抗混叠滤波、模数变换、分帧和预加重预处理以及端点检测，提取出梅尔-频率倒谱系数、共振峰和过零率三个特征参数后，对其进行特征组合，与搭建好的动物情绪声音的声学模型进行匹配得出后验概率，最后经过概率比较得到识别结果并输出； ③模型自增强当所采集的情绪声音信号与某种情绪声音模型匹配所得到的后验概率大于设定的阈值，将该声音数据和匹配结果更新到已建好的动物情绪声音数据模板库，不断训练声学模型，实现1?型的自增强，提闻动物声首情绪的识别率。
5.按权利要求4所述的动物声音情绪识别方法，其特征在于步骤②情绪识别: A、系统初始化(30)I ； B、采集动物声音信号(302)； C、对采集到的声音信号进行抗混叠滤波、模数变换、分帧和预加重预处理(403); D、进行端点检测(304)； E、提取出梅尔-频率倒谱系数、共振峰和过零率三个特征参数(304)； F、与建立好的声音情绪模型相匹配，得到每个模型下对应的后验概率(306)； G、比较每个模型下的后验概率，选取最大后验概率所对应的情绪模型，即为所得的识别结果(307)； H、将该后验概率与预设的概率阈值进行比较(308)，判断后验概率是否大于设定阈值，是则进入步骤I ;否则，进入步骤J ; 1、将该声音数据连同识别结果通过无线传输网络传送回服务器端进行模型自增强(309)，然后进行步骤J ; J、通过音频输出装置语音输出识别结果(310)，再进入步骤B ; 循环执行。
6.按权利要求4所述的动物声音情绪识别方法，其特征在于步骤③模型自增强: a、接收由无线传输装置(30)传输声音数据(401); b、将接收的声音数据保存到早先建立好的声音数据模板库中(402)； C、对更新后的声音数据模板库中的数据进行进行抗混叠滤波、模数变换、分帧和预加重预处理以及端点检测(403)； d、从更新后的模板库声音数据中提取出梅尔-频率倒谱系数、共振峰和过零率三个特征参数，并按照权重对其进行特征组合(404)； e、对提取出来的特征向量建立高斯混合模型，更新原有模型参数(405); f、将更新后的模型参数传输数据处理装置(20)并存储(406 )。
【专利摘要】本发明公开了一种动物声音情绪识别系统及其方法，涉及语音识别技术。本系统包括音频处理装置（10）、数据处理装置（20）、无线传输装置（30）和电源（40）；音处理装置（10）、数据处理装置（20）和无线传输装置（30）依次连接；电源（40）分别与音频处理器（10）和数据处理装置（20）连接。本方法是：①声音数据模板库和模型的建立；②情绪识别；③模型自增强。本发明适用于动物园、农林部门和野生动物保护部门对动物生活习性的及时掌控以及保护策略的制订；还适用于日常家居方便人与宠物之间的互动交流。
【IPC分类】G10L15-02, G10L25-63, G10L15-06, G10L25-03
【公开号】CN104700829
【申请号】CN201510143593
【发明人】杨春勇, 侯金, 陈少平, 苏家仪, 刘恒
【申请人】中南民族大学
【公开日】2015年6月10日
【申请日】2015年3月30日

完整全部详细技术资料下载

当前第2页1 2