基于哭声识别的遗漏孩童检测方法

文档序号:10614129阅读:222来源:国知局
基于哭声识别的遗漏孩童检测方法
【专利摘要】本发明涉及一种校车上的遗留孩童检测方法,采用音量初检和声音内容复核的双层检测模式,实现遗漏孩童的可靠检测。首先采用短时能量特征检测校车内是否存在音量大的声音,如果存在,则认为可能存在遗漏孩童;然后结合梅尔倒谱系数特征和支持向量机分类器进行声音内容复核,确认是否存在孩童的哭喊声和尖叫声,可靠检测校车上是否存在遗漏孩童。
【专利说明】
基于哭声识别的遗漏孩童检测方法
技术领域
[0001] 本发明涉及一种遗漏孩童检测方法,属于安防监控技术领域。
【背景技术】
[0002] 校车上遗漏孩童非常危险,极易造成孩童死亡事故。为了提高校车运营的安全性, 保障孩童安全,除了对相关责任人和乘车孩童进行经常性的安全教育和监督检查之外,还 需要从技术上提高遗漏孩童的发现和预警能力。专利"车内滞留乘员状态识别及险态控制 系统"(编号:CN201510779628.0,2015)通过压力传感器检测座位上是否存在有乘客遗留, 对检测乘客遗留有一定效用,但对于检测遗漏孩童作用不大,因为这种检测方法无法区分 人和物,也无法检测走廊或其他未安装传感器区域的遗留孩童,漏检现象严重。基于声音检 测孩童哭声的研究目前进展明显,如文献"婴儿监护系统中哭声检测模块设计与实现"(数 字技术与应用,2014)设计了一种婴儿哭声的检测装置,可以依据声音的频率检测哭声,但 对于检测遗漏孩童效果并不理想,一是因为遗漏孩童发现危险时除了哭喊之外还可能尖 口Η,二是该装置的灵敏度也不高。

【发明内容】

[0003] 本发明特提出一种可靠的遗漏孩童检测方法。
[0004] 本发明所要解决的技术问题在于提供一种校车上的遗留孩童检测方法,首先采用 短时能量特征检测校车内是否存在音量大的声音,如果存在,则认为可能存在遗漏孩童;然 后结合梅尔倒谱系数特征和支持向量机分类器进行声音内容复核,确认是否存在孩童的哭 喊声和尖叫声,可靠检测校车上是否存在遗漏孩童。
[0005] 采用声音信号的短时能量特征初步检测校车内是否存在可疑的大音量,避免漏 警;采用梅尔倒谱系数和支持向量机对声音内容进行复核,降低虚警,最终提高依据音频信 号检测遗漏孩童的可靠性,可广泛用于校车安全领域。
[0006] 为实现上述发明目的,本发明采用下述的技术方案,流程图如图1所示: 1、基于短时能量的音量初检 当校车停止之后,由于车窗封闭,车内声音一般很小。如果存在遗漏孩童,孩童发现危 险之后的哭声和尖叫声都比较大。基于该思路,本发明首先依据拾音器采集的音量大小来 初步检测是否存在遗漏孩童。这里需要说明的是,在本发明中音频数据按帧输入,采样频率 为8KHz,每256个采样点为一帧,帧与帧之间不重叠。音量初检步骤为: Stepl:快速傅里叶变换 设AM)表示第?帧第/2个采样点的音频信号,该信号是纯净声音和噪声的线性组合, 为了滤除噪声,需要在频域进行平滑处理。故先对乃(《)进行快速傅里叶变换,得到幅度谱 KA),k表示频率索引。
[0007] Step2:平滑功率谱计算 第t帧声音信号的平滑功率谱可以表示为
其中,^为平滑系数,在本发明中,取'=〇. 5。(幻表示第t-ι帧的平滑功率谱,初始 平滑功率谱界认)置为0。
[0008] Step3:傅里叶反变换 对引h进行傅里叶反变换,得到滤波后的音频信号Λ^1。
[0009] Step4:短时能量计算 第t帧的短时能量鸟可以表示为
Step5:音量初检 如果爲大于阈值T,则认为可能存在遗漏孩童,进入声音内容复核阶段。否则,继续进 行音量初检。考虑到系统刚启动(也即车门刚关闭)的一小段时间内车内是无声的(因为此 时校车上的人都没走远,如果有声则可以引起其他人的注意,解救遗漏孩童),在本发明中, 取系统启动后前50帧短时能量的平均值作为阈值T的值。
[0010] 2、基于梅尔倒谱系数和支持向量机的声音内容复核 单纯依靠音量检测遗漏孩童一般不存在漏警,但虚警率很高。为降低虚警率,本发明在 音量初检发现可疑目标之后,再采用声音识别方法分析声音内容,辨别声音中是否存在哭 喊声、尖叫声,这两类声音是遗漏孩童发现危险之后通常采用的求救方式。具体步骤为: Stepl:求取对数能量谱 对第t帧音频信号的幅度谱K (幻取对数,得到对数能量谱& 〇t)。
[0011] Step2:计算梅尔倒谱系数 梅尔倒谱系数(MFCC)的计算公式为:
其中,?(?)表示第t帧的第η个梅尔倒谱系数,K表示梅尔(Mel)滤波器组的个数。在本 发明中,K取24。舍弃直流成分,本发明取n=l,2,. . .,12。
[0012] Step3:SVM 分类 将12个梅尔倒谱系数作为特征,输入支持向量机(SVM)分类器进行分类,如果分类结果 为1,则认为存在遗漏孩童,此时启动报警装置,将警情信息发送给校车负责人和上级监管 部门,提醒相关人员及时救援。SVM分类器需要事先训练得到,本发明的训练方法是:挑选 100段包含孩童哭喊、尖叫的声音片段作为正样本,以及1000段其他声音片段作为负样本, 提取各类样本的梅尔倒谱系数特征,选择径向基函数作为核函数,用Matlab提供的SVM工具 包进行训练,得到SVM分类器。
[0013] 本发明的优点在于:采用音量初检和声音内容复核的双层检测模式,实现遗漏孩 童的可靠检测。
【附图说明】
[0014] 图1遗留孩童检测流程图。
【具体实施方式】
[0015] -种校车上的遗留孩童检测方法,首先采用短时能量特征检测校车内是否存在音 量大的声音,如果存在,则认为可能存在遗漏孩童;然后结合梅尔倒谱系数特征和支持向量 机分类器进行声音内容复核,确认是否存在孩童的哭喊声和尖叫声,可靠检测校车上是否 存在遗漏孩童。
[0016] 采用声音信号的短时能量特征初步检测校车内是否存在可疑的大音量,避免漏 警;采用梅尔倒谱系数和支持向量机对声音内容进行复核,降低虚警,最终提高依据音频信 号检测遗漏孩童的可靠性,可广泛用于校车安全领域。
【主权项】
1.基于哭声识别的遗留孩童检测方法,其特征在于,首先采用短时能量特征检测校车 内是否存在音量大的声音,如果存在,则认为可能存在遗漏孩童;然后结合梅尔倒谱系数特 征和支持向量机分类器进行声音内容复核,确认是否存在孩童的哭喊声和尖叫声,检测校 车上是否存在遗漏孩童; 流程如下: (1 )、基于短时能量的音量初检 首先依据拾音器采集的音量大小来初步检测是否存在遗漏孩童,在本发明中音频数据 按帖输入,采样频率为SIfflz,每256个采样点为一帖,帖与帖之间不重叠,音量初检步骤为: Stepl:快速傅里叶变换 设Λ(.Η)表示第t帖第η个采样点的音频信号,该信号是纯净声音和噪声的线性组合, 为滤除噪声,需要在频域进行平滑处理,先对Λ?>)进行快速傅里叶变换,得到幅度谱早片,k 表示频率索引; Step2:平滑功率谱计算 第t帖声音信号的平滑功率谱表示为其中,0'为平滑系数,在本发明中,取心=〇.5,巧_1(巧表示第t-1帖的平滑功率谱,初始平 滑功率谱巧耻)置为0; Step3:傅里叶反变换 对巧(巧进行傅里叶反变换,得到滤波后的音频信号泉拆); Step4:短时能量计算 第t帖的短时能量驾,可W表示为steps:音量初检 如果驾大于阔值T,则认为可能存在遗漏孩童,进入声音内容复核阶段,否则,继续进行 音量初检;在本发明中,取系统启动后前50帖短时能量的平均值作为阔值T的值; (2)、基于梅尔倒谱系数和支持向量机的声音内容复核 单纯依靠音量检测遗漏孩童一般不存在漏警,但虚警率很高,为降低虚警率,在音量初 检发现可疑目标之后,再采用声音识别方法分析声音内容,辨别声音中是否存在哭喊声、尖 叫声,具体步骤为: Step2.1:求取对数能量谱 对第t帖音频信号的幅度谱化)取对数,得到对数能量谱S (巧; Step2.2:计算梅尔倒谱系数 梅尔倒谱系数(MFCC)的计算公式为:其中,?(?)表示第t帖的第η个梅尔倒谱系数,K表示梅尔(Mel)滤波器组的个数,在本 发明中,K取24,舍弃直流成分,本发明取n=l,2,. . .,12; Step2.3: SVM 分类 将12个梅尔倒谱系数作为特征,输入支持向量机SVM分类器进行分类,如果分类结果为 1,则认为存在遗漏孩童,此时启动报警装置,将警情信息发送给校车负责人和上级监管部 Π ,提醒相关人员及时救援。2.根据权利要求1所述的基于哭声识别的遗留孩童检测方法,其特征在于,SVM分类器 需要事先训练得到,本发明的训练方法是:挑选100段包含孩童哭喊、尖叫的声音片段作为 正样本,W及1000段其他声音片段作为负样本,提取各类样本的梅尔倒谱系数特征,选择径 向基函数作为核函数进行训练,得到SVM分类器。
【文档编号】G10L25/51GK105976831SQ201610314228
【公开日】2016年9月28日
【申请日】2016年5月13日
【发明人】谢剑斌, 刘通, 李沛秦, 闫玮
【申请人】中国人民解放军国防科学技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1