本发明涉及一种模型训练层adaboost算法的参数优化方法。从应用场景的角度讲,属于音频事件识别技术领域;从技术实现的角度来讲,亦属于计算机科学与音频处理技术领域。
背景技术:
音频事件识别技术是基于音频数据的内容,识别音频流中的事件声音段落。音频事件识别技术在有广泛的应用,可用于异常场景的监控,如无人车行驶环境下的异常声音事件,公共场所异常骚乱情况等。随着数字多媒体技术的快速发展,以及多终端移动设备的普及应用,音频数据的数量正以指数形式进行增长,音频事件识别技术的应用价值越来越显著。
近年来,研究者们针对不同的应用场景提出了多种多样的音频事件识别算法。音频事件识别系统的模块数量、识别流程程度都在变得复杂,各模块的关键参数数量也不断增加,传统的网格法参数寻优耗时多、需要人工介入、并且结果易陷入局部最优解,甚至有多参的高分辨率优化无法实施等问题。因此,迫切需要针对音频事件识别系统的参数优化问题进行研究,提出更快速、有效并且方便地实现识别系统参数的整体优化。
目前关于音频事件识别的参数优化研究较少,尚处于起步阶段,将不同的参数优化算法引入音频事件识别技术领域,对于减少参数优化耗时、提高准确率、完善音频事件识别的理论体系,为其他领域提供基础技术,有较高的实用和理论价值。
技术实现要素:
本发明的目的是:针对音频事件识别系统模型训练层算法参数的优化问题,提出了一种模型训练层adaboost算法的参数优化方法,缓解模型训练阶段网格法寻优耗时严重的问题。
本发明的设计原理如图1所示,具体为:首先,提取音频训练样本底层特征,生成特征向量;然后,使用模拟退火算法进行adaboost模型的参数优化;最后使用优化后参数生成音频事件识别模型。本发明可以提高系统的参数优化速度,得到较好的识别结果。
本发明的技术方案是通过如下步骤实现的:
步骤1,采集并生成音频事件训练样本,完成数据的预处理,具体实现方法为:
步骤1.1,采集多段音频,将音频中的某一特定事件标记为正样本,音频中其余事件标记为负样本;
步骤1.2,提取音频样本特征向量;
步骤1.3,将n个音频片段中的l个正样本片段记为yi=1,m负样本片段记为yi=0,l+m=n。
步骤2,使用adaboost算法训练音频事件识别模型,具体方法如下:
步骤2.1,初始化权重
步骤2.2,对第t次训练(t为总训练次数,且t=1,2,…,t),归一化权重:
步骤2.3,对每一维特征j,训练弱分类器hj,计算其样本集的分类错误率:
步骤2.4,选取分类率et最小的分类器ht,放入强分类器列表;
步骤2.5,更新样本权重:
其中,i=1,2,…,n,
步骤2.6,重复步骤2.2至步骤2.5共t次。
步骤3,对adaboost参数进行优化,具体方法如下:
步骤3.1,在步骤2中随机设定一个迭代次数t0,将步骤2输出结果的准确度记为f(t0)=a,使用t0和a作为模拟退火算法的初始值,步骤2中的数据操作函数f作为目标函数;
步骤3.2,运行模拟退火算法;
步骤3.3,记录模拟退火算法结果tbest,并将此值作为adaboost的迭代次数。
有益效果
相比于常用的网格法进行参数优化,本发明提出的基于模拟退火的音频事件识别模型参数优化方法,通过随机搜索方式对参数寻优路径进行调整,缓解了模型训练阶段网格法寻优耗时严重的问题。
本发明所提方法,对模型训练层adaboost算法参数进行优化,逼近迭代次数的最优解。在保持优秀的识别效果的同时,极大地缩短了参数优化时间,进而提高模型训练的效率。
附图说明
图1为本发明提出的训练层adaboost算法的参数优化方法原理图;
具体实施方式
为了更好的说明本发明的目的和优点,下面结合实例对本发明方法的实施方式做进一步详细说明。
训练数据选择枪声音频数据。枪声为正样本,时长约2h。包含了各种不同类型的枪声,如机关枪声、手枪声等。样本时长分布在小于1s、1-5s和5-10s三个范围。非枪声为负样本,包含各种各种语言人声、动物叫声,不同地区音乐等等,尽可能多的包含除枪声外的各种声音,总时长约2h。其中,样本时长分布较广,最短时长小于1s,最长时长约30s。
以下测试的实验环境均为同一台计算机,其配置为:四核2.9ghzcpu,8.0gb内存,windows7操作系统。
第一环节
本环节使用数据源为原始数据源。详细训练数据的生成过程。具体实施步骤如下:
步骤1.1,选取有枪声的音频段,标记为正样本,其他音频段标记为负样本;
步骤1.2,提取音频样本特征向量;
步骤1.3,根据特征向量提取的音频片段,标记正样本yi=1及个数l=3600,标记负样本yi=0及个数m=3600,总音频片段数n=7200。
第二环节
本环节使用数据源为上一环节获得的数据源。详细说明adaboost算法计算过程。具体实施步骤如下:
步骤2.1,初始化权重
步骤2.2,对第t次训练(t为总训练次数,且t=1,2,…,t),归一化权重;
步骤2.3,对每一维特征j,训练弱分类器hj,计算其样本集的分类错误率ej;
步骤2.4,选取分类率et最小的分类器ht,放入强分类器列表;
步骤2.5,更新样本权重
步骤2.6,重复步骤2.2至步骤2.5共t次。
第三环节
本环节使用数据源为第一环节获得的数据源。并使用第二环节计算过程作为参数优化目标函数。具体实施步骤如下:
步骤3.1,随机设定一个迭代次数t0,使用第二环节输出结果的准确度记为f(t0)=a,使用t0和a作为模拟退火算法的初始值,步骤2中的数据操作函数f作为目标函数;
步骤3.2,运行模拟退火算法;
步骤3.3,记录模拟退火算法结果tbest,并将此值作为adaboost的迭代次数。
本发明首先是针对音频事件识别研究的不断深入,算法架构日趋复杂,各个模块的关键参数逐渐增多,显著增加了系统整体参数寻优的难度和耗时的问题,其次针对音频事件识别系统模型训练层算法参数的优化问题,提出了一种模型训练层adaboost算法的参数优化方法。通过音频事件识别模型训练实验证明,本方法可以对音频中特定事件的识别模型的训练参数进行优化,结果会逼近最优参数,而不会因为人为设定造成准确率的下降。本方法在优化adaboost训练模型参数的操作上简单高效,易于推广,极具使用价值。