一种基于麦克风阵列的摄像头引导装置及引导方法

文档序号：7821817阅读：781来源：国知局

一种基于麦克风阵列的摄像头引导装置及引导方法
【专利摘要】本发明涉及基于麦克风阵列的摄像头引导装置及引导方法，该引导装置包括带有控制云台的摄像头、麦克风阵列和多通道声音信号同步采集处理系统，多通道声音信号同步处理系统包括调理电路、Codec芯片、DSP芯片和485接口，调理电路用于对麦克风采集的模拟信号进行调理，Codec芯片用于将模拟信号转换为数字信号并将数字信号送入DSP芯片中，DSP芯片用于根据所接收到的数字信号进行突发声信号检测以及突发声信号测向，并将测向结果通过485接口传送给摄像头的控制云台，从而调整摄像头的视角以对准目标进行拍摄。该引导装置具有自适应性，应用范围广，能避免摄像头没有目的的转动；同时，方向的估计精度和系统的鲁棒性高。
【专利说明】一种基于麦克风阵列的摄像头引导装置及引导方法

【技术领域】
[0001] 本发明属于监控【技术领域】，涉及一种利用麦克风阵列对突发声源进行检测及测向，并引导摄像头捕捉该突发声源的装置及方法。

【背景技术】
[0002] 目前，视频监控是监控领域中的一个重要手段，已经得到广泛应用。然而，摄像头有盲区，一般摄像头的视角为52°，监控范围有限，可转动的摄像头通常是有规律的旋转或由人工控制，很难及时捕捉到突发事件，如公共场所的骚乱、居民小区车辆偷窃报警、交通事故等。如果这些事件没有在摄像头的监控区域，传统的视频监控系统就无能为力了。
[0003] 众所周知，人可以通过耳朵对突发事件的声音进行定位，进而及时调整视角。借鉴人的感知机理，可以为摄像头装上"耳朵"，这个"耳朵"就是麦克风阵列。利用麦克风阵列对突发事件的声音进行检测及测向，并引导摄像头，实现对突发事件的音视频实时监控。
[0004] 目前利用麦克风阵列对声源进行定位，进而引导摄像头对准声源已有多个专利。美国专利US 6, 826, 284 B1中利用6个麦克风组成立体阵列，通过时间延迟测向算法 (TDOA)对声源进行定位，从而引导摄像头指向声源。中国专利CN10156798B披露了基于麦克风阵列声音智导的智能视频导播方法，其首先对关键区域进行拍摄参数设置，将示例保存在训练集中，然后利用麦克风阵列对声源进行定位，并将定位结果与训练集中的示例进行比对计算，最后引导摄像头按给定参数进行拍摄。中国实用新型专利CN203151672U披露了一种声源定位功能的视频系统，其在自己搭建的硬件系统上实现了声源定位并控制云台上的摄像头对准声源。
[0005] 但是，以上这些专利中共同的缺点是：1.没有声音检测模块，如果不加入声音检测模块则摄像头并不能有的放矢的对准突发事件，且整个系统容易受外界噪声干扰；2.以上专利中利用的都是TDOA类声源定位方法，该类方法要求传声器间隔较大，因此导致整个装置体积庞大，在实际中难以实用；并且该类测向算法属于时域处理方法，而不同场景下的声音信号的频率范围是不同的，该类方法没有对声音频率进行选择。

【发明内容】

[0006] 本发明针对上述现有技术的不足，提出了一种利用麦克风阵列引导摄像头捕捉突发声源的装置及方法，其中使用了噪声谱估计技术和宽带信号波达方向估计技术，因此具有自适应性，应用范围广，能避免摄像头没有目的的转动；同时，方向的估计精度和系统的鲁棒性高。
[0007] 为了实现上述目的，本发明提供如下技术方案：一种基于麦克风阵列的摄像头引导装置，其包括带有控制云台的摄像头、由多个麦克风组成的围绕所述摄像头设置的麦克风阵列和多通道声音信号同步采集处理系统，其中，所述多个麦克风通过音频线连接到所述多通道声音信号同步采集处理系统从而将多通道麦克风信号输送到所述多通道声音信号同步采集处理系统中，所述多通道声音信号同步处理系统包括调理电路、Codec芯片、DSP 芯片和485接口，其中，所述调理电路用于对所述多个麦克风采集的模拟信号进行调理，所述Codec芯片用于将经所述调理电路调理过的模拟信号转换为数字信号并将所述数字信号送入所述DSP芯片中，所述DSP芯片用于根据所接收到的数字信号进行突发声信号检测以及突发声信号测向，并将测向结果通过所述485接口传送给所述摄像头的控制云台，从而调整所述摄像头的视角以对准目标进行拍摄。
[0008] 此外，本发明还提供一种采用上述基于麦克风阵列的摄像头引导装置的摄像头引导方法，其包括以下步骤：第一步：启动所述摄像头引导装置，通过所述Codec芯片将所述多个麦克风采集到的模拟信号转换为数字信号，并将所述数字信号送入所述DSP芯片；第二步：由所述DSP芯片根据其中一个麦克风接收到的信号自适应地估计环境噪声能量；第三步：由所述DSP芯片计算该麦克风接收到的信号的能量和所述环境噪声能量的比值，根据该比值判断是否有突发声信号出现，如果有转入第四步；如果没有则转入第二步，继续根据麦克风接收到的信号自适应地估计环境噪声能量；第四步：由所述DSP芯片根据第三步的突发声检测结果，截取出所述多个麦克风中有突发声的信号段；第五步：由所述DSP芯片将所述第四步中截取的麦克风的信号分别进行快速傅里叶变换，变成多个窄带信号，根据不同的应用场景和突发声信号的特点，选取合适的频带利用宽带波达方向估计算法估计目标的方位角和俯仰角；第六步：由所述DSP芯片将所述方位角和俯仰角通过所述485接口发送给所述摄像头的控制云台，所述控制云台根据该方位角和俯仰角调整所述摄像头的视角进行拍摄。
[0009] 进一步地，其中，所述第二步中，假设某个麦克风接收到的信号为x(t)，则根据该麦克风接收到的信号自适应地估计环境噪声能量p n(t)用公式可以表示为

【权利要求】
1. 一种基于麦克风阵列的摄像头引导装置，其包括带有控制云台的摄像头（I)、由多个麦克风组成的围绕所述摄像头（1)设置的麦克风阵列（2)和多通道声音信号同步采集处理系统（3)，其中，所述多个麦克风通过音频线连接到所述多通道声音信号同步采集处理系统（3)从而将多通道麦克风信号输送到所述多通道声音信号同步采集处理系统（3)中，所述多通道声音信号同步处理系统包括调理电路、Codec芯片、DSP芯片和485接口，其中，所述调理电路用于对所述多个麦克风采集的模拟信号进行调理，所述Codec芯片用于将经所述调理电路调理过的模拟信号转换为数字信号并将所述数字信号送入所述DSP芯片中，所述DSP芯片用于根据所接收到的数字信号进行突发声信号检测以及突发声信号测向，并将测向结果通过所述485接口传送给所述摄像头（1)的控制云台，从而调整所述摄像头（1) 的视角以对准目标进行拍摄。
2. -种采用权利要求1所述的基于麦克风阵列的摄像头引导装置的摄像头引导方法，其包括以下步骤：第一步：启动所述摄像头引导装置，通过所述Codec芯片将所述多个麦克风采集到的模拟信号转换为数字信号，并将所述数字信号送入所述DSP芯片；第二步：由所述DSP芯片根据其中一个麦克风接收到的信号自适应地估计环境噪声能量；第三步：由所述DSP芯片计算该麦克风接收到的信号的能量和所述环境噪声能量的比值，根据该比值判断是否有突发声信号出现，如果有转入第四步；如果没有则转入第二步，继续根据麦克风接收到的信号自适应地估计环境噪声能量；第四步：由所述DSP芯片根据第三步的突发声检测结果，截取出所述多个麦克风中有突发声的信号段；第五步：由所述DSP芯片将所述第四步中截取的麦克风的信号分别进行快速傅里叶变换，变成多个窄带信号，根据不同的应用场景和突发声信号的特点，选取合适的频带利用宽带波达方向估计算法估计目标的方位角和俯仰角；第六步：由所述DSP芯片将所述方位角和俯仰角通过所述485接口发送给所述摄像头的控制云台，所述控制云台根据该方位角和俯仰角调整所述摄像头的视角进行拍摄。
3. 如权利要求2所述的摄像头引导方法，其中，所述第二步中，假设某个麦克风接收到的信号为X(t)，则根据该麦克风接收到的信号自适应地估计环境噪声能量Pn (t)用公式可以表示为
其中，4和fH为麦克风接收到的信号的最低频率和最高频率，Pn(t，f)是麦克风接收到的信号在频率f处的能量，Pn(t-1，f)是麦克风接收到的信号在前一时刻频率f处的能量， X(t，f)是麦克风接收到的信号的傅里叶变换，α⑴是平滑系数。
4. 如权利要求3所述的摄像头引导方法，其中，所述第三步中，该麦克风接收到的信号的能量为乃(0= 则该麦克风接收到的信号的能量和环境噪声能量的比值 f~fhy SNR=Ps (t)/Pn(t)，当SNR>Th时，检测到突发声信号；当SNR<Th时，没有检测到突发声信号，其中Th为检测阈值。
5. 如权利要求4所述的摄像头引导方法，其中，所述第五步中，所述宽带波达方向估计算法选用频域波束形成算法，频域波束形成算法通过对接收信号做傅里叶变换，将不同麦克风之间的时间延迟转换为各个频带上的相位差，然后在每个频带上应用波束形成算法获得该频带上的角度估计，最后将这些频带上的角度估计结果取平均获得目标信号的角度估计。
6. 如权利要求5所述的摄像头引导方法，其中，具体地，假定所述麦克风阵列接收到的信号为xn(t)，n= 1，2，...，N，其中N为麦克风阵列中麦克风的个数，首先对接收到的信号做快速傅里叶变换，得到信号在各个频带上的表示Xn(f)，将N个麦克风的信号表不成列向量的形式 x(f) = [XJfhx2(f)，···，XN(f)]T 其中[·]τ表示向量转置变换，根据向量X(f)获得阵列信号在频带f处的协方差矩阵R(f)，用公式可以表示为 R(f) =E[X(f)X(f)H] 其中Ε[·]为取均值运算，利用协方差矩阵R(f)就可以获得宽带波束形成算法的代价函数艮供）
其中Θ和卩分别为目标信号的俯仰角和方
位角，a(/,<9,供)为麦克风阵列的导向矢量其中为目标信号到第η个麦克风和第1个麦克风之间的时间延迟，该延迟可以根据麦克风陈列的形状和位置确定，最后通过对代价函数的搜索就可以获得目标信号的俯仰角和方位角，用公式可以表示为
【文档编号】H04N5/232GK104469154SQ201410726856
【公开日】2015年3月25日申请日期:2014年12月5日优先权日:2014年12月5日
【发明者】蔡盛盛申请人:合肥国科声拓信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡盛盛;
技术所有人：合肥国科声拓信息技术有限公司;
我是此专利的发明人

上一篇：改进的滑动窗口模幂计算方法
上一篇：用于消除耳机插拔杂音的音频处理电路及线控耳的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。