麦克风控制系统及方法

文档序号:7757840阅读:319来源:国知局
专利名称:麦克风控制系统及方法
技术领域
本发明涉及一种麦克风控制系统及方法。
背景技术
麦克风是一种将声音转换成电子信号的能量转换器,其基本原理为当麦克风的声音振膜经过声音的震动以后,将声音震动转变成电子信号,电子信号经过扩大器放大,再送到喇叭就成为原来的声音。目前,麦克风在使用过程中没有结合影像侦测技术,无法自动侦测使用者的面部及口部位置,并按使用者身高自行调整至最佳收音位置及角度,使用者只能在使用前自行动手调整麦克风的高度与角度位置。然而,大部分的活动流程中总会有多位致词者或表演者,即使活动前已请专业音效师事先设置好麦克风位置,却往往因为每位致词者或表演者的身高不尽相同而导致收音效果不一样。若每位致词者在致词前皆重新调整麦克风高度与角度位置,除了会影响演说情绪及表演质量,也可能导致活动时间拖延而不易管控,另外使用者自行调整后的麦克风收音与扩音效果也不能够达到最佳效果。

发明内容
鉴于以上内容,有必要提出一种有必要提供一种麦克风控制系统及方法,能够自动调整麦克风高度及与用户的距离,将麦克风调整至最佳收音位置。一种麦克风控制系统,包括麦克风、时间飞行(Time of Flight,T0F)摄像机、制动单元、存储器及处理器。麦克风与制动单元相连接,TOF摄像机、制动单元及存储器分别与处理器相连接。TOF摄像机持续拍摄麦克风前方场景得到场景影像,处理器对场景影像进行分析侦测3D人脸区域,根据存储器预先储存的当麦克风调整到最佳的收音位置时,3D人脸区域在场景影像中所占第一比例、确定3D人脸区域口部位置的第二比例及3D人脸中口部位置在场景影像中的位置信息,控制制动单元自动调整麦克风与用户的距离及麦克风的高度,将麦克风调整到最佳的收音位置,达到最好的收音效果。一种麦克风控制方法,该方法包括以下步骤(a)利用TOF摄像机拍摄麦克风前方的场景,得到场景影像;(b)利用处理器将当前场景影像中各点到镜头的距离转换为像素值储存至当前场景影像的特征矩阵;(c)利用处理器将当前场景影像的特征矩阵中各点的像素值与三维人脸模板中相应特征点的像素值的容许范围进行比较,判断当前场景影像是否存在某一区域、该区域有满足第一预设数目的特征点的像素值落入三维人脸模板中相应特征点的像素值的容许范围,以侦测该场景影像中的三维人脸区域从场景影像中侦测三维人脸区域;(d)利用处理器判断三维人脸区域在场景影像中所占比例是否等于第一预设比例,若不等于第一预设比例,则执行步骤(e)后返回步骤(a),若等于第一预设比例,则执行步骤(f) ; (e)利用处理器下达第一控制指令至制动单元以调整麦克风与用户的距离;(f) 利用处理器根据第二预设比例在三维人脸区域中确定用户的口部位置;及(g)利用处理器判断口部位置是否在场景影像中的预设位置,当口部位置在场景影像中的预设位置时,结束流程,当口部位置不在场景影像中的预设位置时,下达第二控制指令至制动单元以调整麦克风的高度并返回步骤(a)。 相较于现有技术,本发明所提供的麦克风控制系统及方法能够根据使用者面部及口部位置自动调整麦克风的高度及用户的距离,将麦克风调整至最佳收音位置,使得麦克风能够撷取到使用者最清晰的声音。使用者无需以手动方式调整麦克风位置,不仅能够更精确掌控活动流程与时间,也可以让麦克风实时达到最佳的收音效果。


图1是本发明麦克风控制系统较佳实施例的硬件架构图。
图2是图1中麦克风控制系统的两种工作模式示意图。
图3是图1中处理器及存储器的功能模块图。
图4是本发明麦克风控制方法较佳实施例的流程图。
图5是图4中步骤S32的具体流程图。
图6及图7是图1中TOF摄像机拍摄麦克风前方的场景得到的两张场景
图8及图9是判断场景影像用户口部位置的示意图。
图10是图1中麦克风控制系统安装在麦克风支架上的示意图。
主要元件符号说明
权利要求
1.一种麦克风控制系统,其特征在于,该系统包括TOF摄像机,用户拍摄麦克风前方的场景影像,该TOF摄像机用于得到场景影像中被拍摄物体各点与TOF摄像机的镜头之间的距离信息;存储器,用于储存三维人脸影像及判断麦克风的位置是否需要调整的预设标准,该预设标准包括当麦克风处于预设的收音位置时,TOF摄像机拍摄得到的场景影像中三维人脸区域在场景影像中所占的第一比例,用于确定三维人脸中口部位置的第二比例,以及口部位置在场景影像中的预设位置;及与存储器及TOF摄像机相连接的处理器,该处理器包括三维人脸模板建立模块,用于根据存储器储存的三维人脸影像中各点与镜头之间的距离信息建立三维人脸模板,以用于储存三维人脸影像中各特征点的像素值的容许范围;影像信息处理模块,用于获取TOF摄像机拍摄的当前场景影像,将当前场景影像中各点到镜头的距离转换为像素值储存至当前场景影像的特征矩阵;三维人脸识别模块,用于将当前场景影像的特征矩阵中各点的像素值与三维人脸模板中相应特征点的像素值的容许范围进行比较,判断当前场景影像是否存在某一区域、该区域有满足第一预设数目的特征点的像素值落入三维人脸模板中相应特征点的像素值的容许范围,以侦测该场景影像中的三维人脸区域;控制模块,用于当三维人脸区域在场景影像中所占比例不等于第一预设比例时,下达第一控制指令至制动单元,以调整麦克风与用户的距离;三维人脸识别模块,还用于根据第二预设比例在三维人脸区域中确定口部位置;及控制模块,还用于当口部位置不在当前场景影像中的预设位置时,下达第二控制指令至制动单元,以调整麦克风的高度。
2.如权利要求1所述的麦克风控制系统,其特征在于,该系统还包括控制器,该控制器包括自动按钮及设定按钮,用于供用户启用麦克风控制系统的自动模式或重新设置模式。
3.如权利要求2所述的麦克风控制系统,其特征在于,当用户启用自动模式,所述预设标准为麦克风控制系统的出厂预设值,当用户启用重新设置模式,所述预设标准为当用户将脸部移动至麦克风前方的收音位置时,处理器分析TOF摄像机拍摄的包括用户脸部的场景影像计算得到并暂存在存储器的预设标准。
4.如权利要求3所述的麦克风控制系统,其特征在于,当用户结束重新设置模式启用自动模式时,处理器清空存储器暂存的预设标准。
5.如权利要求1所述的麦克风控制系统,其特征在于,该系统安装在一个麦克风支架上,并且所述麦克风及TOF摄像机位于同一水平位置。
6.一种麦克风控制方法,其特征在于,该方法包括(a)利用TOF摄像机拍摄麦克风前方的场景,得到场景影像;(b)利用处理器将当前场景影像中各点到镜头的距离转换为像素值储存至当前场景影像的特征矩阵;(c)利用处理器将当前场景影像的特征矩阵中各点的像素值与三维人脸模板中相应特征点的像素值的容许范围进行比较,判断当前场景影像是否存在某一区域、该区域有满足第一预设数目的特征点的像素值落入三维人脸模板中相应特征点的像素值的容许范围,以侦测该场景影像中的三维人脸区域;(d)利用处理器判断三维人脸区域在场景影像中所占比例是否等于第一预设比例,若不等于第一预设比例,则执行步骤(e)后返回步骤(a),若等于第一预设比例,则执行步骤 (f);(e)利用处理器下达第一控制指令至制动单元以调整麦克风与用户的距离;(f)利用处理器根据第二预设比例在三维人脸区域中确定用户的口部位置;及(g)利用处理器判断口部位置是否在场景影像中的预设位置,当口部位置在场景影像中的预设位置时,结束流程,当口部位置不在场景影像中的预设位置时,下达第二控制指令至制动单元以调整麦克风的高度并返回步骤(a)。
7.如权利要求6所述的麦克风控制方法,其特征在于,所述麦克风控制方法应用于自动模式或重新设置模式。
8.如权利要求6所述的麦克风控制方法,其特征在于,当用户启用自动模式,所述预设标准为出厂预设值,当用户启用重新设置模式,所述预设标准为当用户将脸部移动至麦克风前方的收音位置时,处理器分析TOF摄像机拍摄的包括用户脸部的场景影像计算得到并暂存在存储器的预设标准。
9.如权利要求7所述的麦克风控制方法,其特征在于,当用户结束重新设置模式启用自动模式时,处理器清空存储器暂存的预设标准。
10.如权利要求6所述的麦克风控制方法,其特征在于,所述麦克风及TOF摄像机安装在麦克风支架上的同一水平位置。
全文摘要
本发明提供一种麦克风控制系统及方法。该麦克风控制系统包括麦克风、时间飞行(Time of Flight,TOF)摄像机、制动单元、存储器及处理器。麦克风与制动单元相连接,TOF摄像机、制动单元及存储器分别与处理器相连接。TOF摄像机持续拍摄麦克风前方场景得到场景影像。处理器对场景影像进行分析侦测3D人脸区域,根据存储器预先储存的当麦克风调整到最佳的收音位置时,3D人脸区域在场景影像中所占第一比例、确定3D人脸区域口部位置的第二比例及3D人脸中口部位置在场景影像中的位置信息,控制制动单元自动调整麦克风与用户的距离及麦克风的高度,将麦克风调整到最佳的收音位置,达到最好的收音效果。
文档编号H04N5/232GK102378097SQ201010262470
公开日2012年3月14日 申请日期2010年8月25日 优先权日2010年8月25日
发明者李后贤, 李章荣, 罗治平 申请人:鸿富锦精密工业(深圳)有限公司, 鸿海精密工业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1