专利名称:拾音设备和方法
技术领域:
本发明涉及当例如两个远距离会议室内的多个与会者通过使用多个麦克风召开音频电话会议或通过进一步增加视频而召开声音+电视会议时优选使用的拾音设备和方法。
具体地,本发明涉及用于改进回声消除处理缺陷的拾音设备及方法,其中,当在用一个回声消除器对多个麦克风执行回声消除的拾音设备内切换麦克风时立即将回声消除器的内部处理切换到对新麦克风的内部处理时,产生所述回声消除处理缺陷。
背景技术:
具有拾音设备或具有增加图像的拾音设备的电视会议系统已经用于使远距离的两个会议室内的与会者能召开会议。
在拾音设备中,选择麦克风,这里,该麦克风由在使用多个麦克风的多个讲话者中其声音应该传送给另一方会议室的讲话者使用。
在此拾音设备中,为多个麦克风设置一个回声消除器。尽管回声消除器通常有可能以高速进行处理,但由于回声消除器由昂贵的数字信号处理器(DSP)来实现,因此,用一个回声消除器来执行多个麦克风的回声消除处理。
回声消除器通过对来自所选麦克风的声音执行学习处理而执行回声消除。从而,在回声消除器中,保存用于每个麦克风的回声消除的学习数据。
当一个回声消除器执行多个麦克风的回声消除处理时,进而,当执行从第一麦克风到第二麦克风的切换时,如果立即将回声消除器内的学习数据切换到用于第二麦克风的学习数据,就发生以下情况用第一麦克风的学习数据对来自第二麦克风的声音执行回声消除处理。
这是因为在回声消除器中通过学习处理获得的用于每个麦克风的学习数据基于经过预定时间持续获得的声音数据。
发明内容
本发明的目的是提供拾音设备及方法,以防止在用一个回声消除器对多个麦克风执行回声消除处理的拾音设备中当从第一麦克风切换到第二麦克风时的错误回声消除处理。
根据本发明的第一方面,提供一种拾音设备,包括基于预定条件而布置的多个麦克风;麦克风选择器,所述麦克风选择器检测多个麦克风的拾音信号,并选择在检测的拾音信号中已经检测到有效拾音信号的麦克风;对所选麦克风的声音信号执行回声消除处理的回声消除处理器;以及回声消除处理控制器,当切换麦克风的声音信号时,该控制器在预定时期停止回声消除处理。
优选地,当通过选择新麦克风的拾音信号而输出声音信号时,麦克风选择器交叉渐变先前所选麦克风的声音信号和新麦克风的声音信号,并且,回声消除处理控制器在交叉渐变期间停止回声消除处理。
根据本发明的第二方面,提供一种拾音方法,包括麦克风选择步骤,所述麦克风选择步骤检测基于预定条件而布置的多个麦克风的拾音信号,并选择在检测的拾音信号中已经检测到有效拾音信号的麦克风;对所选麦克风的声音信号执行回声消除处理的回声消除处理步骤;以及回声消除处理控制步骤,当在麦克风选择步骤中切换麦克风的声音信号时,所述回声消除处理控制步骤在预定时期停止回声消除处理。
根据本发明,通过在选择(改变)麦克风时停止回声消除处理而可以避免不自然的回声消除处理。
从以下结合附图对优选实施例的描述中,本发明这些和其它的目的和特征将变得更加清楚,在附图中
图1A示意性地示出作为应用本发明拾音设备的例子的会议系统,图1B为图1A拾音设备的放置状态的视图,而图1C为放置在桌子上的拾音设备和与会者的布置图;图2为本发明实施例的拾音设备的透视图;图3为图2所示拾音设备内部的剖视图;图4为图3所示拾音设备中上罩被取下的麦克风电子电路壳体的平面图;图5示出第一实施例的麦克风电子电路壳体的主要电路的连接配置,并示出第一数字信号处理器(DSP1)和第二数字信号处理器(DSP2)的连接配置;图6为图4所示麦克风的特性的视图;图7A-7D示出具有图6所示特性的麦克风的指向性分析结果;图8为本发明拾音设备的修改例的部分配置的视图;图9示意性示出第一数字信号处理器(DSP1)中处理的总体内容;图10为本发明拾音设备中滤波处理的视图;图11为图10处理结果的频率特性的视图;图12为本发明的带通滤波处理和电平转换处理的框图;图13为图12所示处理的流程图;图14为示出在本发明实施例的拾音设备中用于判断讲话开始和结束的处理的图形;图15示出在本发明实施例的拾音设备中正常处理的流程;图16为在本发明实施例的拾音设备中正常处理的流程的流程图;图17为示出在本发明实施例的拾音设备中麦克风切换处理的框图;图18为示出在本发明第二实施例的拾音设备中麦克风切换处理的方法的框图;图19为示出在图5所示拾音设备的配置中第二DSP(EC)的配置的拾音设备部分视图,其中,所述拾音设备作为本发明第二实施例的拾音设备;图20为简要示出图19所示拾音设备内的第一DSP中的麦克风选择处理和回声消除处理的框图;图21示出回声消除处理的操作定时的实例。
具体实施例方式
以下结合附图描述本发明的优选实施例。
第一实施例以下解释本发明实施例的拾音设备。
图1A-1C为示出应用本发明实施例的拾音设备的实例的配置图。
如图1A所示,在两个会议室901和902内布置拾音设备10A和10B。这些拾音设备10A和10B通过通信线路920如电话线而连接。
通常,通过通信线路920,在一个扬声器和另一个之间,即一对一地执行会谈,但是在本发明实施例的通信设备中,在会议室901和902内的多个与会者可通过使用一个通信线路920而互相交谈。应指出,在本实施例中,为了避免音频拥塞,同时(同一时段)讲话的与会者被限制为每侧一个。
如上所述,拾音设备选择(识别)主叫方,并拾取所选主叫方的音频。
拾取的音频和成像的视频传输到另一侧的会议室,并且在另一侧的拾音设备中播放。
通信设备的细节结合图2-图4解释根据本发明实施例的拾音设备内的通信设备的配置。第一拾音设备10A和第二拾音设备10B相似。
图2为根据本发明实施例的拾音设备的透视图。
图3为图2所示拾音设备的剖视图。
图4为图2和3所示拾音设备的麦克风电子电路壳体的平面图,并且是沿图3中线X-X的平面图。
如图2所示,拾音设备具有上罩11、声反射板12、耦合部件13、扬声器壳体14和操作单元15。
如图3所示,扬声器壳体14具有声反射表面14a、底面14b和上部声音输出孔14c。接收和再现扬声器16装在由声反射表面14a和底面14b围成的空间即内腔14d内。声反射板12位于扬声器壳体14上方。扬声器壳体14和声反射板12通过耦合部件13而连接。约束部件17穿过耦合部件13。约束部件17约束扬声器壳体14的底面14b的约束部件底部固定部分14e与声反射板12的约束部件固定部分12b之间的空间。应指出,约束部件17只穿过扬声器壳体14的约束部件通道14f。约束部件17穿过约束部件通道14f并且不约束它的理由是扬声器壳体14随着扬声器16的操作而振动,并且在上部声音输出孔14c周围不限制扬声器壳体14的振动。
另一会议室的讲话者的讲话穿过接收和再现扬声器16以及上部声音输出孔14c,并沿着由声反射板12的声反射表面12a与扬声器壳体14的声反射表面14a确定的空间,向绕着轴C-C的全部360°方向散播。如图所示,声反射板12的声反射表面12a的横截面描绘出宽松的喇叭型弧。声反射表面12a的横截面在绕着轴C-C的360°(全部方向)上形成图示的截面形状。相似地,如图所示,扬声器壳体14的声反射表面14a的横截面描绘出宽松的凸面形状。声反射表面14a的横截面在绕着轴C-C的360°(全部方向)上形成图示的截面形状。
从接收和再现扬声器16输出的声音S穿过上部声音输出孔14c,穿过由声反射表面12a和声反射表面14a确定的并且具有喇叭型横截面的声音输出空间,在绕着轴C-C的全部360°方向上沿着放置拾音设备的桌子911的表面散播,并且,所有与会者A1-A6听到相同的音量。在本实施例中,桌子911的表面用作声音传播装置的一部分。
从接收和再现扬声器16输出的声音S的散播状态由箭头表示。
声反射板12支撑印刷电路板21。
如图4中平面所示,印刷电路板21安装麦克风电子电路壳体2的麦克风MC1-MC6、发光二极管LED 1-6、微处理器23、编解码器24、第一数字信号处理器(DSP)25、第二数字信号处理器(DSP)26、A/D转换器部件27、D/A转换器部件28、放大器部件29、以及其它各种类型的电子电路。声反射板12还作为用于支撑麦克风电子电路壳体2的部件。
印刷电路板21具有连接到其上的减振器18,用于吸收来自接收和再现扬声器16的振动,以防止来自接收和再现扬声器16的振动通过声反射板12传递、进入麦克风MC1-MC6等中、并变为噪音。每个减振器18都由螺钉和插入在螺钉与印刷电路板21之间的缓冲材料如振动吸收橡胶组成。缓冲材料由螺钉紧固到印刷电路板21上。即,从接收和再现扬声器16传递到印刷电路板21的振动由缓冲材料吸收。因此,麦克风MC1-MC6受扬声器16声音的影响不大。
麦克风的布置如图4所示,从印刷电路板21的中心轴C以相同角度和相同间隔(以60度间隔)径向布置6个麦克风MC1-MC6。每个麦克风是具有单一指向性的麦克风。其特性在后面解释。
每个麦克风MC1-MC6都由具有挠性或弹性的第一麦克风支撑部件22a和第二麦克风支撑部件22b支撑,从而它可自由地摇动(为简化图解,只示出麦克风MC1的第一麦克风支撑部件22a和第二麦克风支撑部件22b)。除了借助使用以上缓冲材料的减振器18来防止接收和再现扬声器16的振动影响的措施以外,通过具有挠性或弹性的第一麦克风支撑部件22a和第二麦克风支撑部件22b来吸收印刷电路板21的振动,防止接收和再现扬声器16的振动的影响,以避免接收和再现扬声器16的噪音,其中,印刷电路板21因接收和再现扬声器16的振动而振动。
如图3所示,接收和再现扬声器16的方向与麦克风MC1-MC6布置平面的中心轴C-C(在本实施例中(方向)向上)垂直。通过接收和再现扬声器16与6个麦克风MC1-MC6的此布置,接收和再现扬声器16与麦克风MC1-MC6之间的距离变得相等,并且,接收和再现扬声器16的音频以几乎相同的音量和相同的相位到达麦克风MC1-MC6。然而,因声反射板12的声反射表面12a和扬声器壳体14的声反射表面14a的配置,而防止接收和再现扬声器16的声音直接输入到麦克风MC1-MC6中。另外,如以上所解释地,通过使用采用缓冲材料的减振器18以及具有挠性或弹性的第一麦克风支撑部件22a和第二麦克风支撑部件22b,减小接收和再现扬声器16的振动的影响。
如图1C所示地,与会者A1-A6通常在以60°间隔布置的麦克风MC1-MC6附近在通信设备的360°方向上以几乎相等的间隔定位。
作为通知确定讲话者的装置(麦克风选择结果显示装置),在麦克风MC1-MC6附近布置发光二极管LED1-LED6。发光二极管LED1-LED6必须设置得即使在装上罩11的状态下也能从所有与会者A1-A6观看到。相应地,上罩11设置有透明窗,从而,可看到发光二极管LED1-LED6的发光状态。自然地,也可在上罩11中在发光二极管LED1-LED6的部位上设置开孔,但从防止灰尘进入麦克风电子电路壳体2的观点出发,优选透明窗。
为了执行在后面解释的各种信号处理,印刷电路板21设置第一数字信号处理器(DSP1)25和第二数字信号处理器(DSP)26,并且,在除布置麦克风MC1-MC6的部位以外的空间中布置各种电子电路27-29。
在本实施例中,DSP 25用作与各种电子电路27-29一起执行诸如滤波处理和麦克风选择处理的处理的信号处理装置,并且,DSP 26用作回声消除器。
图5为微处理器23、编解码器24、DSP 25、DSP 26、A/D转换器部件27、D/A转换器部件28、放大器部件29、以及其它各种类型电子电路的示意性配置的视图。
微处理器23执行用于麦克风电子电路壳体2的总体控制的处理。
编解码器24对将要传输给另一方会议室的音频进行压缩和编码。
DSP 25执行在后面解释的各种信号处理,如滤波处理和麦克风选择处理。
DSP 26用作回声消除器。
在图5中,对于A/D转换器部件27的实例,以四个A/D转换器271-274为例子进行说明;对于D/A转换器部件28的实例,以两个D/A转换器281和282为例子进行说明;对于放大器部件29的实例,以两个放大器291和292为例子进行说明。
另外,作为麦克风电子电路壳体2,在印刷电路板21上安装各种电路,如电源电路。
在图4中,在相对于印刷电路板21的中心轴C对称(或相对)的位置上在直线上布置麦克风对MC1-MC4、MC2-MC5和MC3-MC6,这些麦克风对向A/D转换器271-273输入两个通道的模拟信号,其中,A/D转换器271-273将模拟信号转换为数字信号。在本实施例中,一个A/D转换器将两个通道的模拟输入信号转换为数字信号。从而,位于跨过中心轴C的直线上的两个(一对)麦克风如麦克风MC1和MC4的检测信号输入到一个A/D转换器中,并转换为数字信号。进一步地,在本实施例中,为了识别其音频传输给另一方会议室的讲话者,查询位于一根直线上的两个麦克风的音频差异、音频的大小等。从而,当位于一根直线上的两个麦克风的信号输入到同一A/D转换器中时,转换定时变得几乎相同。从而有以下优点当发现两个麦克风的音频输出差异时定时误差较小;信号处理变得容易;等等。
应指出,A/D转换器271-274也可配置为具有可变增益型放大功能的A/D转换器271-274。
在A/D转换器271-273转换的麦克风MC1-MC6的拾音信号输入到DSP 25中,在DSP 25中执行后面解释的各种信号处理。
对于DSP 25的处理结果之一,选择麦克风MC1-MC6之一的结果输出给发光二极管LED1-LED6,其中,发光二极管LED1-LED6是麦克风选择结果显示装置的一个实例。
DSP 25的处理结果输出给DSP 26,在DSP 26中执行回声消除处理。DSP 26例如具有回声消除发送器和回声消除接收器。
DSP 26的处理结果在D/A转换器281和282中转换为模拟信号。根据需要,D/A转换器281的输出在编解码器24上编码,通过放大器291输出给电话线920(图1A)的线路输出端,并通过布置在另一方会议室内的通信设备的接收和再现扬声器16而输出为声音。
布置在另一方会议室内的通信设备的音频通过电话线920(图1A)的线路输入端而输入,在A/D转换器274中转换为数字信号,并输入到DSP 26,在其中用于回声消除处理。进一步地,来自布置在另一方会议室内的通信设备的音频通过未示出的路径施加于扬声器16,并输出为声音。
D/A转换器282的输出作为通信设备的接收和再现扬声器16的声音而通过放大器292输出。即,除了从以上解释的接收和再现扬声器16听到另一方会议室内所选讲话者的音频之外,与会者A1-A6也可通过接收和再现扬声器16听到会议室内讲话方发出的音频。
麦克风MC1-MC6图6为示出麦克风MC1-MC6的指向性的图形。
如图6所示,在每个单一指向性的麦克风中,频率特性和电平特性随着音频从讲话者到麦克风的到达角而不同。多根曲线表示当拾音信号的频率为100Hz、150Hz、200Hz、300Hz、400Hz、500Hz、700Hz、1000Hz、1500Hz、2000Hz、3000Hz、4000Hz、5000Hz和7000Hz时的指向性。应指出,为了简化图解,图6示出150Hz、500Hz、1500Hz、3000Hz和7000Hz时的指向性,作为代表性实例。
图7A-7D为示出对声源位置和麦克风的拾音电平的分析结果的图形,并且,作为分析的实例,图7A-7D示出通过将扬声器定位得距通信设备预定距离,如1.5米的距离,并以恒定时间间隔对麦克风所拾取的音频应用快速傅里叶变换(FFT)而获得的结果。X轴代表频率,Y轴代表信号电平,Z轴代表时间。
当使用具有图6所示指向性的麦克风时,在麦克风的前面显示出强的指向性。在本实施例中,通过较好地利用此特性,DSP 25执行麦克风的选择处理。
当麦克风没有象本发明实施例中那样的指向性时,通过使用没有指向性的麦克风,麦克风周围所有的声音都被拾取,从而,混合讲话者音频与周围噪音的S/N,因此,较好的声音不能拾取得太多。为了避免此现象,在本发明中,通过用一个指向性麦克风来拾取声音,增强具有周围噪音的S/N。
进一步地,对于获得麦克风指向性的方法,可以使用麦克风阵列,该阵列使用多个没有指向性的麦克风。然而,对于此方法,为了匹配多个信号的时间轴(相位),需要复杂的处理,从而,占用较长时间,响应较低,并且,硬件配置变复杂。即,对DSP的信号处理系统还要求复杂信号处理。本发明通过使用具有图6所示指向性的麦克风来解决此问题。
进一步地,组合麦克风阵列信号以将所述麦克风用作指向性拾音麦克风有以下缺点外形受通过频率特性的限制,并且,外形变大。本发明也解决此问题。
具有以上配置的拾音设备具有以下优点。
(1)偶数个麦克风MC1-MC6以相同角度和相同间隔径向布置,偶数个麦克风与接收和再现扬声器16之间的位置关系是恒定的,并进一步地,它们的距离非常接近,从而,从接收和再现扬声器16发出的直接返回的声音电平比从接收和再现扬声器16发出的穿过会议室(房间)环境并返回到麦克风MC1-MC6的声音电平大很多并占有压倒性优势。因此,声音从扬声器16到达麦克风MC1-MC6的特性(信号电平(强度)、频率特性(f特性)、以及相位)总是相同。也就是说,本发明实施例中的拾音设备具有传输功能总是相同的优点。
(2)从而,优点是当因讲话者改变而切换发送给另一方会议室的麦克风输出时,传输功能不改变,并且,无论何时切换麦克风都不必调整麦克风系统的增益。换句话说,优点是一旦在制造通信设备时执行了调整,就不必再次进行调整。
(3)即使因与以上相同原因而在改变讲话者时切换麦克风,单个回声消除器(DSP)26也足够。DSP比较昂贵。进一步地,不必在具有很少空置空间的印刷电路板21上布置多个DSP,因为在印刷电路板21上安装各种元件。另外,用于在印刷电路板21上布置DSP的空间可以较小。结果,印刷电路板21,进而本发明的通信设备,可制作得较小。
(4)如以上解释地,由于接收和再现扬声器16与麦克风MC1-MC6之间的传输功能是恒定的,因此,优点例如为只用通信设备的麦克风单元就可执行麦克风灵敏度差异+3dB的调整。灵敏度差异调整的详细情况在后面解释。
(5)通过使用圆桌或多边形桌作为其上安装拾音设备的桌子,有可能实现通过通信设备1中的一个接收和再现扬声器16均匀地分散(散射)音频的扬声器系统,其中,所述音频在绕着轴C的全部360°方向上具有相同的音质。
(6)优点为从接收和再现扬声器16输出的声音通过圆桌的桌面传播(边界效应),并且,优质声音有效地、均匀地且高效率地到达与会者,对立侧的声音和相位在会议室的天花板方向被消除并且变小,在与会者处几乎没有天花板方向的反射声,结果,清晰的声音分配给与会者。
(7)从接收和再现扬声器16输出的声音以相同音量同时到达以相同角度和相同间隔径向布置的麦克风MC1-MC6,从而,判断声音是讲话者音频还是所接收音频变容易。结果,减少麦克风选择处理中的错误判断。其细节在后面解释。
(8)通过以相同角度和相同间隔径向布置偶数个如6个麦克风,从而在直线上布置一对相向的麦克风,容易执行用于检测方向的电平比较。
(9)借助减振器18、麦克风支撑部件22等,可减少因接收和再现扬声器16的声音而引起的振动对麦克风MC1-MC6的拾音的影响。
(10)如图3所示,在结构上,接收和再现扬声器16的声音不直接传播给麦克风MC1-MC6。相应地,在拾音设备中,几乎没有接收和再现扬声器16的噪音的影响。
修改例在结合图2-图3解释的拾音设备中,在更低的部位上布置接收和再现扬声器16,并且,在更高的部位上布置麦克风MC1-MC6(以及相关的电子电路),但还有可能在垂直方向上颠倒接收和再现扬声器16与麦克风MC1-MC6(以及相关的电子电路)的位置,如图8所示。即使在此情况下,也显示出以上效果。
麦克风的数量不局限于6个。可绕着轴C以相同角度和相同间隔径向布置任意数量如4个或8个麦克风,从而,在直线上(在相同方向上)布置多对,例如,与麦克风MC1和MC4相同。在直线上互相面对地布置两个麦克风如MC1和MC4作为优选实施例是为了选择麦克风和识别讲话者。
信号处理的内容以下解释主要由第一数字信号处理器(DSP)25执行的处理的内容。
图9示意性地示出在拾音设备10A中由DSP 25执行的处理。以下给出简单解释。
(1)环境噪音的测量对于初始操作,优选地,测量布置拾音设备的环境的噪音。
拾音设备可用于各种环境中(会议室)。为了实现麦克风的正确选择并提高拾音设备的性能,在本发明中,在初始阶段中,测量布置拾音设备的周围环境的噪音,以便能从在麦克风拾取的信号消除此噪音的影响。
自然地,当在相同会议室内重复使用拾音设备时,由于事先测量了噪音,因此,当噪音状态没有变化时可省略此处理。应指出,也可在正常状态下测量噪音。
(2)主席的选择例如,当使用拾音设备进行双向会议时,如果有主持会议室进程的主席是有利的。相应地,对于本发明的一个方面,在使用拾音设备的初始阶段中,从拾音设备的操作单元15设定主席。作为设定主席的方法,例如,位于操作单元15附近的第一麦克风MC1用作主席的麦克风。自然地,主席的麦克风可以是任何麦克风。
应指出,当重复使用拾音设备的主席相同时,可省略此处理。可替换地,也可事先确定主席所坐位置的麦克风。在此情况下,不需要每次都选择主席的操作。
自然地,主席的选择不局限于初始状态,并且可在任何时候执行。
(3)麦克风灵敏度差异的调整对于初始操作,优选自动调整放大单元的增益或渐变单元的渐变值,其中,放大单元用于放大麦克风MC1-MC6的信号,从而,接收和再现扬声器16与麦克风MC1-MC6之间的声耦合变得相等。
作为常规处理,执行以下举例说明的各种处理。
(1)用于麦克风选择和切换的处理当在一个会议室内多个与会者同时讲话时,音频被混合,并且另一方会议室内的与会者A1-A6难以理解此音频。从而,在本发明中,原则上,在一定的时间间隔内只允许一个人讲话。为此,DSP 25执行用于选择和切换麦克风的处理。
结果,只有所选麦克风的讲话通过电话线920传输到另一方会议室的通信设备1,并从扬声器输出。自然地,如结合图5所解释地,开启所选讲话者的麦克风附近的LED。也可从该房间的通信设备1的扬声器听到所选讲话者的音频,从而,可识别谁是允许的讲话者。
此处理的目的是选择面向讲话者的单一指向性麦克风的信号,并且向另一方发送具有良好S/N的信号,作为传输信号。
(2)显示所选的麦克风通过开启相应的麦克风选择结果显示装置,如发光二极管LED1-LED6,使得所有与会者A1-A6容易识别是否选择讲话者的麦克风以及哪个是允许发言的与会者的麦克风。
(3)信号处理作为以上麦克风选择处理的背景技术,或者为了正确地执行麦克风选择处理,执行以下举例说明的各种信号处理。
(a)用于麦克风的拾音信号的频带分离和电平转换的处理
(b)用于判断讲话开始和结束的处理用作开始判断的触发,所述判断用于选择面向讲话者方向的麦克风的信号(c)用于检测在讲话者方向上的麦克风的处理用于分析麦克风的拾音信号,并判断讲话者所用的麦克风(d)用于判断在讲话者方向上的麦克风的切换定时的处理,以及用于切换面向所检测讲话者的麦克风的信号选择的处理用于指示切换到从以上处理结果选择的麦克风(e)在正常操作时测量场地噪音场地(环境)噪音的测量此处理分为在开启拾音设备的电源之后立即进行的初始处理、以及正常处理。
应指出,在以下典型前提下执行处理。
(1)条件测量时间和暂定阈值1.测试音调声压根据麦克风信号电平为-40dB2.噪音测量单位时间10秒3.在正常状态下的噪音测量通过重复10次的10秒测量结果来计算平均值,以寻找作为噪声电平的平均值。
(2)依据在场地噪音与讲话开始基准电平之差的有效距离的标准值和阈值1.26dB或更大3米或更远开始讲话的检测电平阈值场地噪声电平+9dB结束讲话的检测电平阈值场地噪声电平+6dB2.20-26dB不超过3米开始讲话的检测电平阈值场地噪声电平+9dB结束讲话的检测电平阈值场地噪声电平+6dB3.14-20dB不超过1.5米开始讲话的检测电平阈值场地噪声电平+9dB结束讲话的检测电平阈值场地噪声电平+6dB
4.9-14dB不超过1米开始讲话的检测电平阈值场地噪声电平与讲话开始基准电平之差÷2+2dB结束讲话的检测电平阈值讲话开始阈值-3dB5.9dB或更小稍微困难点,几十厘米开始讲话的检测电平阈值-3dB6.场地噪声电平与讲话开始基准电平之差÷2结束讲话的检测电平阈值-3dB7.相同或负数不能判断,禁止选择(3)从获得开启电源时场地噪声电平+3dB时开始正常处理的噪声测量开始阈值。
通过滤波处理产生各种频率分量信号图10为示出使用由麦克风拾取的声音信号在DSP 25上执行的滤波处理的配置图,其中,该处理作为预处理。图10示出用于一个麦克风(通道(一个拾音信号))的处理。
在具有截止频率如100Hz的模拟低频截止滤波器101上处理麦克风的拾音信号,其中除去100Hz或更低频率的滤波声音信号输出给A/D转换器102,并且,在A/D转换器102上转换为数字信号的拾音信号在数字高频截止滤波器103a-103e(统称为103)上除去它们的高频分量(高频截止处理),所述滤波器103a-103e具有7.5kHz、4kHz、1.5kHz、600Hz和250Hz的截止频率。数字高频截止滤波器103a-103e的结果在减法器104a-104d(统称为104)中进一步减去相邻数字高频截止滤波器103a-103e的滤波信号。
在本发明的此实施例中,实际上通过DSP 25中的处理来实现数字高频截止滤波器103a-103e和减法器104a-104d。A/D转换器102可作为A/D转换器部件27的一部分来实现。
图11为示出结合图10解释的滤波处理结果的频率特性的视图。以此方式,从具有单一指向性的麦克风所拾取的信号产生具有各种频率分量的多个信号。
带通滤波处理和麦克风信号电平转换处理作为开始麦克风选择处理的一个触发,判断讲话的开始和结束。通过在DSP 25上执行的图12所示的带通滤波处理和电平转换处理而获得用于此目的的信号。图12只示出在麦克风MC1-MC6上拾取的输入信号的6个通道的处理的一个通道(CH)。对于麦克风的拾音信号的通道,DSP 25中的带通滤波处理和电平转换处理单元具有带通滤波器201a-201f(统称为“带通滤波器部件201”)和电平转换器202a-202g(统称为“电平转换器部件202”),其中,带通滤波器201a-201f具有100-600Hz、200-250Hz、250Hz-600Hz、600-1500Hz、1500-4000Hz以及4000-7500Hz的带通特性,并且,电平转换器202a-202g用于转换原始麦克风拾音信号和带通拾音信号的电平。
每个电平转换单元202a-202g具有信号绝对值处理单元203和峰值保持处理单元204。相应地,如波形图所示,当接收输入的由虚线表示的负信号时,信号绝对值处理单元203反转符号,将负信号转换为正信号。峰值保持处理单元204保持信号绝对值处理单元203的输出信号的最大值。应指出,在本实施例中,随着时间的消逝,保持的最大值下降一点点。自然地,还有可能改进峰值保持处理单元204,以减小下降量,并且能长时间地保持最大值。
以下解释带通滤波器(BPF)。用于通信设备1中的带通滤波器例如只由麦克风信号输入阶段的二次IIR高频截止滤波器和低频截止滤波器组成。本实施例利用以下事实如果从具有扁平频率特性的信号减去通过高频截止滤波器的信号,余下的信号就变得与通过低频截止滤波器的信号基本等效。
为了匹配频率-电平特性,就需要全带通的带通滤波器的一个额外频带。通过频带数量以及带通滤波器的频带数量+1个滤波系数而获得需要的带通。此时需要的带通滤波器的带频为在以下麦克风信号每个通道(CH)中所示带通滤波器的以下6个频带BP特性 带通滤波器BPF1=[100Hz-250Hz].. 201b
BPF2=[250Hz-600Hz] ..201cBPF3=[600Hz-1.5kHz]..201dBPF4=[1.5kHz-4kHz] ..201eBPF5=[4kHz-7.5kHz] ..201fBPF6=[100Hz-600Hz] ..201a在此方法中,DSP 25中IIR滤波器的计算程序仅为6CH(通道)×5(IIR滤波器)=30。将此与常规带通滤波器的配置进行比较。
在本发明的实施例中,通过输入阶段的模拟滤波器来实现100Hz低频截止滤波处理。准备的二次IIR高频截止滤波器有五个截止频率250Hz、600Hz、1.5kHz、4kHz和7.5kHz。在它们之中具有7.5kHz截止频率的高频截止滤波器实际上具有16kHz的采样频率,因此是不必要的,但是有意旋转缩小数量的相位,以便在相减处理的步骤中减少带通滤波器输出电平因IIR滤波器相位旋转而减小的现象。
图13为在DSP 25中通过图12所示配置执行的处理的流程图。
在图13所示DSP 25上的滤波处理中,执行高通滤波处理,作为处理的第一阶段,同时,执行从高通滤波处理的第一阶段的结果进行相减的处理,作为处理的第二阶段。图11为信号处理结果的镜频特性的视图。在以下解释中,[x]表示在图11中的每个处理情形。
第一阶段[1]对于全带通滤波器,输入信号通过7.5kHz高频截止滤波器。此滤波器输出信号通过输入的模拟低频截止匹配而变为[100Hz-7.5kHz]的带通滤波器输出。
输入信号通过4kHz高频截止滤波器。此滤波器输出信号通过与输入模拟低频截止滤波器结合而变为[100Hz-4kHz]的带通滤波器输出。
输入信号通过1.5kHz高频截止滤波器。此滤波器输出信号通过与输入模拟低频截止滤波器结合而变为[100Hz-1.5kHz]的带通滤波器输出。
输入信号通过600Hz高频截止滤波器。此滤波器输出信号通过与输入模拟低频截止滤波器结合而变为[100Hz-600Hz]的带通滤波器输出。
输入信号通过250Hz高频截止滤波器。此滤波器输出信号通过与输入模拟低频截止滤波器结合而变为[100Hz-250Hz]的带通滤波器输出。
第二阶段[1]当带通滤波器(BPF5=[4kHz-7.5kHz])执行滤波器输出[1]-[2]([100Hz-7.5kHz]-[100Hz-4kHz])的处理时,获得以上信号输出[4kHz-7.5kHz]。
当带通滤波器(BPF4=[1.5kHz-4kHz])执行滤波器输出[2]-[3]([100Hz-4kHz]-[100Hz-1.5kHz])的处理时,获得以上信号输出[1.5kHz-4kHz]。
当带通滤波器(BPF3=[600Hz-1.5kHz])执行滤波器输出[3]-[4]([100Hz-1.5kHz]-[100Hz-600Hz])的处理时,获得以上信号输出[600Hz-1.5kHz]。
当带通滤波器(BPF2=[250Hz-600Hz])执行滤波器输出[4]-[5]([100Hz-600Hz]-[100Hz-250Hz])的处理时,获得以上信号输出[250Hz-600Hz]。
带通滤波器(BPF1=[100Hz-250Hz])将前述[5]的信号定义为输出信号[5]。
带通滤波器(BPF6=[100Hz-600Hz])将前述[4]的信号定义为以上[4]的输出信号。
通过DSP 25中的以上处理而获得所需带通滤波器输出。
如表1所示,麦克风的输入拾音信号MIC1-MIC6不断地更新为全频带的声压级和通过带通滤波器的6个频带的声压级。
表1.信号电平的转换结果
在表1中,例如,L1-1表示当麦克风MC1的拾音信号通过第一带通滤波器201a时的峰值电平。在判断讲话的开始和结束时,利用通过图12所示100Hz-600Hz带通滤波器201a并且在电平转换单元202b中经过声压级转换的麦克风拾音信号。
用于判断讲话开始和结束的处理如图14所示,基于从声压级检测单元输出的值,当麦克风拾音信号电平上升超过场地噪音并超过讲话开始电平的阈值时,第一数字信号处理器(DSP1)25判断讲话开始;当高于开始电平阈值的电平在此之后持续时,判断讲话正在进行;当电平下降到低于讲话结束的阈值时,判断有场地噪音;并且,当电平持续达讲话结束判断时间如0.5秒时,判断讲话结束。
讲话开始判断从通过100Hz-600Hz带通滤波器并且在图12所示麦克风信号电平转换处理单元202b中经过声压级转换的声压级数据(麦克风信号电平(1))变得比图14所示阈值电平大时,判断讲话开始。
DSP 25设计成在检测讲话开始之后,在讲话结束判断时间如0.5秒内不检测下一讲话的开始,以避免随着麦克风频繁切换而产生的误操作。
麦克风选择DSP 25检测相互通话系统中讲话者的方向,并基于所谓的“记分卡方法”而自动地选择面向讲话者的麦克风的信号。
图15为示出拾音设备的操作类型的视图。
图16为示出拾音设备的正常处理的流程图。
如图15所示,拾音设备根据麦克风MC1-MC6的拾音信号而执行用于监视声音信号的处理,判断讲话开始/结束,判断讲话方向,选择麦克风,并在麦克风选择结果显示装置30如发光二极管LED1-LED6上显示结果。
以下结合图16的流程图描述主要使用拾音设备中DSP 25的操作。应指出,通过微处理器23执行麦克风电子电路壳体2的总体控制,但描述集中在DSP 25的处理上。
步骤S1监视电平转换信号在麦克风MC1-MC6上拾取的信号在结合图11-图13尤其是结合图12解释的带通滤波器部件201和电平转换部件202中转换为七类电平数据,因此,DSP 25不断地监视麦克风拾音信号的七类信号。
基于监视结果,DSP 25转到讲话者方向检测处理或讲话开始/结束判断处理。
步骤S2用于判断讲话开始/结束的处理DSP 25通过结合图14,并进一步根据在下面详细解释的方法,而判断讲话的开始和结束。当检测讲话的开始时,DSP 25向步骤S3的讲话者方向判断处理通知检测到讲话的开始。
应指出,在步骤S2的用于判断讲话开始和结束的处理中,当语音电平变得比讲话结束电平更小时,启动讲话结束判断时间(如0.5秒)计时器。当在讲话结束判断过程中语音电平比讲话结束电平更小时,判断讲话已经结束。
当在讲话结束判断过程中语音电平变得比讲话结束电平更大时,进入等待处理,直到语音电平再次变得比讲话结束电平更小为止。
步骤S3用于检测讲话者方向的处理通过恒定地和连续地搜索讲话者方向,执行DSP 25中用于检测讲话者方向的处理。随后,数据提供给步骤S4的用于判断讲话者方向的处理。
步骤S4用于切换讲话者方向麦克风的处理当步骤S2的处理和步骤S3的处理的结果是此时讲话者检测方向与到目前为止选择的讲话者方向不同时,在DSP 25内用于切换讲话者方向麦克风的处理中用于判断定时的处理向步骤S4的用于切换麦克风信号的处理指示在新的讲话者方向上选择麦克风。
然而,当已经从操作单元15设定主席的麦克风并且主席的麦克风与其它与会者同时讲话时,向主席的讲话赋予优先级。
此时,在麦克风选择结果显示装置如发光二极管LED1-LED6上显示所选麦克风信息。
步骤S5麦克风拾音信号的传输用于切换麦克风信号的处理只发送由步骤S4的处理从6个麦克风中选择的麦克风信号,作为例如通过通信线路920从第一拾音设备10A向另一方的第二拾音设备10B的传输信号,从而,将该信号输出给图5所示通信线路920的线路输出端。
讲话开始的判断处理1比较与6个麦克风相应的声压级检测器的输出电平以及讲话开始电平的阈值。
当输出电平超过讲话开始电平的阈值时,判断讲话开始。当与所有麦克风相应的声压级检测器的输出电平超过讲话开始电平的阈值时,DSP 25判断该信号来自接收和再现扬声器16,并且不判断已经开始讲话。这是因为接收和再现扬声器16与所有麦克风MC1-MC6之间的距离相同,所以,来自接收和再现扬声器16的声音几乎相等地到达所有麦克风MC1-MC6。
处理2准备三组麦克风,并利用麦克风信号的电平差异,其中,所述三组麦克风每一组都包括通过以60°的相同角度和相同间隔径向布置图4所示6个麦克风而获得的两个单一指向性麦克风(麦克风MC1和MC4、麦克风MC2和MC5、以及麦克风MC3和MC6),每一组麦克风在相对方向上具有偏移180°的指向性轴。即,执行以下操作(麦克风1的信号电平-麦克风4的信号电平)的绝对值...[1](麦克风2的信号电平-麦克风5的信号电平)的绝对值...[2](麦克风3的信号电平-麦克风6的信号电平)的绝对值...[3]DSP 25比较以上绝对值[1]、[2]和[3]以及讲话开始电平的阈值,并当绝对值超过讲话开始电平的阈值时,判断讲话开始。
在此处理的情况下,与处理1(因为接收和再现扬声器16的声音相等地到达所有麦克风)不同,所有绝对值不会变得都比讲话开始电平的阈值更大,所以,不必判断声音是来自接收和再现扬声器16还是来自讲话者的音频。
用于检测讲话者方向的处理为了检测讲话者方向,利用在图6中举例说明的单一指向性麦克风的特性。在单一指向性麦克风中,如图6所例示的,频率特性和电平特性根据讲话者的音频到达麦克风的角度而改变。在图7A-7D中示出该结果。图7A-7D示出通过将扬声器布置得距拾音设备10A预定距离,如1.5米距离,对由麦克风以不变时间间隔拾取的音频应用快速傅里叶变换(FFT)的结果。X轴代表频率,Y轴代表信号电平,而Z轴代表时间。横向线代表带通滤波器的截止频率。夹在这些直线之间的频带的电平变为麦克风信号电平转换处理的数据,其中,所述麦克风信号通过带通滤波器的五个频带并转换为结合图10-图13解释的声压级。
以下描述根据本发明实施例的判断方法,该方法作为在拾音设备中用于检测讲话者方向的实际处理。
对于带通滤波器的每个频带的输出电平执行适当的加权处理(当在1dB全量程(1dBFs)步长中为0dBFs时为0,而当-3dBFs时为3,或者,反之亦然)。通过此加权步骤而确定处理的分辨力。
对每个采样时钟执行以上加权处理,对每个麦克风的加权分数进行相加,该结果对恒定的采样数取平均,并且,判断具有较小(大)总点数的麦克风信号为面向讲话者的麦克风。下表2以图像表示此结果。
表2.信号电平用点数表示的情形
在表2所示的实例中,第一麦克风MC1具有最小的总点数,因此,DSP 25判断在第一麦克风MC1的方向上有声源(有讲话者)。DSP 25以声源方向麦克风编号的形式保存该结果。
如以上解释,DSP 25对每个麦克风的频带的带通滤波器的输出电平进行加权,按从具有最小(最大)点数的麦克风信号开始的顺序对带通滤波器的频带的输出排序,并且判断对于三个或更多个频带具有第一次序的麦克风信号是来自面向讲话者的麦克风。接着,DSP 25准备与下表3中一样的记分卡,该卡表示在第一麦克风MC1方向上具有声源(有讲话者)。
表3.通过带通滤波器的信号以电平顺序排列的情形
实际上,根据房间特性,因声反射和驻波的影响,在所有带通滤波器的输出中,第一麦克风MC1的结果不总是在顶部,但是,如果在五个频带的大多数频带中处于第一级,就可判断在第一麦克风MC1方向上有声源(有讲话者)。DSP 25以声源方向麦克风编号的形式保存该结果。
DSP 25按下面所示形式对麦克风的带通滤波器的频带的输出电平数据求和,判断具有大电平的麦克风信号来自面向讲话者的麦克风,并且以声源方向麦克风编号的形式保存该结果。
MIC1电平=L1-1+L1-2+L1-1+L1-4+L1-5MIC2电平=L2-1+L2-2+L2-1+L2-4+L2-5MIC3电平=L3-1+L3-2+L3-1+L3-4+L3-5MIC4电平=L4-1+L4-2+L4-1+L4-4+L4-5MIC5电平=L5-1+L5-2+L5-1+L5-4+L5-5MIC6电平=L6-1+L6-2+L6-1+L6-4+L6-5用于判断讲话者方向麦克风的切换定时的处理当由图16的步骤S2的讲话开始判断结果激活并从步骤S3的讲话者方向的检测处理结果和以前的选择信息检测到新讲话者的麦克风时,DSP 25向步骤S5的用于麦克风信号切换选择的处理发出麦克风信号切换命令,向麦克风选择结果显示装置(发光二极管LED1-6)通知已切换讲话者麦克风,由此通知讲话者,拾音设备已经响应他的发言。
为了消除在具有较大回声的房间内声反射和驻波的影响,DSP 25禁止发出新的麦克风选择命令,除非在切换麦克风之后过了讲话结束判断时间(如0.5秒)。
根据图16的步骤S1的麦克风信号电平转换处理结果和本实施例中步骤S3的讲话者方向的检测处理结果准备两个麦克风选择切换定时。
第一方法当可清楚判断讲话开始时在所选麦克风方向上的讲话结束并在另一方向上有新的讲话的情形。
在此情况下,在所有麦克风信号电平(1)和麦克风信号电平(2)变为讲话结束阈值电平或更小之后经过讲话结束判断时间(如0.5秒)或更长时间之后,并且当任何一个麦克风信号电平(1)变为讲话开始阈值电平或更大时,DSP 25判定讲话开始,基于声源方向麦克风编号的信息而确定面向讲话者方向的麦克风是正当的拾音麦克风,并且,开始步骤S5的麦克风信号选择切换处理。
第二方法在继续讲话的过程中在另一方向上有新的更大声音讲话的情形在此情况下,在从讲话开始(当麦克风信号电平(1)变为讲话阈值电平或更大时)经过讲话结束判断时间(如0.5秒)或更长时间之后,DSP 25开始判断处理。
当从步骤S3的处理判断在检测讲话结束之前改变声源方向麦克风编号并且该编号是稳定的时,DSP 25判定有以比当前选择的在与声源方向麦克风编号相应的麦克风处的讲话者更大的声音讲话的讲话者,确定声源方向麦克风编号为正当的拾音麦克风,并且,激活步骤S5的麦克风信号选择切换处理。
用于面向所选讲话者的麦克风的信号的切换选择的处理通过由图16中步骤S4的讲话者方向麦克风的切换定时判断处理的命令有选择性判断的命令来激活DSP 25。
通过图17所示6个乘法器和6输入加法器而实现DSP 25的用于切换麦克风信号选择的处理。为了选择麦克风信号,DSP 25使连接将要选择的麦克风信号的乘法器的通道增益(CH增益)为[1]而使其它乘法器的CH增益为
,从而,加法器相加(麦克风信号×[1])的选择信号和(麦克风信号×
)的处理结果,并在输出端给出所希望的麦克风选择信号。
当如上所述通道增益切换到[1]或
时,由于所切换麦克风信号的电平差异,有可能产生微小静电干扰声。从而,在拾音设备中,如图18所示,在切换过渡时期,如在10毫秒的时期,CH增益从[1]到
和从
到[1]连续地变化,以便交叉,并由此避免因麦克风信号的电平差异而引起的微小静电干扰声。
进一步地,通过将最大通道增益设定为除[1]之外的值,如
,可调整后面DSP 25中的回声消除处理操作。
如以上解释地,本发明第一实施例的拾音设备可有效地应用于不受噪音影响的会议呼叫处理。
从结构方向考虑,本发明第一实施例的通信设备具有以下优点(1)在具有单一指向性的多个麦克风与接收和再现扬声器之间的位置关系是不变的,并且它们之间的距离非常接近,因而,从接收和再现扬声器输出的直接返回的电平比从接收和再现扬声器输出的穿过会议室(房间)环境并返回到多个麦克风的电平大很多并占有压倒性优势。因此,声音从接收和再现扬声器到达多个麦克风的特性(信号电平(强度)以及它的频率特性(f特性和相位)总是相同。也就是说,本发明的拾音设备具有传输功能总是相同的优点。
(2)从而,优点是当切换麦克风时,传输功能不改变,从而,无论何时切换麦克风都不必调整麦克风系统的增益。换句话说,优点是一旦在制造通信设备时执行调整,就不必再次进行调整。
(3)即使因与以上相同的原因而切换麦克风,数字信号处理器(DSP)所配置的回声消除器的数量也保持为一个。DSP比较昂贵,而且,在印刷电路板上用于布置DSP的空间可以保持较小,由于安装各种元件,印刷电路板几乎没有空置空间。
(4)接收和再现扬声器与多个麦克风之间的传输功能是恒定的,因此,优点为只用所述单元就可执行麦克风本身的灵敏度±3dB的调整。
(5)其上安装安装拾音设备的桌子变得有可能利用此设备作为扬声器系统,该系统通过通信设备中的一个接收和再现扬声器在全部方向上均匀地分散(散射)具有均匀质量的音频。
(6)从接收和再现扬声器输出的声音通过桌面传播(边界效应),并且,优质声音有效地、高效率地且均匀地到达与会者,对立侧声音在会议室的天花板方向的相位被消除并且变小声,从开花板方向到与会者几乎没有反射声,结果,清晰的声音分配给与会者。
(7)从接收和再现扬声器输出的声音以相同音量同时到达所有的多个麦克风,从而,判定声音是讲话者的音频还是所接收音频就变得容易。结果,减少麦克风选择处理中的错误判断。
(8)通过以相同角度和相同间隔径向布置偶数个麦克风,容易执行用于检测方向的电平比较。
(9)借助使用缓冲材料的减振器、具有挠性或弹性的麦克风支撑部件等,可减少因接收和再现扬声器的声音而引起的振动对麦克风的拾音的影响,其中,所述振动通过其上安装麦克风的印刷电路板而传递。
(10)接收和再现扬声器的声音不直接进入麦克风。相应地,在此通信设备中,几乎没有接收和再现扬声器的噪音的影响。
从信号处理观点出发,本发明第一实施例的通信设备具有以下优点(a)以相同间隔径向布置多个单一指向性麦克风,以便能检测声源方向,并且,麦克风信号切换到拾取具有良好S/N的声音和清晰声音,并将该声音发送给另一方。
(b)有可能从周围的讲话方拾取具有良好S/N的声音,自动地选择面向讲话者的麦克风。
(c)在本发明中,作为麦克风选择处理的方法,划分通过的音频带,并且比较在划分频带时的电平,以简化信号分析。
(d)实现本发明的麦克风信号切换处理,作为DSP的信号处理。多个信号全部交叉渐变,以防止在切换时发出微小静电干扰声。
(e)可向麦克风选择结果显示装置如发光二极管或向外部通知麦克风选择结果。
第二实施例结合图19-21描述本发明的第二实施例,其中,此描述关于回声消除处理的细节。
通过通信路径从另一方输入的声音从此侧拾音设备的扬声器16均匀地输出到所有方向(360°),并且,可被会议室内的与会者相同地听到,其中,此侧拾音设备已结合图2和3描述。
在另一侧,扬声器16的声音被此侧会议室内的墙壁、天花板等反射。所检测到的反射声和此侧与会者的声音重叠,成为多个如6个麦克风MC1-MC6的回声。进一步地,扬声器16的声音可直接进入麦克风MC1-MC6,和此侧与会者的声音重叠,成为回声,并且被麦克风MC1-MC6检测到。
如上所述,麦克风MC1-MC6检测的声音不仅包括此侧会议室内与会者的声音而且包括来自另一方拾音设备的声音。
从而,如果不从由麦克风检测的声音信号中除去回声信号,其中,所述声音信号由此侧的拾音设备检测,就向另一方拾音设备发送包括作为回声的由此侧拾音设备所选声音的声音,并且,听到的声音包括从此侧发送的声音以及从另一方拾音设备的扬声器输出的声音,其中,后一声音成为回声。因而,必需除去此回声。
图19为在图5所示拾音设备配置中示出第二DSP 26配置的拾音设备部分视图,其中,所述拾音设备作为本发明第二实施例的拾音设备。
第二DSP 26用作回声消除器,用于执行上述回声消除处理。
来自另一方的成为回声的此声音不被多个麦克风相同地检测到,因为麦克风的位置不同并且从墙壁、天花等的反射状态不同。从而,第二DSP 26为每个麦克风执行回声消除处理。从而,第二DSP 26称作回声消除器(EC)26。
在本实施例中,具体地,一个EC 26为多个如6个麦克风执行回声消除处理。
由于用一个容纳存储器的DSP来实现EC 26,因此,实际上,EC 26在DSP中执行程序处理。然而,在图19中,为方便或功能目的而示出内部配置,该配置由回声消除(EC)处理部分261、存储器(MEM)部分263以及EC中的控制处理(CNT)部分264组成。
EC处理部分261对由第一DSP 25检测的并输入到EC 26的麦克风声音信号执行回声消除处理,并且,处理后的信号经D/A转换器281和线路输出端发送给另一方的拾音设备,其中,第一DSP 25执行麦克风选择处理等。
存储器263存储用于EC处理部分261的数据。
EC中的控制处理部分264执行EC 26中的控制处理,例如具体为,EC处理部分261中与第一DSP 25协作的控制处理的定时控制。
图20为简要示出图19所示拾音设备内第一DSP 25中的麦克风选择处理以及EC 26中的回声消除处理的框图。
图20所示例证简化并举例说明在第一DSP 25中选择图4所示6个麦克风之中两个麦克风MCa和MCb中任一个的情形。以下简要描述第一DSP 25的处理。
两个麦克风MCa和MCb的输出经过图5所示A/D转换器27中的两个A/D转换器27a和27b而输入到第一DSP 25中,并且,在第一DSP 25内的峰值检测部分PDa和PDb上检测峰值。第一DSP 25中的麦克风选择处理部分25MS例如选择具有更高峰值的一个。作为从麦克风选择处理部分25MS的一个麦克风切换到另一麦克风的切换方法,优选通过图18所示交叉渐变来切换。从而,麦克风选择处理部分25改变渐变器FDa和FDb的值,其中,渐变器FDa和FDb互相设置在A/D转换器27a和27b的输出侧并处于交叉状态。
通过渐变器FDa和FDb交叉渐变的两个麦克风MCa和MCb的声音输出由加法器ADR相加,并输出给EC 26。
已经简单解释在第一DSP 25中通过交叉渐变而将两个麦克风MCa和MCb之一切换到另一个的切换方法,然而,麦克风选择方法和切换方法的细节基于第一实施例的上述方法。
在图20中简要示出EC处理部分261的处理。
EC处理部分261具有第一开关SW1、第二开关SW2、第一和第二传输特性处理部分2611和2612、加法器-减法器部分2614、以及学习处理部分2615。
通过EC中的控制处理部分,第一开关SW1将停机开关、第一和第二传输特性处理部分2611和2612中的任一个连接到A/D转换器274的输出信号S1。
传输特性处理部分2611和2612是分别为麦克风MCa和MCb的信号产生回声消除分量的部分。它们具有相同的传输特性功能,并具有因麦克风MCa和MCb而不同的延迟元和滤波系数。传输特性功能、延迟元和滤波系数在后面描述。
通过EC 264中的控制处理部分,第二开关SW2也将停机开关、第一和第二传输特性处理部分2611和2612中的任一个连接到加法器-减法器部分2614。
从第一DSP 25的加法器ADR的信号S25减去所连接传输特性处理部分2611和2612的任何输出,作为加法器-减法器部分2614中的回声消除分量。
在学习处理部分2615中估计回声分量,在存储器部分263中存储(更新)根据所估计回声分量的延迟元和滤波系数,并且,将延迟元和滤波系数设定到传输特性处理部分2611和2612中与任一个麦克风MCa和MCb相应的任一个。
EC处理部分261中的回声消除处理是与延迟元有关的均衡滤波处理。在从另一方拾音设备发送的麦克风信号被墙壁、天花板等反射,并由此侧的麦克风检测且进一步到达EC 26之前,延迟元被规定为平均延迟时间。接着,应该除去的振幅的回声信号分量由均衡滤波器的滤波系数规定。
传输特性处理部分2611和2612由相同配置的传输功能而被规定为均衡滤波器,然而,延迟元和滤波系数因麦克风MCa和MCb而不同。延迟元和滤波系数由学习处理部分2615存储在存储器部分263中。
学习处理部分2615具有与传输特性处理部分2611和2612相同的传输特性功能,连续地输入A/D转换器274的输出信号S1、第一DSP 25中加法器ADR的输出信号S25、以及加法器-减法器部分2614的回声消除处理结果信号S27,学习、处理并估计特性,其中,输出信号S1表示另一方拾音设备的麦克风选择信号,从而,除去根据另一方拾音设备麦克风选择信号的回声信号(如扬声器16的反射信号),并估计延迟元和滤波系数。
通过在学习处理部分2615中估计得到的延迟元和滤波系数存储在存储器部分263中,对通过开关SW1和SW2连接到加法器-减法器部分2614的任一个传输特性处理部分2611和2612进行配置,并使任一个传输特性处理部分2611和2612中A/D转换器274的输出信号S1均衡。
回声消除信号S26输出到D/A转换器281,在此,回声消除信号S26是以下信号,其中,均衡信号应用到加法器-减法器部分2614,在加法器-减法器部分2614中从信号S25减去均衡信号,并删除根据另一方拾音设备麦克风选择信号的回声信号(如扬声器16的反射信号)。
在本实施例中,在图20例示中,通过一个EC 26,即,通过一个EC处理部分261,对在多个如两个麦克风MCa和MCb之中选择的一个麦克风的声音信号执行回声消除处理。
当两个麦克风MCa和MCb之一切换到两个麦克风中的另一个时,从第一DSP 25中的控制部分25MS或从整个控制部分23经过控制部分25MS向EC中的控制处理部分264报告切换信号。然而,如果EC中的控制处理部分264激活开关SW1和SW2,从而,与所选麦克风相应的传输特性处理部分2611和2612连接到加法器-减法器部分2614,并且,如果学习处理部分2615切换到存储在存储器23中的延迟元和滤波系数已被切换的麦克风,回声消除处理就出错。
理由是由于在从A/D转换器274输出的信号S1与回声之间有时滞,其中,回声例如为从扬声器16输出的并由麦克风MCa和MCb检测的反射声,因此,如果立即切换回声消除处理的目标,就对由与先前所选麦克风MCa和MCb有关的回声消除处理信号切换的麦克风MCa和MCb的信号执行回声消除处理。
接着,在本发明的第二实施例中,通过图21例示的方法执行回声消除处理的切换。
图21为示出回声消除处理的操作定时的视图。
以下举例说明执行从第一麦克风MCa到第二麦克风MCb的切换(选择改变)的情况。
在时间点t1,当检测到从第一麦克风MCa到第二麦克风MCb的切换时,从第一DSP 25的控制部分25MS经过用于整个控制的微处理器23或从第一DSP 25中的控制部分25MS直接向EC中的控制处理部分264报告检测的信号。以下描述从控制部分25MS直接向EC中的控制处理部分264报告的情形。
在与时间点t1几乎相同或稍微延后的时间点t2,EC中的控制处理部分264命令EC处理部分261的学习处理部分2615停止其操作。同时,EC中的控制处理部分264断开开关SW1和SW2,并切断传输特性处理部分2611、2612与加法器-减法器部分2614之间的连接。因此,回声消除变为停止状态,即,在加法器-减法器部分2614中不执行回声消除处理。
在时间点t3,如结合图18所述地,第一DSP 25中的控制部分25MS使麦克风MCa和MCb交叉渐变。从时间点t4开始交叉渐变。
交叉渐变时间τcf通常为几十毫秒,如大约10毫秒-80毫秒。
在时间点t5,在时间点t3或t4被从控制部分25MS报告开始交叉渐变的EC中控制处理部分264命令学习处理部分2615从存储器部分263读出与麦克风MCb有关的延迟元和滤波系数,并将它们设定到切换的传输特性处理部分2612中。学习处理部分2615学习作为新回声消除处理目标的麦克风MCb,从存储器部分263读出用于麦克风MCb的延迟元和滤波系数,并将它们设定到相应的传输特性处理部分2612中。
在时间点t6,被从控制部分25MS报告交叉渐变完成的EC中的控制处理部分264激活开关SW1,从而,A/D转换器274的输出信号S1输入到与所选麦克风MCb相应的传输特性处理部分2612中。在此,在选择的传输特性处理部分2612中,通过使用事先获得的并存储在存储器部分263中的延迟元和滤波系数来计算回声消除分量。然而,由于在此状态下开关SW2仍然处于断开状态,因此,传输特性处理部分2612的输出不施加到加法器-减法器部分2614。
当假设输入所选传输特性处理部分2612的输出信号,并且输出信号施加到加法器-减法器部分2614并执行回声消除处理时,学习处理部分2615检查是否进入很好地执行回声消除处理的状态。
学习处理部分2615连续地执行上述检查。当判断所选麦克风MCb进入能充分地或在一定程度上执行回声消除处理的状态时,学习处理部分2615通过施加与所选麦克风MCb相应的传输特性处理部分2612的输出信号,而开始回声消除处理。
可替换地,学习处理部分2615不执行上述检查,时间点t6和t7之间的时间定义为事先设定的回声时间,并且,在从时间点t6过去预定时间之后,可在时间点t7重新开始上述回声消除处理。
然后,在传输特性处理部分2612中计算的回声消除分量在与麦克风MCb有关的加法器-减法器部分2614中减小。
学习处理部分2615估计回声消除分量,从而,在加法器-减法器部分2614的输出中除去来自另一方拾音设备的声音信号,学习用于此设备的延迟元和滤波系数,在存储器部分263中存储延迟元和滤波系数,并将它们设定到传输特性处理部分2612。
从而,即使执行从第一麦克风MCa到第二麦克风MCb的切换,也可防止发生不自然的回声消除处理。
EC处理部分261中的回声消除处理为举例说明。例如,执行传输特性处理部分2611和2612中的传输特性功能以及学习处理部分2615中的学习处理。可执行其它的回声消除处理。
在本实施例中,通过对具有时间常数或延迟元的回声分量在预定时期保持回声消除处理为停止状态,可防止不自然的回声消除处理。
尽管上述实施例描述执行交叉渐变的情形,但当不执行交叉渐变时,就只能不考虑交叉渐变期地执行处理。
对于第二DSP(回声消除器)26中的上述处理,尽管在本发明的实施例中描述用具有图20例示组件的EC 26执行处理的情形,但DSP 26的组件没有具体限制,并且,只能在EC 26中执行上述回声消除处理。
在通过使用一个EC 26(EC处理部分261)对多个麦克风的声音信号执行回声消除处理的情况下,本实施例尤其有效。
进一步地,在上述实施例中,尽管描述通过始终使用学习处理部分2615并估计回声消除处理分量而在传输特性处理部分2611和2612中设定延迟元和滤波系数的情形,但是,可采用不需使用学习处理部分2615的方法。
例如,在布置拾音设备时,为每个麦克风获得传输特性功能,为每个麦克风获得延迟元和滤波系数,它们存储在存储器部分263中,并且它们用作固定值。也就是说,当切换麦克风时,例如,在上述定时,EC中的控制处理部分264设定到传输特性处理部分2611和2612。根据此方法,学习处理部分2615变得不必要,由于不必在学习处理部分2615中顺序地学习和执行处理并估计回声消除处理分量,因此,减少第二DSP(回声消除器)26的处理。
在本实施例中,可任意地组合上述多个实施例。
应指出,本发明不局限于以上实施例,并且包括在权利要求范围内的修改。
权利要求
1.一种拾音设备,包括基于预定条件而布置的多个麦克风;麦克风选择器,所述麦克风选择器检测所述多个麦克风的拾音信号,并选择已经检测到所述检测的拾音信号中有效的拾音信号的麦克风;对所述选择的麦克风的声音信号执行回声消除处理的回声消除处理器;以及回声消除处理控制器,当切换所述麦克风的声音信号时,该控制器在预定时期停止所述回声消除处理。
2.如权利要求1所述的拾音设备,其中,当通过选择新麦克风的拾音信号而输出时,所述麦克风选择器交叉渐变先前所选麦克风的声音信号和新麦克风的声音信号,并且,所述回声消除处理控制器在所述交叉渐变期间停止所述回声消除处理。
3.一种拾音方法,包括麦克风选择步骤,所述麦克风选择步骤检测基于预定条件而布置的多个麦克风的拾音信号,并选择已经检测到所述检测的拾音信号中有效的拾音信号的麦克风;对所述选择的麦克风的声音信号执行回声消除处理的回声消除处理步骤;以及回声消除处理控制步骤,当在所述麦克风选择步骤中切换所述麦克风的声音信号时,所述回声消除处理控制步骤在预定时期停止所述回声消除处理。
4.如权利要求3所述的拾音方法,其中,在所述麦克风选择步骤中,当通过选择新麦克风的拾音信号而输出时,对先前所选麦克风的声音信号和新麦克风的声音信号执行交叉渐变;以及在所述回声消除处理控制步骤中,在所述交叉渐变期间停止所述回声消除处理。
全文摘要
本发明涉及一种拾音设备,所述拾音设备用一个回声消除器对多个麦克风执行回声消除处理。在切换麦克风时,本发明设备在预定时期停止回声消除器的学习处理,通过对切换之前麦克风和切换之后麦克风的声音信号进行交叉渐变而将学习数据切换到新麦克风的学习数据,并且在交叉渐变之后,利用切换之后的学习数据而重新开始回声消除处理。
文档编号H04M9/08GK1655646SQ20051000820
公开日2005年8月17日 申请日期2005年2月7日 优先权日2004年2月13日
发明者大木一弘, 铃木博之 申请人:索尼株式会社