专利名称:声音收集设备的制作方法
技术领域:
本发明涉及一种声音拾取设备,该声音拾取设备用在会议中用 来拾取会议中的参与者的语音。
背景技术:
最近,IP电话等已经配备了作为用于检测声音存在/不存在的功
能的VAD (语音行为检测)。很多电话配备了作为用于在无声期间 不发射声音信息的功能的DTX (不连续发射)(例如,参见非专利 文献l和非专利文献2)。通过采用在无声期间不发射声音信息的结 构(以下称为"无声抑制"),可以降低要发射的信息量(平均的比 特率)。然而,无声抑制的执行产生了一个问题当出现从无声到有 声的转变时,在声音开始时会出现中断。
因此,已经建议了一种声音压縮方法,用于当出现从无声到有 声的变化时,将拾取到的声音临时存储在存储器中,以及从存储器中 读取过去的声音,并且发射以此方式读取的声音,从而防止了在声音 中出现中断,否则在开始时将会引起声音中断(例如,参见专利文献 1)。
非专利文献1: ITU-T G.711 Appendix II to Recommendation G.711 (02/2000)
非专利文献2: RFC3389 Real-time Transport Protocol (RTP) Payload for Comfort Noise (CN)
专利文献l: JP-A-2005-26641
发明内容
本发明所要解决的问题
然而,关于专利文献1所描述的方法面临一个问题,即当由于
4麦克风灵敏度低的原因而不能获得合适的音频信号时,难以检测到开 始时的声音。同时,当增加麦克风灵敏度来检测开始时的声音时,可 能会错误地将无声阶段认为是有声阶段。而且,当增加麦克风的灵敏 度并且当在开始时输入大的声音时,出现了一个问题声音超过容许 输入极限(发生限幅)。
本发明旨在提供一种声音拾取设备,当执行无声抑制时,该声 音拾取设备能准确地检测到开始时的声音,并且当在开始时输入大的 声音时,该声音拾取设备未能引起限幅。
解决该问题的手段
本发明的声音拾取设备的特征在于包括 麦克风阵列,其由多个麦克风的排列形成;
信号分配装置,其输入由多个麦克风拾取到的音频信号,并且 分配地输出音频信号;
第一声音拾取信号处理装置和第二声音拾取信号处理装置,用 于根据由信号分配装置分配地输出的音频信号来分别产生朝同一个 区域显示出指向性的第一声音拾取束和第二声音拾取束;
电平设置装置,用于将由第一声音拾取信号处理装置所产生的 第一声音拾取束设置为高电平灵敏度,并且将由第二声音拾取信号处 理装置所产生的第二声音拾取束设置为低电平灵敏度;
第一存储器和第二存储器,用于分别存储由第一声音拾取信号 处理装置所产生的第一声音拾取束和由第二声音拾取信号处理装置 所产生的第二声音拾取束;
声音判断单元,用于对由第一声音拾取信号处理装置所产生的
第一声音拾取束的信号电平和由第二声音拾取信号处理装置所产生 的第二声音拾取束的信号电平进行检测,并用于根据经检测的信号电 平来判断是否存在声音,并且检测第一声音拾取束是否超过容许输入 极限;
选择器,用于读取存储在第一存储器和第二存储器中的声音拾 取束,并且选择性地输出任何一个声音拾取束;以及
控制单元,其进行设置,以便当声音判断单元没有检测到第一
5声音拾取束超过容许输入极限时,在判断从无声切换到有声的时刻将 存储在第一存储器中的高灵敏度声音拾取束输出到选择器,并且以便 当声音判断单元检测到第一声音拾取束超过容许输入极限时,在判断 从无声变化到有声的时刻将存储在第二存储器中的第二声音拾取束 输出到选择器。
在这种配置中,信号分配装置将由多个麦克风拾取到的音频信 号分配地输出到第一声音拾取信号处理装置和第二声音拾取信号处 理装置。第一声音拾取信号处理装置和第二声音拾取信号处理装置分 别产生第一声音拾取束和第二声音拾取束,并且这些声音拾取束被分 别设置为高灵敏度和低灵敏度。在存储器中分别存储高灵敏度声音拾 取束和低灵敏度声音拾取束。选择器在控制单元指定时从较早的起依 次读取存储在存储器中的任何一个声音拾取束,并且输出以此方式读 取的声音拾取束。声音判断单元检测声音拾取束中是否存在声音,并 检测超过容许输入极限(引起限幅)的声音拾取束。控制单元输入来 自声音判断单元的判断结果。在声音拾取束没有被限幅的情况下,当 输入了显示判断从无声到有声变化的结果时,控制单元对选择器进行 设置,以便选择并读取高灵敏度的声音拾取束。而且,在声音拾取束 被限幅的情况下,当输入了显示判断从无声到有声变化的结果时,控 制单元对选择器进行设置,以便选择并读取低灵密度的声音拾取束。
而且,本发明的声音拾取设备的特征在于,当声音判断单元将 显示声音存在的判断保持了一段预定的时间或更长时间时,控制单元 执行正常的输出处理,以命令信号分配装置将所有麦克风所拾取到的 音频信号输出到单个声音拾取信号处理装置;命令电平设置装置将由 声音拾取信号处理装置所产生的声音拾取束设置为高灵敏度;并且命
令选择器输出高灵敏度的声音拾取束。
在该配置中,当在一段给定的时间或更长时间内稳定地输入显 示声音存在的判断结果时,执行正常的输出处理,以从所有麦克风所 拾取到的声音来产生单个高灵敏度的声音拾取束,并且输出该声音拾 取束。因此,当声音被稳定地判断为存在时,语音声音被可靠地输出。
本发明的声音拾取设备的特征在于,当声音判断单元将判断从有声改变到无声时,控制单元将处理从正常输出处理变为检测模式, 以命令信号分配装置将音频信号分配地输出到第一信号处理装置和 第二信号处理装置;命令电平设置装置将由第一声音拾取信号处理装 置所产生的声音拾取束的灵敏度设置为高灵敏度,并将由第二声音拾 取信号处理装置所产生的声音拾取束的灵敏度设置为低灵敏度;并且 对选择器进行设置,以便当声音判断单元没有检测到超过容许输入极 限的声音拾取束时,在判断从无声变化到有声的时刻输出高灵敏度的 声音拾取束,并且当声音判断单元检测到超过容许输入极限的声音拾 取束时,在判断从无声变化到有声的时刻输出低灵敏度的声音拾取 束。
在这种配置中,当在显示声音存在的判断结果被稳定地输入了 一段给定的时间或更长时间的状态下输入了显示无声的判断结果时, 会引起从正常输出处理到检测模式的变化,其中检测模式使用高灵敏 度声音拾取束和低灵敏度声音拾取束来检测从无声到有声的变化。
本发明的声音拾取设备的特征在于,电平设置装置改变由多个 麦克风所拾取到的音频信号的电平并且将音频信号输入到声音拾取 信号处理装置,由此将声音拾取束设置为高灵敏度或低灵敏度。
本发明的声音拾取设备的特征还在于,电平设置装置改变声音 拾取信号处理装置的每一个的输入电平与输出电平的比率,由此将声 音拾取束分别设置为高灵敏度或低灵敏度。
本发明的优点
根据本发明,设置了低灵敏度声音拾取束和高灵敏度声音拾取 束,并且通过高灵敏度声音拾取束可靠地检测到了从无声变化到有声 的时刻。当高灵敏度的声音拾取束被限幅时,输出被切换到低灵敏度 的声音拾取束,从而准确地检测到了开始时的声音。即使在开始时输 入了大的声音时,也不会出现限幅。
图l是示出一个实施例的声音拾取设备中的麦克风布局的视图。 图2是示出该实施例的声音拾取设备的结构框图。图3是示出麦克风数量和布局的概念描述。
图4是示出其中通过麦克风阵列来拾取声音的声音拾取区域的视图。
101:外壳,11至18:麦克风,21:输入和输入I/F, 22:声音 拾取放大器,23: A/D转换器,24:数字音频接线,25A, 25B:声 音拾取束生成单元,26A, 26B: FIFO存储器,27:声音检测器,28:
控制单元,29:编码器
具体实施例方式
本发明的实施例的声音拾取设备将多个麦克风所拾取的音频信 号延迟一段给定的时间,并且将以此方式被延迟的信号结合起来,从 而生成了将具有高灵敏度的特定区域中的声音聚集而成的声音拾取 束(信号)。通过监测该声音拾取束的信号电平来检测有声或无声(语 音的存在或不存在)。当声音的存在在一段预定的时间内或更长的时 间内被稳定地检测到时通过所有麦克风将声音聚集成的音频信号被 延迟一段给定的时间并被结合起来,从而生成声音拾取束(这被视为 正常模式)。同时,当没有拾取到语音时,各个麦克风所拾取的音频 信号被分配输入到信号处理单元,这些信号处理单元(按照功能)被 分为两个单元,各个信号处理单元生成与单个声音拾取区域相关的灵
敏度不同的声音拾取束。在这种情况下,通过高灵敏度的声音拾取束 来检测声音从无到有的转变。当高灵敏度声音拾取束的信号电平被限
幅时,低灵敏度声音拾取束被输出到下一级(这被视为VAD模式)。 以下将参考附图描述本发明的实施例的声音拾取设备。 图1是示出本实施例的声音拾取设备的麦克风布局的视图。 本实施例的声音拾取设备具有在外壳101中设有的多个麦克风
11至18。
外壳101采取了在一个方向上伸长的基本上为长方体的形状。 在以下描述中,在外壳101的四个侧表面中,伸长的表面被称为长表 面,较短的表面被称为短表面。
在外壳101的一个长表面上设有相同规格的麦克风11至18。沿长方向以给定的间隔直线地布置麦克风11至18,从而构建了麦克风 阵列。
虽然在本实施例中,麦克风阵列中的麦克风数量被设置为8,但 是麦克风的数量并不限于8个。更好地是,根据规格来改变麦克风的 数量。而且,麦克风阵列中麦克风间的间隔也可以不是恒定的。例如, 还可以存在一种沿纵向在中心处紧密放置以及朝两端零散放置的形 式。
由麦克风11至18组成的麦克风阵列产生朝特定区域201至204 具有高指向性的声音拾取束。本实施例的声音拾取设备在各个预定时 段内对麦克风阵列中各个麦克风所拾取的声音进行延迟,并且将以此 方式被延迟的信号结合起来,从而生成与特定区域201至204相关的 多个声音拾取束。后面将提供详细的描述。
图2是示出本实施例的声音拾取设备的结构框图。图2所示的 框图示出了用于处理多个声音拾取束中的一个声音拾取束的声道。如 图2所示,本实施例的声音拾取设备具有麦克风11至18;输入/输 出I/F 21;多个前端放大器22 (图中是8个);8通道A/D转换器 23;数字音频接线24;声音拾取束生成单元25 (25A和25B) ; FIFO 存储器(26A和26B);声音检测器27;控制单元28和编码器29。 在正常模式下,每个声音拾取束生成单元25和FIFO存储器26作为 单个组成元件来操作;然而,在VAD模式下,它们中的每个按功能 被划分为两个子部分,这些子部分分别操作从而处理不同的声音拾取 束。控制单元28提供用于在正常模式和VAD模式之间进行切换的 指令。
输入/输出I/F21向外部输出声音拾取设备所拾取的音频信号。 输入/输出I/F21在将信号转换为符合网络的数据格式(协议)之后 还能向外部输出音频信号,当然也能向外部输出未经修改形式的数字 音频信号。必要时,输入/输出I/F21具有内置的D/A转换器,并且 能向外部输出模拟音频信号。
麦克风阵列中的各个麦克风11至18还可以是全向的或是指向 性的。然而,期望的是,麦克风是指向性的,以及麦克风从声音拾取
9设备的外部拾取声音,并且将声音拾取信号Sl至S8输出到各个放
大器22。
各个放大器22通过AMP 22来放大声音拾取信号Sl至S8,并 且向A/D转换器23提供信号。A/D转换器23对声音拾取信号Sl至 S8进行数字转换,并且将数字信号输出到数字音频接线24。 A/D转 换器23能为每个声音拾取信号设置单独的增益(输出模拟信号电平 与输出数字信号电平的比率),每个声音拾取信号的增益由控制单元 28来设置。
在正常模式下,如图3B所示,数字音频接线24将声音拾取信 号Sl至S8输出到声音拾取束生成单元25。在VAD模式下,如图 3A所示,数字音频接线24将从A/D转换器23输入的声音拾取信号 Sl至S8分配地输出到各个声音拾取束生成单元25A和25B。数字音 频接线24能改变被分配地输出到各个声音拾取束生成单元25A和 25B的声音拾取信号的数量(从0至8)。控制单元28设置将要被 输出的声音拾取信号的数量以及声音拾取信号的组合。特别地,数字 音频接线24能自由地改变麦克风阵列中的麦克风的布局和麦克风数
声音拾取束生成单元25对从数字音频接线24输出的声音拾取 信号进行预定的延迟处理,从而生成声音拾取束信号MB,该声音拾 取束信号MB对于外壳101周围的预定方向(区域201至204中的任 何一个区域)显示出高指向性。
例如,假设声波从前面同时到达所有的麦克风,则从各个麦克 风输出的声音拾取信号经过结合被加强。同时,当声波从前面之外的 其它方向到达麦克风时,从各个麦克风输出的声音拾取信号在相位上 彼此不同,因此,声音拾取信号经过结合被减弱。因此,麦克风阵列 的灵敏度被縮小在声束分布图上,从而仅在向前的方向上产生声音拾 取束。
声音拾取束生成单元25赋予每个声音拾取信号一段预定的延迟 时间,从而能使声音拾取束的方向倾斜。当声音拾取束被倾斜时,以 下列方式进行设置每当置于一端的麦克风经过一段预定的时间后,
10音频信号就从下一个麦克风顺序输出。当声源处于麦克风阵列的一端 的前方时,声波来自最接近声源的那端,并且最终到达另一端。然而, 声音拾取束生成单元25向来自各个麦克风的声音拾取信号赋予一个 延迟时间,以校正传播时间上的差异,随后将这些信号结合起来。控
制单元28保持着与各个声音拾取信号对应的麦克风的位置的相关信
息,并且单独地控制各个声音拾取信号的延迟时间。因此,通过结合 增强了在特定方向上获取的音频信号。如上所述,从一端到另一端顺 序地延迟从成行布置的麦克风输出的音频信号,从而根据延迟时间来 使声音拾取束倾斜。
在VAD模式下,声音拾取束生成单元25按照功能被划分为声 音拾取束生成单元25A和25B。声音拾取束生成单元25A和25B对 从数字音频接线24输出的声音拾取信号进行预定的延迟处理,从而 产生声音拾取束信号MB1和MB2,信号MB1和MB2朝外壳101周 围的预定方向(区域201至204中的任何一个)表现出高指向性。通 过将同一区域的处于不同灵敏度水平的声音进行收集来产生声音拾 取束信号MB1和MB2。在正常模式和VAD模式下均对同一区域(区 域201至204中的任何一个)的声音进行拾取;因此,不管当前的模 式是正常模式还是VAD模式,赋予每个声音拾取信号的延迟量假定 为相等的。
在正常模式下,声音拾取束生成单元25将声音拾取束信号MB 输出到FIFO存储器26和声音检测器27。在VAD模式下实现的声音 拾取束生成单元25A和25B将声音拾取束信号MB1和MB2输出给 按功能划分的FIFO存储器26A和26B。而且,声音拾取束生成单元 25A和25B将声音拾取束信号MB1和MB2输出到声音检测器27。
FIFO存储器26顺序地存储输入的声音拾取束信号MB。 FIFO 存储器26从较早的起依次向编码器29输出所存储的声音拾取束信号 MB。输出定时(周期)由控制单元28来指定。声音拾取束信号MB 因此在FIFO存储器26中被缓冲了一段给定的时间。在VAD模式下 实现的FIFO存储器26A和26B顺序地存储输入的声音拾取束信号 MB1和MB2,并且从较早的起依次向编码器29输出所存储的声音拾取束信号MB1和MB2。甚至在这种情况下,输出定时(周期)也由 控制单元28来指定。声音拾取束信号MB1和MB2因此在FIFO存 储器26A和26B中被缓冲了一段给定的时间。
声音检测器27对输入的声音拾取束信号MB的信号电平进行检 测。基于所检测到的信号电平,声音检测器27判断声音是否存在。 特别地,当声音拾取束信号的信号电平从一个小于预定阈值的电平变 为一个等于或大于阈值的电平时(当信号电平变为等于或大于阈值 时),声音检测器27判断发生了从无声到有声的变化。同时,在声 音拾取束信号的信号电平从等于或大于预定阈值的电平变为小于阈 值的电平的情况下,仅当信号电平在小于阈值的电平保持一段预定时 间或更长时,声音检测器27才会判断发生了从有声到无声的变化。 当信号电平变为小于阈值时的时间段小于预定的时间段时,判断声音 的存在是连续的。判断结果被输出至控制单元28。
声音检测器27分别对在VAD模式下输入的声音拾取束信号 MB1和MB2的信号电平进行检测。声音检测器27基于高灵敏度声 音拾取束信号MB1的信号电平来判断是否存在声音。判断结果被输 出至控制单元28。
编码器29在正常模式下对从FIFO存储器26输入的声音拾取束 信号MB进行压縮,并且将以此方式被压縮的信号输出到输入/输出 I/F21。声音压縮方案还可以基于任何方案,例如ITU-T G.711。
在VAD模式下,编码器29对从FIFO存储器26A和26B输入 的声音拾取束信号MB1和MB2中的任何一个进行声音压縮,并且将 以此方式被压縮的信号输入到输入/输出I/F21。控制单元28对声音 拾取束信号MB1和MB2被压縮后哪一个被输出进行设置。控制单元 28对编码器29是否执行声音压縮进行设置。特别地,控制单元28 从声音检测器27接收是否存在声音的判断。当判断不存在声音时, 控制单元28进行设置,使得编码器29不执行声音压缩并且将压缩的 声音输出到输入/输出I/F21。
声音拾取束信号MB1和MB2在FIFO存储器26A和26B中被 缓冲一段预定的时间。因此,当控制单元28从声音检测器27接收到
12判断从无声到有声变化的结果而向编码器29发送命令来执行切换到 有声压縮时,最初获得的声音不产生中断。
然而,当所有麦克风的灵敏度水平都低,并且当声音拾取束信
号MB1和MB2的信号电平也低时,声音检测器27不能判断从无声 到有声的变化。如果使得用于判断有声和无声的阈值更小的话,即使 当最初应该给出显示无声的判断时,也将给出显示有声的判断。同时, 当麦克风的灵敏度水平高,并且当声音拾取束信号MB1和MB2的信 号电平也高时,就超过了容许输入极限(限幅出现)。
因此,在本实施例的声音拾取设备中,在VAD模式下,数字音 频接线24改变麦克风阵列中麦克风的布局和数量,从而对高灵敏度 声音拾取束生成单元和低灵敏度声音拾取束生成单元进行设置。从 而,在确定无疑地检测到从无声变化到有声的同时,防止了当在从无 声到有声的变化期间输入大的声音时而引起的限幅发生。
将描述声音拾取设备的特定操作。图3是示出麦克风的数量和 布局的概念描述,以及图4是示出其中麦克风阵列拾取声音的声音拾 取区域的视图。图3A是示出VAD模式的处理声道的视图;声音拾 取信号Sl、 S3、 S5和S7被输入到声音拾取束生成单元25B;并且 声音拾取信号S2、 S4、 S6和S8被输入到声音拾取束生成单元25A。 图3B是示出正常模式的处理声道和图示一个其中所有的声音拾取信 号S1至S8被输入到声音拾取束生成单元25示例的视图。当(在一 段预定时间或更长时间内)从声音检测器27稳定地输入显示声音存 在的判断结果而没有引起限幅时,控制单元28对图3B中的正常模 式进行设置。
在正常的模式下,数字音频接线24以麦克风11至18的所有输 入线都与声音拾取束生成单元25连接的方式进行设置。A/D转换器 23设置麦克风11至18的所有输入声道为高增益,并且输出高电平 的声音拾取信号Sl至S8。这些设置由控制单元28来控制。
声音拾取束生成单元25将高电平的声音拾取信号Sl至S8结合 起来,从而产生高电平的声音拾取束信号MB。在这个实施例中,例 如,如图4B所示,声音拾取束信号MB对应于区域202中的声音的
13收集。声音拾取束信号MB被输入到FIFO存储器26。控制单元28 设置FIFO存储器26的输出定时,并且将在FIFO存储器26中缓冲 的声音拾取束信号MB输出到编码器29。
声音拾取束信号MB被输入到声音检测器27。声音检测器27 对输入的声音拾取束信号MB的信号电平进行检测,从而判断是否存 在声音。是否存在声音的判断结果被输入到控制单元28。
当被提供了从声音检测器27输入的显示存在声音的判断结果 时,控制单元28设置编码器29,以便在将声音拾取束信号MB进行 声音压縮之后将其输出。在正常模式下,当被提供了从声音检测器 27输入的显示判断从有声到无声变化的结果时,控制单元28转变至 VAD模式;将声音拾取束生成单元25和FIFO存储器26中的每个均 划分为两个子部分;并且控制A/D转换器23和数字音频接线24来 执行如下所述的设置。
数字音频接线24进行设置,从而将麦克风11、麦克风13、麦 克风15和麦克风17的输入线连接至声音拾取束生成单元25B,并且 将麦克风12、麦克风14、麦克风16和麦克风18的输入线连接至声 音拾取束生成单元25A。
A/D转换器23将麦克风11、麦克风13、麦克风15和麦克风17 的输入线设置为低增益,并且输出低电平的声音拾取信号Sl、 S3、 S5和S7。而且,A/D转换器23将麦克风12、麦克风14、麦克风16 和麦克风18的输入线设置为高增益,并且输出高电平的声音拾取信 号S2、 S4、 S6禾口 S8。
声音拾取束生成单元25A将高电平的声音拾取信号S2、 S4、 S6 和S8结合起来,从而产生高电平的声音拾取束信号MB1。声音拾取 束生成单元25B将低电平的声音拾取信号SI、 S3、 S5和S7结合起 来,从而产生低电平的声音拾取束信号MB2。如图4 (A)所示,声 音拾取束信号MB1和声音拾取束信号MB2对应于同一区域(该图中 的区域202)中的声音的收集。
声音拾取束信号MB1被输入到FIFO存储器26A,而声音拾取 束信号MB2被输入到FIFO存储器26B。控制单元28设置FIFO存储器26A和FIFO存储器26B的输出定时,并且FIFO存储器26A和 FIFO存储器26B将缓冲的声音拾取束信号MBl和缓冲的声音拾取 束信号MB2输出到编码器29。
声音拾取束信号MBl和声音拾取束信号MB2被输入到声音检 测器27。如前所述,声音检测器27对输入的声音拾取束信号MBl 的信号电平和输入的声音拾取束信号MB2的信号电平进行检测,从 而判断声音是否存在,并且判断结果被输出到控制单元28。在正常 模式时,声音检测器27基于高电平的声音拾取束信号MBl的信号电 平来判断声音是否存在。当高电平的声音拾取束信号的信号电平被限 幅时(当超过容许输入极限时),显示发生限幅的结果被输出到控制 单元28。
当从声音检测器27输入显示无声的判断结果时,控制单元28. 设置编码器29不输出压縮的声音,无需执行声音压縮。同时,当从 声音检测器27输入显示声音存在的判断结果而没有引起限幅时,控 制单元28设置编码器29,以便将高电平的声音拾取束信号MBl进 行声音压縮,并且输出以此方式被压縮的信号。当从声音检测器27 输入显示存在声音的判断结果并且具有限幅时,控制单元28对编码 器29进行设置,以便将低电平的声音拾取束信号MB2进行声音压縮, 并且输出以此方式被压縮的信号。而且,当(在一段预定的时间或更 长时间内)从声音检测器27稳定地输入显示声音存在的判断结果, 而没有引起限幅时,控制单元28从VAD模式转变到正常模式。
如上所述,声音检测器27基于高电平声音拾取束信号MB1的 信号电平能可靠地检测从无声到有声的变化。当从无声到有声的变化
期间输入大的声音时,控制单元28设置编码器29,以便将低电平的 声音拾取束信号MB2进行声音压縮,并且输出以此方式被压縮的信 号;因此,没有失真等的声音被输出到外部。当然,由于声音拾取束 信号MB1和声音拾取束信号MB2在FIFO存储器26A和FIFO存储 器26B中进行缓冲,因此不会出现开始时声音中断的发生,当控制 单元28接收到显示判断从无声到有声变化的结果并且控制编码器29
切换到有声压縮时将会引起这种中断的发生。
15当声音检测器27 (在一段预定的时间或更长时间内)稳定地输 出显示存在声音的判断结果,而没有引起限幅时,转变到正常模式, 并且声音拾取束是采用所有的麦克风11至18产生的。因此,改善了 声音质量,并且能确定无疑地拾取到扬声器的语音。当声音检测器
27输出显示判断从有声到无声变化的结果时,控制单元28转变到 VAD模式。因此,当执行无声抑制时,在通过高电平的声音拾取束 信号和低电平的声音拾取束信号确定无疑地进行从无声到有声变化 的判断的同时,能防止限幅的发生。当执行有声压缩时,通过声音质 量高的声音拾取束信号,能从所有的麦克风确定无疑地拾取到扬声器 的语音,并且能输出以此方式被拾取到的语音。
上述实施例提供了一个示例,其中控制单元28通过单独地设置 A/D转换器23的各个输入/输出线的增益来产生高电平声音拾取束信 号和低电平声音拾取束信号;然而,还可以为A/D转换器23的所有 线路设置单个增益。在这种情况下,基本要求是进行设置,以使声 音拾取束生成单元25A和声音拾取束生成单元25B在增益(输出信 号电平与每个声音拾取信号的电平的比率)上彼此不同。基本要求是
即使输入了相同电平的声音拾取信号时,声音拾取束生成单元25A 也应该输出高电平声音拾取束信号,而且声音拾取束生成单元25B 也应该输出低电平声音拾取束信号。
权利要求
1. 一种声音拾取设备,其包括麦克风阵列,其由多个麦克风的排列形成;信号分配装置,其输入由多个麦克风拾取到的音频信号,并且分配地输出音频信号;第一声音拾取信号处理装置和第二声音拾取信号处理装置,用于根据由信号分配装置分配地输出的音频信号来分别产生朝同一个区域表现出指向性的第一声音拾取束和第二声音拾取束;电平设置装置,用于将由第一声音拾取信号处理装置所产生的第一声音拾取束设置为高电平灵敏度,并且将由第二声音拾取信号处理装置所产生的第二声音拾取束设置为低电平灵敏度;第一存储器和第二存储器,用于分别存储由第一声音拾取信号处理装置所产生的第一声音拾取束和由第二声音拾取信号处理装置所产生的第二声音拾取束;声音判断单元,用于对由第一声音拾取信号处理装置所产生的第一声音拾取束的信号电平和由第二声音拾取信号处理装置所产生的第二声音拾取束的信号电平进行检测;根据经检测的信号电平来判断是否存在声音;并且检测第一声音拾取束是否超过容许输入极限;选择器,用于读取存储在第一存储器和第二存储器中的声音拾取束,并且选择性地输出任何一个声音拾取束;以及控制单元,其进行设置以便当声音判断单元检测到第一声音拾取束没有超过容许输入极限时,在判断从无声到有声变化的时刻将存储在第一存储器中的高灵敏度声音拾取束输出到选择器,并且以便当声音判断单元检测到第一声音拾取束超过容许输入极限时,在判断从无声到有声变化的时刻将存储在第二存储器中的第二声音拾取束输出到选择器。
2. 根据权利要求l所述的声音拾取设备,其中, 当声音判断单元将显示声音存在的判断保持了一段预定时间或更长时间时,控制单元执行正常的输出处理,用以命令信号分配装置将由所有麦克风所拾取到的音频信号输出到单个声音拾取信号处理装置;命令电平设置装置将由声音拾取信号处理装置所产生的声音拾取束设置为高灵敏度;以及命令选择器输出高灵敏度的声音拾取束。
3. 根据权利要求2所述的声音拾取设备,其中, 当声音判断单元将判断从有声改变到无声时,控制单元将处理从正常输出处理改变为检测模式,用以-命令信号分配装置将音频信号分配地输出到第一信号处理装置 和第二信号处理装置;命令电平设置装置将由第一声音拾取信号处理装置所产生的第 一声音拾取束的灵敏度设置为高灵敏度,并且将由第二声音拾取信号 处理装置所产生的第二声音拾取束的灵敏度设置为低灵敏度;以及对选择器进行设置,以便当声音判断单元没有检测到第一声音拾取束超过容许输入极限 时,在判断从无声变化到有声的时刻输出第一声音拾取束,以及当声音判断单元检测到第一声音拾取束超过容许输入极限时, 在判断从无声变化到有声的时刻输出第二声音拾取束。
4. 根据权利要求1或2或3所述的声音拾取设备,其中电平设 置装置改变由多个麦克风所拾取到的音频信号的电平并且将音频信 号输入到声音拾取信号处理装置,从而将第一声音拾取束和第二声音 拾取束设置为高灵敏度或低灵敏度。
5. 根据权利要求1或2或3所述的声音拾取设备,其中电平设 置装置改变第一声音拾取信号处理装置和第二声音拾取信号处理装 置中每一个的输入电平与输出电平的比率,从而将第一声音拾取束和 第二声音拾取束分别设置为高灵敏度或低灵敏度。
全文摘要
本发明公开了一种声音收集设备。其中A/D转换器将声音收集信号设置为低灵敏度,并且将该信号输入到声音收集束生成单元。A/D转换器将声音收集信号设置为高灵敏度,并且将该信号输入到声音收集束生成单元。声音检测器根据声音收集束来判断是否存在声音,从而判断是否存在限幅。控制单元输入声音检测器的判断结果。当高电平声音收集束信号被限幅时,对编码器进行设置以便低电平声音收集束信号被输出到外部。
文档编号H04R3/00GK101502129SQ20078002941
公开日2009年8月5日 申请日期2007年8月2日 优先权日2006年8月7日
发明者本间茂 申请人:雅马哈株式会社