专利名称:具有麦克风阵列的语音控制系统的制作方法
技术领域:
本发明涉及具有麦克风阵列的语音控制系统,特别是用于控制属于消费类电子装置。
语音控制系统被使用在多种技术领域。在这个例子中,口语字首先被检测为声音信号,通常由一个或多个麦克风检测,然后,声音信号被馈送到语音识别系统。在这个例子中,通常,语音识别是基于声音模型和语音模型。声音模型采用大量的语音图形、所用的数学算法指明声学上与口语字最匹配的字。而语音模型是基于分析,该分析使用多个文档样本以确定上下文,以及在该上下文中某些字是如何经常被使用。这样的语音识别系统不仅识别单个的字,并且能够高识别率的识别连续口语句子。然而,当不可忽视的背景噪声呈现时,识别率急剧下降。
有关这些声学干扰影响的强度可由各种不同的方式增加。因此,在计算机的专用系统中,耳机上的麦克风直接紧扣在讲话者嘴的前面。在这些系统中,真实的不变信号和在某些情况中的可感知的识别率只在直接邻近嘴的位置获得。同样已知通过把声音操作指令输入到集成在遥控装置中的麦克风来控制电视机。然而,在此类情况下遥控装置必须放置在用户的嘴的前面。
本发明的目的是提供一种语音控制的装置,尽管语音输入来自相对远的距离,但该装置具有足够大的抗干扰能力。本发明目的可由下面将描述说明的装置获得。
为了能够从相对远的距离进行语音控制,语音信号必须从干扰背景信号中分离出来。这可以通过使用包括两个或多个麦克风的麦克风阵列完成空间分离。在这种情况中,在尽可能大的距离上空间地分布阵列的单个麦克风是非常有利的。然而,在单个消费电子电器中,各个麦克风之间的距离被电器的直径所限制,例如,电视机的外壳直径小于1米。
原则上,本发明的语音控制系统包括具有多个麦克风的麦克风阵列,其把语音指令转换成为电信号,和中央语音识别单元,其把这些电信号转换成为操作指令,麦克风配置在相互之间连接的不同电器之间,由麦克风产生的信号可以被传送到中央语音识别单元的这样一种方式连接的。
在这种情况中,电器可以方便地通过双向网络连接,该网络基于IEEE1394总线,该连接特别便利。
如果一个或多个麦克风被集成在消费电子类播放电器内,特别是在电视机中,并且一个或多个麦克风被集成在外部扩音器内,该系统是特别地有效。
参考附图论述本发明的实施例。按照本发明,附图显示了具有麦克风阵列的语音控制。
图1显示了本发明的系统。两个外部扩音器LS1、LS2连接到电视机TV。电视机的内部扩音器(未在图中示出)与外部扩音器一起使得能够进行多信道音频信号的环绕声再现,例如,按照MPEG2或AC3标准的相应数字音频信号的再现。在这个情况中,通过称为火线的IEEE1394总线外部扩音器被直接连接到电视机,但也同样连接到适当的环绕声接收器。使用IEEE1394总线是很便利的,因为后者能够快速数据传输和在不同电器之间快速通信。此外,在有源扩音器的情况中,可以同时由这个总线供电。
为了检测语音信号,提供了麦克风阵列。后者包括两各集成在电视接收机内的麦克风MTV1和MTV2和集成在扩音器外壳内的各自的麦克风MLS1和MLS2。这些麦克风把检测到的声音信号转换成为电信号,该电信号由放大器放大,并由AD转换器转换成为数字信号,然后,该信号被馈送到信号处理单元。在这种情况中,来自外部扩音器的信号同样通过IEEE1394总线被馈送到电视机内的信号处理单元。所述的信号处理单元通过检测到的声音信号的不同的值或处理考虑用户各自的所在位置。此外,麦克风信号可由扩音器输出的声音信号校正。然后,以这种方式处理的信号被馈送到语音识别单元,该单元把电信号转换成为词。最后,对应这些词的指令被馈送到系统管理器,用于控制系统。
由信号处理单元检测到声音信号的值或处理要求麦克风的空间配置。生产厂家早已经知道把麦克风集成在电视机的外壳内。相反,对于配置在扩音器中的麦克风,其相对于电视机的位置必须被确定。这可以通过对应的屏幕菜单测量和输入确定的值来完成。但是,测量和校准操作同样可以由扩音器再生的测试信号音完成,并由麦克风检测,并从不同的传输延迟确定麦克风的位置。
集成在电视接收机内的两个麦克风可以方便地安装在各自电器外壳的左右两边。但是,麦克风的数量没有限制两个麦克风。集成麦克风的多个组合同样是可能的。因此,除了电视机以外,麦克风也可以集成在录像机、DVD播放机或遥控装置中。它甚至可以把麦克风安装在不同房间的电器内。
此外,电器的连接不局限于总线系统,例如,在图1实施例中的扩音器可由无线电信号驱动,然而,在这种情况中,除了无线电接收机以外,单个扩音器也必须有一个无线发射机。
本发明可以适用属于消费电子产品的各种电器的语音激励遥控装置,例如,电视机、录像机、DVD播放机、卫星接收机、电视/视频组合、音频装置或完整的音频系统,同样,适用于个人计算机或家用电器。
权利要求
1.一种具有麦克风阵列语音控制系统,包括多个麦克风,其把语音指令转换成为电信号,和中央语音识别单元,其把这些电信号转换成为操作指令,其特征在于麦克风配置在相互之间连接的不同电器之间,不同的电器之间是以这种方式,由麦克风产生的信号可以被传送到中央语音识别单元的这样一种方式连接的。
2.按权利要求1所述的系统,其特征在于所述电器是通过双向网络连接的电器。
3.按权利要求2所述的系统,其特征在于双向网络基于IEEE1394总线。
4.按权利要求1所述的系统,其特征在于一个或多个麦克风被集成在消费电子类的环绕声再现的播放电器内,特别是在电视机中,并且一个或多个麦克风被集成在外部扩音器内。
全文摘要
为了从相对远的距离实现语音控制,语音信号必须从干扰背景信号中分离出来。包括两个或多个麦克风的麦克风阵列实现空间分离。在尽可能远的距离上,空间地分布麦克风阵列的单个麦克风是很方便的。在单个消费电子电器中,单个麦克风之间的距离局限于电器的直径。本发明的语音控制系统包括具有多个麦克风的麦克风阵列,该阵列分布在不同电器之间,由麦克风产生的信号被传输到中央语音识别单元,该传输是基于IEEE1394总线的双向网络。
文档编号G10L21/0216GK1288222SQ00123498
公开日2001年3月21日 申请日期2000年8月18日 优先权日1999年9月14日
发明者恩斯特·F·施罗德 申请人:德国汤姆森-布兰特有限公司