采用肌电描记传感器启动与基于语音的装置的口头交流的方法和设备的制作方法

文档序号:6512746阅读:238来源:国知局
专利名称:采用肌电描记传感器启动与基于语音的装置的口头交流的方法和设备的制作方法
技术领域
本发明通常涉及基于语音的系统,并且更具体地涉及启动与基于语音的系统的口头交流(oral communication)。
背景技术
人类通过各种方式与各种电子装置进行接口(interface)。人类与电子装置进行接口的方式大部分取决于该装置的功能。例如,计算机典型地在些时候依赖于来自用户的数据输入,并且在传统上这种输入来自键盘、鼠标、或某些其它类型的外围装置。然而,移动电话不仅通过键盘接收输入,而且通过麦克风进行口头输入。但是占主导的情况是,用户与该装置进行接口,以告知该装置所要处理的信息。
在接口技术中可以察觉到有一种“免提”接口的趋势。在很多情况下,人们可能需要或希望与电子装置进行接口,而不需要大量的物理操作或甚至接触。例如,汽车司机在驾驶的时候,由于安全的原因可能希望不必通过手动来拨电话号码,或使用手动控制来操作诸如导航系统的装置。可替换地,身体障碍人士可能在操作诸如键盘和鼠标的常规计算外围装置时具有巨大的困难。某些身体障碍人士可能完全不能从身体上操作这些种类的外围装置。在这些情况下,免提接口就大大增强了各种电子装置的功用。
在基于语音的技术中的最新进展已经加速了这种免提接口的趋势。传统上,基于语音的技术(包括语音识别技术)性能非常差,或者完全不能工作。产生这些困难的某些原因是语言本身。每种语言都有其自己的语法、句法、发音、拼写等规则,它们中的某些相对较复杂,从而不同的语言典型地需要单独的应用。这就损害了应用的通用性。某些困难是由语音引起的。即使两个人说相同的语言,它们讲起来也可能非常不同。这种情况的一个经典范例就是,美国英语与英国英语的区别。但是更微妙的是,语音通常不仅随语言而变,而且还随其它因素(诸如方言、成语、地理位置等)而变。当在噪音环境中(诸如在车辆中或在工厂地板上)使用基于语音的系统时产生另一个问题。
计算技术中的进步已经明显地有助于基于语音的系统中的进步。电子装置的计算能力已经明显地增加了,而产生这种计算能力的电路大小却明显地减小。于是电子装置越来越小,并且计算能力越来越强。这就让设计者能够采用更强大和复杂的软件算法,以处理口头输入(oral input)并得到合理精确的结果。
尽管具有最新的这些进展,但是与现代电子装置进行接口通常需要来自用户的手动干涉。例如,启动接口仍然典型地需要某些手动干涉。一种通常的实施方式就是熟知的“即按即说”切换(push-to-talkswitch),其中需要用户实际操作。对于移动电话,该切换通常位于插入电话的耳机(headset)的绳上。对于计算设备,该切换可以是键盘上被编程的热键,或者是显示给用户的图形用户界面中的可点击按钮。不管是哪种方式,该电子装置都是被动的,即其不能检测会话的启动,用户必须手动启动会话。
本发明意欲克服、或者至少减少上述一个或多个问题。

发明内容
本发明是一种用于电子装置的用户接口和一种用于与电子装置进行接口的方法。该用户接口包括传感器和接口。该传感器能够感测与口头交流相关联的用户的物理移动并产生其指示。该传感器然后能够通过该接口向电子装置提供该指示。该方法包括感测用户的物理移动,并响应于对物理移动的感测,向电子装置指示口头交流的启动。


可以连同附图一起,参照下面的描述理解本发明,其中相同的附图标记表示相同的部件,并且其中图1所述为根据本发明的系统的第一实施例;图2所述为可以在图1的系统中使用的耳机的一个实施例;图3所述为在图1的系统中使用的电子装置的功能性方框图;图4所示为本发明的第二实施例,其中耳机通过无线通信链路与计算设备进行接口;和图5所示为本发明的第三实施例,其中电子装置安装有麦克风。
但是本发明容许有各种修改和替换形式,这里已经通过范例的方式示出了本发明的具体实施例,并对其进行了详细描述。然而应该理解的是,此处具体实施例的描述并不意欲将本发明限制为所公开的特定形式,相反其意欲覆盖通过所附权利要求书限定的本发明的精神和范围内的所有修改、等同物和替换形式。
具体实施例方式
下面描述本发明的说明性实施例。出于清楚的考虑,在本说明中并没有描述实际实施方式的所有特征。当然会理解的是,在开发这种实际的实施例中,必须做出多种实施方式特定的判决,以实现开发者的具体目标,诸如符合与系统相关的和商业相关的限制,其会根据各种不同的实施方式而变化。而且应该理解的是,这种开发努力可能会比较复杂和费时,但是对于任何受到本发明教导的本领域的熟练技术人员都是常规程序。
对这里所使用的术语和短语的理解和解释应该与相关技术领域的熟练技术人员对这些词语和短语所理解的意义一致。这里,属于或短语的一致使用不会暗指该术语或短语的特殊定义,即与本领域的熟练技术人员所理解的普通意义和习惯意义不同的定义。在术语或短语意欲表示特殊意义(即与本领域的熟练技术人员所理解的意义不同的意义)时,会在说明中以定义的方式陈述这种特殊定义,其直接并且明确地提供该术语或短语的特殊定义。
如下更加详细的讨论,本发明在其各个方面和实施例中包括能够感测与口头交流相关联的用户的物理移动并产生其指示的传感器;和该传感器能够通过其向电子装置提供该指示的接口。在使用中,该传感器感测用户的物理移动,并且向电子装置指示启动口头交流,以响应于对物理移动的感测。通过这种方式,用户基本上可以“免提”地与电子装置进行接口。
现在转向附图,图1所述为本发明的特定实施例100。图1的实施例包括通过通信链路109与电子装置106通信的耳机103。在该特定实施例中,通信链路109包括线缆112和连接器115,耳机103通过其与电子装置106进行接口。该电子装置106例如可以是计算设备118,或可替换地是移动电话121。在替换实施例中,该电子装置106可以是任何能够支持基于语音的特征的装置,包括并不限于语音识别系统、音频记录器等。
在图2中更加详细的描述了耳机103。耳机103包括基部(base)200、从基部200向外延伸的架杆(boom)203、安装在架杆203末端的麦克风209、与基部200关联的传感器212、扬声器215和受话器盖(ear piece)218。当使用耳机103时,传感器212能够感测与口头交流相关的物理移动。在所述实施例中,受话器盖218将耳机103与用户固定,并进一步定位基部200,以将传感器212放在靠近用户的理想位置,以感测用户的物理移动。在该特定实施例中,该传感器212位于用户的下颌与头骨相连接的颞下颌关节的区域中。在替换的实施例中,该传感器212可以位于在其中能够检测到用户的所需移动(诸如用户的至少一部分脸部运动)的任何所需位置。架杆203可以用来相对于用户的嘴部定位麦克风209。架杆203、麦克风209、和扬声器215以常规的方式工作。
在所述实施例中,传感器212是肌电描记(electromyographicEMG)传感器。EMG传感器在某些医学领域中、并且特别是在物理康复治疗和人造修复中是熟知的。将EMG传感器放置在皮肤表面上,感测在皮肤下由于神经元(neuron)刺激收缩肌肉产生的肌肉电活动。如在所述实施例中所提到的,在颞下颌关节的区域中及其周围放置传感器212,所述颞下颌关节富含有大量与语音相关的肌肉组织。当用户启动口头交流时,传感器212感测肌肉的电活动,并产生指示可以进行口头交流的信号。
在所述实施例中,基部200协同受话器盖218一起定位传感器212,使得其能够感测用户的物理移动。然而,基部200只是可以实现该功能的一个设备。在本发明的教导下,本领域的技术人员可以清楚其它设备。在一个实施例中,基部200、受话器盖218、和架杆203可以提供用于将麦克风209固定到所需位置上的设备。但是也可以其它方式实施该特征,诸如将架杆固定到地轴架(未示出)上。受话器盖218也只是通过其可以定位基部200以放置传感器212来感测物理移动的一个设备。例如可以替代使用头带(headband),并且还可以使用其它设备。
在所述实施例中,传感器212感测与口头交流相关的用户的物理移动。该范例中的传感器212是变换器(transducer),并且从而产生表示移动的输出,即电子信号。在某些实施例中,最好可以使用另外的电路来调节信号,以与电子装置106所采用的输入/输出(I/O)协议兼容。但是注意到,这种调节并不需要太复杂,因为在某些情况下该信号可能用来简单地表示口头交流的启动。
图3所述的功能性方框图为在计算设备118中实施的能够提供语音识别能力的电子装置106。计算设备118包括通过总线系统315与某个存储器310通信的处理器305。存储器310可以包括硬盘和/或RAM和/或可移动存储器,诸如磁盘317和光盘320。在所述实施例中,存储器310包括语音识别软件323和一个或多个用于为语音识别软件323提供信息的数据结构325。可以以本领域所知道的任何方式实施语音识别软件323和数据结构325。
存储器310也可以包括操作系统330和接口软件335,其连同显示器340和耳机103一起组成操作者接口345。该操作者接口345也可以包括可选的外围I/O装置,诸如以前未示出的键盘350或鼠标355。该处理器305在操作系统330的控制下运行,其实际上可以是本领域所知道的任何操作系统。在操作系统330的控制下,处理器305在启动时调用接口软件335,使得用户可以控制该计算设备118。如下更加详细所述,用户通过操作者接口345由处理器305调用该语音识别软件323。
图4所示为替换图1实施例的第二实施例400,其中耳机103通过无线通信链路403与计算设备118进行接口。计算技术包括多个定义完好、理解完好、并且广泛熟知的技术和协议,用于使外围装置(诸如鼠标和键盘)与计算系统进行无线接口。这些相同的技术可以用来实现实施例400。在所述的实施例中,耳机103包括传输电路和调节电路,以对传感器212产生的信号进行调节。许多计算机已经包括端口,诸如端口406(通常位于背面),用于与可以用于此目的的外围装置进行无线通信。在一个实施例中,耳机103可以通过端口406与计算设备118通信。
图5所示为第三实施例500,其中耳机503通过无线通信链路403与计算设备118接口,与图4的实施例中相同。在所述实施例中,耳机503包括基部200、传感器212、扬声器215和受话器盖218。如图中所见到的,图5中所示的耳机503并不包括架杆203(参见图2)和麦克风209(参见图2)。相反,在所述实施例500中,麦克风506与计算设备118关联着。特别地,麦克风506安装到监视器509上,但是其可替换地可以安装在例如麦克风站架(未示出)或CPU盒512上。注意到在某些替换实施例中,只要它们具有“对讲机”(walkie-talkie)功能,耳机503还可以与移动电话121(在图1中未示出)一起使用。
现在返回图1,在操作中,耳机103固定在用户的头上。当用户开始讲话时,就可以感测与口头交流相关的用户的物理移动(例如下颌的移动)。在所述的实施例中,通过检测收缩产生物理移动的肌肉的电子脉冲来感测这种移动。然后响应于对物理移动的感测,将已经启动口头交流的指示传送给电子装置106。电子装置106然后调用基于语音的能力(例如图3中的语音识别软件323、或移动电话中用于传输的信号处理),以处理通过麦克风209接收的口头交流。
于是根据该实施方式,本发明可以产生优于现有技术的重大好处。例如当与计算机一起使用时,本发明使得用户可以更加“免提”地接口,因为用户不再必须手动地激活基于语音的功能。当与移动电话一起使用时,其通过允许用户的双手都保持在方向盘上,可以使得电话的用户更加安全。在这些和其它实施方式中还有的其它好处和优点对于受到本发明教导的本领域技术人员是显而易见的。
这里结束该详细描述。上面所公开的特定实施例只是说明性的,由于可以以不同但是等同的方式修改和实现本发明,其对于受到本发明教导的本领域的熟练技术人员是显而易见的。而且,此处所示的详细结构和设计无意欲限制本发明,而是由下面所述的权利要求书进行限制。因此显然可以改变和修改上面所公开的特定实施例,并且所有这些变化都认为是位于本发明的精神和范围内。相应的,此处的保护范围如下面的权利要求书中所述。
权利要求
1.一种用于电子装置的用户接口,包括能够感测与口头交流相关联的用户的物理移动并产生其指示的传感器;和传感器可通过其将所述指示提供给电子装置的接口。
2.权利要求1的用户接口,进一步包括用于定位传感器以感测物理移动的装置。
3.权利要求1的用户接口,进一步包括能够接收来自用户的口头交流的麦克风。
4.权利要求1的用户接口,其中所述传感器包括肌电描记传感器。
5.权利要求1的用户接口,其中所述用户接口包括连接器。
6.权利要求1的用户接口,进一步包括用于通过无线通信链路传输的发射器。
7.一种用于与电子装置一起使用的耳机,包括基部;与所述基部相关联的麦克风;与所述基部相关联,能够感测与口头交流相关联的物理移动并产生其指示的传感器;可通过其定位所述基部,以放置传感器来感测物理移动的装置;和传感器可通过其将所述指示传送给电子装置的接口。
8.权利要求7的耳机,其中所述基部和受话器盖包括用于定位传感器的装置。
9.权利要求7的耳机,其中所述传感器包括肌电描记传感器。
10.权利要求7的耳机,其中所述用户接口包括连接器。
11.权利要求7的耳机,其中所述用户接口包括无线通信链路。
12.权利要求7的耳机,进一步包括与基部相关联的扬声器。
13.权利要求7的耳机,其中基部定位装置包括受话器盖或头带。
14.一种设备,包括电子装置;和用户接口,包括能够感测与口头交流相关联的用户的物理移动并产生其指示的传感器;和传感器可通过其将所述指示传送给电子装置的接口。
15.权利要求14的设备,进一步包括用于定位传感器以感测物理移动的装置。
16.权利要求14的设备,进一步包括能够接收来自用户的口头交流的麦克风。
17.权利要求14的设备,其中所述传感器包括肌电描记传感器。
18.权利要求14的设备,其中所述用户接口包括连接器。
19.权利要求14的设备,其中所述用户接口包括无线通信链路。
20.权利要求14的设备,其中所述电子装置包括计算装置或移动电话。
21.一种用于与电子装置进行接口的方法,包括感测用户的物理移动;和响应于对物理移动的感测,向电子装置指示口头交流的启动。
22.权利要求21的方法,进一步包括接收所述口头交流;调用基于语音的能力;和处理接收的口头交流,以响应感测口头交流的启动。
23.权利要求21的方法,进一步包括启动与所述电子装置的口头交流。
24.权利要求21的方法,进一步包括定位所述传感器,以感测物理移动。
25.权利要求21的方法,其中感测物理移动包括感测产生物理移动的肌肉组织的电活动。
26.权利要求21的方法,其中向所述电子装置进行指示包括产生电子信号。
27.权利要求26的方法,其中向所述电子装置进行指示包括调节所述电子信号。
全文摘要
本发明公开了一种用于电子装置的用户接口,和一种用于与电子装置进行接口的方法。该用户接口包括传感器和接口。该传感器能够感测与口头交流相关的用户的物理移动并产生其指示。该传感器然后能够通过该接口向电子装置提供该指示。该方法包括感测用户的物理移动,并响应于对物理移动的感测,向电子装置指示口头交流的启动。
文档编号G06F3/00GK1707425SQ20051000434
公开日2005年12月14日 申请日期2005年1月13日 优先权日2004年1月14日
发明者凯文·B.·安布罗斯 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1