用于提供邮件及包裹分拣信息的基于电话的语音识别的制作方法

文档序号:7669038阅读:273来源:国知局
专利名称:用于提供邮件及包裹分拣信息的基于电话的语音识别的制作方法
技术领域
本发明涉及邮件及包裹分拣系统,更具体地涉及用于提供邮件及包裹分拣信息的基于电话的语音识别系统。
背景技术
一般而言,邮件或包裹的分拣会是劳动密集型的工作。邮件或包裹的分拣要使用到附在邮件或包裹上的投递地址。运输、称重以及分拣这些操作都依赖于投递地址的读取。读取投递地址后,自动分拣、装运记录及帐单文件的创建这些操作都依赖于投递地址,以保证这些记录和文件的准确性。
邮件或包裹投递公司已经采用了传统的语音识别系统来提高邮件及包裹分拣的效率。通常,用户的语音输入向远程计算机提供了投递地址信息。远程计算机处理用户的声音或语音输入,将投递地址与存储的正确地址信息数据库进行比较。远程计算机向用户返回对用户语音输入的反馈。计算机可以向用户提供对投递地址的音频或视觉反馈。音频反馈可以是通过耳机、头戴耳机或扬声器向用户播放的音频信号。视觉反馈可以是发送至显示屏或监视器而由用户观看的视频信号。传统的分拣系统向用户提供形式为音频信号或显示屏视频信号的信号。用户从计算机接收反馈,并且用户响应于该信号进行相应的操作。
语音识别分拣系统中的一个尝试公布了一种便携式事物处理终端,其具有包含在一个手持机中的条码读取器、微处理器、收发器、调制解调器、视觉显示器、以及语音识别系统。用户进行分拣操作时,微处理器从条码扫描器或从语音识别系统的输出端接收信息输入,其中语音识别系统处理用户向手持机说的字母数字的名字或字词。通过调制解调器,收发器可以与远程的调制解调器进行信息交换。微处理器通过手持机向用户提供预先设定的音频消息,或在视觉显示器上提供信息。上述设备的一个缺点在于,条码读取器、收发器、调制解调器、显示器以及语音识别系统包含在一个手持机中,这使得手持机很复杂并很昂贵,不便于用户佩带和操作。另外,包含这些复杂设备的手持机的制造和维护也会很昂贵。这个设备的另一个缺点在于,微处理器无法向用户发送同时的信号,即给手持机的音频信号和给视觉显示器的信号,以进行反馈。
另一个在邮件及包裹分拣操作中利用语音识别的尝试涉及到手持机及独立的便携式计算设备。该计算设备包括语音识别模块,手持机包括用户显示器、麦克风和扬声器。用户向该设备输入语音数据时,该设备利用附属的便携计算机处理信息,通过手持机向用户提供音频反馈形式的数据反馈,或在显示器上提供视觉信息。和上述的便携式事物处理终端一样,所述便携式计算设备的一个缺点在于,语音识别模块、显示器、麦克风以及扬声器包含在一个手持机中,这使得手持机很复杂并很昂贵,不便于和便携式计算机一起佩带和操作。另外,包含这些复杂设备的手持机的制造和维护也会很昂贵。这个设备的另一个缺点在于,便携式计算机无法向用户发送同时的信号,即给手持机的音频信号和给视觉显示器的信号,以进行反馈。
另一个尝试使用了携带在用户身体上的便携计算机。用户通过安装在手持机中的麦克风与便携计算机进行通讯。用户把口述的地址信息传送到便携计算机,这里把信息处理为提供给用户的分拣信息。同样,缺点在于手持机和便携计算机不便于用户佩带和操作。另外,另一个缺点在于,便携计算机无法向用户发送同时的信号,即给手持机的音频信号和给视觉显示器的信号,以进行反馈。
因此,本领域中需要一种语音识别系统,用于分拣包裹这样的邮件,与传统的系统和设备相比,其便于佩带,易于操作和维护。另外,需要一种用于分拣包裹这样的邮件的语音识别系统,其可以向用户发送同时的信号,即给手持机的音频信号和给视觉显示器的信号,以进行反馈。

发明内容
本发明旨在解决上述问题。本发明提供了一种用于提供邮件及包裹分拣信息的基于电话的语音识别系统,与传统的系统和设备相比,其便于佩带,易于操作和维护。另外,本发明提供了一种用于提供邮件及包裹分拣信息的基于电话的语音识别系统,其可以向用户返回同时信号以进行反馈。也就是说,该系统提供同时信号,比如给用户手持机的语音信号,以及显示屏或监视器的数据信号以进行信息的视觉显示。在一种用于提供邮件及包裹分拣信息的基于电话的语音识别系统中,根据本发明实现了上述目的。
提供上述优点的基于电话的语音识别系统转化为了低成本的投递地址数据采集及返回系统。响应于用户的口述投递地址输入而发送的同时信号可以为用户提供多种形式的反馈,并可以向一个或多个用户提供相同或类似的反馈以执行一项或多项不同的分拣或投递操作。另外,还具有用户佩带舒适、操作简单、维护费用低的优点,并能降低操作用于分拣邮件及包裹的语音识别系统的总成本。
大致而言,本系统包括用于发送用户口述的分拣信息的无线电话机。第一调制解调器从无线电话机接收口述分拣信息,并通过电话系统将口述分拣信息发送到第二调制解调器。第二调制解调器通过电话系统接收口述分拣信息,并将口述分拣信息发送至计算机。计算机从第二调制解调器接收包含口述分拣信息的信号。计算机利用语音识别程序处理信号,响应于口述分拣信息,计算机生成具有语音信号和数据信号的返回信号。计算机将语音信号和数据信号发送至第二调制解调器。第二调制解调器对数据信号和语音信号进行编码,并通过电话系统将编码后的返回信号发送至第一调制解调器。第一调制解调器把编码返回信号解调为数据信号和语音信号。第一调制解调器把语音信号发送至无线电话机,把数据信号发送至相关的设备,如本地计算机,以用于其它的反馈用途,比如屏幕上的视觉显示或在打印机上打印标签。
更具体而言,无线电话机包括麦克风和发射器。当用户向麦克风读分拣信息,比如与一件包裹相关的投递地址时,发射器以无线电频率向基本电话接收器发送信号。基本电话接收器将语音信号发送至第一同时语音及数据(SVD)调制解调器。第一SVD调制解调器通过公共交换电话网络(PSTN)把语音信号发送至第二SVD调制解调器。
第二SVD调制解调器接收语音信号,并通过电话接口将该信号发送至计算机。计算机执行存储的一组指令,比如语音识别程序,以从语音信号中确定口述分拣信息。响应于分拣信息,计算机生成具有语音信号和数据信号的返回信号,将其发送回第二SVD调制解调器。SVD调制解调器将数据信号与语音信号一起进行编码,从而第二SVD调制解调器可以通过公共交换电话网络(PSTN)把信号组合发送至第一SVD调制解调器。第一SVD调制解调器接收返回信号,并将返回信号解码为语音信号和数据信号。第一SVD调制解调器把语音信号发送至基本电话接收器,基本电话接收器把语音信号发送至无线电话机。无线电话机的接收器把语音信号发送至扬声器,以向用户输出。
第一SVD调制解调器把数据信号发送至本地计算机、打印机、显示屏,或外部设备的任意组合。数据信号可以用于对标签或屏幕显示进行格式化。在一个优选实施例中,数据信号可以直接发送至打印机以打印标签。或者,数据信号可以直接发送至显示屏由用户查看。
在本发明的另一个方面,本发明与计算机局域网(LAN)协同工作。用户向无线设备的麦克风口述分拣信息。麦克风把口述分拣信息传送至发射器。发射器通过无线电频率把包含口述分拣信息的信号发送至语音设备,如语音编码器/解码器。语音编码器/解码器通过LAN把语音信号发送至计算机。计算机接收包含口述分拣信息的语音信号。所存储的一组指令,如语音识别程序,把语音信号解释为口述分拣信息。响应于口述分拣信息,计算机生成具有语音信号和数据信号的返回信号。计算机把数据信号和语音数据一起编码,并通过LAN把编码信号发送至语音编码器/解码器。语音编码器/解码器把返回信号解码或分离为语音信号和数字信号。把语音信号发送至无线设备的接收器。接收器把语音信号传送至扬声器,以输出给用户。语音信号可以包含音频指令或响应于口述分拣信息而向用户提供反馈。
也可以通过LAN把返回信号发送至本地计算机。本地计算机将返回信号解码为数据信号。把数据信号发送至相关的打印机、显示屏或其它外部设备,以编排标签、显示结果,或响应于口述分拣信息而提供反馈。
由以下的说明,结合附图和权利要求书,可以清楚地理解本发明其它的目标、特征和优点。


图1是本发明第一实施例的功能模块图;图2是本发明第二实施例的功能模块图;图3是一个流程图,解释了本发明的第一方法。
具体实施例方式
本发明可以在提供邮件和包裹分拣信息的系统中实施。响应于通过公共交换电话网络而接收到的包含分拣指令的用户语音输入,计算机,如中央或远程计算机,利用语音识别程序来解释用户的语音输入。与中央或远程计算机相关联的响应程序生成返回信号,比如数据信号和语音信号。中央或远程计算机把返回信号发送至编码器设备,如SVD调制解调器,把数据信号编码和语音信号一起编码,以通过公共交换电话网络进行同时信号传输。解码器设备,比如另一个SVD调制解调器,通过公共交换电话网络接收返回信号,并把返回信号分离或解码为数据信号和语音信号。把返回信号的各个信号部分发送给该用户或发送至几个用户,以用于不同的设备或应用,比如发送给音频头戴机以进行音频响应,发送给显示屏或监视器以进行视觉信息显示,发送给打印机以用于标签或类似的有形的反馈,或发送给类似的外部设备以用于其它的邮件或分拣功能。
本发明可以在这样一个系统中实施,其具有一个与第一SVD调制解调器相连的计算机,如中央或远程计算机,第一SVD调制解调器通过公共交换电话网络与第二SVD调制解调器进行通讯。用户通过无线电话机与该系统相通讯,该无线电话机与一个基本电话接收器相通讯。无线电话机向基本电话接收器发送无线电通信信号。基本电话接收器把用户的语音输入发送给第一SVD调制解调器。第一SVD调制解调器把用户的语音输入转换为语音信号,以通过公共交换电话网络传输至第二SVD调制解调器。第二SVD调制解调器接收包含用户语音输入的语音信号,并把语音信号发送至中央或远程计算机。在某些情况下,电话接口在信号到达中央或远程计算机之前接收数字信号。与中央或远程计算机相关联的语音识别程序解释用户的语音输入,计算机中存储的响应程序把用户的语音输入与分拣信息数据库进行比较。响应于用户的语音输入,响应程序生成包含,例如,语音信号和数据信号的返回信号。
响应程序把返回信号发送至第二SVD调制解调器,以把数据信号和语音信号一起编码,通过公共交换电话网络同时传输至第一SVD调制解调器。第一SVD调制解调器接收到返回信号时,该调制解调器把返回信号解码为语音信号和数据信号。第一SVD调制解调器把语音信号发送至基本电话接收器,以通过无线电话机进一步传输给用户。另外,第一SVD调制解调器把数据信号发送至本地计算机,以对信号进行处理,用于显示屏或监视器、用于打印机以编排或打印标签,或用于其它的外部设备。
无线电话机可以是使用户可以通过公共交换电话网络或类似网络传送语音输入的任何设备。基本电话接收器可以是能够在无线电话机和调制解调器之间交换信号的任何设备。
本发明使用的SVD调制解调器可以是能够发送和接收同时信号,如数据信号和语音信号的任何类型的调制解调器或设备。另外,SVD调制解调器可以是能够把数据信号与语音信号一起编码,并从语音信号中解码出数据信号的任何设备。公共交换电话网络可以是在两个SVD调制解调器之间交换信号,如模拟和数字信号的任何类型的网络。
电话接口可以是从计算机发送和接收信号的任何类型的接口。计算机可以是中央或远程计算机,或可以执行所存储的一组指令,以识别用户的语音输入,生成对用户语音输入的响应,并生成返回信号,如数据信号和语音信号,发送回用户的任何类型的计算机或设备。典型的,中央或远程计算机远离用户的位置,用户可以通过电话系统或计算机网络连接进行访问。在某些情况下,中央或远程计算机可以邻近或位于用户的位置,但用户同样通过电话系统或计算机网络连接进行访问。本地计算机可以是能够接收数据信号并对信号进行处理以输入至外部设备,如打印机或显示屏或监视器的任何类型的计算机或设备。典型的,如果对数据信号进行处理,以实现标签、视觉显示这样的反馈或类似的反馈,则本地计算机位于或邻近用户的位置,用户可以容易地进行访问。但是,有一些情况下,如果本地计算机位于用户无法访问的位置,则把数据信号发送给另一个用户,以实现打印标签、显示视觉输出的反馈,或其它类似的反馈。
现在参考附图,其中在所有的图中用相似的标号表示相似的部件。图1显示了本发明的第一实施例。系统100包括无线电话机102、基本电话接收器104、第一调制解调器106、公共交换电话网络(PSTN)108、第二调制解调器110、电话接口112、中央或远程计算机114、以及本地计算机116。
无线电话机102可以是传统的电话头戴机,其配置为通过选定的无线电频率在用户118和基本电话接收器104之间交换信号。无线电话机102包括与扬声器122相连的无线接收器120,以及与麦克风126相连的无线发射器124。用户118在其头部,或其可以对着麦克风126说话,并通过扬声器122收听输出信号的任何部位佩带无线电话机102。无线发射器124配置为通过无线电频率把无线电信号128从无线头戴机102发送至基本电话接收器104。无线接收器120配置为通过无线电频率从基本电话接收器104接收无线电信号128,并进一步配置为把信号128发送至扬声器122。合适的无线电话机为康涅狄格州Wilton的Voice Communication Interface公司制造的VL2h Voice Link系统。
基本电话接收器104配置为在无线电话机102和第一调制解调器106之间传送电话信号130a。典型的,基本电话机104通过传统的电话线与第一调制解调器106连接。但是,电话连接可以包括互联网、无线通信,以及其它合适的链接。基本电话接收器104可以,例如,配置为通过无线电频率与第一调制解调器106进行电话信号130a的通信。
第一调制解调器106连接在基本电话接收器104和PSTN 108之间,并连接在PSTN 108和本地计算机116之间。第一调制解调器106配置为从基本电话接收器104发送和接收电话信号130a,并把电话信号130a发送至PSTN 108。第一调制解调器106进一步配置为从PSTN 108接收数据信号132、语音信号133,或两者的组合,比如复合返回信号134。利用传统的解码方法和设备,第一调制解调器106把具有数据信号132和语音信号133的复合返回信号134解码或分离为单独的数据信号成分132和语音信号成分133。第一调制解调器106进一步配置为把数据信号132发送至本地计算机116,并把语音信号133发送至基本电话接收器104。
例如,响应于包含分拣信息,如投递地址的用户语音输入,可以生成返回信号,其具有包含分拣指令,如把一个邮件或包裹分拣进入的特定分拣仓号,的语音信号,以及包含分拣指令,如对一个邮件或包裹进行分拣的特定分拣仓号,的数据信号。把语音信号发送至基本电话接收器,并传输至用户的无线电话机,以由用户音频地接收该特定的分拣仓号,同时把数据信号发送至本地计算机,以传输至相关联的打印机,以编排或打印包含该特定分拣仓号的标签。可以生成其它类型的信号,比如确认音,或预先录制或计算机生成的语音响应。可以生成其它的数据信号,比如字符或数字串。利用与数据信号结合在一起的语音信号,返回信号可以向用户提供分拣信息,以对用户的口述分拣信息进行检验、校正、提示,或提供反馈。
适当的第一调制解调器是能够向/从基本电话接收器104发送/接收语音信号的同时语音及数据(SVD)调制解调器,并用于对从PSTN 108接收到的数据信号进行解码。例如,合适的第一调制解调器使用加利福尼亚州Newport Beach的Rockwell Telecommunication公司制造的RC288Aci/SVD芯片组。
PSTN 108连接在第一调制解调器106和第二调制解调器110之间。PSTN 108是配置为在第一调制解调器106和第二调制解调器110之间进行电话信号、数据信号、和这两种信号的组合的通信的传统公共交换电话网络或其它类型的通信网络。PSTN 108通过传统的电话线或通过无线电频率在第一调制解调器106和第二调制解调器110之间进行这些类型的信号的通信。
第二调制解调器110连接在PSTN 108和计算机电话接口112之间。第二调制解调器110配置为把包含口述分拣信息的语音信号130a从PSTN 108传输至电话接口112。另外,第二调制解调器110配置为编码并发送返回信号,如数据信号132,或语音信号133,或者这两个信号的组合,如复合返回信号134。第二调制解调器110利用传统的方法和技术来将数据信号132与语音信号133一起编码,从而形成复合返回信号134。合适的第二调制解调器可以是能够将语音信号与其它信号,如数据信号复用的同时语音及数据(SVD)调制解调器。例如,合适的第二调制解调器利用加利福尼亚州Newport Beach的Rockwell Telecommunication公司制造的RC288Aci/SVD芯片组。
电话接口112连接在第二调制解调器110和计算机,如中央或远程计算机114之间。电话接口112配置为从第二调制解调器110接收语音信号130a,并进一步配置为将接收到的信号130a转换为中央或远程计算机114有用的格式。合适的电话接口可以是用于把语音信号130a转换成计算机数字信号130b的传统的模数转换器。
如上所述,中央或远程计算机114与电话接口112相连。中央或远程计算机114配置为处理从电话接口112接收到的包含口述分拣信息的数字信号或电话信号130b,并进一步配置为响应于口述分拣信息生成返回信号,如数据信号132、语音信号133,或者两个信号的组合,如与语音信号133一起编码的数据信号132。典型的,中央或远程计算机114存储了一组包含语音识别程序136的指令,或者这组具有语音识别程序136的指令可以存储在中央或远程计算机114可以访问的外部设备(未显示)或格式中。计算机114执行语音识别程序136,把接收到的包含口述分拣信息的信号处理为计算机可读的格式,比如计算机114可以处理的数据串。
计算机114配置为执行存储的一组包含响应程序(未显示)的指令,以利用语音识别程序136处理得到的口述分拣信息生成返回信号。典型的,计算机14可以访问包含分拣信息的数据库(未显示)或存储设备。例如,计算机114配置为通过检查数据库,比如包含先前存储的投递地址的数据库,核对接收到的分拣信息的准确性,以处理接收到的口述分拣信息,如投递地址。响应程序配置为利用数据库分拣信息来生成对应于用户口述的投递地址的返回信号,如包含语音响应和特定分拣仓号的数字信号以及具有该特定分拣仓号的数据信号。其它的响应程序可以配置为利用语音识别程序136处理得到的口述分拣信息,基于与数据库的比较、存储设备中的信息、或者其它类似结构或设备中存储的数据来生成返回信号。
从而,响应于接收到的口述分拣信息,中央或远程计算机114生成返回信号,如数据信号132或语音信号133,或者这两者的组合,作为复合返回信号134。计算机14可以把返回信号发送回用户118或发送至本地计算机116,用于以下的相关用途。
中央或远程计算机114与第二调制解调器110相连。如前所述,第二调制解调器110配置为把语音信号和其它信号,如数字信号复用在一起。也就是说,第二调制解调器110配置为把包含语音和数据信号组合的返回信号从计算机114传输至PSTN 108。另外,PSTN 108与第一调制解调器106相连,并配置为把同时的语音和数据信号从第二调制解调器110传输至第一调制解调器106。
本地计算机116连接在第一调制解调器106和计算机外部设备,比如打印机138和显示屏140之间。本地计算机116配置为处理来自中央或远程计算机114的解码数据信号成分。处理过的数据信号成分可以由与本地计算机116相连的相关打印机138进行编排。另外,处理过的数据信号成分可以在与本地计算机116相连的相关显示屏140上编排或打印以进行视觉显示。其它的相关计算机外部设备,比如存储设备或其它输出设备可以配置为从本地计算机116接收处理过的数据信号成分。另外,第一调制解调器106可以直接与计算机外部设备相连,比如打印机138或显示屏140,其中第一调制解调器106配置为绕过本地计算机116而把解码数据返回信号直接发送至计算机外部设备138、140。
为了操作基于电话的语音识别系统100,用户118佩带无线电话机102。用户118开始分拣操作,比如分拣包裹142,或信件、邮包等等。用户118向无线电话机102的麦克风126读分拣信息,比如与包裹142相关联的标签146上的包裹投递地址144。麦克风126把口述分拣信息传送至无线电话机102的无线发射器124。无线发射器124通过无线电频率向基本电话接收器104发送包含口述分拣信息的无线电信号128。
基本电话接收器104接收来自发射器124的无线电信号128,并生成包含口述分拣信息的语音电话信号130a。基本电话接收器104通过无线电频率或传统的电话线把语音电话信号130a发送至第一调制解调器106。
第一调制解调器106接收来自基本电话接收器104的包含分拣信息的语音电话信号130a。第一调制解调器106通过公共交换电话网络(PSTN)108发送包含口述分拣信息的语音电话信号130a。PSTN 108接收来自第一调制解调器106的包含口述分拣信息的语音信号130a,并通过无线电频率或传统的电话线把信号130a传输至第二调制解调器110。
第二调制解调器110从PSTN 108接收到语音信号130a时,第二调制解调器110把语音信号130a发送至电话接口112。电话接口112从电话接口112接收信号130a,并把信号130a转换成格式130b,使中央或远程计算机114可以执行语音识别程序136。
当中央或远程计算机114从电话接口112接收到转换后的信号130b时,计算机114执行一组包含语音识别程序136的指令,以解释转换后的信号130b中的口述分拣信息。语音识别程序136处理口述分拣信息,确定口述分拣信息的内容。例如,口述分拣信息可以包含贴在包裹142上的标签146上的投递地址144。语音识别程序136把转换后的信号130b解释为用户口述投递地址,以用于相关的响应程序(未显示)。
响应程序利用语音识别程序136的结果,响应于口述分拣信息而生成返回信号,如数字语音信号133或数据信号132,或者这两者,作为复合返回信号134。返回信号是基于口述分拣信息,如投递地址144而发送回用户118、本地计算机116,或计算机外部设备138、140的响应。例如,计算机114可以访问内部或外部数据库,以将包含投递地址144的口述分拣信息与先前存储的地址进行核对或比较。响应于找到与投递地址相匹配的地址,计算机114生成相应的返回信号,比如确认文本串。确认文本串可以包含核准把包裹投递到投递地址144,或投递到与投递地址144相对应的特定分拣仓的校验码。另外也可以响应于未找到匹配的投递地址,计算机114生成相应的返回信号,比如包含拒绝把包裹投递到投递地址144的代码的确认文本串。在各种情况下,把返回信号中的确认文本串发送给用户118,以对用户的口述分拣信息进行核对、校正、提示,或提供反馈。
计算机,如中央或远程计算机114可以生成的返回信号的另一个例子是包含用户提示、附加分拣信息的询问、或对用户118的其它类似类型的反馈的语音信号。中央或远程计算机114可以生成的返回信号的另一个例子是复合返回信号134,比如与语音133一起编码的数据信号132。数据信号132可以包含返回分拣信息,比如分拣仓识别码、确认码,以及可以包含音频确认响应的语音信号133。
中央或远程计算机114通过系统100把语音信号133发送回用户118。语音信号部分133通过电话接口112从中央或远程计算机114发送至第二调制解调器110。第二调制解调器110从电话接口112接收语音信号133。
数字信号132从中央或远程计算机114直接发送至第二调制解调器110。第二调制解调器110接收数据信号132和语音信号133,并把数据信号132与语音信号133一起编码,以构成复合返回信号134。第二调制解调器110通过PSTN 108把包含数据信号132和语音信号133的复合返回信号134发送至第一调制解调器106。
如上所述配置为处理同时语音及数据传输的第一调制解调器106接收包含语音信号133和数据信号132的复合返回信号134。第一调制解调器106把复合返回信号134解码为单独的语音信号133和数据信号132。通过基本无线电话接收器104把解码后的语音信号133发送至用户118。基本无线电话接收器104从第一调制解调器106接收语音信号133,然后把语音信号133发送至用户的无线电话头戴机102中的无线接收器120。用户118接收音频信号形式的语音信号133,其包含返回分拣信息,比如分拣仓号或确认音,是从无线接收器120传输至用户的无线电话头戴机102中的扬声器122的。
第一调制解调器106把解码后的数据信号部分132发送至与第一调制解调器106相连的本地计算机116。本地计算机116接收数据信号132,利用数据信号132作为所存储的指令的输入。本地计算机116可以执行所存储的指令,使相关的打印机138打印具有MaxiCode码、条码、邮编、或其它类型的机器可读码或文本信息的标签,或者在相关的显示监视器140或屏幕上显示信息。
另外,第一调制解调器106也可以把数据信号132发送给与第一调制解调器106相关联的打印机138。利用数据信号132,打印机138可以编排和打印数据信号部分132中包含的返回分拣信息。另外,也可以把数据信号132直接从第一调制解调器106发送至与第一调制解调器106相关联的显示监视器132或屏幕。利用数据信号132,显示监视器140或屏幕可以视觉地显示数据信号部分132中包含的返回分拣信息。
图2是本发明第二实施例的功能模块图。本发明在包含计算机202局域网(LAN)的系统200中实施。系统200包括语音设备,如语音编码器/解码器204,其与LAN 202通讯,以与一个或多个相关联的计算机206、208交换语音输入信号和语音输出信号。语音编码器/解码器204配置为对用户210的语音输入信号进行数字编码,以便于计算机使用。另外,语音编码器/解码器204配置为将来自LAN 202的返回信号解码或转换为用于用户210的音频格式。语音编码器/解码器204包括处理器212,用于把用户的语音输入转换成数字信号格式,从而可以通过LAN 202而传送至一个或多个相关联的计算机206、208。例如,语音编码器/解码器204可以包含一个处理器,其配置有互联网语音协议(VoIP),或者类似的提供互联网语音传输的协议。另外,处理器也可以配备有语音识别硬件或软件模块,以将用户的语音输入转换成通过LAN 202或互联网传输的格式。
用户210佩带的无线设备214与语音编码器/解码器204进行通讯以交换信号。无线设备214可以与图1所示的无线电话机102类似,并可以包括类似的部件,比如与扬声器218相连的无线接收器216,以及与麦克风222相连的无线发射器220。用户210把无线设备214佩带在其头部,或者用户210可以对麦克风222说话并通过扬声器218收听输出信号的任何身体部位。
无线发射器220配置为从麦克风222接收包含用户口述分拣信息的用户语音输入,并将用户的语音输入转换成信号224。无线发射器220进一步配置为通过无线电频率把信号224发送至语音编码器/解码器204。无线接收器216也配置为通过无线电频率从语音编码器/解码器204接收信号224,并进一步配置为把信号224发送至扬声器218。合适的无线头戴机是康涅狄格州Wilton的Voice Communication Interface公司制造的VL2hVoice Link系统。
LAN 202是计算机分布式网络。本发明也可以用互联网、内部网、或其它类型的计算机网路实施。LAN 202连接在语音编码器/解码器204和计算机,如远程计算机206之间。LAN 202配置为利用互联网语音协议(VoIP)或类似的协议传输已经转换成信号格式的用户语音输入,或者传输如上所述由语音识别硬件或软件得到的信号。另外,LAN 202配置为传输由远程计算机206生成的数据和编码语音输出返回信号。
远程计算机206通过传统的数据链路与LAN 202相连,从而远程计算机206与LAN 202相通讯。远程计算机206进一步配置为接收已经利用互联网语音协议(VoIP)或类似协议转换成数字信号格式的用户语音输入,或由语音识别硬件或软件模块得到的信号。典型的,计算机,如远程计算机206,远离用户210的位置,用户如果不通过LAN 202则无法访问。在一些情况下,本地计算机208位于或接近用户210的位置,但是,本地计算机208保持与LAN 202的连接,LAN 202与本地计算机208相通讯。利用传统的语音识别硬件或软件(未显示),远程计算机206可以处理包含用户语音输入的信号格式,以确定包含用户口述分拣信息的文本串。响应于用户的口述分拣信息,远程计算机206利用响应程序(未显示)生成数字数据返回信号227,或者编码音频输出返回信号226,或两者226、227。典型的,远程计算机206把从LAN 202接收到的信号中的口述分拣信息与相关数据库中的分拣信息进行比较。基于包含口述分拣信息的文本串与相关数据库中的分拣信息之间的比较结果,远程计算机206生成数字数据返回信号227,或编码音频输出返回信号226,或两者226、227。合适的远程计算机206是得克萨斯州休斯顿的Compaq Computer Corporation公司制造的Deskpro Pentium III桌面计算机。
本地计算机208通过传统的链接与LAN 202相连,从而本地计算机208可以与LAN 202进行通讯。本地计算机208是与LAN 202连接的计算机,LAN202与远程计算机206相通讯。典型的,本地计算机208位于或接近用户210的位置。在一些情况下,本地计算机208位于用户210无法访问的位置,但是,本地计算机208保持与LAN 202相连,LAN 202与远程计算机206相通讯。本地计算机208配置为通过LAN 202从远程计算机206接收输出返回信号,即数字数据返回信号227。本地计算机208可以处理数字数据返回信号227,并将数字数据返回信号227发送至相关的打印机228或屏幕显示器230或监视器,或这两者。其它相关的计算机外部设备,比如存储设备或其它输出设备,可以配置为接收来自本地计算机208的数字数据返回信号。
打印机228接收来自本地计算机208的数字数据返回信号227。打印机228配置为编排和打印包含在数字数据返回信号227中的打印信息。
屏幕显示器230或监视器接收来自本地计算机208的数字数据返回信号227。屏幕显示器230或监视器配置为编排和显示数字数据返回信号227中包含的显示信息。
另外,远程计算机206也可以把数字数据返回信号227直接发送给与LAN 202相关联的打印机228。利用数字数据返回信号227,打印机228可以编排和打印数字数据返回信号227中包含的返回分拣信息。另外,数字数据返回信号227也可以直接从远程计算机206发送至与本地计算机208相关联的显示监视器230或屏幕。利用数字数据返回信号227,显示监视器230或屏幕可以视觉地显示数字数据返回信号227中包含的分拣信息。
为了操作系统200,用户210佩带无线头戴机214。用户开始分拣操作,如分拣包裹232,或信件、邮包等等。用户210对着无线头戴机214的麦克风222读入分拣信息,比如与包裹232相关联的标签236上的包裹投递地址234。麦克风222把口述分拣信息传送至发射器220,发射器220向语音编码器/解码器204发送无线电信号224。语音编码器/解码器204接收无线电信号224,处理器212把无线电信号224转换成数字信号,以利用互联网语音协议(VoIP)或类似协议通过LAN 202进行传输。另外,处理器212也可以配备有传统的语音识别硬件或软件(未显示),其可以把包含口述分拣信息的无线电信号224转换成数字信号,以通过LAN 202或互联网进行传输。语音编码器/解码器204向LAN 202发送包含口述分拣信息的信号238。
LAN 202从语音编码器/解码器204接收信号238,并把信号238发送至远程计算机206。远程计算机206从LAN 202接收信号238,并利用传统的语音识别硬件或软件(未显示)来处理包含口述分拣信息的信号238。响应于口述分拣信息,远程计算机206生成包含数字数据返回信号227、编码音频输出返回信号226、或这两者226、227的输出返回信号。远程计算机206通过LAN 202把包含编码音频返回信号226的输出返回信号发送回语音编码器/解码器204。
例如,远程计算机206可以从LAN 202接收包含口述分拣信息,如投递地址234的信号238。利用语音识别硬件或软件模块,远程计算机206把信号238处理为文本串格式。远程计算机206把包含口述分拣信息的文本串与包含分拣信息,如先前存储的地址的相关数据库(未显示)进行比较。远程计算机206访问相关的数据库,以对包含口述分拣信息的文本串与相关数据库中的先前存储的地址进行核对或比较。响应于找到与口述分拣信息匹配的地址,计算机206生成相应的包含数字数据返回信号227或编码音频输出返回信号226,或这两者226、227的输出返回信号,比如确认文本串。确认文本串可以包含准许把包裹投递到投递地址的校验码。远程计算机206通过LAN 202把包含数字数据返回信号227、编码音频输出返回信号226,或这两者226、227的输出返回信号发送回语音编码器/解码器设备。
另外,也可以响应于未找到匹配的投递地址,远程计算机206生成相应的输出返回信号226,比如包含拒绝把包裹投递到投递地址234的代码的确认文本串。在这两种情况下,包含编码音频输出返回信号226的输出返回信号226被发送给用户210,以对用户的口述分拣信息进行核对、校正、提示,或者提供反馈。
可以由计算机,如远程计算机206生成的输出返回信号的其它例子是包含用户提示、附加分拣信息询问、或其它类似类型的对用户210的反馈的音频信号。可以由远程计算机206生成的输出返回信号的另一个例子是数字数据信号部分227。数字数据信号部分227可以包含返回分拣信息,比如用于打印机或显示器的确认码。
LAN 202从远程计算机接收输出返回信号226。LAN 202把输出返回信号226发送至语音编码器/解码器204。语音编码器/解码器204的无线接收器216从LAN 202接收输出返回信号226。语音编码器/解码器204把输出返回信号226发送至处理器212。处理器212把输出返回信号226解码为模拟音频信号。解码后的音频信号作为信号224通过无线电频率被发送至无线设备218的接收器220。接收器把信号224传送至无线设备218的扬声器218。用户210收听从扬声器218传来的包含返回分拣信息的音频信号形式的信号224。
处理器212也可以把解码后的数字数据信号227发送给用户210。处理器212可以结合传统的语音合成软件或硬件(未显示)一起操作,以生成合成的语音。可以通过用户的无线设备218中的扬声器218把合成语音发送给用户210。例如,可以通过语音合成软件或硬件模块处理包含返回分拣信息的数字数据信号227,以生成合成语音命令。处理器212通过无线电频率的信号224把合成语音命令发送至接收器220。接收器220把信号传送给扬声器218,从而扬声器218可以把合成语音命令广播给用户210。
图3是一个逻辑流程图,显示了本发明的第一方法。第一方法300可用于本发明不同的实施例。例如,以下结合图1所示的系统100对第一方法300进行说明。第一方法300从步骤302开始。
步骤302后是步骤304,其中系统100从用户处接收包含包裹地址的口述分拣信息。如图1所示,用户118佩带无线电话机102。用户118开始分拣操作,比如分拣包裹142,或信件、邮包等等。用户向无线电话机102的麦克风126读出分拣信息,比如包裹142上的相关标签146上的投递地址144。
步骤304之后是步骤306,其中系统100把口述分拣信息发送至远程计算机114。麦克风126把口述分拣信息传送给发射器124,发射器124向基本电话接收器104发送包含口述分拣信息的无线电信号128。基本电话接收器104通过无线电频率或传统的电话线向第一调制解调器106发送包含口述分拣信息的语音信号130a。第一调制解调器106通过公共交换电话网络(PSTN)108发送包含口述分拣信息的语音信号130a。PSTN 108通过无线电频率或传统的电话线把信号130a传输至第二调制解调器110。第二调制解调器110把语音信号130a发送至电话接口112。电话接口把信号130a转换成计算机,如执行语音识别程序136的远程计算机114的格式。远程计算机114从电话接口112接收转换后的信号130b,并把转换后的信号130b处理为分拣信息。
步骤306之后是步骤308,其中系统100响应于接收到诸如投递地址144的口述分拣信息,生成返回信号,比如数据信号132、语音信号133,或复合返回信号134中这两者的组合。远程计算机114执行一组包含语音识别程序136的指令,以解释转换后的信号130b中包含投递地址的口述分拣信息。语音识别程序136处理口述分拣信息,以确定分拣和/或投递信息。例如,口述分拣信息可以包含来自包裹142或标签146的投递地址144。响应程序(未显示)响应于口述分拣信息,利用来自语音识别程序136的投递地址144生成返回信号。返回信号是基于口述分拣信息发送回用户118、本地计算机116,或发送回计算机外部设备138、140的响应。例如,计算机114可以访问内部或外部数据库,以对包含投递地址144的口述分拣信息以及先前存储的地址进行核对或比较。响应于找到与投递地址144匹配的地址,计算机114生成相应的返回信号,比如确认文本串。确认文本串可以包含核准投递到投递地址144的校验码。另外,也可以响应于未找到匹配的投递地址,计算机114生成相应的返回信号,比如包含拒绝投递到投递地址144的代码的确认文本串。在这两种情况下,把返回信号中的确认文本串发送给用户118,以对用户的口述分拣信息进行核对、校正、提示,或者提供反馈。
步骤308之后是步骤310,其中系统100把返回信号编码为数据信号132、语音信号133,或者这两者的组合作为复合返回信号134。远程计算机114通过电话接口112把语音信号133发送至第二调制解调器110。第二调制解调器110从电话接口112接收语音信号133。把数据信号132从中央或远程计算机114直接发送至第二调制解调器110。第二调制解调器110接收数据信号132和语音信号133,并把数据信号132和语音信号133一起编码成复合返回信号134。
步骤310之后是步骤312,其中系统100把复合返回信号134发送至第一调制解调器106。第二调制解调器110通过PSTN 108把包含数据信号132和语音信号133的复合返回信号134发送至第一调制解调器106。
步骤312之后是步骤314,其中系统100对复合返回信号134进行解码。第一调制解调器106把返回信号134解码为单独的语音信号133和数据信号132。可以通过基本无线电话接收器104把解码语音信号133发送给用户118。基本无线电话接收器104从第一调制解调器106接收语音信号133,然后把语音信号133发送至用户的无线电话机102中的无线接收器120。用户接收从无线接收器120传输到用户的无线电话机102中的扬声器122、包含返回分拣信息的音频信号形式的语音信号133。
第一调制解调器106可以把解码数据信号132发送至与第一调制解调器106相连的本地计算机116。本地计算机116接收数据信号132,并利用数据信号132作为所存储的一组指令的输入。本地计算机116可以执行所存储的一组指令,以指示相关的打印机138打印标签,或在相关的显示监视器140或屏幕上显示信息。
步骤314之后是步骤316,方法300结束。
如上所述,可以看出,本发明提供了一种基于电话的语音识别系统,用于提供包裹和信件分拣中使用的信息。本发明提供了一种用于提供包裹及信件分拣信息的基于电话的语音识别系统,与传统的系统和设备相比,其便于佩带,易于操作和维护。另外,本发明提供了一种用于提供包裹及信件分拣信息的基于电话的语音识别系统,其可以向用户返回同时的信号以进行反馈。可以理解,所公布的实施例是用于示例,在不脱离所附权利要求的范围和实旨的情况下,本领域技术人员可以进行多种改进。
权利要求
1.一种系统,用于处理用户口述的分拣信息,并响应于用户口述的分拣信息,利用计算机生成返回信号,以在电话系统上传送回该用户,所述的系统包括无线电话机,用于接收用户口述的分拣信息;把分拣信息发送至第一调制解调器,所述的第一调制解调器用于通过电话系统把口述分拣信息从无线电话机发送至第二调制解调器;所述的第二调制解调器用于从第一调制解调器接收口述分拣信息;把口述分拣信息发送至计算机;以及所述的计算机用于从第二调制解调器接收口述分拣信息;响应于口述分拣信息生成包含语音信号和数据信号的返回信号;把所述的语音信号和数据信号发送至第二调制解调器;所述的第二调制解调器还用于把数据信号和语音信号一起编码,以通过电话系统传输至第一调制解调器;所述的第一调制解调器还用于把来自第二调制解调器的数据信号和语音信号解码为单独的语音信号和数据信号;把语音信号发送至无线电话机;以及所述的无线电话机还用于从计算机处接收语音信号。
2.根据权利要求1所述的系统,其中的口述分拣信息包括投递地址。
3.根据权利要求1所述的系统,其中的无线电话机包括发射器,用于把口述分拣信息发送至第一调制解调器,以及接收器,用于从第一调制解调器处接收返回信号。
4.根据权利要求3所述的系统,其中的无线电话机还包括麦克风,用于从用户处接收口述输入,以及扬声器,用于广播接收器接收到的返回信号。
5.根据权利要求3所述的系统,其中的无线电话机还包括基本电话接收器,用于接收来自发射器的口述分拣信息,以及把口述分拣信息发送至第一调制解调器。
6.根据权利要求1所述的系统,其中的电话系统包括无线电话网络。
7.根据权利要求6所述的系统,其中的电话系统包括公共交换电话网络。
8.根据权利要求1所述的系统,其中的计算机还包括电话接口,用于把口述分拣信息从第二调制解调器传送至远程计算机。
9.根据权利要求1所述的系统,其中的计算机还用于执行一组包含语音识别程序的指令,以解释口述分拣信息。
10.根据权利要求1所述的系统,其中的计算机包括远程计算机。
11.根据权利要求1所述的系统,其中的第一调制解调器包括同时语音及数据(SVD)调制解调器。
12.根据权利要求11所述的系统,其中的第二调制解调器包括同时语音及数据(SVD)调制解调器。
13.根据权利要求1所述的系统,其中的返回信号包括一个提示,提示用户对口述分拣信息的准确性进行响应。
14.根据权利要求1所述的系统,其中的返回信号包括分拣指令。
15.根据权利要求1所述的系统,其中的第一调制解调器还用于把返回信号解码为语音信号和数据信号。
16.根据权利要求15所述的系统,其中的第一调制解调器还用于把数据信号发送至本地计算机。
17.根据权利要求16所述的系统,其中由本地计算机对数据信号进行处理,并且本地计算机指示相关的打印机编排或打印标签。
18.根据权利要求16所述的系统,其中由本地计算机对数据信号进行处理,并且本地计算机在相关的视觉显示设备上显示信息。
19.根据权利要求15所述的系统,其中的第一调制解调器把数据信号发送至相关的打印机以编排或打印标签。
20.根据权利要求15所述的系统,其中的第一调制解调器把数据信号发送至相关的视觉显示设备以显示信息。
21.根据权利要求15所述的系统,其中的语音信号包括响应于用户口述分拣信息的音频指令。
22.一种系统,用于处理用户口述的分拣信息,并响应于口述分拣信息生成包含与语音信号编码在一起的数据信号的返回信号,该系统包括具有语音编码器和语音解码器的语音设备,其中,语音编码器配置为从用户处接收口述分拣信息,并把口述分拣信息编码为数据信号,语音解码器配置为接收基于口述分拣信息的返回信号,并将返回信号解码为语音信号;计算机,配置为处理来自语音编码器的包含口述分拣信息的数据信号,并配置为基于口述分拣信息生成返回信号,其中,返回信号包括数据信号和编码语音信号;以及网络,用于在语音设备和计算机之间传送信号,其中,语音编码器通过网络把口述分拣信息发送至计算机,语音解码器通过网络从计算机处接收包含与语音信号编码在一起的数据信号的返回信号。
23.根据权利要求22所述的系统,其中的口述分拣信息包括投递地址或指令。
24.根据权利要求22所述的系统,其中的语音设备包括无线电话机,其具有配置为把口述分拣信息发送至语音编码器的发射器和配置为从语音解码器接收返回信号的接收器。
25.根据权利要求24所述的系统,其中的无线电话机还包括配置为从用户处接收口述输入的麦克风和配置为广播接收器接收到的返回信号的扬声器。
26.根据权利要求22所述的系统,其中的网络包括计算机局域网。
27.根据权利要求22所述的系统,其中的计算机进一步配置为执行一组包含语音识别程序的指令,以解释口述分拣信息。
28.根据权利要求22所述的系统,其中的计算机包括远程计算机。
29.根据权利要求22所述的系统,其中的返回信号包括一个提示,提示用户对口述分拣信息的准确性进行响应。
30.根据权利要求22所述的系统,其中的返回信号包括分拣指令。
31.根据权利要求22所述的系统,其中的返回信号包括响应于用户口述分拣信息的音频指令。
32.根据权利要求22所述的系统,其中的计算机进一步配置为把返回信号发送至本地计算机。
33.根据权利要求32所述的系统,其中,由本地计算机对返回信号进行处理,并且本地计算机指示相关的打印机编排或打印标签。
34.根据权利要求32所述的系统,其中,由本地计算机对返回信号进行处理,并且本地计算机在相关的视觉显示设备上显示信息。
35.根据权利要求22所述的系统,其中的计算机把返回信号发送至相关的打印机以编排并打印标签。
36.根据权利要求22所述的系统,其中的计算机把数据信号发送至相关的视觉显示设备。
37.在包含基本电话接收器和计算机的电信网络中,一种处理口述分拣信息并生成对口述分拣信息的响应的方法,包括通过基本电话接收器接收来自用户的口述分拣信息;响应于接收到口述分拣信息,利用计算机生成返回信号,其中,返回信号包括要传输至基本电话接收器的与语音信号编码在一起的数据信号;通过基本电话接收器把返回信号发送给用户;以及把返回信号解码为数据信号和语音信号。
38.根据权利要求37所述的方法,还包括把数据信号发送至相关的本地计算机,所述本地计算机用于利用数据信号生成标签;以及响应于口述分拣信息打印标签。
39.根据权利要求37所述的方法,还包括把数据信号发送至相关的视觉显示设备,所述的视觉显示设备用于利用数据信号并响应于口述分拣信息生成视觉显示。
40.根据权利要求37所述的方法,其中,所述的口述分拣指令包括投递地址或指令。
41.根据权利要求37所述的方法,其中的计算机包括远程计算机。
全文摘要
本发明涉及用于分拣包裹(142)和信件的基于电话的语音识别系统。本发明包括通过电话系统(108)或网络与计算机(114)相通讯的无线电话机(102)。通过无线电话机(102)把用户(118)口述的分拣信息发送至语音设备或调制解调器(106)。语音设备或调制解调器(106)通过电话系统(108)或网络向计算机(114)发送一个包含口述分拣信息的信号。一组存储的指令,如语音识别程序,解释该信号以获得口述分拣信息。计算机(114)响应于口述分拣信息生成返回信号,如数据信号、编码语音信号,或这两者。第二调制解调器(110)对返回信号进行编码,并通过电话系统(108)或网络把返回信号发送至语音设备或调制解调器(106)。语音设备或调制解调器(106)把返回信号解码为输出至本地计算机(116)的数据信号(132)以及输出给用户(118)的语音信号(133)。
文档编号H04M3/493GK1479656SQ01820177
公开日2004年3月3日 申请日期2001年12月5日 优先权日2000年12月7日
发明者约翰·C·科吉歇尔, 詹尼弗·M·爱德华兹, 卡尔·M·斯科博格, M 爱德华兹, M 斯科博格, 约翰 C 科吉歇尔 申请人:美国联合包装服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1