专利名称:语音处理系统及方法
技术领域:
本发明是关于一种语音处理系统及方法,特别是关于一种将网络电话(VoIP,Voice over IP)接收到的语音信息转换成文字信息的语音处理系统及方法。
背景技术:
在企业国际化的发展趋势下,许多企业的办公模式将不同的职能部门分布于世界各地,例如将美国设定销售地,将台湾作为研发中心,以大陆作为制造基地,利用各地的最佳资源提高该企业的利润,但该运行模式使得位于各地办公的员工之间的实时沟通显得格外重要,由于Internet的普及,国际化企业普遍以VoIP网络电话作为沟通的媒介。
所谓VoIP(Voice over IP)网络电话,就是将语音信号压缩成数据包,并在IP网络上传送语音的服务,也就是通过国际互联网(以下简称Internet)传送语音的电信应用服务系统。因此,为使用VoIP网络电话的通信功能,使用者即要建构一网络电话系统,令多个网络电话设置在其中,且供网络电话设置处的使用者使用该网络电话提供的语音通信功能。
对上述国际化企业而言,各个网络电话常常储存有不同客户的来电语音信息(voice message)以及其它业务上往来的重要语音信息,如重要的会议记录信息等,若使用者想要接收网络电话上的语音信息,需在该网络电话设置处以播放方式从该网络电话取得这些语音信息。然而,若使用者未在网络电话设置处,使用者便不能接收到网络电话上的语音信息,这给网络电话的使用者带来诸多不便和麻烦。
再者,当使用者位于网络电话处,该网络电话仅可通过播放(replay)语音的方式让使用者得知该信息要传达的内容,但这方式产生不少问题,例如若使用者注意力不集中、所在地点过于吵闹,使其没有听清楚内容或使用者记忆力差,忽略、遗漏或遗忘该信息中的部分内容,这会造成接收的该信息不全;再者,或该语音信息本身是因Internet等传输问题,使得语音的传送出现颤音等不稳定的现象,也会造成使用者对该语音信息的接收不全;另外,若该语音信息是中文客户的留言,该语音信息的接听者是使用非中文的外国人,不能听懂该中文语音信息,这也会造成语音信息接收上的问题。因此,对于无法听清楚或无法听懂某一特定语言的网络电话使用者而言,会造成网络电话使用者在语音接收上的问题,该接收问题轻者会妨碍VoIP网络电话的使用者间的沟通,重者会使该国际化企业因网络电话的语音信息沟通上的障碍造成重大的经济损失。
此外,对于一些重要的语音信息,如该国际化企业在网络电话上召开的联合会议(associates meeting),或某些与客户在网络电话上往来的语音对话,使用者需提取其中一个语句、一片段或全部的语音内容并将其转成对应的文字信息,供无法接听网络电话语音的用户取得该信息。另外,某些情况下,对于网络电话正在接听或已接听过的语音信息,也需打印成文字信息以备份保存,使之成为更有用的参考资料。
因此,如何令VoIP网络电话将接收到的语音信息产生对应的文字信息,使用者未在VoIP网络电话处时,也可取得对应的文字信息以接收网络电话收到的语音信息,提供网络电话的使用者更方便地接收信息的服务,即是目前需要解决的问题。
发明内容
为克服上述现有技术的缺点,本发明的主要目的在于提供一种语音处理系统及方法,可将网络电话接收到的语音信息转换成对应的文字信息,使无法接听语音信息的使用者,或无法听懂某一特定语言的网络电话的使用者,也能明白该网络电话接收到的语音信息所代表的内容。
本发明的再一目的在于提供一种语音处理系统及方法,应用在网络电话与网络装置间通过网络服务器所建构的网络系统中,允许使用者将网络电话接收到的语音信息(部分或全部),通过网络服务器发送至输出文字信息的网络装置上,如传真机上,由传真机打印该网络电话接收到的语音信息。
本发明的又一目的在于提供一种语音处理系统及方法,将网络电话接收到的语音信息转变为对应的文字信息,让远离网络电话或未具有网络电话的网络装置的使用者,能够接收网络电话接收到的内容,使网络电话的信息接收不受限于网络电话本身及网络电话所能提供的信息形式。
为达上述及其它目的,本发明提供一种语音处理系统及方法。本发明的语音处理系统,将网络电话接收到的语音信息转换成供与该网络电话网络连接的网络装置输出的文字信息,该语音处理系统至少包括语音接收模块,接收该网络电话传来的语音信息(voice message);指定模块,指定属于该网络装置的通信号码;语音转换模块,将该语音接收模块接收的语音信息转换成供该网络装置输出的文字信息;以及传送模块,根据该指定模块指定的该通信号码,将该语音转换模块转换得到的文字信息,传送至具有该通信号码的网络装置上,令该网络装置以文字信息的方式输出该网络电话接收到的语音信息。
上述网络电话及该网络装置是通过网络服务器建立网络连接,该语音接收模块、指定模块、语音转换模块以及传送模块建构在网络服务器中,该网络服务器将网络电话接收到的语音信息传送至用于输出对应文字信息的网络装置上,例如该网络装置是传真机,则由该传真机打印出与该语音信息对应的文字信息。
本发明的语音处理方法,应用在上述语音处理系统中,该方法包括首先令使用者通过该网络服务器指定一通信号码,令具有该通信号码的网络装置接收来自该网络电话的语音信息(voice message);接着令该网络电话接收该语音信息、并通过该网络服务器将该语音信息转换成供该网络装置输出的文字信息(text message);以及令该网络服务器根据该指定的通信号码,使具有该通信号码的网络装置输出通过该网络服务器转换得到的文字信息。
本发明的语音处理系统及方法是在该网络服务器设置一语音信息转送单元,用于储存使用者从网络电话中选取的供转换为文字信息的语音信息的地址,使该网络服务器将语音信息转送单元提供的网络电话的语音信息,转换成供该网络装置输出的文字信息(text message),并通过该网络服务器将转换得到的文字信息,传送至如传真机等网络装置上并打印出来。本发明的语音处理系统及方法包括文字数据单元,用于将该语音信息转送单元内的语音信息转换成更多样式的文字信息,并借该文字数据单元提供的文字数据的多样性,供不同的使用者使用,例如无法听懂某一特定语言的网络电话的使用者使用,以更加灵活的方式读取该网络电话所接收到的语音信息。
图1是本发明的语音处理系统的基本结构方块示意图;图2是本发明的语音处理系统的网络电话服务器的基本功能模块示意图;以及图3是本发明的语音处理方法所需执行的流程步骤。
具体实施例方式
实施例图1是本发明的语音处理系统的基本结构方块示意图。如图所示,本发明的语音处理系统至少包括网络电话服务器(VOIP sever)11、至少一个与该网络电话服务器网络连接的网络电话12以及网络装置13。
该网络电话服务器11是网络电话12与网络装置13间的沟通桥梁,使用者可通过该网络电话服务器11指定网络装置的通信号码,并令网络电话12将接收到的语音信息,转送到属于该通信号码的网络装置13上,使该网络装置13以文字信息的形式输出该网络电话12接收到的语音信息。其中,使用者可提供该通信号码至网络电话12,令网络电话12将该通信号码传送至网络电话服务器11;或者,令该网络装置13本身提供该通信号码登载到网络电话服务器11中;或者,对该网络电话服务器11本身或与该网络电话服务器11进行网络连接的其它电子装置(图未标),输入该通信号码,指定该通信号码给该网络电话服务器11中。
该网络电话12与上述网络电话服务器11网络连接,为该网络电话服务器11提供所需的语音信息。该语音信息可以是使用者在网络电话12上接收到的语音信息,也可以是不在该网络电话12上接收的、但后续以适当的方式储存在该网络电话12的语音信息,如令网络电话12作为录音机转录其它的语音信息,或将可移动的语音磁盘驱动器设置在网络电话12,等效地作为该网络电话12上接收的语音信息。该网络电话12上接收的语音信息,可以是某一次通话的全部语音内容,或经剪辑处理的一部分语音内容;或是某一时段上定义的语音内容,在此并非有所限制。但是无论该语音信息如何定义,储存每一语音信息的该网络电话12的语音数据单元(容后说明)具有起始地址和终止地址,借由该起始地址与终止地址定义完整的语音信息,也可利用该地址让程序员(programmer)在语音数据单元内方便地查找到该条语音信息。
该网络装置13例如是网络传真机或网络打印机,它与上述网络电话服务器11进行网络连接,响应该网络电话服务器11指定的通信号码,令具有该通信号码的网络装置13通过上述网络电话服务器11,将该网络电话12传来的语音信息以相应的文字信息打印出来,也就是该网络装置13借由硬拷贝(hard copy)的方式输出该信息;或者,在该网络装置13上设置一拷贝装置(图未标),如光驱、磁盘驱动器等,令该网络装置13将该网络电话12传来的语音信息,以对应的文字信息储存在该拷贝装置内,供使用者以电子文件形式保存。此外,该网络装置13也可以是其它可供输出文字信息、且与网络电话服务器11进行网络连接的电子装置,如计算机,掌上型计算机,数字助理机等。其中,该网络连接的方式是通过国际互联网(Internet)、企业内部互联网(Intranet)、企业间互联网(Extranet)、WAV、局域网络(LAN)以及卫星通信网络等网络连接。
上述网络电话服务器11、网络电话12及网络装置13可位于同一区域,也可位于不同的区域,也就是可将网络装置13设置在网络电话12的远程。因此,本发明的语音处理系统,在网络电话12、网络电话服务器11以及网络装置13之间进行网络连接,将网络电话12接收到的以语音形式储存的信息,通过网络电话服务器11转换成供网络装置13(可位于网络电话12远程)输出的文字信息,使网络电话12上的信息接收不受限于网络电话12的本身,也不受限于网络电话12所能提供的信息形式。
图2是本发明的语音处理系统的网络电话服务器的基本功能模块示意图。如图所示,该网络电话服务器11包括至少一个中央处理单元21(Processor)、程序存储单元23、语音数据转送单元24、文字数据单元25、语音数据单元26、缓冲单元27以及网络连接单元28。
该中央处理单元21用于控制网络电话服务器11内的各种电子元件及其它与该网络电话服务器11进行网络连接的装置间(如网络电话及网络装置)的运行关系(为简化附图及说明,此处软硬件结构仅显示与本发明有关的构件,其它无关的构件,未显示在附图中),且根据程序存储单元23内储存的程序,如语音选择程序231(Voice MessageSelection Program)、语音转换程序233(Voice To Text ConversionProgram)以及传送程序235(Message Sending Program),控制语音数据转送单元24、文字数据单元25、语音数据单元26、缓冲单元27以及网络连接单元28间的运行关系。
该中央处理单元21包括指定模块210,用于令使用者通过与该网络电话服务器11网络连接的网络电话12或网络装置13指定一通信号码,产生一信号至网络电话服务器11,并令网络电话服务器11的中央处理单元21接收此信号,使该中央处理单元21执行该程序存储单元23内的语音选择程序231。
该语音选择程序231供该中央处理单元21控制该网络电话服务器11所在的网络系统选取网络电话12接收到的语音信息,借以产生一信号并发送至网络电话服务器11的中央处理单元21,该中央处理单元21接收到此信号后,即令该中央处理单元21将该网络电话12传来的语音信息储存在语音数据单元26中。
该语音数据单元26储存该网络电话12接收到的所有语音信息,且已储存的每一语音信息在该语音数据单元26内具有起始地址和终止地址,该定义的地址可方便地在该语音数据单元26内查找到该条语音信息。该中央处理单元21在该语音数据单元26内查找到该语音信息之后,即将该语音信息发送至网络电话服务器11的语音数据转送单元24,由该语音数据转送单元24保存该语音信息的起始地址和终止地址,并提示使用者是否需选取该网络电话12接收到的下一条语音信息,若是,则该中央处理单元21根据该程序存储单元23内的语音选择程序231继续进行上述程序,通过中央处理单元21将位于语音数据单元26内的下一条语音信息的起始地址和终止地址,发送到语音数据转送单元24。
该语音数据转送单元24内接收到的语音信息的起始地址和终止地址,即是供程序存储单元23内的语音转换程序233处理的语音信息,该中央处理单元21借由语音转换程序233根据语音数据转送单元24提供的该语音信息的起始地址和终止地址,从该语音数据单元26内读取具有该起始地址和终止地址的语音信息,将读取到的语音信息借由语音转换程序233的处理转换成可供网络装置13输出的文字信息。
该语音转换程序233供该中央处理单元21将上述语音选择程序231读取到的语音信息转换成可供网络装置13输出的文字信息,如上所述,其中,这些语音信息是借由语音数据转送单元24内提供的语音信息的起始地址和终止地址,通过网络电话服务器11的中央处理单元21从语音数据单元26内读取具有该起始地址和终止地址的语音信息,或者,将语音数据单元26内所有的语音信息直接通过网络电话服务器11的中央处理单元21读取。令该中央处理单元21将读取到的一条语音信息通过模数转换等处理,将模拟语音信号转换为对应的数字文字信号。令该中央处理单元21接收该转换后得到的数字信号,该中央处理单元借由语音转换程序233处理及分析这些数字信号,也就是该语音信息产生的语音频率信息。
由于该中央处理单元21电性连接文字数据单元25,该文字数据单元25例如是ROM以及EERPOM的存储单元,其储存有多个特定语音频率及与这些特定语音频率分别对应的文字数据,例如中文文字数据库(也就是中文语音频率对应的中文文字信息)或英文文字数据库(也就是中文语音频率对应的英文文字信息),供不同的使用者使用。该语音转换程序233根据该中央处理单元21分析出的语音信息的语音频率信息,从该文字数据单元25读取与该语音频率信息对应的文字信息,使该语音转换程序233将语音信号转换成可供该网络装置13输出的文字信息。
该传送程序235即令该网络电话服务器11的中央处理单元21呼叫使用者指定的具有该通信号码的网络装置13,并通过网络连接单元28,将由上述语音转换程序233转换得到的、且暂存在缓冲单元27内的各文字信息传送到该网络装置13。
该中央处理单元21令缓冲单元27检测该网络装置13是否已收到储存在该缓冲单元27中的文字信息,直至该网络装置13已接收到所传送的文字信息、并由该网络装置13响应一接收成功的信号至该网络电话服务器11,令该网络电话服务器11得知传送成功。
图3是本发明的语音处理方法所需执行的流程步骤图。如图所示,该方法应用在上述图1所示的语音处理系统中,其中,该网络电话12以及网络装置13通过该网络电话服务器11建构成一网络系统。
首先执行步骤S1,令使用者通过网络电话服务器11指定网络装置13的通信号码,将网络电话12与网络装置13建立连接,接着,进至步骤S2。
在该步骤S2中,检测使用者是否选取网络电话12接收到的全部语音信息,若是,进至步骤S5;若否,则进至步骤S3。
在该步骤S3中,网络电话服务器11将使用者选取的网络电话12语音信息的地址(起始地址和终止地址),发送至语音数据转送单元24内,接着,进至步骤S4。
在该步骤S4中,令网络电话服务器11将语音数据转送单元24内提供的语音信息转换成对应的文字信息,接着,进至步骤S6。
在该步骤S5中,令网络电话服务器11将网络电话12内接收到的全部语音信息转换成对应的文字信息,接着,进至步骤S6。
在该步骤S6中,令网络电话服务器11将转换得到的文字信息发送至网络电话服务器11的缓冲单元27内,接着,进至步骤S7。
在该步骤S7中,令属于该通信号码的网络装置13接收网络电话服务器11的缓冲单元27内的文字信息,接着,进至步骤S8。
在该步骤S8中,令网络电话服务器11判断该网络装置13是否成功接收到网络电话服务器11传送来的文字信息,若是,进至步骤S9;若否,则返回该步骤S6,令网络电话服务器11重新将转换得到的文字信息发送至网络装置13。
在该步骤S9中,若该网络装置13已接收到网络电话服务器11传送来的文字信息,则令网络电话服务器11发送“成功信息”的语音信息至选取的网络电话12。
综上可知,通过本发明的语音处理系统及方法,使网络电话接收到的语音信息,借由与该网络电话网络连接的网络装置以文字信息的方式输出,此方式使网络电话的信息接收不受限于网络电话的本身及网络电话所能提供的信息形式,让不同的使用者,如无法接听或无法听懂某一特定语言的网络电话使用者,以更加灵活的方式读取该网络电话接收到的语音信息。
权利要求
1.一种语音处理系统,将网络电话接收到的语音信息转换成与该网络电话网络连接的网络装置输出的文字信息,其特征在于,该系统包括语音接收模块,接收该网络电话传来的语音信息;指定模块,指定属于该网络装置的通信号码;语音转换模块,将该语音接收模块接收的语音信息转换成供该网络装置输出的文字信息;以及传送模块,根据该指定模块指定的该通信号码,将该语音转换模块转换得到的文字信息,传送至具有该通信号码的网络装置上,令该网络装置以文字信息的方式输出该网络电话接收到的语音信息。
2.如权利要求1所述的语音处理系统,其特征在于,该语音接收模块包括语音数据转送单元,它存储该网络电话传来语音信息的起始地址和终止地址。
3.如权利要求1所述的语音处理系统,其特征在于,该语音转换模块用于转换该语音数据转送单元提供的语音信息。
4.如权利要求1所述的语音处理系统,其特征在于,该系统还包括文字数据单元,该文字数据单元用于储存至少一个文字信息,以对应该语音接收模块接收的语音信息。
5.如权利要求4所述的语音处理系统,其特征在于,该语音转换模块对应该语音接收模块接收的语音信息产生相应的语音频率,并使该语音频率对应该文字数据单元内的文字信息,供该语音转换模块将该语音接收模块接收的语音信息,转换成供该网络装置输出的文字信息。
6.如权利要求1所述的语音处理系统,其特征在于,该系统还包括一缓冲单元,储存该语音转换模块转换每一语音信息所得到的文字信息。
7.如权利要求1所述的语音处理系统,其特征在于,该网络装置是传真机。
8.如权利要求1所述的语音处理系统,其特征在于,该语音处理系统建构在网络服务器中,借由该网络服务器使网络电话与网络装置建立网络连接。
9.如权利要求1所述的语音处理系统,其特征在于,该语音处理系统建构在该网络电话中。
10.如权利要求1所述的语音处理系统,其特征在于,该语音处理系统建构在该网络装置中。
11.一种语音处理方法,将网络电话接收到的语音信息转换成供与该网络电话网络连接的网络装置输出的文字信息,该网络电话以及该网络装置通过网络服务器建立网络连接,其特征在于,该方法包括令使用者通过该网络服务器指定一通信号码,令具有该通信号码的网络装置接收来自该网络电话的语音信息;令该网络电话接收该语音信息、并通过该网络服务器将该语音信息转换成供该网络装置输出的文字信息;以及令该网络服务器根据该指定的通信号码,使具有该通信号码的网络装置输出通过该网络服务器转换得到的文字信息。
12.如权利要求11所述的语音处理方法,其特征在于,该网络服务器还包括语音数据转送单元,它储存该网络电话传来语音信息的起始地址和终止地址。
13.如权利要求12所述的语音处理方法,其特征在于,该网络服务器用于转换该语音数据转送单元提供的语音信息,将该语音信息转换为文字信息并传送至指定的网络装置。
14.如权利要求11所述的语音处理方法,其特征在于,该网络服务器还包括文字数据单元,该文字数据单元用于储存至少一个文字信息,以对应该接收来的网络电话的语音信息。
15.如权利要求14所述的语音处理方法,其特征在于,该网络服务器对应该接收来的网络电话的语音信息产生相应的语音频率,并使该语音频率对应文字数据单元内的该文字信息,供该网络服务器将来自网络电话的语音信息转换成供该网络装置输出的文字信息。
16.如权利要求11所述的语音处理方法,其特征在于,该网络服务器还包括缓冲单元,它储存经转换后的文字信息。
17.如权利要求11所述的语音处理方法,其特征在于,该网络装置是传真机。
全文摘要
一种语音处理系统及方法,该系统包括语音接收模块,接收该网络电话所传来的语音信息;指定模块,指定属该网络装置的通信号码;语音转换模块,将该语音接收模块接收的语音信息转换成供该网络装置输出的文字信息;以及传送模块,根据该指定模块指定的该通信号码,将该语音转换模块转换得到的文字信息传至具有该通信号码的网络装置上。本发明使无法接听语音信息的使用者也能明白该网络电话接收到的语音信息代表的内容,允许使用者由传真机打印该网络电话接收到的语音信息,使网络电话的信息接收不受限于网络电话本身及网络电话所能提供的信息形式。
文档编号G10L15/26GK1798220SQ20041010166
公开日2006年7月5日 申请日期2004年12月20日 优先权日2004年12月20日
发明者赖新来, 翁世雄 申请人:英保达股份有限公司