非特定人语音识别电话机的制作方法

文档序号:7630908阅读:393来源:国知局
专利名称:非特定人语音识别电话机的制作方法
技术领域
本实用新型涉及一种电话机,特别涉及一种非特定人语音识别电话机。
背景技术
目前,作为通讯终端设备的电话机,有线电话机或者无线电话机,在使用时需要按键拨号,用户必须先要在自己的电话薄中查到人名以及号码再拨送出去。还有一种存储号码的电话机,需要记住第几号码对应的是哪一个联系人。用户使用时非常不方便。
在先技术中,中国专利ZL 97193828.8提供一种在手提电话设备中装有训练语音识别系统。中国专利ZL 98806844.3,ZL 98807475.3提供一种具有语音拨号功能的蜂窝电话。上述的专利均是在手机中装有训练语音识别系统。也就是说,为了使相关设备,或者特指手机具有语音识别功能,采用“特定人语音识别”方式,需要预先训练用户语音标签才可识别特定人的语音。
中国专利ZL 99253151.9提供的一种非特定人语音识别电话机,也是使用了特定人语音识别处理器,需要用户进行语音训练。同时它还需要另一个微处理器来控制语音识别处理器,进行语音训练和识别等功能。
总之,上述的专利中都是需要用户进行带识别的语音特征临时录制,并保存起来后,才能进行语音识别。这给用户带来了很大的不便。同时保存下来的是个体的语音特征,而不是文本格式的通讯薄,也就不方便与其他设备如计算机(PC)中的通讯薄进行信息互换或者同步的可能。因此,用户使用不便,同时非常影响产品的通用性。

发明内容
本实用新型为了克服上述在先技术中的不足,提供一种非特定人的语音识别电话机。既保留普通电话的接收和拨打电话的使用功能,又能够进行通讯簿管理和语音识别,将其经过语音识别结果与通讯簿匹配的最终号码拨打出去。
本实用新型为了达到上述的目的,所采取的技术措施是使它包含外壳,置于外壳上的控制按键组、显示屏、通讯接口、电话线接口、下面带有弹簧开关的话柄座、置于话柄座上的带听筒和话筒的话柄;置于外壳内的电源、与外壳上电话线接口相连的拨号器件,与话柄、控制按键组和拨号器件相连的普通电话控制电路,分别与显示屏、控制按键组、拨号器件以及通讯接口相连的内部嵌入电话通话状态管理、通讯簿管理、语音识别和发送拨号的管理系统的中央处理器,连接在中央处理器与置于外壳上听筒之间的模数转换器。
所述的中央处理器是连接有闪存器(FLASH)和随机存储器(RAM)的微处理器(MCU),或者是内部嵌有随机存储器和闪存器的微处理器,或者是连接有内存器的微处理器,或者是带有只读存储器(ROM)、可擦除只读存储器(EEPROM)和随机存储器(RAM)的微处理器,或者是带有可擦除只读存储器和随机存储器的微机处理器,或者是数字信号处理单元(DSP)。
所述的嵌入在中央处理器内的管理系统包含空闲信息队列控制单元,与空闲信息队列控制单元相连的相互连接电话通话状态管理单元、通讯簿管理单元以及语音识别和发送拨号控制单元。
所述的通讯簿管理单元包含通讯接口管理模块,分别与通讯接口管理模块相连的接收外部通讯簿模块、接收单条名片模块、备份通讯簿模块、发送单条名片模块以及编辑管理通讯簿模块,与编辑管理通讯簿模块相连的输入法模块;编辑管理通讯簿模块分别与接收单条名片模块、备份通讯簿模块、发送单条名片模块相连。
所述的语音识别和发送拨号控制单元包含用于采集语音数据流并将其分成分段语音数据流送入下序模块中的语音信号采集模块;含有非特定人的语音基元特征数据库,用于对上述语音信号采集模块送来的分段语音数据流依据语音基元特征数据库内的语音基元特征进行识别,并与通讯簿中的名字相匹配的语音识别模块;用于接收语音识别模块识别和匹配的结果,并在通讯簿中找到对应通讯号码的号码确认模块;用于将经过号码确认模块确认后的号码,发送到拨号器件上的号码拨送模块;在号码确认模块与号码拨送模块之间加有用于拨长途号码上的IP电话卡模块 。
所述的电话通话状态管理单元,用于连接普通电话控制电路和按键组,接收控制信号,并管理通话状态。
所述的通讯接口包含红外接口,串行接口和USB(普通串行控制总线接口)接口;或者包含红外接口和USB接口;或者包含红外接口和串行接口,或者至少包含其中的一种接口,或者其他满足要求的通讯接口。
如上述的结构,在未接通电话时,如果需要拨号可以使用语音识别的方式查找电话号码并拨出,此时不论是拨出电话还是打进来的电话接通,嵌入在中央处理器内的电话状态管理单元都会变成“正在通话状态”。当接通电话时,挂断后电话状态管理单元会变成“未通话状态”,并且在接通时如果需要语音查询通讯簿名片时,嵌入在中央处理器内的电话状态管理单元,使其置为“语音查询状态”屏蔽话筒通话,受话方为静音模式。模数转换器将其语音模拟信号转换成数字信号送入嵌在中央处理器内的管理系统中的语音识别和发送拨号控制单元内;语音识别和发送拨号控制单元中的语音采集模块采集到话音数据流,将其分成分段语音数据流送入语音识别模块中;语音识别模块依据其内部的语音基元特征数据库内的语音基元特征对所送入的分段语音数据流进行识别。并与通讯簿中的名字相匹配。将识别匹配的结果送入号码确认模块中;号码确认模块用控制按键组选择出最终识别结果。并在通讯簿(文本格式的)中找到对应的通讯号码,如果仅仅是“语音查询状态”,查询结束后可以继续通话,如果需要在未通话时拨出号码,可以送号码到发送模块中;如果是长途号码,经过IP电话卡模块。号码发送模块将其查询号码结果送至拨号器件或电话控制电路上拨送。
本实用新型非特定人语音识别电话机的效益显著1.本实用新型非特定人语音识别电话机具有非特定人语音拨号功能。因为本实用新型电话机内包括嵌入在中央处理器内的管理系统,管理系统中语音识别和发送拨号控制单元中的语音识别模块中含有由语音基元特征组成的非特定人的语音基元特征数据库。所以,接到语音数据流后,依据语音基元特征数据库中的语音基元特征将语音数据流识别为相应的人名或单位名,或通讯簿中相应的条目。而对于由哪一个人发出的语音查询无关。也无需用户事先进行语音识别训练或预先写入语音数据,然后才能识别或放出录音。
2、本实用新型电话机的功能齐全。本实用新型电话机将电子通讯簿、语音识别和普通电话合为一体。既具有非特定人语音识别功能,又含有电子通讯簿。经过语音识别的结果就在通讯簿上查到相应的电话号码或者相应的条目,其结果可以直接通过拨号器件拨送。
3、本实用新型的电话机含有通讯接口,能够与计算机、手机、电话机、个人数据助理等其它设备通讯,互相交换通讯簿,以及同步使用通讯簿信息。
4、本实用新型电话机兼容普通电话。当不需要查询号码时,也就是当语音识别系统不发挥作用时,就是普通电话机,可以直接拨打接听电话。
5、本实用新型电话机的控制按键组包含语音控制按键组和普通电话机按键组,并可以兼容英文26个字母。因此按键组能够实现控制录音、选择最佳条目和通讯号码以及拨打电话等多种功能,操作方便。
6、本实用新型电话机中存储电子通讯簿是文本格式的,这也给与外部设备相互交换通讯簿,或与外部设备同步使用通讯簿带来许多方便。


图1为本实用新型非特定人语音识别电话机的内部结构示意图。
图2为本实用新型非特定人语音识别电话机外壳表面的结构示意图。
图3为嵌入于中央处理器内部的管理系统的结构示意图。
图4为图3管理系统中的通讯簿管理单元310的结构示意图。
图4-1为通讯簿管理单元310中接收外部通讯簿模块314的流程图。
图4-2为通讯簿管理单元310中的编辑管理通讯簿模块311的流程图。
图4-3为通讯簿管理单元310中输入法模块312的流程图。
图5为管理系统中空闲消息队列控制340的结构流程图。图6为图3管理系统中的语音识别和发送拨号控制单元320的结构及流程图。
图6-1为语音识别和发送拨号控制单元320中的号码确认模块323的流程图。
图7为管理系统中的电话通语状态管理单元330的流程图。
图8-1,图8-2,图8-3为控制按键组的三种按键组组成的形式。
图9为控制按键组兼容26个英文字母的组成形式。
具体实施方式
以下结合附图进一步说明本实用新型非特定人语音识别电话机的结构。
图1,图2所示,是本实用新型电话机的结构。它包含外壳200,置于在外壳200表面上的显示屏103,控制按键组107,通讯接口104,电话线接口115和带有弹簧开关的话柄座110,置于话柄座110上的由听筒111和话筒112构成的话柄114(如图2所示)。置于外壳200内的供电电源120,与显示屏103、控制按键组107、通讯接口104相连的中央处理器101,与中央处理器101、话柄座110和控制按键组107相连的普通电话控制电路113,与普通电话控制电路113、控制按键组107和中央处理器101相连的拨号器件105以及连接在话筒112与中央处理器101之间的模数转换器(ADC)102(如图1所示)。
所述的中央处理器101用于电话通话状态管理,通讯簿管理以及语音识别和发送拨号控制的程序运行。它可以是连接有闪存器(FLASH)和随机存储器(RAM)的微处理器(MCU)。这种结构的中央处理器是比较常用的。例如,本实施例中就采用这种连接有闪存器和随机存储器的微处理器,使用时,可以将通讯簿及语音基元特征数据库都存入闪存器中,程序运行在随机存储器内进行。如上所述,中央处理器101或者是内部嵌有随机存储器(FLASH)和闪存器(RAM)的微处理器(MCU);或者是连接有随机存储器的微处理器;或者是连有只读存储器(ROM)、可擦除只读存储器(EEPROM)和闪存器(RAM)的微处理器;或者是连接有可擦除只读存储器(EEPROM)和闪存器的微处理器;或者是数字信号处理单元(DSP-为微处理器的一种)。
所述的普通电话控制电路113和拨号器件105都是已知的普通电话机的元器件。如上所述的普通电话控制电路113就是普通电话机所包含的电话芯片,可以控制拨打,接听电话,震铃声音等。还可以加入来电显示芯片,或者增加射频控制电路芯片,使其成为无绳电话等。
所述的通讯接口104包含红外接口、串行接口和USB接口(串行控制总线接口)。或者它包含红外接口和USB接口;或者它包含红外接口和串行接口;或者至少包含其中的一种接口,或者其他满足要求的通讯接口。本实用新型电话机可以通过这些通讯接口与计算机、手机、PDA以及别的电话机等其它设备连接。相互通讯、相互交换通讯簿名片以及同步使用通讯簿信息。
图3是嵌入在中央处理器101内的管理系统。它包含空闲信息队列控制单元340,与空闲信息队列控制单元340连接的相互连接的电话通话状态管理单元330、通讯簿管理单元310和语音识别发送拨号控制单元320。
图4是图3中管理系统中的通讯簿管理单元310的结构和流程。如图4所示,它包含用于接收和发送信息的与通讯接口相连的通讯接口管理模块313,分别与通讯接口管理模块313相连的接收外部通讯簿模块314、接收单条名片模块315、备份通讯簿模块316、发送单条名片模块317以及编辑管理通讯簿模块311。与编辑管理通讯簿模块311相连的输入法模块312。其中编辑管理通讯簿模块311分别与接收单条名片模块315、备份通讯簿模块316和发送单条名片模块317相连。所述的通讯簿是文本格式的。
如上述图4的结构,接收外部通讯簿模块314通过通讯接口管理模块313将外部通讯簿同步到本地,其具体的流程如图4-1所示。接收外部通讯簿模块314通过通讯接口管理模块313从外部设备上接收全本通讯簿,是否全部覆盖原来旧的通讯簿?确认全部覆盖,则将新的通讯簿覆盖掉原来旧的通讯簿;如果不是全部覆盖,而是添加新通讯簿,则将新的通讯簿内的内容加在旧的通讯簿后面;所述的备份通讯簿模块316是将本地的通讯簿(即编辑管理通讯簿模块311中的通讯簿)通过通讯接口管理模块313备份到外部设备内;接收单条名片模块317通过通讯接口管理模块313接收从外部发送的一条名片信息到本地,并送入编辑管理通讯簿模块311中进行编辑,是增加或减少名片;发送单条名片模块317从编辑管理通讯簿模块311中查找到所要查找的名片通过通讯接口管理模块313将其发送到外部设备。
所述的编辑管理通讯簿模块311用于编辑名片,在原通讯簿上增加或减少(删除)名片。具体的流程如图4-2所示。当编辑管理通讯簿模块311接收到从接收单条名片模块315发来的一条名片信息,是增加名片?或是删除名片?是增加新名片信息,从输入法模块312中选定输入法,进行编辑名片;是在原通讯簿中增加新信息,或者是修改原通讯簿中的某条目信息,编辑完成后,保存新的通讯簿。如果是删除名片,确认后,在原通讯簿中搜寻到所要删除的名片或相关信息,删除后,保存新的通讯簿。
所述的输入法模块312的功能和构成可以选择普通的输入法。如本实施例中,输入法模块312包括1)汉字拼音输入法;2)大写英文字母数字输入;3)小写英文字母数字输入;还可以扩展输入法加入1)联想功能;2)汉字笔划输入法;简单的流程如图4-3所示。首先选择状态是状态1-拼音输入?或状态2-大写字母输入?或状态3-小写字母数字?
接收按键信息“0-9、*、#、上箭头、下箭头、确定键、取消键等输出汉字,英文字母,数字选择状态1,显示新的汉字组,选择确定或取消后,输出结果;选择状态2、3是否更新为新的字母或数字?显示新的字母或数字,选择、确定或取消后,输出结果。
图5为管理系统中空闲信息队列控制单元340的流程。该控制单元340用于管理系统的启动或等待,以及将各渠道进来信息进行排队。如图5中,有通过控制按键组进来的信息,或者通过通讯接口进来的信息,或者管理系统内部的处理信息,将其信息按时间先后排成队列,先后启动或等待状态。
图6是本发明嵌入中央处理器内管理系统中的语音识别和发送拨号单元320的结构及流程。如图6所示,语音识别和发送拨号单元320包含语音信号采集模块321,它用于采集语音数据流,它从经模数转换器将模拟信号转换得到的脉冲编码调制(PCM)格式的数字语音数据流,并为了下序的需要,传送和识别方便,将其分成分段语音数据流,例如分成每段语音为10毫秒,然后再将分段语音数据流送入下序模块;语音识别模块322含有由语音基元特征构成的语音基元特征数据库库,用于接收由上序采集语音数据流321发来的分段语音数据流后,依据语音基元特征数据库库中的语音基元特征进行语音识别,并与通讯簿中的人名(或单位名,或地名等条目)相匹配;其识别的结果可能是在通讯簿上无对应结果,(则程序结束),或者是有一条最优的匹配结果,或者是有N条最优匹配结果,显示在显示屏上。或者通过数模转换器将其数字信号转换成模拟信号从听筒中听到其结果。本实施例中,选用含有语音基元特征数据库的“嵌入式非特定人语音识别模块”(INTPORT INC公司提供)。
号码确认模块323用于接收语音识别模块322所识别并与通讯簿中条目匹配的结果,并在通讯簿中找到对应的通讯号码。具体的流程如图6-1所示。当语音识别模块322给出在显示屏上有N条最优候选名字(N一般为比较小的数目)时,此时用控制按键组中的“↑、↓”键翻转,选择出所要的名字,按“确认”或“OK”键确定;在通讯簿中找到对应的通讯号码;如果名字下仅有一个号码,则为最终号码;如果名字下有多个号码,再按“↑键”,或“↓键”,选择该条目下的N个号码中的一个,按“确认”或“OK”键选定。将选定的这个号码送入下序模块中;如果仅仅是“语音查询地址”状态时,不再需要送号码到拨号器件便可以结束这个单元320到下一个单元340。
号码拨送模块325用于将上序号码确认模块323送来的选定号码发送到拨号器件上。如果号码确认模块323选定的号码是长途号码,则通过IP电话卡模块324后再发送到拨号器件上。
图7是管理系统中电语通话状态管理单元330的流程。此管理单元330用于对当前通话状态记录,跟踪通话状态,使得其它信号不能影响电话机的通话。因为电话机在接听,或在拨打,或挂断电话时,只是普通电话控制电路在工作,与此同时,将必要的信息通知到中央处理器101。
如图7的流程流程图7最右边的流程04是如果当前是“未通话状态”,接到开始电话的信号,需要将记录状态改为“正在通话状态”;流程图7最左边流程01是如果当前是“正在通话状态”,接到通话结束的信号,需要将记录状态改为“未通话状态”;流程图7中间的二条流程02,03在通话时,遇到要求查询事件的处理。即正在通话时,用户想利用语音查询一下在本电话机中通讯簿。本管理单元也只是将状态设置为“语音查询状态”,并屏蔽话筒,如偏左的一条流程02所示;在本查询处理结束后,再让话筒正常通话,并且回复为正常的“正在通话状态”,如偏右边的一条流程03所示。
图8-1,图8-2,图8-3,是本实用新型电话机控制按键组的三种实施例。其特征是包含语音控制按键组和普通电话机按键组。其中语音控制按键组包含“控制录音键”——“Dialing Easy”键、“↑”键、“↓”键、“确认”或“OK”键。其中控制录音键——“Dialing Easy”键与话柄座110上的弹簧开关相连。
对于“控制录音键”——“Dialing Easy”有几种控制方式a)按下Dialing Easy键,开始用语音念出名字条目,念完后松开DialingEasy键,然后语音识别程序识别出N个最优候选条目;b)按下Dialing Easy键,再松开Dialing Easy键,开始用语音念出名字条目,在预先设定的时间内,如3秒钟内念完条目,然后语音识别程序识别出N个最优候选。
c)第三种使用模式,电话机话柄座110下面的那个弹簧开关与“DialingEasy键”连接在一起,电话机话柄摘机后,就开始录音,在预定时间内,例如5秒钟为语音识别时间,用户可以念名字,并识别出N个最优候选;如果用户按了除“DialingEasy键”以外的键或者在特定时间没有语音念名字就说明是采用按键拨号。同时,根据用户喜欢,可以在开始录音前发出“哔”声,或者其他提示音。例如“请念出人名”等,这个提示音在上面使用Dialing Easy按键的方法中包含,可以作为一个用户自主选择的候选项。得到N个最优候选条目后,用“↑”键、“↓”键,“确认”键,“取消”键,选定是否某个条目为识别结果再用“↑”键、“↓”键,“确认”键,可以选择拨出这个条目中的哪一个号码,如手机号码,家里号码,公司号码中选定一个拨出。
图9是本实用新型电话机的控制按键组的另一个实施例,如图9所示。它包含语音控制按键组和普通电话机按键组,并兼容英文26个字母。可用26个字母拼写名字或所要求的条目输进中央处理器内运行。
权利要求1.一种非特定人语音识别电话机,它包含外壳,置于外壳上的控制按键组、显示屏、通讯接口、电话线接口、下面带有弹簧开关的话柄座,置于话柄座上的带听筒和话筒的话柄;置于外壳内的电源,与外壳上电话线接口相连的拨号器件,与话柄、控制按键组和拨号器件相连的普通电话控制电路,其特征在于包含分别与显示屏、控制按键组、拨号器件以及通讯接口相连的内部嵌入电话通话状态管理、通讯簿管理、语音识别和发送拨号的管理系统的中央处理器,连接在中央处理器与置于外壳上听筒之间的模数转换器。
2.根据权利要求1所述的非特定人语音识别电话机,其特征在于所说的中央处理器是连接有闪存器和随机存储器的微处理器,或者是内部嵌有随机存储器和闪存器的微处理器,或者是连接有随机存储器的微处理器,或者是连有只读存储器、可擦除只读存储器和闪存器的微处理器,或者是连接有可擦除只读存储器和闪存器的微处理器,或者是数字信号处理单元。
3.根据权利要求1所述的非特定人语音识别电话机,其特征在于所说的嵌入在中央处理器内的管理系统包含空闲信息队列控制单元,与空闲信息队列控制单元相连的电话通话状态管理单元、通讯簿管理单元以及语音识别和发送拨号控制单元。
4.根据权利要求3所述的非特定人语音识别电话机,其特征在于所说的通讯簿管理单元包含通讯接口管理模块,分别与通讯接口管理模块相连的接收外部通讯簿模块、接收单条名片模块、备份通讯簿模块、发送单条名片模块以及编辑管理通讯簿模块,与编辑管理通讯簿模块相连的输入法模块,编辑管理通讯簿模块分别与接收单条名片模块、备份通讯簿模块、发送单条名片模块相连。
5.根据权利要求3所述的非特定人语音识别电话机,其特征在于所说的语音识别和发送拨号控制单元包含用于采集语音数据流并将其分成分段语音数据流送入下序模块中的语音信号采集模块;含有非特定人语音基元特征数据库的用于对上述语音信号采集模块送来的分段语音数据流依据语音基元特征数据库内的语音基元特征进行识别,并与通讯簿中的名字相匹配的语音识别模块;用于接收语音识别模块识别和与通讯簿中条目匹配的结果,并在通讯簿中找到对应通讯号码的号码确认模块;用于将经过号码确认模块确认后的号码,发送到拨号器件上的号码拨送模块;在号码确认模块与号码拨送模块之间加有的IP电话卡模块。
6.根据权利要求3所述的非特定人语音识别电话机,其特征在于所说的电话通话状态管理单元,用于连接普通电话控制电路和按键组,接收控制信号,并管理通话状态。
7.根据权利要求1所述的非特定人语音识别电话机,其特征在于所说通讯接口包含红外接口,串行接口和USB接口;或者包含红外接口和USB接口;或者包含红外接口和串行接口,或者至少包含其中的一种通讯接口。
8.根据权利要求1所述的非特定人语音识别电话机,其特征在于所说的控制按键组包含语音控制按键组和普通电话机控制组;或者控制按键包含语音控制按键组和普通电话机按键组,兼容26个英文字母。
9.根据权利要求7所述的非特定人语音识别电话机,其特征在于所说的语音控制按键组包含控制录音键“↑”键,“↓”键和“确认”或“OK”键和“取消”或“Cancel”键。
10.根据权利要求8所述的非特定人语音识别电话机,其特征在于所说控制录音键与话柄座上的弹簧开关相连。
专利摘要一种非特定人语音识别电话机,它包含置于外壳内的普通电话控制电路和内部嵌有电话通话状态管理单元、通讯簿管理单元和语音识别和发送拨号控制单元管理系统的中央处理器。其中语音识别和发送拨号控制单元中的语音识别模块中含有由语音基元特征组成的语音基元特征数据库。因此,本实用新型电话机能够对非特定人的语音进行识别。无需用户事先进行语音识别训练以及事先录音。在通讯簿管理单元中含有文本格式的通讯簿,通过通讯接口可以很方便地与外部设备进行互相交换通讯簿,以及与外部设备同步使用通讯簿。本实用新型非特定人语音识别电话机具有兼容普通电话机的功能。
文档编号H04M1/27GK2817242SQ200520039510
公开日2006年9月13日 申请日期2005年2月4日 优先权日2005年2月4日
发明者孙远 申请人:孙远
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1