专利名称:具声控拨号功能的手机及其控制方法
技术领域:
本发明涉及一种具声控拨号功能的手机及其控制方法,尤指一种具一种或多种模式声控拨号功能的手机及其控制方法。
背景技术:
传统的手机大都采用类似电话机拨号的方式,手机键盘上设置多个数字键和功能键。然而,随着手机日趋小型化的设计,使得拨号区的面积减小,数字键的设计相应变小,导致用产容易发生错按、漏按个别按键的情况。此外,在光线较弱的时候,使用按键式手机也容易出错,对于盲人手机用户,使用键入式手机更是容易出错。
中国第01252989号专利申请揭示了一种现有具声控拨号功能的手机,其包括语音集成电路和手机拨号电路,所述语音集成电路包含语音接收器和关键字存储识别电路。然而,使用此种现有具声控拨号功能的手机时,必须先由用户对着语音接收器说出0~9十个电话号码数字的语音信号,再由关键字存储识别电路将上述语音信号“音标”分别记录在关键字存储识别电路的十个存储单元内,因此,此种现有具声控拨号功能的手机仅具一种数字声控拨号模式,而且当他人使用时,会因为“音标”不符而无法实现声控拨号功能,通用性不强。
发明内容
为了克服上述现有技术的不足,而提供一种具声控拨号功能的手机及其控制方法,其具有一种或多种模式声控拨号功能,无需事先录音存储,且通用性强。
本发明所采用的技术方案为提供一种具声控拨号功能的手机,该手机包括话筒、A/D转换器、语音编码器、微处理器和显示器,其进一步包含一声控识别软件系统,该声控识别软件系统包含一种或多种语音的特征数据列表。
所述声控识别系统包括姓名常用字语音、数字语音以及命令语音的特征数据列表。
所述特征数据列表还包含了对多音字和多音数字的不同语音特征数据。
所述特征数据是指上述语音模拟信号转变为数字信号以后的频谱信息和增益系数。
本发明所采用的技术方案还包括提供一种具声控拨号功能的手机控制方法,该手机包括话筒、A/D转换器、语音编码器、微处理器和显示器和内嵌式声控识别软件系统,该声控识别软件系统包含一种或多种语音的特征数据列表,该控制方法包括以下步骤声控识别软件系统根据其特征数据列表自动对所述手机电话簿内的信息进行初始化比对,并根据相似性创建一个索引信息;通过话筒输入语音信息,A/D转换器将语音信息转换成数字格式,语音编码器压缩所述数字语音信息,并输出信息数据至微处理器;声控识别软件系统将检测识别上述信息数据的语音字段并分析提取特征数据,并将此特征数据与索引信息中的特征数据或直接与该系统特征数据列表中的特征数据对比;在显示器上显示对比匹配后的信息,并自动拨打相应的号码。
在所述初始化过程中,是将该手机本机和SIM卡的电话簿中每个名字的发音按照第一个字的特征数据相似性创建上述索引信息,其存储一数据存储区内且此索引信息中每个单元的特征数据信息和上述电话簿中所存号码的对应姓名序号一一对应。
在所述检测识别过程中,智能声控识别系统利用所述输入信息数据中的代码薄增益检测语音分段,把分段信息中的频谱信息包括频谱特征和强度、频谱系数等特征数据与存储在数据存储区内与索引信息中的特征数据或直接与该系统特征数据列表中的特征数据对比,依次判断每一字段与上述特征数据的相似性,若没有超过一预定限值,则表明在匹配范围,并返回索引信息中数据段所对应的电话簿中所存号码的姓名序号或数字字符串。
所述返回索引信息中数据段所对应的电话簿中所存号码的姓名序号或数字字符串为多条时,则分别以数字标注序号,声控识别系统发送信号提示再次输入语音信号,直至输入语音信号匹配出相应的数字标注序号后即自动拨打相应的号码。
所述相似性判断表示为不匹配时,声控识别系统发送再次进行语音输入的信号,直至不能匹配过程超出一设定次数,声控识别系统将关闭结束,并返回失败信号返回到待机状态。
本发明的有益效果在于本发明具声控拨号功能的手机通过在其内部嵌入一包含一种或多种语音的特征数据列表声控识别软件系统,并通过初始化电话薄信息和对比匹配识别手段,可实现一种或多种模式声控拨号的功能,而且无需事先录音存储,通用性强。
图1是本发明具声控拨号功能的手机的电路原理图;图2是本发明具声控拨号功能的手机控制方法的流程图。
具体实施例方式
请参阅图1,本发明具声控拨号功能的手机10包括依次相连的一用于采集语音信号的话筒20、一将上述语音信号进行模数转换的A/D转换器30、一语音编码器40、一微处理器50及一用于显示的LCD60。此外,本发明具声控拨号功能的手机10还包括一数据存储区70和一智能声控识别软件系统80(以下简称智能声控识别系统),其均与微处理器50相连。
本实施例的智能声控识别系统80包含了姓名常用字的语音、0~9数字的语音以及部分简单命令语音的特征数据列表,即包括语音模拟信号转变为数字信号以后的频谱信息和增益系数等数据。此列表的特征数据是在正常语速(如每个字发音大约在0.5秒)经多次采样得出的样本,其中还包含了对多音字的不同语音特征数据(例如“解”分为“jie”和“xie”两种语音特征数据),多音数字不同语音特征数据(例如“1”分为“yi”和“yao”两种语音特征数据)的处理。因此,本实施例的具声控拨号功能的手机10包括名字拨号模式、数字拨号模式和命令拨号模式三种拨号模式。
下面结合图1和图2对本发明具声控拨号功能的手机10三种拨号模式的工作原理进行说明。
初始化过程本发明具声控拨号功能的手机10开机以后,智能声控识别系统80首先根据系统中自带的字与其发音的特征数据列表,对本发明具声控拨号功能的手机10本机上和SIM卡上的电话簿内的名字信息进行初始化,即将电话簿中每个名字的发音按照第一个字的特征数据相似性创建一个索引信息,并通过微处理器50控制将此索引数据表存储在数据存储区70内,且此索引中每个单元的特征数据信息和电话簿中所存号码的对应姓名序号一一对应。
识别过程在启动以后,智能声控识别系统80首先会发出准备接收语音数据就绪的命令信号,此时本发明具声控拨号功能的手机10的微处理器50收到此信号以后,同意消息通道打开,之后语音信号就可以自话筒20传入,A/D(模拟—数字)转换器30将上述自话筒20传入的语音模拟信号转变成数字信号语音数据格式并传输至语音编码器40,语音编码器40压缩传来的数字语音数据,并输出信息数据。智能声控识别系统80利用信息数据中的代码薄增益检测语音分段,把分段信息中的频谱信息包括频谱特征和强度、频谱系数等特征数据存储在数据存储区70内。
(1)名字拨号模式智能声控识别系统80在得到第一个字段数据开始就用初始化过程中存储的索引信息表中的样本特征数据进行对比,如果两者的相似性没有超过一个预定限值,则表明在匹配范围,根据找出的第一个字段的位置找出索引数据段,然后对第二个字段进行对比,如果有三,四等字段,依此参照第一字段的方法进行对比。如果能匹配则返回索引中数据段所对应的电话簿中所存号码的姓名序号。
(2)数字拨号模式智能声控识别系统80依次将输入的每一个字段与系统80自带的0~9数字语音特征数据进行对比,如果两者的相似性没有超过一个预定限值,则表明在匹配范围,再返回识别出的一个或几个数字字符串。
(3)命令拨号模式智能声控识别系统80将得到的数据与系统80自带的简单命令语音特征数据进行对比,如果匹配,则进入相应的名字拨号模式、数字拨号模式或者取消退出系统。若进入相应的名字拨号模式或数字拨号模式,此后的系统处理过程如前所述。
显示过程(1)名字拨号模式本发明具声控拨号功能的手机10通过识别过程中返回的姓名序号,就可以根据电话簿的序号表将电话簿中的实际姓名显示在LCD60上。
(2)数字拨号模式本发明具声控拨号功能的手机10通过识别过程中返回的数字字符串就可以在LCD上显示实际的号码。
(3)命令拨号模式此模式的显示过程显示如前名字拨号模式或数字拨号模式所述。
如果返回多个序号或字符串,则显示的排序依照对比时特征数据对比差值大小递增进行,即特征数据对比差值最小的排到第一个显示。此外,还可以按照LCD60实际的显示范围自由设定具体要显示的最大条数。
如果不能匹配则智能声控识别系统80会发送再次进行语音输入的信号给本发明具声控拨号功能的手机10,本发明具声控拨号功能的手机10的LCD60上会显示或通过扬声器(图未示)输出信息表示请再次输入语音,进行再一次的识别匹配过程。
如果此不能匹配过程超出设定的次数(例如三次),智能声控识别系统80将关闭结束,返回失败信号给本发明具声控拨号功能的手机10,本发明具声控拨号功能的手机10将通过LCD60给出屏幕提示后返回到待机界面。
拨打过程(1)名字拨号模式若在上述显示过程中显示于LCD60上所识别出的姓名仅为一条,本发明具声控拨号功能的手机10将自动拨打该姓名在电话簿中对应的默认号码。
若在上述显示过程中显示于LCD60上所识别出的姓名仅为多条,则分别以数字标注序号,此时智能声控识别系统80会发信号给本发明具声控拨号功能的手机10,本发明具声控拨号功能的手机10将通过LCD60显示或扬声器播放语音提示继续语音信号输入,当再次输入的语音信号匹配出相应的数字标注序号后,本发明具声控拨号功能的手机10就会自动拨打对应的名字在电话簿中的默认号码。
(2)数字拨号模式若在上述显示过程中显示于LCD60上所识别出号码仅为一条,本发明具声控拨号功能的手机10将自动拨打该号码若在上述显示过程中显示于LCD60上所识别出号码为多条,则分别以数字标注序号,此时智能声控识别系统80会发信号给本发明具声控拨号功能的手机10,本发明具声控拨号功能的手机10将通过LCD60显示或扬声器播放语音提示继续语音信号输入,当再次输入的语音匹配出相应的数字标注序号以后就会自动拨打对应的号码。
(3)命令拨号模式此模式的拨打过程如前名字拨号模式或数字拨号模式所书。
可以理解,本发明具声控拨号功能的手机10的拨号模式并不仅限于中文,其可通过在智能声控识别系统80中输入其他语言常用字的语音、数字的语音以及部分简单命令语音的特征数据列表来实现语音拨号;此外,本发明具声控拨号功能的手机10的拨号模式并不仅限于上述三种,其可通过在智能声控识别系统80中输入任意其他模式的语音的特征数据列表来实现语音拨号。
权利要求
1.一种具声控拨号功能的手机,该手机包括话筒、A/D转换器、语音编码器、微处理器和显示器,其特征在于进一步包含一声控识别软件系统,该声控识别软件系统包含一种或多种语音的特征数据列表。
2.如权利要求1所述的具声控拨号功能的手机,其特征在于所述声控识别系统包括姓名常用字语音、数字语音以及命令语音的特征数据列表。
3.如权利要求2所述的具声控拨号功能的手机,其特征在于所述特征数据列表还包含了对多音字和多音数字的不同语音特征数据。
4.如权利要求3所述的具声控拨号功能的手机,其特征在于所述特征数据是指上述语音模拟信号转变为数字信号以后的频谱信息和增益系数。
5.一种具声控拨号功能的手机控制方法,该手机包括话筒、A/D转换器、语音编码器、微处理器和显示器,该手机内嵌入一声控识别软件系统,该声控识别软件系统包含一种或多种语音的特征数据列表,其特征在于该控制方法包括以下步骤声控识别软件系统根据其特征数据列表自动对所述手机电话簿内的信息进行初始化比对,并根据相似性创建一个索引信息;通过话筒输入语音信息,A/D转换器将语音信息转换成数字格式,语音编码器压缩所述数字语音信息,并输出信息数据至微处理器;声控识别软件系统将检测识别上述信息数据的语音字段并分析提取特征数据,并将此特征数据与索引信息中的特征数据或直接与该系统特征数据列表中的特征数据对比;在显示器上显示对比匹配后的信息,并自动拨打相应的号码。
6.如权利要求5所述的具声控拨号功能的手机控制方法,其特征在于在所述初始化过程中,是将该手机本机和SIM卡的电话簿中每个名字的发音按照第一个字的特征数据相似性创建上述索引信息,其存储一数据存储区内且此索引信息中每个单元的特征数据信息和上述电话簿中所存号码的对应姓名序号一一对应。
7.如权利要求6所述的具声控拨号功能的手机控制方法,其特征在于在所述检测识别过程中,智能声控识别系统利用所述输入信息数据中的代码薄增益检测语音分段,把分段信息中的频谱信息包括频谱特征和强度、频谱系数等特征数据与存储在数据存储区内与索引信息中的特征数据或直接与该系统特征数据列表中的特征数据对比,依次判断每一字段与上述特征数据的相似性,若没有超过一预定限值,则表明在匹配范围,并返回索引信息中数据段所对应的电话簿中所存号码的姓名序号或数字字符串。
8.如权利要求7所述的具声控拨号功能的手机控制方法,其特征在于所述返回索引信息中数据段所对应的电话簿中所存号码的姓名序号或数字字符串为多条时,则分别以数字标注序号,声控识别系统发送信号提示再次输入语音信号,直至输入语音信号匹配出相应的数字标注序号后即自动拨打相应的号码。
9.如权利要求7或8所述的具声控拨号功能的手机控制方法,其特征在于所述相似性判断表示为不匹配时,声控识别系统发送再次进行语音输入的信号,直至不能匹配过程超出一设定次数,声控识别系统将关闭结束,并返回失败信号而返回到待机状态。
全文摘要
一种具声控拨号功能的手机及其控制方法,该手机包括话筒、A/D转换器、语音编码器、微处理器、显示器和内嵌式声控识别软件系统,该软件系统包含一种或多种语音的特征数据列表。该控制方法包括以下步骤声控识别软件系统根据其特征数据列表自动对手机电话簿内的信息进行初始化比对,并根据相似性创建一索引信息;由话筒输入语音信息,A/D转换器将语音信息转换成数字格式,语音编码器压缩该数字语音信息,并输出信息数据至微处理器;声控识别软件系统将检测识别该信息数据的语音字段并分析提取特征数据,并将此特征数据与索引信息中的特征数据或直接与该系统特征数据列表中的特征数据对比;在显示器上显示对比匹配后的信息,并自动拨打相应的号码。
文档编号H04M1/27GK1635768SQ20041009184
公开日2005年7月6日 申请日期2004年12月24日 优先权日2004年12月24日
发明者王刚, 刘雷, 阳超导 申请人:深圳市金立通信设备有限公司