一种通过话路传送信息的方法

文档序号:7597826阅读:218来源:国知局
专利名称:一种通过话路传送信息的方法
技术领域
本发明涉及通信信息传输技术领域,更确切地说是涉及一种通过话路传送信息的方法。
背景技术
在通信领域中,当一个呼叫建立并接通后,如果呼叫双方希望传送除语音信息之外的其它信息,对于固定终端来说,可以通过双音多频(DTMF)或频移键控(FSK)实现信息在话路中的传输;对于移动终端来说,则可以通过信令实现信息的传输。
对于移动终端来说,语音信号在经过空中接口传送时,要进行语音压缩和解压缩,这个过程中,DTMF信号经过语音压缩后会严重失真,识别准确率很低,FSK同样如此。因此,目前的移动终端不支持通过DTMF及FSK进行的信号发送和接收。所以说,目前的固定终端与移动终端在建立话路后,两个终端之间无法直接通过已建立的话路传输语音信息之外的信息。
而固定终端在通话后又不支持信令方式的信息传送,也就是说,移动终端和固定终端在建立通话后,也无法通过信令方式传输信息。因此,如果希望固定终端和移动终端之间进行非语音的信息交互,则需要依赖网络设备对所要传送的信息进行相应的转换来实现,显然,这对网络侧的依赖较大,并且实现起来比较麻烦,还需要增加网络侧的负担。

发明内容
有鉴于此,本发明的主要目的在于提供一种通过话路传送信息的方法,使通话双方能够通过话路进行非语音信息的端到端传送。
为达到以上目的,本发明的技术方案是这样实现的一种通过话路传送信息的方法,在信息接收端设置声音信息识别模块,该方法进一步包括以下步骤a.信息发送端将所要发送的信息转换为声音信息,并通过话路将该声音信息传送到信息接收端;b.信息接收端通过所述声音信息识别模块从接收到的声音信息中识别出相应的信息。
该方法可以进一步包括,在信息发送端设置用于表达信息的信息基本元素,并设置与信息基本元素对应的音频信息元,每个音频信息元对应一个声音信息;所述步骤a为信息发送端将要发送的信息转换为相应的信息基本元素,并将与该信息基本元素对应的音频信息元所对应的声音信息通过话路发送给信息接收端。
所述声音信息识别模块根据所述声音信息与信息基本元素的对应关系设置;所述步骤b为信息接收端中的声音信息识别模块根据收到的声音信息识别出相应的信息基本元素,并根据该信息基本元素确定发送端所发送的信息。
所述信息基本元素为ASCII字符、或二进制字符,或根据信息发送端的按键信息设置。
所述音频信息元为语音片段;或者为声音信息转换得到的声学特征矢量的测量值;所述音频信息元所对应的声音信息为根据所述音频信息元产生模拟语音片段。
该方法还可以进一步包括在每两个音频信息元之间设置音频隔离符;步骤a中,所述信息发送端在发送音频信息元所对应的声音信息之前,进一步包括在每两个音频信息元之间设置音频隔离符;步骤b中,所述信息接收端中的声音信息识别模块根据收到的声音信息识别出相应的信息基本元素包括根据音频隔离符从自身收到的声音信息中分离出与音频信息元对应的声音信息,并根据所述声音信息识别出相应的信息基本元素。
该方法还可以进一步包括在信息接收端设置针对每个音频信息元所对应的声音信息的声音模式;步骤b中,所述信息接收端通过声音信息识别模块确定相应的信息基本元素为信息接收端用该声音信息与所设置的声音模式进行匹配,确定最大匹配的声音模式,并通过该声音模式确定相应的信息基本元素。
该方法还可以进一步包括根据信息基本元素与音频信息元的对应关系确定音频信息元对应声音信息所对应的声音模式与信息基本元素的对应关系;所述声音信息识别模块根据声音模式与信息基本元素的对应关系设置;步骤b中,所述声音信息识别模块通过该声音模式确定相应的信息基本元素为直接根据所述对应关系确定相应的信息基本元素。
所述声音模式为音频信息元所对应的声音信息的声学特征矢量相关描述值的范围;步骤b中,所述信息接收端用该声音信息与所设置的声音模式进行匹配为根据声音信息得到相应的声学特征矢量相关描述值,并用该声学特征矢量相关描述值与所设置的所有声音模式进行匹配。
该方法还可以进一步包括设置用于标识信息发送开始的开始信息元素及相应的开始音频信息元;步骤a中,所述信息发送端在将要发送的信息转换为信息基本元素时,进一步包括在所述信息基本元素的最始端设置开始信息元素;所述信息发送端通过话路发送给信息接收端的声音信息包括所述与开始信息元素对应的开始音频信息元所对应的声音信息;步骤b中,所述信息接收端中的声音信息识别模块根据收到的声音信息确定相应的信息基本元素包括检测自身收到的信息中是否出现开始信息元素,如果是,则开始识别收到的声音信息中开始信息元素对应的开始音频信息元之后的声音信息;否则,继续执行检测是否出现开始信息元素的步骤。
该方法可以进一步包括在信息接收端设置用于执行开始信息元素识别的一级识别功能,及用于执行信息基本元素识别的二级识别功能;步骤b中,所述检测是否出现开始信息元素通过启动一级识别功能实现;所述开始识别收到的声音信息中开始信息元素对应的开始音频信息元之后的声音信息通过启动二级识别功能实现。
该方法还可以进一步包括设置用于表示信息发送结束的结束信息元素及相应的结束音频信息元;步骤a中,所述信息发送端在将要发送的信息转换为信息基本元素时,进一步包括在所述信息基本元素的最末端设置结束信息元素;所述信息发送端通过话路发送给信息接收端的声音信息包括所述与结束信息元素对应的结束音频信息元所对应的声音信息;步骤b中,所述信息接收端中的声音信息识别模块根据收到的声音信息识别出相应的信息基本元素进一步包括检测自身收到的信息中是否出现结束信息元素,如果是,则结束识别信息基本元素步骤;否则,继续执行检测是否出现结束信息元素的步骤。
所述信息发送端及信息接收端为电话终端,或网络侧通信设备。
本发明通过设置信息基本元素及对应的音频信息元,以及在信息接收端设置声音信息识别模块,信息发送端将需要发送的信息生成相应的信息基本元素,并根据该对应关系得到信息基本元素相应的音频信息元,之后通过已经建立的话路将音频信息元对应的声音信息发送给信息接收端,信息接收端则通过声音信息识别模块对接收到的声音信息进行识别,得到信息基本元素,进而得到用户需要发送的信息,从而实现了通话双方通过已建立的话路发送信息。所以说,本发明方案不需要中间的系统设备的参与,而是完全由通信终端完成终端到终端、设备到设备,以及终端到设备等的信息传送。
另外,本发明方案中的信息接收端只需要识别有限的信息基本元素即可实现本发明的目的,能够保证信息接收端具有较高的识别效率和准确性。


图1为本发明方案的实现流程图。
具体实施例方式
下面结合附图及具体实施例对本发明方案作进一步详细的说明。
参见图1,本发明方案通过以下步骤实现步骤101、在信息发送端设置信息基本元素及对应的音频信息元,在信息接收端根据该信息基本元素及对应的音频信息元设置音频信息识别模块。
当然,每个音频信息元对应一个具体的声音信息,也可以直接是一个具体的声音信息。比如,对于发送端来说,其所设置的音频信息元可以直接是语音片段;也可以是由语音片段或数字声音信息转换得到的所谓声学特征矢量的一组测量值,比如,该音频信息元所对应的声音信息的相关频率分量信息、音素信息等。对于音频信息元是声学特征矢量描述信息的情况来说,发送端应该根据该声学特征矢量描述信息生成相应的声音信息,具体可以通过声音生成器等实现。
为便于信息接收端声音信息识别模块的识别,还可以进一步设置音频隔离符,在每两个音频信息元之间设置该音频隔离符,使得信息发送端每发送完一个音频信息元所对应的声音信息后,就发送一个音频隔离符,之后再发送下一个音频信息元所对应的声音信息。信息接收端进行音频识别时,自动剔除夹杂在其中的音频隔离符。
信息接收端中,根据信息基本元素及对应的音频信息元所设置的音频信息识别模块能够从接收到的声音信息中识别出相应的信息基本元素。具体来说,由于针对每个音频信息元都可以设置相应的声音模式,并且在一般情况下,一个音频信息元的声音模式可以是该音频信息元所对应的声音信息的声学特征矢量的相关描述值的范围,因此可以设置包含有各个音频信息元所对应的声音模式的数据库,简称声音模式库。这样,接收端的音频信息识别模块在收到发送端发送来的声音信息后,用该声音信息与声音模式库里的声音模式进行匹配,选择最大匹配的声音模式作为匹配结果,并将该声音模式所对应的信息基本元素作为所要确定的信息基本元素。
具体来说,信息接收端中的声音信息识别模块首先要从信息发送端发送来的声音信息中提取一段声音信息,将所提取的这段声音信息看作与音频信息元对应的声音信息。当然,在设置了音频隔离符的情况下,根据音频隔离符则可以直接确定与音频信息元对应的声音信息。在确定对应于一个音频信息元的声音信息之后,可以先测量出该声音信息的一组声学特征矢量值,然后,根据该组测量值与声音模式库中的所有声音模式进行匹配,并将声音模式库中最大匹配了该组测量值的声音模式所对应的信息基本元素作为音频信息元所对应的信息基本元素。如果音频信息元是声学特征矢量的描述信息,则音频信息元所对应的声音模式可以直接是该声学特征矢量的相关描述值的范围,也可以是根据该声学特征矢量描述信息所生成的相应声音信息的声学特征矢量的相关描述值的范围。其中,可以根据信息基本元素与音频信息元的对应关系,在信息接收端直接设置声音模式与信息基本元素的对应关系。这样,信息接收端在根据接收到的声音信息确定了相应的最大匹配声音模式后,即可根据该对应关系确定相应的信息基本元素。
当从声音信息中提取的声音信息没能有效地匹配到声音模式库里的一个声音模式时,说明本次提取的声音信息没有与其对应的音频信息元,这时可以重新从声音信息中提取一段声音信息进行相应的处理。
总之,可以根据信息基本元素对应的音频信息元确定相应的声音模式,并根据该声音模式和信息基本元素来设置信息接收端中的音频信息识别模块。这样,接收端在接收到发送端发送的声音信息后,将相应的声音信息转换为声学特征矢量描述信息,并根据该声学特征矢量描述信息去匹配相应的声音模式,从而,音频信息识别模块能够根据最大可能匹配的声音模式从接收到的音频信息中识别出信息基本元素。
由于语音识别技术是公知技术,所以不对该声音识别技术本身作过多的描述。本发明主要在于使用语音识别技术来完成接收端对发送端发送来的声音信息的识别,以得到发送端所要传输的信息,从而实现以声音信息作为承载,通过话路对非声音信息的传送,也即通过话路实现非声音信息的传送。
步骤102~104、信息发送端与信息接收端建立话路后,在需要发送信息时,根据该信息得到信息基本元素序列,并根据信息基本元素与音频信息元的对应关系,确定该信息基本元素序列所对应的所有音频信息元,之后再通过已建立的话路将这些音频信息元所对应的声音信息发送到接收端。
信息基本元素可以为二进制字符的“0”和“1”,这种情况下,如果希望发送字母“A”,而“A”的ASCII字符值为16进制的“41”,则发送端可以将“A”分解为信息基本元素序列“01000001”,这样,就可以根据该信息基本元素序列确定相应的音频信息元了。也就是说,在设置了“0”和“1”分别对应的音频信息元后,就可以根据该对应关系来确定信息基本元素序列对应的音频信息元,之后通过已经建立的话路将这些音频信息元所对应的声音信息发送到信息接收端。
如果所设置的音频信息元信息是语音片段,则发送端可以直接发送该语音片段的数字声音信息,当然,对于模拟通信的情况来说,则可以是直接播放该语音片段,也即传送语音片段的模拟声音信号。
如果所设置的音频信息元是由语音片段等声音信息转换得到的声学特征矢量的描述信息,则信息发送端可以根据该描述信息产生一个模拟语音片段的声音信息,并将该模拟语音片段的声音信息发送给接收端。
步骤105~106、信息接收端在接收到声音信息后,通过自身的音频信息识别模块从声音信息中识别出相应的信息基本元素,进而根据识别出的信息基本元素序列得到相应的信息。
这里,信息基本元素序列可以直接是要传送的信息,比如,使用“0”到“9”的数字字符作为信息基本元素时,信息基本元素序列“88115066”可以直接是要传送的一个电话号码信息。
通过上述步骤,即可实现本发明的目的。
本发明方案所涉及的音频信息元实际上可以是音频信号,该音频信号所对应的信息既可以是诸如语音文件之类的语音信息,也可以是诸如音乐文件之类的音乐信息。如果希望一个音频信号对应的信息是语音信息,可以将该音频信息元设置为对应一个语音片段。
显然,上述信息发送端和信息接收端可以是包括移动终端和固定终端在内的所有电话终端,还可以是其它的网络侧通信设备。也就是说,通过本发明方案的设置,通信双方只要能够建立话路,就可以通过该话路实现信息交互。
上述过程所提的信息基本元素可以是通信终端的按键信息,当然,也可以是其它的信息。以按键信息为例,比如,每个按键数字代表该数字的原意,也即每个按键数字所对应的按键信息就是信息基本元素,并设置各个按键信息基本元素所对应的音频信息元。这样,信息发送端用户在需要向信息接收端发送电话号码之类的数字信息时,即可通过输入按键信息来生成信息基本元素,信息发送端在收到通过按键输入的信息后,对该信息再作相应的处理,从而得到与输入的按键信息相对应的音频信息元,而后将音频信息元所对应的声音信息发送到信息接收端。信息接收端则通过音频信息识别模块从收到的声音信息中识别出信息基本元素,由于信息基本元素即为按键信息,因此,得到信息基本元素即为得到按键信息,也就得到信息发送端所发送的电话号码。同样,通过这种方式可以从信息发送端向信息接收端传送其它信息,比如,号码簿号码,以及信息接收端要求输入的诸如接入密码等信息。
在根据按键设置信息基本元素时,还可以作进一步的设置。比如,可以设置点击某个按键所代表的信息基本元素,快速双击某个按键所代表的信息基本元素,长时间按住某个按键不动所代表的信息基本元素,或者是多个按键的组合所代表的信息基本元素等等,并设置这些特殊按键信息基本元素所对应的音频信息元。当然,还需要对信息接收端中的音频信息识别模块作相应的设置,使其能够识别出这些特殊的信息基本元素。
信息基本元素还可以设置为ASCII字符,相应地,应设置各个ASCII字符所对应的音频信息元。通过这种方式,信息发送端则可以快捷地将一个email地址发送到信息接收端。
当然,如前所述,信息基本元素还可以设置为二进制字符,二进制字符只包括“0”和“1”,因此,设置信息基本元素所对应的音频信息元即为设置“0”和“1”所对应的音频信息元。由于通过“0”和“1”可以表达任何信息,因此,通过这种方式,信息发送端可以向信息接收端发送任何信息。这种情况下,信息接收端的音频识别模块也要能识别出“0”和“1”两个基本信息元素。
另外,本发明还可以设置用于表示信息发送开始的开始信息元素及相应的开始音频信息元。信息发送端在发送信息元之前,首先根据开始信息元素来发送开始音频信息元所对应的声音信息,而后发送由要发送信息得到的音频信息元所对应的声音信息;相应地,在信息接收端设置两级识别功能,当信息接收端在与信息发送端建立通话后,首先启动一级识别功能,监测收到的声音信息中是否出现了开始信息基本元素,当检测到开始信息基本元素,开始启动二级识别功能,对后续接收到的声音信息进行二级识别,从而得到要发送的信息所对应的信息基本元素,进而得到要发送的信息。
这里,由于一级识别功能所识别的信息基本元素仅仅包括开始信息基本元素,因此识别效率会更高,从而,对正常通过该话路进行的语音通信影响较小。由于二级识别功能要识别信息基本元素包括所有可能的信息基本元素,这些信息基本元素集可能较大,因此,在进行语音模式匹配时,处理的效率会较一级识别底。当然,也可以适当扩大一级识别功能所识别的信息基本元素的数量,从而实现信息发送端对信息接收端进行较为复杂的控制功能。比如,接收端可以有不同的识别方式,发送端可以通过控制命令,指示接收端启动相应的识别方式。
实际当中,可以由某种动物特别的叫声中截取一个音频片段来得到开始音频信息元,比如,从叫驴的冗长叫声中截取一些人类难以模仿的声音片段。当然,也可以从一些动物的特别的叫声中截取一些音频片段来得到其它的音频信息元。
相应地,还可以设置用于表示信息发送结束的结束信息元素及相应的结束音频信息元。信息发送端在结束发送信息时,根据结束信息元素来发送结束音频信息元所对应的声音信息,信息接收端在识别到接收信息基本元素时则结束二级识别功能。当然,结束二级识别功能后,识别模块可以重新回到一级识别状态。
以上所述仅为本发明方案的较佳实施例,并不用以限定本发明的保护范围。
权利要求
1.一种通过话路传送信息的方法,其特征在于,在信息接收端设置声音信息识别模块,该方法进一步包括以下步骤a.信息发送端将所要发送的信息转换为声音信息,并通过话路将该声音信息传送到信息接收端;b.信息接收端通过所述声音信息识别模块从接收到的声音信息中识别出相应的信息。
2.根据权利要求1所述的方法,其特征在于,该方法进一步包括,在信息发送端设置用于表达信息的信息基本元素,并设置与信息基本元素对应的音频信息元,每个音频信息元对应一个声音信息;所述步骤a为信息发送端将要发送的信息转换为相应的信息基本元素,并将与该信息基本元素对应的音频信息元所对应的声音信息通过话路发送给信息接收端。
3.根据权利要求2所述的方法,其特征在于,所述声音信息识别模块根据所述声音信息与信息基本元素的对应关系设置;所述步骤b为信息接收端中的声音信息识别模块根据收到的声音信息识别出相应的信息基本元素,并根据该信息基本元素确定发送端所发送的信息。
4.根据权利要求2或3所述的方法,其特征在于,所述信息基本元素为ASCII字符、或二进制字符,或根据信息发送端的按键信息设置。
5.根据权利要求2或3所述的方法,其特征在于,所述音频信息元为语音片段;或者为声音信息转换得到的声学特征矢量的测量值;所述音频信息元所对应的声音信息为根据所述音频信息元产生模拟语音片段。
6.根据权利要求3所述的方法,其特征在于,该方法进一步包括在每两个音频信息元之间设置音频隔离符;步骤a中,所述信息发送端在发送音频信息元所对应的声音信息之前,进一步包括在每两个音频信息元之间设置音频隔离符;步骤b中,所述信息接收端中的声音信息识别模块根据收到的声音信息识别出相应的信息基本元素包括根据音频隔离符从自身收到的声音信息中分离出与音频信息元对应的声音信息,并根据所述声音信息识别出相应的信息基本元素。
7.根据权利要求3或6所述的方法,其特征在于,该方法进一步包括在信息接收端设置针对每个音频信息元所对应的声音信息的声音模式;步骤b中,所述信息接收端通过声音信息识别模块确定相应的信息基本元素为信息接收端用该声音信息与所设置的声音模式进行匹配,确定最大匹配的声音模式,并通过该声音模式确定相应的信息基本元素。
8.根据权利要求7所述的方法,其特征在于,该方法进一步包括根据信息基本元素与音频信息元的对应关系确定音频信息元对应声音信息所对应的声音模式与信息基本元素的对应关系;所述声音信息识别模块根据声音模式与信息基本元素的对应关系设置;步骤b中,所述声音信息识别模块通过该声音模式确定相应的信息基本元素为直接根据所述对应关系确定相应的信息基本元素。
9.根据权利要求8所述的方法,其特征在于,所述声音模式为音频信息元所对应的声音信息的声学特征矢量相关描述值的范围;步骤b中,所述信息接收端用该声音信息与所设置的声音模式进行匹配为根据声音信息得到相应的声学特征矢量相关描述值,并用该声学特征矢量相关描述值与所设置的所有声音模式进行匹配。
10.根据权利要求3所述的方法,其特征在于,该方法进一步包括设置用于标识信息发送开始的开始信息元素及相应的开始音频信息元;步骤a中,所述信息发送端在将要发送的信息转换为信息基本元素时,进一步包括在所述信息基本元素的最始端设置开始信息元素;所述信息发送端通过话路发送给信息接收端的声音信息包括所述与开始信息元素对应的开始音频信息元所对应的声音信息;步骤b中,所述信息接收端中的声音信息识别模块根据收到的声音信息确定相应的信息基本元素包括检测自身收到的信息中是否出现开始信息元素,如果是,则开始识别收到的声音信息中开始信息元素对应的开始音频信息元之后的声音信息;否则,继续执行检测是否出现开始信息元素的步骤。
11.根据权利要求10所述的方法,其特征在于,该方法进一步包括在信息接收端设置用于执行开始信息元素识别的一级识别功能,及用于执行信息基本元素识别的二级识别功能;步骤b中,所述检测是否出现开始信息元素通过启动一级识别功能实现;所述开始识别收到的声音信息中开始信息元素对应的开始音频信息元之后的声音信息通过启动二级识别功能实现。
12.根据权利要求3或10所述的方法,其特征在于,该方法进一步包括设置用于表示信息发送结束的结束信息元素及相应的结束音频信息元;步骤a中,所述信息发送端在将要发送的信息转换为信息基本元素时,进一步包括在所述信息基本元素的最末端设置结束信息元素;所述信息发送端通过话路发送给信息接收端的声音信息包括所述与结束信息元素对应的结束音频信息元所对应的声音信息;步骤b中,所述信息接收端中的声音信息识别模块根据收到的声音信息识别出相应的信息基本元素进一步包括检测自身收到的信息中是否出现结束信息元素,如果是,则结束识别信息基本元素步骤;否则,继续执行检测是否出现结束信息元素的步骤。
13.根据权利要求1所述的方法,其特征在于,所述信息发送端及信息接收端为电话终端,或网络侧通信设备。
全文摘要
本发明公开了一种通过话路传送信息的方法,该方法首先在信息接收端设置声音信息识别模块,之后,信息发送端在需要向信息接收端发送非语音信息时,将所要发送的信息转换为声音信息,并通过话路将该声音信息传送到信息接收端;信息接收端通过所述声音信息识别模块从接收到的声音信息中识别出相应的信息。本发明方案解决了现有技术不能通过话路传递非语音信息的问题。本发明实现了通话双方通过已建立的话路对非语音信息的传送,且不需要中间系统设备的参与。
文档编号H04L12/00GK1756251SQ20041008060
公开日2006年4月5日 申请日期2004年9月29日 优先权日2004年9月29日
发明者王正伟, 王少见, 覃景繁 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1