专利名称:Ip网上话音传输中双音多频信号的早期检测方法和装置的制作方法
技术领域:
本发明总体上涉及用网际协议在网络上以数字数据分组形式发送的话音传输,具体涉及从要在IP(网际协议)网上发送的数据分组去除双音多频(DTMF)信号的数字音频表示,并且用含足以表示所检测DTMF信号特性的专用控制数据分组代替该信号。
背景技术:
和技术问题以往,电话通信一般涉及在公用交换电话网(有时称为PSTN)上传送话音信号。通常用带内信令进行拨号、某些装置的控制和应答的指示。最普通的带内信令采用按压按键话机按钮而产生的DTMF信号。例如,远端拨入以接入话音函件系统时,可通过按压按键话机上适当的钮,产生话音函件系统能解码的DTMF信号,给话音函件系统提供用户的接入码或PIN号。或者,有些商务操作利用自动化话务台系统应答来话呼叫,用户则可通过按压按键话机相应的钮或按压“0”告知话务员,指明要转接的分机。自动化话务台系统可将用户机产生的DTMF信号解码,用于完成呼叫,无需人工话务员干预。话音应答系统对DTMF信号作出响应,使呼叫者可检索信息,诸如银行帐户结余、本地天气预报、电影时间和其他类型的有用信息。
PSTN电话系统基于个人计算机、调制解调器和因特网时代前许多年的历史时期的设计。当前,现代因特网的发展,以能在采用网际协议的网络(有时称为IP网)上传送的数字数据分组的形式的话音信号传输提供另一路由。然而,随着话音信号在IP网上传输(有时称为IP传知音),出现一些问题。由于IP传话音常用话音编解码器,DTMF和其他带内信号如果作为数字化信号表示发送,就不能充分再现该信号。IP传话音中用的数-模转换和压缩技术不能再现DTMF信号而无大失真。该失真严重到足以使在电路接收端上数-模转换再产生的DTMF信号充分偏离该带内信令的规定要求,往往不会正确识别DTMF信号音。因而,可预计常规DTMF检测器检测从IP接收的数字化表示所再现的该失真DTMF信号会频繁失效。
DTMF信号由2个同时单音组成,该单音必须具有识别为有效DTMF信号的某些特性。低频组的频率包含697、770、852和941Hz。高频组的频率包含1209、1336、1477和1633Hz。为了识别为有效DTMF信号,DTMF信号必须由2个频率组成,一个频率选自低频组,一个频率选自高频组。美国实施的技术规范规定DTMF检测器在双音分别偏离规定频率正或负1.5%以内时必须检出DTMF信号。双音之一偏离规定频率超过正或负3.5%,则DTMF检测器必须拒收DTMF信号。此外,DTMF信号有时还必须符合称为“对织率”的某些信号条件,该对织率定义为高频组单音能量与低频组单音能量的比率。检测的2个双音能量比率(或对织率)必须在对要识别为有效DTMF信号的信号的规定范围内对美国的应用必须大于或等于-8dB并且小于或等于4dB。此外,DTMF信号的“导通”时间在美国应用中必须最短为40毫秒,后续“阻断时间”最短为40毫秒。最短周期时间为93毫秒。不同的国家可容许的频偏、对织率、导通时间、阻断时间和周期时间可不同。但在许多应用,即使可用参数不同于这里提供的例子,TDMF检测也必须考虑容许的频偏、对织率、导通时间、阻断时间和周期时间。为了方便,这里讨论可用的美国参数,但本领域技术人员理解,可替换其他参数而不偏离不发明的实质和范围。
IP网上传送RTP数据分组的规范草案规定要从RTP数据分组去除DTMF信号。然而,为了从诸如话音之类音频信号去除DTMF信号,必须检测DTMF信号。DTMF信号的检测花费有限时间。此外,正常语言常含各种频率和谐波的混合分量,其中时常会瞬间含有DTMF信号的等效频率分量。错误检测是个问题。此外,有效DTMF信号还要在后续最短“阻断”时间的信号持续时间方面满足某些要求,从而检测方案最好至少至少以最短周期时间审查信号,判断是否检测到有效DTMF信号。
以往,去除DTMF依赖的努力,其方案包括全部数字间频数据分组延迟,直到证实无DTMF信号音,才发送这些分组。此方法在传输中引起恼人的延迟。该延迟会减损IP传话音应用的质量,妨碍与某方进行自然交谈的努力。其表现可能显著不同于通常的电话交谈。
以往,去除DTMF信号的努力,其方案还包括发送数字音频数据分组,并仅在证实检测出有效DTMF信号时中断发送的分组流。由于用有限量的时间可靠检测有效DTMF信号,使一些失真的DTMF音可发送得时间长达与DTMF检测延迟相等。此方法未完全去除DTMF信号,反而使失真的DTMF信号可在IP网远端至少瞬间得到接收,不能解决问题。许多应用中,在接收方收到失真的DTMF音,即使该音时间短暂,也令人不愉快。
虽然,已公认从数字音频数据传输中去除DTMF信号为IP传话音应用中的问题,但以往去除DTMF信号的努力都不能解决问题。显然需要一种从IP数据分组传话音去除DTMF信号的改进方法,不在系统中引入过分延迟而同时有效去除DTMF信号,使IP连接的远端听不到失真的DTMF信号。
发明内容
根据本发明示范实施例,提供一种在IP网上传送的话音中早期检测带内DTMF信号的方法和设置。利用数字信号处理器,每当检测出信号可能与DTMF音信号特性对应的指示时,在缓存器中暂存原本要在IP网上发送的数字音频数据分组并使其延迟。数字音频数据分组的缓存给数字信号处理技术提供时间,以可靠判断所检测信号的持性是否足以将其描述为DTMF信号。如果判定该信号具有必要的有效DTMF信号特性,丢弃缓存的数据分组,发送专用控制信号并加以格式化,以对接收方传送足以使DTMF发生器可产生DTMF信号的所检测DTMF信号的特性。判定该信号无必要的有效DTMF信号特性,则发送缓存的数字音频分组。所揭示的方法和设备从RTP数据分组传输中有效去除DTMF信号的数字音频表示,并且用RTP控制数据分组替换DTMF信号,不在系统中引入过分延迟。
本发明的一个种方法和设备提供IP网上所发送数字音频数据分组的较佳DTMF信号消除,并且使处理数字音频数据以证实DTMF信号减少错检时带来的平均延迟减到最小。
附图简述下面,结合
本发明,附图中相同的号指相同的单元,并且图1是说明IP网上传送话音的设备示意表示的框图;图2是说明图1中控制寄存器进一步详况示意表示的框图;图3是说明图1中状态寄存器进一步详况示意表示的框图;图4是说明图1所示DSP执行的方法中各步骤的流程图;图5A是说明图1所示DSP执行的方法中各步骤的流程图,示出图4中DTMF检测器步骤的进一步详况;
图5B是图5A所示流程图的继续;图6是说明图1所示控制器执行的方法中各步骤的流程图;图7是说明控制器所执行方法中各步骤的流程图,示出图6中校验来自DSP的编码话音帧的步骤的进一步详况;图8是说明控制器所执行方法中各步骤的流程图,示出图6中发到主机的RTP数据分组校验步骤的进一步详况;图9是说明DSP所执行方法中各步骤的流程图,示出图5A中DTMF早期检测信号处理算法步骤的进一步详况。
较佳示范实施例详细说明图1是示出用网际协议的网络21上传送话音的本发明设备的框图,该网络21这里称为IP网21。模拟话音信号可从连接公用交换电话网(或PSTN)22的市内电话机23始发。本例中,电话机23产生的模拟话音信号可在PSTN22的市内局(未示出)转换成数字表示后,在T1线路29上发送到接入服务器或媒体接入网关10。另外,PSTN22与网关10之间的连接也可通过E1线路。市内电话机23产生的信号还可包含用户按压按键电话机23的钮时产生的DTMF信号。
在T1线路29的例子中,模拟音频信号通常以8000Hz加以取样,并且用每秒64千位的速率加以PCM编码。此数字表示也足以表示可再现的DTMF信号。然而,如果话音信号以每秒64千位的速率进行数字化,则IP网21上发送许多数据,会使IP网21过载。为了避免IP网21过载,数据在IP网21上发送前,将话音信号解码后,以较低的位速率编码,虽然这样的位速率或压缩程度提供失真程度可接受的话音数字表示,但低位速率和/或高程度压缩不适合提供DTMF信号的数字表示,使该信号能在远端电话机24再现,而没有高到使DTMF数字可靠检测实际上不可能或至少很难实践。因此,必须检测与话音信号混合的任何DTMF信号,并使其从IP网21上发送的数字表示中消除。
接入服务器10执行检测并消除DTMF信号的本发明一种方法。接入服务器10包含T1收发机或E1收发机与线路接口11、DSP模块12、控制器13、存储器16、控制寄存器18、系统控制器或主机14以及IP网接口15。接入服务器10最好包含定时器17和状态寄存器19。接入服务器10还可包含DTMF发生器20。接入服务器10通过T1/E1收发机与线路接口11连接PSTN22,该接口提供电话接口11。
电话接口11经TDM总线30连接数字处理器(或DSP)12,处理音频信号的数字表示,以检测潜在的DTMF信号。数字处理器12连接微控制器13,后者的工作制备话音信号的数字表示,用于作为RTP数据分组传送。微控制器13连接系统控制器或主机14。无DTMF信号时,将RTP数据分组传到主机14,可根据UDP/IP协议将该数据汇编成数据分组。或者,可用TCP/IP协议主机14连接IP网接口,后者又连接IP网21,主机14汇编的数据分组在IP网21上发送到远端网关25。本例中,远端网关25经PSTN22连接远端电话机24。会理解,远端网关25包含类似于接入服务器10的媒体接入网关,因而未详细示出。
微控制器13连接存储器16,以便暂存RTP数据分组。微控制器13经系统控制器14连接网络接口15,将RTP数据分组接到IP网21(RTP数据分组包含在UDP/IP数据分组中)。控制寄存器18是微控制器13和数字处理器12都能读取的双端口寄存器。微控制器13和数字处理器12也可对控制寄存器18进行写入。在说明例中,控制寄存器18包含8位寄存器,图2中较详细示出。
参考图2,控制寄存器18包含标为EDET的DRMF早期检测标记位40,这时潜在DTMF信号检测状态的指示。在检测DTMF信号能量指示接收的信号可能是DTMF信号时,数字处理器使状态位EDET40置位。在检测并证实有效DTMF信号时,或在接收信号不能满足后续的DTMF信号时,或在接收信号不能满足后续的DTMF检测和验证处理时,数字处理器12将此早期DTMF检测位40复位。
控制寄存器18还包含指示检测有效DTMF信号的一个或多个标记位41、42和43。控制寄存器18包含标为DTDET的DTMF双音检测标记位41。除最小导通时间、阻断时间和周期时间外,在接收的信号满足全部DTMF检测指标时,数字处理器12使DTDEF标记41置位。换言之,DTDET标记位41在满足以下条件时置位(a)接收信号得以检测为具有来自低频组(697、770、852和941Hz)的一个单音和来自高频组(1209、1336、1477和1633Hz)的一个单音的2个同时单音;(b)双音分别在预定频率容限内(最好是规定频率的正或负1.5%);(c)双音偏移都不超过预定的频偏(最好是规定频率的正或负3.5%);(d)满足对织率要求,即2个双音的能量比率在预定范围内,最好大于或等于-8dB且小于或等于4dB。如果接收信号不能满足所要求的最小导通时间、阻断时间或周期时间,数字处理器12使DTDET标记复位。
控制寄存器18包含DTMF导通时间满足标记位42,标为OTS。在DTMF最短导通时间得到满足后,数字处理器使OTS标记位42置位。DTMF最短导通时间最好是40毫秒,但根据需要,可用其他合适的最短导通时间。如果接收信号不能满足所要求的最短阻断时间或周期时间,数字信号处理器12使OTS标记位复位。DTMF最短阻断时间最好是40毫秒,但也可按照需要采用其他合适的最短阻断时间。要求的周期时间是最短周期时间,以93毫秒为佳,但也可按照需要采用其他合适的最短周期时间。
控制寄存器18还可包含DTMF检测标记位43,标为DTMFD,示于图2。检测DTMF信号满足全部DTMF检测指标时数字处理器12使DTMFD标记位43置位。数字处理器12使DTMFD标记位43置位时,使EDET标记位40、DTDEF标记位41和OTS标位42复位。
控制寄存器18还包含4位DTMF输出字44,标为DTMFW。数字处理器12在紧接DTDET标记位41置位前,将4位编码DTMF输出字写入DTMFW寄存器。写入DTMFW寄存器44的4位码指示检测到什么DTMF符号或数字。表1中提供DTMFW寄存器44适用的DTMF符号码。
表1DTMF符号 DTMFW输出字0 00001 00012 00103 00113 01005 01016 01107 01118 10009 1001* 1010# 1011A 1100B 1101C 1110D 1111微控制器135能读取EDET标记位40、DTDET标记位41、OTS标记位42、DTMFD标记位43和DTMFW输出字44。较佳实施例中,微控制器13在读取DTMF输出字44后,使DTMFD标记位43复位。否则微控制器13会漏检相同的DTMF符号。
在指示潜在DTMF信号检测状态的EDET标记位40未置位时,微控制器13汇编的RTP数据分组立即连接到网络接口15,以便在IP网21上传输。本领域的技术人员会理解,这种情况下,RTP数据分组会作为UDP数据分组的数据部分在IP上发送。
在指示潜在DTMF信号检测状态的EDET标记位40置位时,将微控制器13汇编的RTP数据分组暂存于存储器16,同时数字处理器12继续处理信号,以检验该信号是否为有效DTMF信号。如果指示潜在DTMF信号检测状态的EDET标记位40复位,并且指示有效DTMF信号检测的DTDET标记位41未置位,则存储器10中暂存的RTP数据分组立即接到网络接口15,以便在IP网21上传输。如果指示有效DTMF信号检测的DTDET标记位41置位,丢弃存储器16中暂存的RTP数据分组,并且微控制器13制备控制数据分组,将其接到网络接口15,以便在IP网21上传输;该控制数据分组包含指示DTMF信号特性的信息。
包含指示DTMF信号特性的控制数据分组最好包含RTP控制数据分组或RTCP数据分组中的32位信息,该信息具有以下较佳格式RRRNNNNNRRVVVVVVDDDDDDDDDDDDDDDD其中,“R”指保留位,“N”指代表DTMF数字的数据位,“V”指舍去符号后用dBm0表示的代表DTMF信号功率电平的数据位,“D”指以时间标记为单位的DTMF信号持续时间的指示数据位。保留位最好设为零。代表DTMF数字的数据位“N”最好以二进制格式偏码,使以下编码数据(为了方便,示为十进制号)代表指示的DTMF数字编码“0”代表DTMF数字0编码“1”代表DTMF数字1编码“2”代表DTMF数字2编码“3”代表DTMF数字3编码“4”代表DTMF数字4编码“5”代表DTMF数字5编码“6”代表DTMF数字6
编码“7”代表DTMF数字7编码“8”代表DTMF数字8编码“9”代表DTMF数字9编码“10”代表DTMF数字*编码“11“代表DTMF数字#编码“12”代表DTMF数字A编码“13”代表DTMF数字B编码“14”代表DTMF数字C编码“15”代表DTMF数字D编码“16”代表闪跳或拍叉簧信号。
接入服务器10能根据从远端网关25接收的数据控制分组产生DTMF信号。当在IP网21上从远端网关25接收含DTMF特性指示信息的控制数据分组时,将该控制数据分组当作专用控制数据分组,进行与含数字音频型数据的RTP数据分组不同的处理。控制数据分组包含从其可产生DTMF信号的信息。可将代表DTMF信号特性的解码数据传给DTMF发生器(或DTMF信号发生器)20。DTMF信号发生器20根据来自指示要产生的DTMF数字的控制数据分组的数据、DTMF信号的功率电平和DTMF信号的持续时间,产生DTMF信号。或者,可用DSP 12产生DTMF信号,并省略分开的DTMF发生器20。
图1所示的远端网关25包含在远端处连接IP网21的第二网络接口。远端网关还包含连接第二网络接口的第二微控制器,以及连接第二微控制器将音频信号数字表示转换成模拟信号的数-模转换器或第二DSP。该模拟信号连接到远端电话机24。远端网关25还包含连接第二微控制器的第二DTMF信号发生器,用于产生具有第一微控制器13所发送控制数据分组中包含的信息决定的特性的DTMF信息。
在微控制器13在存储器16中暂存RTP数据分组时,可在状态寄存器19设定标记。图3中较详细示出状态寄存器19。在说明例中,状态寄存器19包含具有标为“拖延”的标记位45的1位寄存器。“拖延”标记位45置位时,指示缓存器16包含RTP数据分组等待数据处理器12进一步进行DTMF处理和检测。或者,可省略状态寄存器19,将“拖延”标记存入存储器16,或当作可接入微控制器13的任何中购得随机存取存储器中的变量。
从音频信号中去除DTMF信号的本发明方法包含以下步骤(采用数字信号处理)审查音频信号,以求潜在DTMF信号;制备音频信号作为数字数据分组传输;未检测到潜在DTMF信号时,在为DTMF早期检测而扫描数据分组后,立即在IP网21上发送数据数据分组。如果检测到潜在DTMF信号,将数字数据分组暂时存入存储器16,直到能进行DTMF检测。如果潜在DTMF信号不导致DTMF检测,立即发送存储器16中暂存的数字数据分组。如果潜在DTMF信号导致DTMF检测,丢弃存储器16中暂存的数字数据分组,并发送含涉及已检测DTMF信号的特性的信息的控制数据分组。
在IP网21上发送可能包含话音信号和DTMA信号的音频信号的本发明方法最好包含以下步骤处理音频信号的数字表示,以检测潜在DTMA信号;未检测到潜在DTMF信号时的第一操作模式中,(a)制备音频信号的数字表示作为RTP数据分组,并且(b)立即在IP网21上发送该RTP数据分组。在检测到潜在DTMF信号时的第二操作模式中,本方法包含以下步骤制备音频信号的数字表示作为RTP数据分组潜在发送,并且在存储器16中暂存该RTP数据分组,同时对潜在DTMF信号进行处理,检验该信号是否为有效DTMF信号;(a)如果制定潜在DTMF信号不是有效DTMF信号,在IP网21上发送暂存的RTP数据分组,(b)如果判定潜在DTMF信号是有效DTMF信号,丢弃存储器16中暂存的RTP数据分组,制备含DTMF信号特性指示信息的RTP控制数据分组,并且在IP网21上发送该控制数据。
此方法还包含以下步骤在连接IP网21的远端处接收RTP数据分组;对该RTP数据分组解码,恢复音频信号的数字表示;将音频信号的数字表示转换成模拟信号;在连接IP网21的远端处接收RTP控制数据分组;产生具有RTP控制数据分组中含信息决定的特性的DTMF信号。
参考图4中流程图,会更好地理解本发明的方法。图4说明数字处理器(或DSP)12执行的步骤。步骤50代表处理进程的开始。DSP12在步骤51接收来自T1、E1接口的数据。较佳实施例中DSP12任选利用μ律PCM解码器或A律PCM解码器实现G.711编解码器模式。或者,DSP12可实现G.723编解码器模式、G.729编解码器模式、G.726编解码器模式、G.727编解码器模式、G.728编解码器模式或其他期望的编解码器。实质上任何期望的编解码器都可通过将软件下载到DSP12,配置DSP12。DSP12还在步骤53接收回波消除。可按8毫秒增量有选择地提供从8毫秒到122毫秒的回波路径延迟。步骤54中,DSP12对不存在DTMF信号时用的数据提供话音编码。不存在DTMF信号时,编码话音在步骤56通过控制器和DSP的接口提供给控制器13。只要接收数据,处理进程就返回步骤51进行处理。不再接收数据时,在步骤57完成DSP处理。
图4中,在步骤55审查全部接收数据,该审查最好与话音编码步骤并行。图5A和图5B中较详细说明DTMF检测器步骤55。该DTMF检测器步骤55在图5A用步骤60起动。步骤61中,DSP12通过计算宽带信号能量测量信号能量。可用本领域公知的方法计算宽带信号能量。步骤61中,最好将取样输入信号取平方后,由能量平均IIR低通滤波器进行处理,该滤波器的输出就是瞬时宽带信号能量。
参考图5A,DSP12在步骤62对信号进行自动增益控制。步骤63中,DSP12进行校验,观察EDET标记40是否置位。如果EDET标记40未置位,本方法进至步骤64,进行早期DTMF检测。图9中示出早期DTMF检测处理的进一步详况。参照图5A,在完成DTMF早期检测信号处理算法时,方法进至步骤65并且返回。执行返回步骤65,则方法进至图4所示的步骤56。
图5A所示的步骤63中,如果EDET标记40置位,方法进至步骤66,使DSP12校验DTDET标记41,判断该标记是否置位。如果DTDET标记41置位,方法进至图5A中用字母“A”标示的点67。该点对应于图5B中用定母“A”标示的点67。因此,如果DTDET标记41在图5A的步骤66置位,本方法的下一步骤就是图5B所示的步骤130。下文会进一步说明本方法的这些步骤。
参考图5A,步骤66中如果DTDET标记41未置位,方法进至步骤68,执行DRMF检测信号处理算法。步骤68的DTMF检测信号处理算法是完成低频带频率分析(快速傅里叶变换)所需的附加处理。由于低频带频率分析(697、770、852和941Hz)采用较多的频率取样,这些附加取样的分析比高频带频率分析(1209、1336、1477和1633Hz)用的时间长。低频带频率的分析类似于步骤64中用的高频带频率分析和图9中对高频带频率较详细示出的步骤。由于用高频带频率分析判断标记40是否置位指示潜在DTMF信号早期检测,并结合图9详述其较佳频率分析,这里不详述。本领域技术人员会理解,在步骤68采用低频组代替步骤64中采用并且下文结合图9详述的高频组。
对潜在DTMF信号进行的测试结果相当于最好审查潜在DTMF信号,以判断接收信号是否具有一个来自低频组(697、770、852和941Hz)的单音和一个来自高频组(1209、1336、1477和1633Hz)的单音的2个同时单音,2个单音对规定频率的偏移是否都不大于正或负3.5%,双音是否分别在规定频率的正或负1.5%以内。在说明例中,结合早期检测标记40的设定校验高频(1209、1336、1477和1633Hz),低频组(697、770、852和941Hz)则在证实潜在DTMF信号是否为有效DTMF信号的处理期间校验。
图5A所示步骤69中,审查潜在DTMF信号,以判断该信号是否具有错误信号频率。若该信号有错误频率,方法进至步骤71,使EDET标记40复位为零(或“关断”)。然后,方法进至步骤72,进行返回。步骤69中,若潜在DTMF信号无错误频率,方法进至步骤70进行校验,观察该信号是否具有正确DTMF信号频率。再次参考步骤70,若该信号无正确频率,方法进至步骤72并且返回。如果进行步骤69和70时快速傅里叶变换(FFT)的分析未完成,此进程在逻辑上是可能的。对采用较多取样的低频组而言,这时本方法中可能未完成FFT,从而步骤69和步骤70都判定为“否”。这种情况下,可经步骤70达到步骤72。若因步骤69和70的“否判决”状况而进行步骤72并导致返回,即未完成低频组的FFT分析,则通过循环在下一轮又校验潜在DTMF信号的信号频率。
步骤70中,潜在DTMF信号有正确频率,则方法进至步骤73校验该信号,观察是否具有错误的信号对织率。若该信号有错误对织率,则方法进至步骤75,使EDET标记复位为零(或清除)。然后,方法进至步骤76并返回。步骤73中,潜在DTMF信号无错误对织率,方法就进至步骤74。
在步骤74校验潜在DTMF信号,观察是否具有正确的信号对织率。对织率条件最好是2个双音的能量比率必须在大于或等于-8dB且小于或等于4dB的范围内。实际用的对织率条件可因国家、管辖区或外部规范而异。若DTMF无正确信号对织率,方法进至步骤76并返回。如果在进行步骤73和74时对织率分析所要求的计算未完成,此进程在逻辑上可能的。这时在本方法中可能未完成计算,从而步骤73和步骤73都判定为“否”。这种情况下,可经步骤74到达步骤76。若因步骤73和74的“否判决”而进行步骤76并导致返回,即进行步骤73和74时未完成低频组对织分析所需的FFT计算,则通过循环在下一轮又校验潜在DTMF信号的信号对织率。
参考图5A,步骤74中若潜在DTMF信号具有正确对织率,则方法进至步骤77。在步骤77显示DTMF信号。通过码写入或载入DTMF字的DTMFW4位寄存器44,指示检测什么DTMF符号(根据表1),从而显示DTMF信号。控制器13能读DTMFW寄存器44,以判断DSP12检测什么DTMF数字。步骤77中,在DTMFW寄存器44(示于图2)加载后,使DTDET标记41置位。或者,可通过对存储器16写入信息,指明检测的DTMF数字,最好还包含所检测DTMF信号持续时间和量的指示信息,从而显示DTMF信号。存储器16可由控制器13读取,并且控制器13可根据DSP写的信息判定构建指示DSP12所检DTMF信号的特性的控制数据分组需要的信息。完成步骤77后,方法进至步骤78并返回。
图5A所示的步骤66中,若DTDET标记41置位,方法进至图5B所示的步骤130。步骤130中,校验OTS标记42(示于图2),判断该标记是否置位。如果未置位,方法进至步骤131,校验潜在DTMF信号,判断其宽带能量是否低于预定门限。如果该信号无低于预定门限的宽带能量,方法进至步骤132并返回。步骤131中,潜在DTMF信号具有低于预定门限的能量,则方法进至步骤133,校验潜在DTMF信号,判断是否满足预定的最短导通时间。最好测试该信号,判断其是否保持导通至少40毫秒,但可依据适当的国家或管辖区采用其他预定最短导通时间。如果步骤133中不满足预定最短DTMF导通时间,方法进至步骤134,使EDET标记40复位为0,DTDET标记41也复位为0。然而,方法进至步骤136,进行返回。
步骤133中,如果潜在DTMF信号具有预定最短导通时间,方法进至步骤135,使OTS状态位42置位(本例中,“置位”的含义是二进制位改为逻辑“1”)。然后,方法进至步骤136。
参考图5B,如果步骤130中OTS状态位42置位,方法进至步骤137,测试潜在DTMF信号,判断其是否具有低于预定门限电平的宽带能量。如果不具有,方法进至步骤138,使EDET标记40、DTDET标记41和OTS标记42都复位为0。然后,方法进至步骤139并返回。
步骤131和137用的宽带能量门限用于检测宽带信号能量的突然升降。满足最短导通时间前,突然升降与无损伤DTMF信号不一致,但与话音信号一致,最好根据经验测试选择门限值,本领域的技术人员从本揭示获益后,会知道设定适当门限值的方法。
步骤137中,潜在DTMF信号的宽带能量如果低于预定门限于电平,方法进至步骤140,判断潜在DTMF信号是否符合预定最短阻断时间的条件,该阻断时间的说明例是40毫秒。虽然本例中用40毫秒的较佳阻断时间,但依据适当国家或管辖区,可用其他预定最短阻断时间。如果潜在DTMF信号不符合预定最短阻断时间,方法经步骤144返回。如果步骤140在潜在DTMF信号符合预定最短阻断时间条件,方法进至步骤141,判断该信号是否满足周期时间条件(即,本例中93毫秒的最短周期时间)。如果该信号不符合最短周期时间条件,方法经步骤144返回。如果步骤141中潜在DTMF信号符合最短周期时间条件,方法进至步骤142,使DTMFD标记43置位。方法进至步骤143,使EDET标记40。DTDET标记41和OTS标记42都复位为0。然后,方法进至步骤144并返回。
图9说明图5A所示DTMF早期检测信号处理算法步骤64所执行各步骤的详况。参考图9,DTMF早期检测信号处理算法中审查信号,以判断该信号是否潜在DTMF信号,并且该算法在步骤150开始。步骤151中,对审查的信号进行测试,判断其否具有大于预定最小门限的宽带能量。如果该信号无大于预定最小门限的宽带能量,方法进至步骤153并返回。如果该信号有大于预定最小门限的宽带能量,方法进至步骤152审查该信号,判断其是否具有小于预定最大门限的宽带能量。如果步骤152审查的信号无小于预定最大门限的宽带能量,方法进至步骤153并返回。步骤152中,如果审查的信号具有小于最大预定门限的宽带能量,则信号充分满足DTMF信号测试,并且在步骤154中进一步处理。
步骤151和152用的最小和最大宽带能量门限用于检测宽带信号能量的突然升降。突然升降在满足最短导通时间前与无损伤DTMF信号不一致,但与话音信号一致。最好根据经验测试选择门限值,本领域的技术人员从本揭示获益后,会知道如何设定适当门限值。
图9所示的步骤154中,用公知的数字信号处理技术对审查的信号施加快速傅里叶变换(FFT)高频带频率窗。然后,在步骤155对信号施加快速傅里叶变换。接着,方法进至步骤156,对信号施加高频带频率能量测量。
步骤154用的快速傅里叶变换(FFT)高频带频率窗是最小2项BlackmanHarris。此FFT窗有助于准确测量频偏。步骤155用的快速傅里叶变换是Goertzel算法。此快速傅里叶变换有助于低复杂度频域分析。快速傅里变换分析用的参数取决于所用的取样量和取样频率。最好选择取样量,使处理延迟最短(假设DTMF信号检测达到充分的频率分辨率),并且可依据DSP12的速度。最好对低频组和高频组取样6个频率,其中包括标称频率以及2个刚好高于和低于每组的附加频率。较佳门限测试中,仅允许组中一个频率的能量高于预定最小能量门限,并且此能量对全部其他频率能量的比率必须大于另一门限。这些门限用于区分DTMF信号与背景噪声和话音,并且后一比率的门限还用于确保频偏容限。实践中,(a)使处理延迟量短与(b)提供充分频率分辨率之间相互抵触的要求会导致选用数量与低频组频域分析不同的高频组频域分析取样。高频组用的取样数量少于低频组用的取样数量。因此,步骤156中最好用高频带能量测量判决指示潜在DTMF信号早期检测的标记40是否置位。换言之,由于高频带频率能量测量用较少的取样,能比低频组所用取样数量分析更快地完成这些取样的分析,并且能进行步骤156、157、158和159,以判决低频取样分析完成前EDET标记40是否置位。
步骤157中,审查信号,判断所推测DTMF信号音的单音能量是否大于预定最小门限。测试能量的单音最好包括全部高频组单音。说明实施例中不选用低频单音,因为实践中不可能足够快地完成低频取样处理。步骤157的测试最好校验各单音频率(1209Hz、1336Hz、1477Hz和1633Hz),以确保仅有一个单音能量大于预定门限。如果信号无能量大于最小预定门限的单一单音,不认为该信号是有效DTMF信号,并且方法进至步骤161并返回。步骤157中,如果审查的信号具有能量大于预定最小门限的单一单音,方法进至步骤158,对该信号进行高频带频偏测量。步骤159中,审查信号,以判断单一单音的频偏是否小于预定最大门限。如果该信号在步骤159不小地预定最大频偏门限,方法进至步骤161并返回。步骤159中,信号小于预定最大频偏,则判定该信号是潜在DTMF信号,并且方法进至步骤160,使早期DTMF检测状态位置位,EDDT标记40就是早期DTMF检测状态位。因此,在步骤160将审查信号判定为潜在DTMF信号,并且使EDET标记40置位。然后,方法进至步骤161并返回。于是,本方法在图5中从步骤64进到步骤65。
一本发明方法中,一旦判定信号是潜在DTMF信号(有时称为DTMF早期检测),就使EDET标记40置位,起状态位的作用,指示已进行潜在DTMF信号早期检测。EDET标记40可由控制器13读取。DSP12进行潜在DTMF信号的进一步处理。以判断潜在DTMF信号是否为有效DTMF信号。同时,在DSP12进行该进一步处理的期间,在存储器16中缓存控制器13汇编的RTP数据分组,暂时存储到完成该进一步处理。本发明的较佳实施例中,如果判定潜在DTMF信号符合测试,足以使DTDET标记41置位,就丢弃存储器10中储存的RTP数据分组,并且根据DTMFW寄存器44中的信息汇编RTP控制数据分组。如果清除EDET标记40并且DTDET标记41未置位,则控制器认为不将潜在DTMF信号判定为有效DTMF信号,并且将存储器16中暂存的数据分组送到主机14,在IP网21上传送。
图6说明控制器13进行的步骤。步骤80代表处理开始。步骤81中,控制器13进行校验,判断是否从DSP12收到编码话音帧。步骤82中,控制器13校验传到系统控制器或主机14的RTP数据分组。在步骤83判断IP传话音模式是否还有效。如果有效,处理返回步骤81。IP传话音模式在步骤83中不再有效,则处理进至步骤84并结束。
图7中进一步详细示出步骤81中控制器13校验并判是否从DSP12收到编码话音帧用的方法。处理在步骤90开始。步骤91中,控制器13进行校验,以判断DSP12是否具有可供给控制器13的新编码数据帧。如果没有,方法进至步骤92并返回。步骤91中有新的编码数据帧,则方法进至步骤93,判断是否可从DSP12获得足够的编码帧,以建立RTP数据分组。如果没有,方法进至步骤94并返回,如果步骤93可获得足够的编码帧建立RTP数据分组,方法进至步骤95,用从DSP 12收到的编码帧建立RTP数据分组。
本发明的处理进至步骤96,判定DTDET标记41是否置位。如果该标记置位,在步骤97丢弃RTP数据分组(因为该分组包含DTMF),并且方法进至步骤98并返回。如果步骤96中该标记未置位,处理进至步骤99,并且控制器13校验EDET标记40,观察其是否置位。
如果在步骤99中EDET标记40由控制器13读取,并且发现其置位(意味着DSP12已进行DTMF早期检测,并且可能存在潜在DTMF信号),控制器13就执行步骤100,并将RTP数据分组放入缓存器16中的主队列。然后,方法进至步骤101并返回。
如果在步骤99中EDET标记由控制器13读取并且未置位(意味着DSP12尚未进行DTMF早期检测),控制器13执行步骤102,将RTP数据分组放入主队列。然后,控制器13执行步骤103,并启动定时器17,从预定早期DTMF检测延迟时间开始递降计数。较佳实施例中,预定早期DTMF检测延迟时间等于20毫秒,是DSP12执行早期DTMF检测所要求的时间。方法进至步骤104并返回。
图8中较详细说明将RTP数据分组发送到主机14的校验处理(图6中示为步骤82)。该处理以步骤110开始。方法进至步骤111,判断RTP数据分组是否在主队列。如果不在主队列,方法进至步骤112并返回。如果步骤111中数据分组在主队列,方法进至步骤113,使控制器13观察队列中的下一分组。步骤114中控制器13校验DTDET标记41,观察其是否置位。如果置位,控制器13在步骤115丢弃该数据分组(因为其中包含DTMF信号),并返回步骤111。
在步骤114中,如果DTDET标记41未置位,控制器13进至步骤116,校验状态寄存器19以确定STALLED标记45是否置位。另外,STALLED标记可以是存储在存储器16中的变量,或者可以包括与数据分组相关联的一个位(如标题中的一个位)。因此,在步骤116中,控制器13校验以确定上述数据分组是否具有STALLED标记位置位。如果STALLED标记置位,这意味着RTP数据分组被缓冲和暂存,因为DSP12作出DTMF早期检测,控制器13等待DSP12确定检测的潜在DTMF信号转为有效DTMF信号,或者DTMF的早期检测是“假警告”。在步骤116中,如果STALLED标记置位,该方法进至步骤117,控制器校验控制寄存器18中EDET标记40,以确定EDET标记40是否仍然置位。如果EDET标记40仍然置位(DSP12仍然在进行DTMF检测),控制器13进至步骤119并返回。如果在步骤117中作出决定为EDET标记40仍然未置位,控制器13进至步骤118,RTP数据分组被传送到主机14。然后方法返回到步骤111。
步骤116中,如果判定“拖延”标记45未置位,方法进至步骤120,使控制器13审查EDET标记40,判断其是否置位。步骤120中如果EDET标记40置位,控制器13进至步骤121,使“拖延”标记45置位。然后,控制器执行步骤122并返回。
步骤120中,EDET标记40未置位,则控制器13进至步骤123,校验定时器17,判断其是否超时,如果定时器17尚未超时,则DSP12仍未完成早期DTMF检测。说明的方法考虑进行DTMF早期检测需要有限时间,该检测即判断审查的数据分组中是否包含潜在DTMF信号。本方法在释放数据分组供传送时,校验定时器17,判断是否已为完成早期检测处理用去足够的时间。若步骤123中定时器17未超过,控制器13进至步骤124并返回。然而,若步骤123中定时器17已超时,则控制器13进至步骤125,对主机14发送数据分组。然后,控制器13返回步骤111,如图8所示。
较佳实施例中,控制器13可根据DTDET标记41判决是否丢弃数据分组。本发明的该实施例中,可不用OTS标记42和DTMFD标记43。与DSP12进行判决OTS标记42和DTMFD标记43状态所需全部步骤的时间相比,该方法用于DSP设定DTDET标记41的时间少,因而可提供可靠的结果,并使延迟减至最短。实际上,如果信号仅通过要设定的DTDET标记41要求的测试,就认为数据分组包含DTMF信号。此方法实施例中,因含DTMF信号而进行的数据分组丢弃相当于DSP12判定潜在DTMF信号具有一个来自低频组(697、770、852和941Hz)的单音和一个来自高频组(1209、1477和1633Hz)的单音的2个同时单音,双音分别在规定频率的正或负1.5%的范围内;双音对规定频率的偏移均不大于正或负3.5%;符合对织率条件,即2个双音的能量比率在大于或等于-8dB且小于或等于4dB的范围内。此方法实施例不等待进行导通时间、阻断时产和周期时间的测试。
然而,另一方法实施例中,根据DTMFD标记43判决数据分组的丢弃。此替换实施例有利于以额外延迟的代价要求较高可靠性的应用场合。参考图1,嵌入服务器或网关10可在IP网21上连接第三远端网关26。第三远端网关26连接调制解调器27。调制解调器27连接包含话筒和扬声器(未示出)的个人计算机28。根据本发明,可用人计算机28在因特网21上进行电话呼叫。本领域技术人员会理解,第三网关26包含与作为接入网关10的部件详细说明的单元类似的单元。
本领域的技术人员会理解,从本揭示获益后,可对这里为了说明而详细阐述的本发明具体实施例作各种修改。例如,说明实施例中示为按硬件实现的本发明各单元可按软件实现,反之亦然。此外,寄存器可代之以用随机存取存储器实现,或者存入寄存器的信息可代之以存入随机存取存储器。由于不需要限制处理速度,最好在所述实施例中对设计进行折衷,或者可提供较快处理速度时也可用不同方式实现设计。在可提供较快处理速度的实施例中,高频带或低频带的频率分析或者这两种分析可用附加频率取样。这里所提供较佳实施例的说明打算给出本发明原理的说明,并教导本领域技术人员如何实践本发明。然而,本发明不受这里所述实施例的限制,但要包含所附权利要求书范围内的全部变化。
权利要求
1.一种从音频信号去除DTMF信号的方法,其特征在于包含以下步骤审查音频信号以找出潜在DTMF信号;制备音频信号作为数字数据分组传送;未检测出潜在DTMF信号时,为在所述数字数据分组中检测潜在DTMF信号而用去足够时间后,立即发送数字数据分组;如果检测出潜在DTMF信号,将数字数据分组暂时存储,直到能进行DTMF检测,如果潜在DTMF信号未导致DTMF检测,立即发送暂存的数字数据分组,如果潜在DTMF信号导致DTMF检测,丢弃暂存的数字数据分组,并且发送含涉及所检测DTMF信号的特性的信息的控制数据分组。
2.如权利要求1所述的方法,其特征在于,制备音频信号作为数字数据分组传送的步骤包含制备音频信号作为RTP数据分组传送。
3.如权利要求1所述的方法,其特征在于,传送所述数字数据分组的步骤包含在IP网上传送数字数据分组。
4.如权利要求2所述的方法,其特征在于,还包含在IP网上传送RTP数据分组的步骤。
5.如权利要求1所述的方法,其特征在于,音频信号包含话音信号的数字化表示。
6.如权利要求2所述的方法,其特征在于,音频信号包含话音信号的数字化表示。
7.如权利要求3所述的方法,其特征在于,音频信号包含话音信号的数字化表示。
8.如权利要求5所述的方法,其特征在于,审查音频信号以找出潜在DTMF信号的步骤是用数字信号处理进行的。
9.如权利要求6所述的方法,其特征在于,审查音频信号以找出潜在DTMF信号的步骤是用数字信号处理进行的。
10.如权利要求7所述的方法,其特征在于,审查音频信号以找出潜在DTMF信号的步骤是用数字信号处理进行的。
11.如权利要求2所述的方法,其特征在于,还包含以下步骤潜在DTMF信号导致DTMF检测时,制备含32位信息的控制数据分组,该信息的格式为RRRNNNNNRRVVVVVVDDDDDDDDDDDDDDDD其中,“R”指保留位,“N”指代表DTMF数字的数据位,“V”指表示DTMF信号功率电平的数据位,该功率去除符号后表为dBm0,“D”指表明DTMF信号持续时间的数据位,该时间以时间标记为单位。
12.如权利要求11所述的方法,其特征在于,对代表DTMF数字的“N”位数据进行编码,使以下编码数据代表所指示的DTMF数字编码的“0”代表DTMF数字0编码的“1”代表DTMF数字1编码的“2”代表DTMF数字2编码的“3”代表DTMF数字3编码的“4”代表DTMF数字4编码的“5”代表DTMF数字5编码的“6”代表DTMF数字6编码的“7”代表DTMF数字7编码的“8”代表DTMF数字8编码的“9”代表DTMF数字9编码的“10”代表DTMF数字*编码的“11“代表DTMF数字#编码的“12”代表DTMF数字A编码的“13”代表DTMF数字B编码的“14”代表DTMF数字C编码的“15”代表DTMF数字D编码的“16”代表闪跳或拍叉簧信号。
13.如权利要求12所述的方法,其特征在于,对代表DTMF数字的“N”位数据进行编码,使以下编码数据代表所指示的DTMF数字编码的“16”代表闪跳。
14.如权利要求11所述的方法,其特征在于,保留位设置为零。
15.如权利要求12所述的方法,其特征在于,保留位设置为零。
16.如权利要求13所述的方法,其特征在于,保留位设置为零。
17.一种在IP网上传送可能含话音信号和DTMF信号的音频信号的方法,其特征在于包含以下步骤处理音频信号的数字表示,以检测潜在DTMF信号;在未检测出潜在DTMF信号时的第一操作模式中,(a)制备音频信号的数字表示作为RTP数据分组传送,并且(b)在足以使处理音频信号数字表示以检测潜在DTMF信号的步骤可完成所述RTP数据分组的预定时间段后,在IP网上发送RTP数据分组;在已检测潜在DTMF信号时的第二操作模式中,制备音频信号数字表示作为RTP数据分组以潜在发送,并且在处理潜在DTMF信号以验证该信号是否为有效DTMF信号时,暂存该RTP数据分组;(a)如果判定潜在DTMF信号不是有效DTMF信号,在IP网上传送暂存的RTP数据分组;(b)如果判定潜在DTMF信号是有效DTMF信号,丢弃暂存的RTP数据分组,制备含指示DTMF信号特性的信息的RTP控制数据分组,并且在IP网上传送该控制数据分组。
18.如权利要求17所述的方法,其特征在于,还包含以下步骤在连接IP网的远端处接收RTP数据分组,对RTP数据分组解码,以恢复音频信号数字表示;将音频信号数字表示转换成模拟信号;在连接IP网的远端处接收RTP控制数据分组;产生具有由RTP控制数据分组中所含信息决定的特性的DTMF信号。
19.一种从IP网上要传送的音频信号去除DTMF信号的设备,其特征在于包含电话接口;连接电话接口的数字处理器,用于处理音频信号的数字表示,以检测潜在DTMF信号;连接数字处理器的微控制器,该微控制器进行工作,以制备音频信号数字表示作为RTP数据分组传送;连接微控制器的存储器,用于暂时存储RTP数据分组;连接数字处理器并且微控制器可读取的控制寄存器,该控制寄存器包含指示潜在DTMF信号检测状态的标记位,该控制寄存器还包含指示有效DTMF信号的检测的一个或多个标记位;连接微控制器的网络接口,用于将RTP数据分组连接到IP网;其中,指示潜在DTMF信号检测状态的标记位未置位时,将RTP数据分组立即接到网络接口,以在IP网上传送,而在指示潜在DTMF信号检测状态的标记位置位时,将RTP数据分组暂时存入存储器,同时数字处理器进行附加的DTMF检测处理,如果指示潜在DTMF信号检测状态的标记位复位且指示有效DTMF信号检测的标记位未置位,将存储器中暂存的RTP数据分组立即接到网络接口,以在IP网上传送,如果指示有效DTMF信号检测的标记位置位,丢弃存储器中暂存的RTP数据分组,并且微控制器制备控制数据分组,该控制数据分组包含指示DTMF信号特性的信息,并且该控制数据分组接到网络接口,以在IP网上传送。
20.如权利要求19所述的设备,其特征在于还包含在远端处连接IP网的第二网络接口;连接第二网络接口的第二微控制器;连接第二微控制器的数-模转换器,用于将音频信号数字表示转换成模拟信号;连接第二微控制器的DTMF信号发生器,用于产生具有由控制数据分组中所含信息决定的特性的DTMF信号。
21.如权利要求19所述的设备,其特征在于,在远端处连接IP网的第二网络接口;连接第二网络接口的第二微控制器;连接第二微控制器的数-模转换器,用于将音频信号数字表示转换成模拟信号;第二数字处理器,进行工作,以产生具有由控制数据分组中所含信息决定的特性的DTMF信号。
全文摘要
揭示一种IP网上所传送话音中带内DTMF信号早期检测的方法和设备。利用数字信号处理器,每当检测出信号可能与DTMF音信号特性对应的指示时,在缓存器中暂存原本要在IP网上发送的数字音频数据分组并使其延迟。数字音频数据分组的缓存给数字信号处理技术提供时间,以可靠判断所检测信号的持性是否足以将其描述为DTMF信号。如果判定该信号具有必要的有效DTMF信号特性,丢弃缓存的数据分组,发送专用控制信号并加以格式化,以对接收方传送足以使DTMF发生器可产生DTMF信号的所检测DTMF信号的特性。判定该信号无必要的有效DTMF信号特性,则发送缓存的数字音频分组。所揭示的方法和设备从RTP数据分组传输中有效去除DTMF信号的数字音频表示,并且用RTP控制数据分组替换DTMF信号。
文档编号H04Q1/457GK1409930SQ00817208
公开日2003年4月9日 申请日期2000年10月3日 优先权日1999年10月14日
发明者M·C·惠特菲尔德, M·J·辛普森, R·P·高盖耶 申请人:科恩格森特系统股份有限公司