专利名称:数字电信系统、用于管理这样的系统的程序产品和方法
技术领域:
本发明涉及语音标识和认证系统,并且更特别地涉及在基于网际协议语音(VoIP) 的电信系统中提供可靠的语音标识和认证。
背景技术:
现有技术的电信系统是数字的并且常常使用基于网际协议(IP)的通信。与具有连续的模拟信号的模拟语音信道不同,IP通信系统对音频数据进行分段、对段进行编码和进行分组而且在无连接的传送中在网络实体之间发送所编码的IP分组。请记住人耳具有不多于20赫兹(20Hz)-20KHz的范围,并且通常的电信信道可能仅有数百KHz的带宽,音频占用通常的IP通信的非常小的部分。已经为IP语音(VoIP)通信开发了和颁布了标准,以保证通常的IP网络补偿传输延迟并且解决服务质量(QoS)问题。这些标准为音频段选择小尺寸,以便编码为相对小的分组,并且选择以相对高的频率发送那些被编码的小分组,使得解码和传输延迟并不显著或者至少是可容忍的。例如,是一种这样的用于VoIP的标准音频数据压缩算法,其中原始音频通常被分段成10毫秒段并且在IP分组中对每个段进行压缩。RFC 3551为具有池比特/秒的数据速率的编码/解码(编解码器)限定净音频数据流。例如参见靈apps. ietf. org/ rfc/rfc3551. html#sec-4. 2。尽管流行的Gxxx电信编解码器(诸如G723或者G729)提供基于分组的高效语音通信,但是这些编解码器可能没有为现有技术的语音识别所要求的高质量语音数据提供充分的或者甚至必需的支持。越来越多的各种应用将语音识别用于语音认证。通常,这些经过语音认证的系统例如在数据库中存储用来对主叫进行认证的语音签名。这些系统可以使用语音标识和认证,以准予访问敏感的个人数据,诸如标识和认证银行客户以便实现远程银行业务。一旦被认证,就可以准予客户访问相应的银行账户,以便例如使用语音命令在银行业务系统响应时实现远程家庭控制。保护这样的敏感的个人数据和资源免受无授权的访问对于保护相应的客户的财产而言是重要的。现有技术的其它语音识别应用例如包括将高质量语音签名用于合法的经过语音签字的协议和经过语音记录的合同。这些语音标识和认证应用要求高质量语音数据,以便实现标准电信编解码器不能提供的质量的可靠的标识和认证。尽管传统的数字语音电信编解码器(诸如例如G711)或者基于媒体的编解码器(例如用于音乐或者视频的编解码器、诸如MPEG)可以传送具有高质量的、质量足以满足认证需要的语音,但是 VoIP电话并不能传送这样的语音。如前文所言,通常对VoIP电话中的语音和音频进行编码和压缩,以允许更高效的带宽使用。如进一步所言,这种编码和压缩仍然可以允许适当的对话语音内容,它仅需足以让在对话一端的人使用多个语音特征中的任一个来在通信中识别他/她的伙伴。这些语音特征可以例如包括伙伴的语言、语法、语句构造、音调、口音和/或语音模式。然而,机器主要使用与声音有关的较少特征来识别说话者的语音。这些特征可以包括流行的电信编解码器可能并未包括或者涵盖的音调、口音和语音模式。因此,对于语音识别,在普通的电信对话中提供的音频数据没有足够的对于可靠的标识、认证和签名所要求的质量。另一方面,使用高质量光盘(⑶)编码或者其它媒体编解码器(例如仅用MPEG衍生物(例如mp3)发送认证数据)进行认证无法提供大量安全性(如果有的话)。此外,使用高质量通信(即足以传送可靠标识、认证和签名)通常已经被证明为成本太高并且使用太多的带宽和信道资源。因此,需要在对要求高质量语音数据的系统和应用实现语音标识、语音认证和语音签名通信的同时诸如在将高压缩编解码器用于对话的现有技术的VoIP电话系统中满足窄带语音通信系统的限制。
发明内容
本发明的目的是允许在窄带通信中传送实时语音标识、语音认证和语音签名日期;
本发明的另一目的是促进在VoIP通信中实时透明地传送语音标识、语音认证和语音签名;
本发明的又一目的是允许在VoIP通信期间实时透明地传送语音标识、语音认证和语
首签名ο本发明涉及一种数字电信系统、一种管理这样的系统中的通信的方法和一种用于管理数字通信系统中的音频传输的程序产品。在网络端点处的设备(例如会话发起协议 (SIP)设备)在与设备的对话期间有选择地透明地提供质量足以用于认证和标识的语音样本。这些设备通过收集正在进行中的对话的认证样本来对例如来自银行会计应用的认证请求做出响应,其中这些样本具有足以用于认证的细节。这些设备并行地向正在进行中的(例如在信令信道中被分段的)对话数据发送认证样本,而不中断对话或者违反带宽要求。可以通过与正在进行中的对话的相对应的部分进行比较而在认证之前检验认证样本。
将从下文参照附图对本发明的优选实施例的详细描述中更好地理解前述和其它目标、方面和优点,其中
图1示出了根据本发明的优选实施例的网际协议(IP)通信系统的例子,该网际协议 (IP)通信系统在对话通信期间透明地提供质量足以用于语音标识和认证的语音签名;
图2示出了根据本发明的优选实施例的例如在SIP电话与银行应用之间的语音标识和认证信令的例子;
图3示出了用于在与SIP设备的对话期间实现认证的系统的实施方案的框图例子。
具体实施例方式现在转向附图并且更特别地,图1示出了根据本发明的优选实施例的网际协议 (IP)通信系统100 (例如IP语音(VoIP)通信系统)的例子,该网际协议(IP)通信系统100 在使用具有相对应的低音频质量的通常的高压缩编解码器的对话通信期间透明地提供质量足以用于语音标识和认证的语音样本和签名。优选的系统100可以是包括有数字呼叫能力的网络102的会话发起协议(SIP)系统,所述有数字呼叫能力的网络102被耦合到将语音签名例如存储在非易失性存储器106中的现有技术的语音标识和认证系统104 (例如银行)。该系统包括具有所连接的数字电话设备(例如VoIP电话)和多媒体终端适配器(MTA) (例如键集、蜂窝电话和/或SIP电话)的端点(EP)108、110、112。由于网络设备限定EP,所以在此可互换地指代每个EP和EP处的(多个)设备。网关114 (例如现有技术的媒体网关) 将网络外部115连接到例如公共交换电话网络/公共陆地移动网络(PSTN/PLMN)和/或因特网。优选的软交换机116管理网络EP通信。优选地,EP 108、110、112是现有技术的VoIP电话和VoIP设备,并且特别是具有高质量麦克风118、复杂音频电路(未示出)和本地扬声器119的高端VoIP设备。同样优选地,现有技术的语音标识和认证系统104包括一个或者更多基本上类似的现有技术的VoIP 电话和VoIP设备,并且可以被直接连接到优选的有数字呼叫能力的网络102或者通过外部网络115来连接(通过虚线表明)。同样,虽然如在此所描述的那样,在这个例子中描述的 SIP设备108、110、112中的每个SIP设备都包括必备的音频电路,但是要理解的是,可以在通过外部网络115将通信设备耦合到现有技术的语音标识和认证系统104的媒体网关114 中包括或者在SIP设备108、110、112与媒体网关114之间分布这个音频电路。此外,媒体网关114向现有技术的语音标识和认证系统104提供最高的可用语音数据质量。尽管对于普通的VoIP通信而言,EP 108、110、112使用标准电信(例如focxx)编解码器来发送实况音频数据,其中这些实况音频数据具有为了适应于窄带音频信道而被有意减少的语音质量;但是当被请求时,这些设备108、110、112有选择地提供对高质量语音数据样本的访问。特别是,这些高质量语音数据样本具有足以用于在现有技术中用于签名标识和认证的语音的细节(例如采样速率和精度),在这里称为认证样本。例如,当银行104正执行语音识别和认证时,该银行104请求相应的设备108、110、 112并行发送认证样本。相应的设备108、110、112可以通过限制认证样本的持续时间来避免超越所分配的带宽限制。此外,因为这些相应的设备108、110、112与对话分离,所以无需准实时地同时发送认证样本,而认证以相对时间的方式、即在对话期间完成。因此,相应的设备108、110、112可以通过在足以用于按照所选的认证质量进行认证的所选时间段内对音频数据进行采样而对请求做出响应,并且例如在EP存储器120中使所收集的样本数据假脱机(spool)而且对于所收集的数据量以相对低的速率发送所收集的样本数据。可以例如在请求中或者缺省地指定认证周期和质量。在信令和媒体信道使用分离的传输信道的VoIP电话系统中,认证样本可以在这些信道中的任一个中或者在任何其它可用信道中传送。然而优选地,认证样本在更可靠的信道(例如信令)中传送。可以通过请求对相应对话的随机采样来确保数据源的真实性。此外,通过相对于实时音频传输来参照(reference)认证样本,例如通过使用通常的现有技术的音频内容比较方法来比较(多个)认证样本与相对应的实时音频,可以通过实时对话本身的连续性来验证真实性。可以利用简单的请求信号发起这个真实性比较。此外,处理这样的真实性请求可能受支配于相互协议和协商,例如通过用户预授权或者通过提示用户授权而受支配于相互协议和协商。此外,除了普通的网络加密之外或者与普通的网络加密一致地,可以使用公知的数据加密来加密(多个)认证样本和相对应的实时音频中的任一个或者 二者 ο图2示出了根据本发明的优选实施例的语音标识和认证信令的例子,所述语音标识和认证信令在图1的系统100中例如通过有数字呼叫能力的网络102和/或外部网络115而在SIP电话110与银行104之间。在这个例子中,SIP电话110处的用户通过他/她的提供商网络102中的软交换机116呼叫银行客户服务(例如银行业务应用或者银行会计系统 106),从而在它们之间建立稳定的呼叫通话状态122。银行客户服务决定使用语音认证来对主叫进行认证,并且因此发起1 利用在这一例子中请求5秒认证样本的预订(Subscribe) (高质量话音、5秒)SIP请求向软交换机116发送“高质量音频请求” 126。软交换机116通过网络向SIP电话110转发SIP请求128,而正在进行中的规则(regular)音频交换通过实时传送协议(RTP)信道130继续。SIP电话110通过开始在接下来的5秒内收集所请求的认证样本而对SIP请求1 做出响应。由于样本大小如与语音通信数据相比相对大,所以在这个例子中对样本进行分割或者分段,并且在足够的时间段内传送这些段,以最小化/ 消除传送整个样本对通信系统负荷的影响。因此,在SIP消息、即通知(高质量数据)消息中向软交换机116发送132第一数据段。对于银行会计系统106,软交换机116向银行104转发SIP消息134。随后,在SIP 消息132A、132B中向软交换机116发送剩余段,该软交换机116向银行104转发段134A、 134B,以用于银行会计系统106,而正在进行中的规则音频交换通过RTP信道130继续。应当注意的是,3次示出相同的RTP信道130,以表明音频交换正在进行中。也应当注意的是, 一收集到每个数据段完成,就可以发送所述每个数据段,其中132、132A、132B和134、134A、 134B中的每个对于这个例子中的5秒样本而言相隔173秒。交替地,可以按照任何适当步幅发送这些段和/或可以按照任何顺序收集整个段、对整个段进行分段和发送所述段。在已经传送了所请求的样本(即转发134B最后的段)之后,银行104或者银行会计系统106可以向软交换机116用信号通知终止、例如发送SIP预订(预订结束)消息136。软交换机116 通过网络向SIP电话110转发SIP预订消息138 ;而正在进行中的规则音频交换再次通过 RTP信道130继续。由于在传送样本的同时通过RTP信道130维持规则的实况音频连接,所以RTP信道130承载相同的、但是质量更低并且具有不同编码的音频。如前文所言,可以比较认证样本和/或段与实况音频连接,以确保通过这两个信道传送相同内容来保证例如尚未替换先前记录的高质量音频(例如mp3)。图3示出了图1的系统100的实施方案的框图例子,该系统100如在图2的例子中那样在已经建立通话状态122并且在SIP设备112接收到预订请求1 之后在与SIP设备112的对话期间实现认证。如前文所言,SIP设备112是具有高质量麦克风118和标准音频电路、即用于提供高质量模拟音频信号的模拟调节器140以及用于数字化模拟音频信号的数字化器142的高端VoIP设备。给用于对话编码/解码的focxx编解码器(例如编码器144和给认证编码器146提供数字化的音频信号。由于认证要求质量比对话高得多的数据,所以认证编码器146将数字化的音频信号编码成如下细节(例如采样速率和精度)所述细节足以用于在标识和认证中提供语音签名。这可以通过硬件和/或软件或者这二者来完成。因此,例如数字化器可以按照每秒8K 个样本来提供16比特的样本,这些样本直接传到认证编码器146,其中对于每第八个样本, 仅8个最高有效位被传到编解码器编码器144。交替地,相同的数据可以被传到编码器144和146,其中编解码器编码器144向数字化的音频信号应用适当的公知压缩算法。
认证编码器146将所编码的认证样本(段)传到假脱机程序(spooler) 120 ;并且编解码器编码器144将对话分组传到分组器(packetizer) 148,该分组器148向套接
字控制器(socket cOntrOller)150转发分组。信令和呼叫控制152向套接字控制器150有选择地转发被假脱机的段。SIP设备112中的套接字控制器150通过网络102/115和银行 104中的套接字控制器巧4建立稳定的呼叫通话状态(122)并且控制在它们之间通过RTP 信道(130)的正在进行中的规则音频交换。套接字控制器150、154也建立SIP消息接发信道156,该SIP消息接发信道156承载SIP请求(126、128 )和消息(132、132A、132B、134、 134A、134B、136 和 138)。在银行104中,套接字控制器154向接收器158转发对话分组,并且信令和呼叫控制160标识出向假脱机程序和检验单元162转发的认证样本段。接收器158从对话分组中提取所编码的对话数据并且向解码器164转发数据,该解码器164对所编码的对话数据进行解码。所解码的对话数据传到假脱机程序和检验单元162,以便与样本段进行实时比较, 并且所解码的对话数据传到数模(D/A)转换器166。D/A转换器166将所解码的对话数据转换成模拟信号,该模拟信号由音频放大器168放大并且在扬声器170上作为对话的一端而被提供。在完整的样本由假脱机程序和检验单元162检验之后,认证单元172将该完整的样本与来自签名数据库106的所存储的签名进行比较并且例如向银行会计系统106提供该比较的为失败或者成功的结果174。一旦认证完成,认证单元172就通过信令信道156用信号通知完成(136、138)。可以与语音认证基本上相同地收集语音签名,其中所收集的语音签名被存储在签名数据库106中。有利地,本发明在满足对语音通信编解码器的高压缩限制的同时在窄带语音通信系统中(例如在现有技术的VoIP电话系统中)透明地实现语音标识、语音认证和语音签名通 尽管已经在优选实施例方面描述了本发明,但是本领域技术人员将认识到可以在所附的权利要求书的精神和范围之内有修改地来实践本发明。意图在于所有这样的变型和修改都落入所附的权利要求书的范围之内。例子和附图因此将被视为说明性的而非限制性的。
权利要求
1.一种数字电信系统100,其包括一个或者更多语音通信设备,每个语音通信设备都在网络102中的多个通信网络端点 108、110、112 之一处;音频数据提取电路140、142,所述音频数据提取电路140、142从所述多个通信网络端点108、110、112中的至少一个端点有选择地提取细节足以用于语音签名、标识和认证的音频数据;音频认证编码器/解码器146,所述音频认证编码器/解码器146对所提取的音频数据有选择地进行编码;对话编码器/解码器144,所述对话编码器/解码器144对用于与所述至少一个端点的对话的音频数据进行编码;以及信令和呼叫控制单元152,所述信令和呼叫控制单元152在与每个所述至少一个端点的对话期间通过所述网络102/115转发所编码的认证数据。
2.如权利要求1所述的数字电信系统100,其中,所述音频数据提取电路包括模拟调节器140和数字化器142,并且每个所述至少一个端点包括所述音频数据提取电路140、142、 所述音频认证编码器/解码器146和假脱机程序120,所述假脱机程序120使所编码的认证数据假脱机并且响应于所述信令和呼叫控制单元152向套接字控制器150有选择地转发被假脱机的认证样本,所述套接字控制器150通过所述网络102/115传递来自所述对话编码器/解码器144的认证样本巧4和对话数据130。
3.如权利要求1所述的数字电信系统100,其中,所述数字电信系统100是网际协议语音(VoIP)系统,所述语音通信设备是VoIP通信设备,并且所述网络102/115将多个通信网络端点108、110、112耦合到现有技术的语音标识和认证系统104,所述现有技术的语音标识和认证系统104包括检验单元162,所述检验单元162比较来自所选择的所述至少一个端点的认证数据与来自相同的所述至少一个端点的对话数据;签名数据库106,所述签名数据库106存储语音签名;认证单元172,所述认证单元172相对于相应的语音签名来认证所检验的认证数据;第二信令和呼叫控制单元160,所述第二信令和呼叫控制单元160标识出通过所述网络102/115转发的所述所编码的认证数据、向所述检验单元162转发所标识出的所述所编码的认证数据并且通过所述网络102/115向进行认证的所述至少一个端点返回认证结果 174。
4.如权利要求3所述的数字电信系统100,其中,音频数据提取电路包括模拟调节器 140和数字化器142,并且其中所述数字电信系统100是会话发起协议(SIP)通信系统并且还包括连接到所述网络102/115的媒体网关、使所编码的认证段假脱机的假脱机程序120、 在SIP消息中插入对话数据的分组器150和向连接到所述网络102/115的套接字控制器 150有选择地转发被假脱机的所述认证段的套接字控制器150,所述假脱机程序120响应于所述信令和呼叫控制单元152传递所述被假脱机的认证段,所述套接字控制器150将SIP 消息传到第二套接字控制器154/传递来自第二套接字控制器IM的SIP消息,所述第二套接字控制器巧4接收所述认证段132、132A、132B、134、134A、134B和对话数据130,所述第二套接字控制器154响应于所述第二信令和呼叫控制单元160传递156认证段132、132A、132BU34U34AU34B以进行检验并且将对话数据130传到接收器158和解码器164。
5.如权利要求4所述的数字电信系统100,其中,所述模拟调节器140、所述数字化器 142、所述音频认证编码器/解码器146和假脱机程序120中的一个或者更多在将所述多个通信网络端点108、110、112连接到所述网络102/115的媒体网关114中。
6.一种管理通信系统100中的网际协议语音(VoIP)通信的方法,所述方法包括以下步骤a)建立从多个网络端点108、110、112中的网络端点110到语音标识和认证系统104的通话状态122 ;b)从所述语音标识和认证系统104向所述网络端点110发送认证请求124;c)开放在所述语音标识和认证系统104到所述网络端点110之间的对话信道130;并且同时所述对话信道130是开放的,d)从所述网络端点110收集认证样本;e)向所述语音标识和认证系统104转发所述认证样本132、132A、132B、134、134A、 134B ;f)比较所述认证样本与语音签名;并且g)从所述语音标识和认证系统104用信号通知所请求的认证完成136、138。
7.如权利要求6所述的管理通信系统100中的VoIP通信的方法,其中,所述通信系统 100是会话发起协议(SIP)通信系统;发送认证请求124的步骤(b)包括向软交换机116发送SIP请求1 并且软交换机116向相应的所述网络端点110转发SIP请求1 ;转发认证样本的步骤(e)包括向所述软交换机116发送认证段132、132A、132B并且软交换机116 向所述语音标识和认证系统104转发认证段134、134A、134B ;而且发送认证请求124的步骤(g)包括向所述软交换机116发送SIP消息136并且软交换机116向所述相应的网络端点110转发SIP消息138。
8.如权利要求7所述的管理SIP通信系统100中的VoIP通信的方法,其中,所述SIP 请求 126、128、所述认证段 132、132A、132B、134、134A、134B 和所述 SIP 消息 136、138 通过 SIP信令信道156,并且在收集所述认证样本的步骤(d)和转发认证样本132、132A、132B、 134、134A、134B的步骤(e)和用信号通知所请求的认证完成的步骤(g)期间通过SIP信令信道156,并且所述方法还包括向检验单元162提供所述认证样本132、132A、132B、134、134A、 134B和对话数据并且检验所述认证样本。
9.一种用于管理会话发起协议(SIP)通信系统100中的网际协议语音(VoIP)通信的计算机程序产品,所述计算机程序产品包括计算机可用介质,所述计算机可用介质具有存储在所述计算机可用介质上的计算机可读程序代码,所述计算机可读程序代码包括计算机可读程序代码装置146,用于对音频数据提取电路140、142从所述多个通信网络端点108、110、112中的至少一个端点提取的细节足以用于语音签名、标识和认证的音频数据进行有选择地编码;计算机可读程序代码装置144,用于对来自端点对话的音频数据进行编码;计算机可读程序代码装置120,用于使所编码的认证数据假脱机;计算机可读程序代码装置,用于在SIP消息中对来自端点对话的所述音频数据进行分组144、148 ;以及计算机可读程序代码装置152,用于在与所述多个通信网络端点108、110、112中的每个网络端点的正在进行中的对话期间通过所述网络102/115转发来自所述多个通信网络端点108、110、112中的相同的相应网络端点的被编码的认证数据。
10. 一种用于对在会话发起协议(SIP)通信系统100中所提供的认证样本132、132A、 132B、134、134A、134B进行标识和认证的计算机程序产品,所述计算机程序产品包括计算机可用介质,所述计算机可用介质具有存储在所述计算机可用介质上的计算机可读程序代码,所述计算机可读程序代码包括计算机可读程序代码装置124,用于请求在所建立的对话中认证主叫的语音; 计算机可读程序代码装置160,用于从通信网络端点108、110、112接收156认证段 132、132A、132B、134、134A、134B 和对话数据 130 ;计算机可读程序代码装置162,用于从接收到156的所述认证段132、132A、132B、134、 134AU34B和对话数据130中标识出所述认证段132、132A、132B、134、134A、134B ;计算机可读程序代码装置162,用于相对于所述对话数据130检验所述认证段132、 132A、132B、134、134A、134B ;计算机可读程序代码装置106,用于存储系统用户的语音签名;以及计算机可读程序代码装置172,用于相对于相应的语音签名认证所检验的认证数据。
全文摘要
一种数字电信系统100、一种管理这样的系统100中的通信的方法和一种用于管理数字通信系统100中的音频传输的程序产品106、120。在网络端点108、110、112处的设备(例如会话发起协议(SIP)设备)在与设备108、110、112的对话130期间有选择地透明地提供质量足以用于认证172和标识的语音样本132、132A、132B、134、134A、134B。设备108、110、112通过收集正在进行中的对话的认证样本132、132A、132B、134、134A、134B来对例如来自银行会计应用106的认证请求126、128做出响应,其中样本132、132A、132B、134、134A、134B具有足以用于认证172的细节。设备108、110、112并行(例如在信令信道156中被分段地)发送并未中断对话130的认证样本132、132A、132B、134、134A、134B。可以通过与正在进行中的对话130的相对应部分进行比较而在认证172之前检验162认证样本132、132A、132B、134、134A、134B。
文档编号H04L29/06GK102160351SQ200880131127
公开日2011年8月17日 申请日期2008年9月15日 优先权日2008年9月15日
发明者F·M·库赫里 申请人:西门子通讯公司