专利名称:用于电信服务的实时语音至文本转换的制作方法
技术领域:
本发明涉及由允许例如语音、视频和数据的不同信息传输模式融合的 通信网络提供的服务。
它特别适用于(但不限于)由标准3GPP和TISPAN规定的"IMS" (IP多J(某体子系统)通信结构。
背景技术:
语音信箱是通信结构能提供的服务中的一种。当被叫用户不希望被联 系上或正忙时,针对该用户的多媒体会话可以被重新路由至语音信箱服务 器。这个服务器发送语音提示并且能够接收和存储构成消息的语音信息。
被叫用户通常可以在消息已被存储之后通过连接到语音信箱服务器来 查阅该消息。
这个向语音信箱的转移可以在几种情形下被触发
-用户已设置了他们的存储在通信网络上的配置文件的参数,以便任 何呼叫都被自动路由至语音信箱。
-用户的一个或多个客户端被关闭或不可由通信网络到达。
-一个或多个客户端正忙并且没有呼叫等待服务。
-用户在特定等待时间之后仍未应答(或特定数目的振铃)。
被叫用户可以当在其通信客户端上收到呼叫时发起对重新路由至语音 信箱服务器的触发。如果用户正忙,或更一般地不希望接听呼叫,则他们 可以发起这个重新路由。
例如,会议中的用户不能轻易地在其移动电话上接听来电,并且可能 需要将该来电转移至其语音信箱。
在这种情形下,通信会话在主叫客户端与语音信箱服务器之间被建立。除了用于通知这个会话终止以及消息被存储在服务器中的可能的信号之 外,不再向被叫客户端通知这个会话。
这个现有技术并不令人满意,因为一皮叫用户不能在消息结束之前查阅 主叫用户留下的消息内容。
此外,用户不能反悔他们的决定。他们不能判定来电的重要性并且一 旦4坎出重新路由决定就不能建立通信。
例如专利申请US 2007/0127631中描述的一些方案能够将主叫用户留 下的消息内容转换成^^送给被叫用户的写文本。被叫用户因而能够谨慎 地查阅信息。然而,这个解决方案也未能解决上述问题,即被叫用户不能 在消息结束之前查阅该消息,并且特别是不能在记录消息期间与主叫方建 立^舌。
发明内容
本发明的目的是通过为用户提供附加的可能性而改进上述情形。
其第一目的是一种连接到通信网络的语音信箱服务器,其包括用于接 收来自主叫客户端且去往被叫客户端用户的多媒体会话的多媒体接口 ,以 及用于存储该会话的内容的存储器。所述服务器的特征在于,它还具有用 于将多媒体会话的全部或一部分实时转换成文本信息的转换器和用于将该 文本信息发送给被叫客户端的文本接口 。
根据本发明的一个实施例,所述文本接口用于在即时消息会话中发送 所述文本信息。所述即时消息会话可以通过MSRP协议来传输。
只有当用户配置文件中存在参数时才可以激活所述转换器和文本接o 。
所述服务器还可以具有用户接口 ,用于在即时消息会话期间接收来自 被叫客户端的替代信号。所述服务器因而用于在收到这种信号时中断文本 信息的传输并且在被叫客户端与主叫客户端之间建立新的多媒体会话。
所述服务器可以具有用户接口 ,该接口用于在即时消息会话期间接收 来自被叫客户端的重定向信号并且在收到这种信号时在主叫客户端与其标识符由重定向信号提供的第三方客户端之间建立新的多媒体会话。
本发明的另一目的是一种在主叫客户端与被叫客户端之间通信的方 法,该方法在于针对被叫客户端的用户的多媒体会话至语音信箱服务器的
传输。这个方法的特征在于,包括下列步骤将全部或部分多媒体会话实 时转换成文本信息,以及将这个文本信息传输给所述被叫客户端。
根据本发明的一个实施例,所述文本信息在即时消息会活内被发送给 所述被叫客户端。这个即时消息会话可以通过MSRP协议来传输。
根据本发明的方法还包括一个配置用户配置文件的在先步骤,特别在 于确定指明了当语音信箱服务器收到针对所述用户的多士某体会话时是否应 当触发所述转换和传输步骤的参数。
也可以设想在传输阶段,被叫客户端可以发送替代信号至语音信箱服 务器,这因而触发了文本信息传输的中断和主叫客户端与^皮叫客户端之间 的新多媒体务活的建立。
本发明的又另一目的是一种通信客户端,其具有用于从显示部分或全 部文本信息内容的显示设备接收文本信息的装置,和可以由用户激活的进 入接口。这个客户端的特征在于,所述文本信息构成关联于主叫客户端的、 与语音信箱服务器建立的文本会话,并且所述i^v接口包括用于触发去往 语音信箱服务器的、用于与主叫客户端建立多媒体会话的信号的装置。
根据一个实施例,所述文本会活是即时消息会活。这可以通过MSRP 协议来承载。
所述进入接口可以具有用于触发去往语音信箱服务器的、用于中断所 述文本会话的信号的装置。
由于本发明,用户可以获知主叫方留下的消息内容而无须接听呼叫。
处于会汉中的用户可以实时读取发送给他们的消息。根据本发明的一 个实施例,如果内容似乎相当重要或具有高优先级,则用户可以决定接听 呼叫(如果必要则离开会议室)。
同样,处于需要保持安静的环境(电影院等)中的用户仍可以立即查 阅他们的消息。此外,本发明的一个附加优点是它还使得处于噪音环境下的用户能够 立即查阅他们的消息而无须移动。
最后,允许不同媒体(语音、文本、视频)融合的这项服务可以仅利 用单个信令协议来实现。
本发明也提供了其他优点。
下面将结合附图描述本发明的实现。
图1示出了其中实施本发明的背景; 图2示出了通信客户端的人机接口;
图3示出了在实施本发明的背景中建立的会话和信令消息序列。
具体实施例方式
通信网络N被用来连接通信客户端A、 B和应用服务器S。网络N包 括图1未示出的不同的设备(路由器、网关、信令服务器等)。通信客户 端A、 B可以是不同的类型移动终端、IP电话、含有电话或视频电话软 件模块的计算机、个人数字助理等。
应用服务器也可以是不同的类型并且使得不同的服务能被提供给通信 网络N的用户。
在图1的例子中,客户端A的用户希望联系客户端B的用户,但是呼 叫被重新路由到语音信箱服务器S。因而在主叫客户端A与语音信箱服务 器S之间建立了多4某体会话MS。
这个消息传送不仅涉及语音,而且还包括视频方面。"语音信箱"因 而被理解成是至少支持语音业务的消息传送服务,并且使用表述"语音信 箱"是为了简单。
语音信箱服务器包括用于接收多媒体会话SM的多媒体接口 INTM。 通常(但不必定)由IETF的RFC 3550 (标题为"A Transport Protocol for Real-Time Applications")定义的RTP协议承载这个多媒体会话。它还具有图1未显示的用于建立这个多媒体会话的信令接口。以传统
的方式,由IETF的RFC 3261 (标题为"Session Initiation Protocol")定 义的SIP协议可以承载这个信令。
一些SIP消息可以包括用于协商待建立的多i某体会话的一些参数(编 解码等)的SDP内容。IETF的RFC 2327定义了这个SDP ( ^S舌描述协 议)。RFC 3264 (标题为"An Offer/Answer Model with the Session Description Protocol (SDP)")定义了通过SIP/SDP协议对RTP协议承载 的多媒体M的协商。
语音信箱服务器也具有用于存储所述多々某体M SM的内容的存储器 MEM。所述内容可以构成这个多媒体会话的一部分或全部。通常,所存储 的内容仅代表在关于留下由语音信箱服务器发送的消息的提示之后的多媒 体会活的一部分。
在这个存储器MEM中,可以将由主叫客户端以这种方式留下的消息 关联于^皮叫用户的标识符,以使得这个用户可以容易地访问属于他们的所 有消息并且不能访问不属于他们的消息。
所述消息通常仅是音频消息,但更一般地,多々某体消息可以特别地包 括视频。
可以利用已知方式来访问这些消息,所述已知方式形成设计应用月艮务 器和语音信箱服务器领域的现有技术的一部分。
所述语音信箱服务器还包括用于视频至文本转换的设备STT。这个转 换器用于实时处理多媒体会话SM的内容。这个内容可以对应于由主叫客 户端留下的消息。在多媒体接口 INTM与转换器STT之间,语音信箱服 务器S也可以具有与存储器MEM相分离的图1未示出的緩冲存储器。
转换器STT可以符合现有的语音识别设备。
市场上存在不同的产品,并且本发明与所使用的产品和技术无关。例 如,Nuance公司提出这种类型的不同解决方案。Alcatel公司的专利申请 US 5 809 464也涉及在通信网络内对这种语音至文本转换设备的使用。所 有这些解决方案构成本领域技术人员可获得的技术的一部分。由转换器STT生成的文本可以被存储在未显示的緩冲存储器中,并且 经由文本接口 INTT裙发送到被叫客户端B 。这个文本接口 INTT可以实施即时消息传送协议,并且与被叫通信客 户端B建立即时消息会话SMI。所讨论的协议可以例如是由IETF的RFC 4975(标题为"The Message Session Relay Protocol")定义的MSRP协i^。然而,也可以4吏用其他协 议,例如由2008年2月的文件"draft-rosenberg-sip-tote-00"提出的TOTE (基于^^舌的普通对象传送和交换,Session Based Trivial Object Transfer and Exchange )协议。这些协议被用来发送会话中的一组即时消息。这样, 一旦SMI会话在 语音信箱服务器S与被叫客户端B之间被建立,文本信息就可以在它被收 到时对应于由主叫客户端A留下的语音消息。每个消息都可以例如对应于一个句子,该句子是通过由转换器STT执 行的语法分析来确定的。被叫客户端B可能希望在收到消息时显示每个消 息(在这种情况下对应于每个句子)。这样,客户端B的用户尽可能快地 获知多媒体^^舌SM的内容。本发明因而通过对多々某体会话实时传输协议、即时文本消息传输协议 和语音至文本转换技术的原始组合,利用现有技术而实现了通信网络内的 数据传输。它在下面三种情况中解决了之前描述的其中被叫客户端B的用户不能 接收来电的情形(因此不能建立主叫客户端A所请求的多媒体^^舌)-当被叫客户端B的用户位于噪音环境中。已知他们不能听到并且与 主叫客户端A的用户交谈,他们可以选择使用语音到文本转换服务并且实 时地读取由主叫方留下的消息。-当用户处于例如^i义的环境中时,他们也可以选择这个特征从而不 干扰会议。-用户也可能为了另一个目的而正在使用他们的通信客户端B。例如, 他们可能正观看视频内容(电影、电视节目等),并且可能不希望被打扰但仍希望获知主叫方可能留下的消息内容。图2示出了通信客户端B的可能的图形接口。这个客户端可以是移动 电话、电视、个人数字助理、计算机等,或任何其他固定的或移动的具有 (如果必要则通过局域网)通信和显示功能的设备。它具有显示区域或屏幕E以及ii^接口 INTE。这个ii^接口 INTE 使得用户能够输入针对客户端B的命令。这个两个接口不必是分离的一 些屏幕可能实际上是触摸屏,以使得进入接口 INTE的部分或全部可以位 于显示区域E中。这个屏幕E内显示了一个较小的显示区域Z1,其可能 对应于用户正观看的^L频流。如果必要,这个显示区域Zl可以占据整个 屏幕空间E,或如图2所示只占用一部分空间。显示区域Z2对应于接收自语音信箱服务器的文本信息。这可以采取 横幅的形式,在该横幅内可以滚动显示文本信息,当然也可以使用其他方 式。ii^接口 INTE可以被用来控制文本信息的显示。例如,它可以控制 滚动速度。它也可以停止所述功能并且删除显示区域Z2。它也可以触发呼叫接听才艮据本发明的可选实施例,可以向^皮叫用户 提议与主叫客户端建立多媒体会话,其可以替换或不替换之前建立的会话。 利用进入接口 INTE,用户发送信号至语音信箱服务器S。这个信号可以是替代信号并且触发-主叫客户端A与语音信箱服务器S之间建立的多媒体会话SM的中 断,以及语音信箱服务器与被叫客户端B之间的文本信息传输的中断; -主叫客户端A与被叫客户端B之间的新多i某体^^的建立。 因此,查阅主叫方留下的消息内容的客户端B的用户可以决定这个呼 叫相对于他们当前的活动而言相当重要或具有优先级,并且决定建立直接 呼叫。这个特征被用来通过避免主叫方必须给出整个消息并且避免净皮叫方 必须在会话后给主叫方回电话来节约时间。它也避免了用来建立新呼叫的 附加操作。如果屏幕E是触4莫屏,则可以设想在显示文本信息的区域Z2上的简单按压被用来发送合适的信号给语音信箱服务器s。这种会话替换可以例如通过发送SIP "INVITE"信令消息来执行,该 消息包含如IETF的RFC 3891定义的"Replace"报头。所述接口也可以被用来接听电话而无须中断正进行的文本会议。合并 信号因而由4皮叫客户端发送并且新会话被创建并与现有文本会话合并。包 含由IETF的RFC 3911定义的"Join"报头的SIP "INVITE"信令消息 的发出例如可以被用来实现这个特征。所述ii^接口也可以设计至例如助手或同事的第三方的呼叫重定向。 重定向信号因而由被叫客户端发送至语音信箱服务器S。可以通过发送包 含由IETF的RFC 3515定义的"Refer"报头的SIP "INVITE"信令消息 来提供这个选项。利用由例如SIP协议的信令协议而提供的可能性的其他特征也是可行 的。本发明的其中 一个优点是它可以受益于所有这些特征同时仍允许多媒 体和文本会话的融合。所提供的每个功能具有由被叫客户端发送给语音信箱服务器S的相应 信号。这个信号通常包括信令消息,但是也可以包括更复杂的对话。这些会话替换、合并或重定向操作可以自动执行。用户只需要激活命 令而不必指定主叫客户端A的号码或标识符,因为这个信息被存储在信令 服务器S中。这些操作中的一个或多个可以通过进入接口 INTE获得。 可以设想可在用户参数中指定的默认行为。只有对应于这个默认行为 的操作可以在文本^^舌期间被提出。图3示出了利用SIP和MSRP协议的本发明的一种可能实现。 在这个例子中,用户"Bob"希望通过"SIP网络,,通信网来连接用户 "Alice"以基于STP协议建立多媒体会话。以传统的方式,他发送邀请消息(1)至"SIP网络"。这个消息通常 是SIP "INVITE"消息。这个消息(1)由通信网络中继并被路由至用户 "Alice"。接收这个消息(2)后,用户"Alice"的客户端用消息"3"响应,消 息"3"是指已收到邀请并且客户端(例如通过振铃)通知了进入呼叫。这 个信令消息(3)也由网络中继并且以信令消息(4)的形式到达主叫方 "Bob"。这些信令消息通常是SIP "180 RINGING"消息。在图3的这个例子中,Alice拒绝进入呼叫。她的客户端因而发送信令 消息(5)以表示这个拒绝。这通常是SIP "603 DECLINE"消息。这个消息(5)到达"SIP网络"通信网络,在该网络内的一个设备触 发呼叫至"语音信箱"服务器的重新路由。这个设备例如可以包括一个或 多个"代理SIP"。在IMS结构的背景中,这可以涉及CSCF (呼叫会话 控制功能)功能,其发送请求至管理通信网络的"消息传送"功能的应用 服务器。邀请消息(6)然后補l送到用户Alice的"语音信箱"服务器。所述 服务器自动接受这个呼叫并且发回信令消息(7 )。这个信令消息(7 )被 发送到主叫客户端"Bob"。当收到这个消息(8)时,客户端"Bob"发送同意消息(9),该消息被发送到语音信箱服务器并且因而#:用来建立"Bob"与"语音信箱"之间的RTP多媒体会话(10)。根据本发明,"语音信箱"服务器然后触发与"Alice"的客户端的文本会话。为此,它发送邀请消息(11)至"Alice"的客户端。进行传统的信令消息(12) 、 (13)和(14)交换,所述消息被用来建立"语音信箱,,与"Alice"的客户端之间的MSRP会活(15)。RTP会话和MSRP会话在"语音信箱"信令服务器中相关联,以使得前者的内容可以被转换成在后者中发送的文本信息。"Bob"的主叫客户端稍后发送信令消息(16)以结束他与"语音信箱"服务器的会活。这个消息(16)通常是SIP "BYE"消息。它祐义送到服务器。当收到这个消息(17)时,语音信箱服务器-首先结束RTP会话并且发送确认消息至"Bob"的客户端信令消 息(18)和(19);并且-其次发送终止消息(20)至"Alice"的客户端,其响应以确认消息 (21)。这些确认消息通常是SIP "200 OK"消息。语音至文本转换功能以及文本会话建立(即文本信息至被叫客户端的 传输)的触发可以是可选的并且由被叫用户触发。例如,当收到ii7v呼叫时,可以提出几种选择,特别是 -接受呼叫, -拒绝呼叫,-在建立文本会话的情况下重新路由呼叫至语音信箱, -在不建立文本会话的情况下重新路由呼叫至语音信箱。所述功能的触发也可以受制于#:叫用户的配置文件中的参数。 所述用户配置用户配置文件,并且这个参数确定当语音信箱服务器收传输。所述转换器和文本接口因而仅在被叫用户配置文件中的参数存在的情 况下被激活。如果这个参数不存在,则语音信箱服务器按照现有技术工作并且将"消息存储在存储器MEM中。
权利要求
1.一种连接到通信网络(N)的语音信箱服务器(S),包括用于接收来自主叫客户端(A)并去往被叫客户端(B)的用户的多媒体会话(SM)的多媒体接口(INTM),和用于存储所述多媒体会话内容的存储器(MEM),其特征在于,还包括用于将所述多媒体会话(SM)的全部或一部分实时转换成文本信息的转换器(STT)和用于发送所述文本信息至所述被叫客户端的文本接口(INTT)。
2. 根据权利要求1所述的语音信箱服务器,其中,所述文本接口用于 在即时消息会话(SMI)中发送所述文本信息。
3. 根据前一权利要求所述的语音信箱服务器,其中,所述MSRP协议 承载所述即时消息会话。
4. 根据权利要求1至3之一所述的语音信箱服务器,其中,所述转换 器和文本接口仅在所述用户的配置文件中存在参数的情况下才被激活。
5. 根据前述权利要求之一所述的语音信箱服务器,还包括用户接口 , 该用户接口用于在所述即时消息会话期间接收来自所述被叫客户端的替换 信号,并且当收到所述信号时中断所述文本信息的传输并建立所述被叫客 户端与所述主叫客户端之间的新多媒体^"。
6. 根据权利要求1至4之一所述的语音信箱服务器,还包括用户接口 , 该用户接口用于在所述即时消息会话期间接收来自所述4皮叫客户端的重定 向信号,并且当收到所述信号时建立所述主叫客户端与其标识符由所述重 定向信号提供的第三方客户端之间的新多媒体会话。
7. —种用于在主叫客户端(A)与被叫客户端(B)之间通信的方法, 该方法在于向语音信箱服务器(S)传输针对所述,皮叫客户端(B)的用户 的多媒体会话(SM),其特征在于,包括用于将所述多媒体会话的全部或 一部分实时转换成文本信息的步骤,以及用于将所述文本信息传输至所述 被叫客户端(B)的步骤。
8. 根据前一权利要求所述的方法,其中,所述文本信息在即时消息会 话内^J^送至所述被叫客户端。
9. 根据前一权利要求所述的方法,其中,MSRP协议承载所述即时消
10. 根据权利要求7至9之一所述的方法,还包括用于配置所述用户 配置文件的在先步骤,该步骤在于确定指明了当所述语音信箱服务器收到夢
11. 根据权利要求7至10之一所述的方法,其中,在所述传输步骤 期间,所述被叫客户端发送替换信号至所述语音信箱服务器以触发所述文 本信息的传输中断以及所述主叫客户端(A)与所述被叫客户端(B)之间 的新多^某体会活的建立。
12. —种通信客户端(B),包括用于从显示所述文本信息的全部或 一部分内容的显示设备(E)接收文本信息的装置,和由用户激活的进入 接口 (INTE),其特征在于,所述文本信息构成关联于主叫客户端(A) 的、与语音信箱服务器(S)建立的文本会话,并且所述i^v接口包括用于 触发去往所述语音信箱服务器的、用于与所述主叫客户端建立多媒体^S舌 的信号的装置。
13. 根据前一权利要求所述的通信客户端,其中,所迷文本会话是即 时消息会活(SMI)。
14. 根据前一权利要求所述的通信客户端,其中,MSRP协议承载所述即时消息会活。
15. 根据权利要求12至14之一所述的通信客户端,其中,所述ii^v 接口 (INTE)包括用于触发去往所述语音邮箱服务器的、用于中断所述文 本会话的信号的装置。
全文摘要
一种连接到通信网络(N)的语音信箱服务器(S),其包括用于接收来自主叫客户端(A)并去往被叫客户端(B)的用户的多媒体会话(SM)的多媒体接口(INTM),和用于存储所述多媒体会话的内容的存储器(MEM)。它还包括用于将所述多媒体会话(SM)的全部或一部分实时转换成文本信息的转换器(STT)和用于发送所述文本信息至所述被叫客户端的文本接口(INTT)。
文档编号H04M3/533GK101577767SQ20091013805
公开日2009年11月11日 申请日期2009年5月6日 优先权日2008年5月7日
发明者J-S·马丁, T·弗罗门特 申请人:阿尔卡特朗讯公司