专利名称:一种提供语音合成应用统一开发平台的系统和方法
技术领域:
本发明涉及一种语音合成应用技术,尤其涉及的是一种提供语章合成 应用的统一开发平台系统和方法。
背景技术:
现有技术的语音合成应用(Txt to Speech,以下简称TTS),是将文本 文件,如帮助文件或者网页,转换成自然语音输出。这种应用使用范围越 来越广泛,如号码百事通的报电话号码、火车站和机场报站名、语音网页、 电子商务领域等,都有TTS的应用案例。
随着电信、联通、移动和网通等各大运营商增值业务的发展,大多数 的业务都由SP (业务提供商,Service Provider)来完成,在SP提供的业 务中,TTS资源的使用越来越广泛。目前大多的SP业务开发能力很强, 但对于TTS资源的集成则比较困难,同时,如果各个SP都建设自己的TTS 资源平台,则存在资源的浪费和使用的不均衡;而且各SP各建一套TTS 系统,对于运营商在管理上也会带来问题,无法对SP进行有效的监管。
因此,现有技术还存在缺陷,而有待于改进和发展。
发明内容
.本发明的目的在于提供一种提供语音合成应用统一开发平台的系统和 方法,可以给运营商统一建立一套TTS资源平台,各SP可以按需使用, SP在此基础上可以很方便的在业务中集成TTS功能,这样SP可以专注于 业务的开发而不必关心底层TTS的技术实现,同时TTS资源统一调配使
用,大大提高资源的利用率,运营商可以对SP使用TTS资源计费,可以 很快收回投资成本,因此,这种资源平台建设模式既减少总体投入成本, 又能促进增值业务的发展,可以真正实现SP和运营商的双赢。 本发明的技术方案如下
一种提供语音合成应用统一开发平台的系统,其中,该系统包括TTS 客户端模块、代理服务器模块、TTS服务器模块;所述TTS客户端模块与 代理服务器模块间通过TCP/IP协议连接;代理服务器模块与TTS服务器 模块间通过TCP/IP协议连接;TTS客户端模块与TTS服务器模块间通过 TCP/IP协议通讯;并且
所述TTS客户端模块用于向业务提供商提供TTS转换接口 ;
所述代理服务器模块用于处理各业务提供商的TTS请求,并对所述 TTS服务器模块进行控制;
所述TTS服务器模块用于对来自代理服务器模块的TTS请求进行緩 存,并进行TTS合成。
所述的系统,其中,所述TTS客户端模块,包括TTS初始化单元、 TTS合成单元和TTS数据接收单元;
'所述TTS初始化单元用于完成与所述代理服务器模块TCP连接的建 立、参数初始化用户鉴权信息的生成以及向所述主控单元发起鉴权请求;
所述TTS合成单元用于对用户提供TTS转换接口 ,根据用户输入的文 本信息向所述代理服务器模块的主控单元发起TTS请求;
所述TTS数据接收单元功能用于接收TTS转换后的语音数据,并保存 为wav文件。
所述的系统,其中,所述代理服务器模块包括主控单元、TTS协议处 理单元、鉴权单元和计费单元;
所述主控单元用于与所述TTS客户端模块和所述TTS服务器模块进行 消息交互,完成本模块内部各单元消息的转发;
所述TTS协议处理单元用于响应来自所述客户端模块的TTS请求,对 TTS内部协议进行解析,分配内部资源,发起TTS转换请求;
所述鉴权单元用于根据所述TTS初始化单元的鉴权信息进行用户鉴 权,向所述TTS客户端模块返回鉴权结果;
所述计费单元用于接收来自TTS服务器模块转换后的成功/失败消息, 并进行计费。
所述的系统,其中,所述TTS服务器模块包括TTSAgent单元和TTS 服务单元;
所述TTSAgent单元用于封装不同厂家、不同语言TTS服务器的调用 接口,响应来自所述代理服务器模块的TTS请求,通过与TTS服务单元 接口调用完成文本转换为语音数据,向所述代理服务器模块的所述计费单 元发送TTS计费请求,将转换后的语音数据发送到所述TTS客户端模块 的所述TTS数据接收单元;
所述TTS服务单元用于实现TTS转换功能,由各TTS服务厂商分别 实现。
所述提供语音合成应用统一开发平台的方法,其包括以下步骤
A、 用户调用TTS合成接口函数,TTS客户端模块的TTS初始化单元向 鉴权单元发起鉴权请求,成功后进入下一步,否则,向用户报错;
B、 TTS客户端模块的TTS合成单元向代理服务器模块的主控单元发 起TTS请求,所述主控单元将此请求转发给代理服务器模块的TTS协议 处理单元,所述TTS协议处理单元分配内部资源,并向TTS服务器模块 的TTS Agent单元发起TTS请求;
C、 所述TTSAgent单元收到TTS请求后调用TTS服务器模块的TTS 服务单元的接口实现TTS的转换。
所述的方法,其中,还包括
D、 所述TTSAgent单元根据转换的结果向所述主控单元发起通知消
息,如果成功则由计费单元完成计费,并进入下一步;否则,由所述主控单 元通知所述客户端模块失败信息;
E、所述TTSAgent单元将转换成功后的语音数据发送到所述TTS数据 接收单元,由所述数据接收单元形成语音文件。
所述的方法,其中,所述语音文件为WAV文件。
所述的方法,其中,所述计费单元根据TTS转换结果进行计费,按转 换后的时长计费或按文本字节数进行计费。
本发明所提供的一种提供语音合成应用统一开发平台的系统和方法, 由于采用统一TTS开发平台,可广泛应用于电信、移动、联通的基于语音 的业务范畴,并将此统一开发平台开放给各SP,由SP完成各种文件转语 音的相关业务,如语音网页等;并且本发明系统采用了分层架构,整个系 统可扩展性强,所述TTS客户端模块、代理服务器模块和TTS服务器模 块均可根据容量进行在线扩容,因此它具备容量大、扩容容易的特点。
图1为本发明TTS统一开发平台系统原理示意图; .图2为本发明的TTS统一开发平台系统结构示意图3为本发明的TTS统一开发平台系统TTS合成处理流程; 图4为本发明的TTS统一开发平台系统具体实施示意图。
具体实施例方式
以下将结合附图,对本发明的各较佳实施例进行更为详细的说明。 本发明的提供语音合成应用统一开发平台的系统和方法,可广泛适用 于电信、保险、金融、证券、民航、铁路、电力调度部门、传呼台等电话 服务领域,如上述领域各行业的Call Center以及各种增值电话业务,它的 特点是为运营商提供统一的TTS开发平台,由SP进行基于TTS的业务开 发,可以提高运营商资源的利用率和系统安全性。
本发明所述提供语音合成应用统一开发平台的系统和方法是一种TTS 平台系统及方法,向第三方提供统一的TTS开发接口 ,分别实现TTS功 能,并对第三方进行计费。
本发明系统的模块组成原理如图1所示,由TTS客户端模块1、代理 服务器模块2、 TTS服务器模块3三个模块组成。TTS客户端模块与代理 服务器模块间通过TCP/IP协议连接;代理服务器模块与TTS服务器模块 间通过TCP/IP协议连接;TTS客户端模块与TTS服务器模块间通过TCP/IP 协议通讯。
本发明各模块的功能描述如下
所述TTS客户端模块1主要包括TTS初始化单元11、 TTS合成单元 12和TTS数据接收单元13,如图2所示。本发明所述TTS初始化单元功 能是完成与所述代理服务器模块TCP连接的建立、参数初始化用户鉴权信 息的生成以及向所述主控单元发起鉴权请求;所述TTS合成单元功能是对 用户提供TTS转换接口 ,根据用户输入的文本信息向所述代理服务器模块 的主控单元发起TTS请求;所述TTS数据接收单元功能是接收所述 TTSAgent单元的TTS转换后的语音数据,并保存为wav文件。
实际应用中,TTS客户端一般是多个,最多支持上千个;根据实际情 况,代理服务器模块和TTS服务器模块由多个组成,本发明以三个TTS 客户端模块, 一个代理服务器模块和二个TTS服务器模块为例说明TTS 统一开发平台的具体实施方式
,如图4所示。
本发明所述TTS客户端模块的功能是向SP提供TTS转换接口 ,为了 SP使用方便,力求接口函数简单,尽量使用同步操作。所述TTS初始化 单元完成TCP连接的建立和鉴权信息的生成发送;所述TTS合成单元完 成TTS的转换请求的封装,并向所述代理服务器模块发送TTS请求。多 个TTS客户端模块可由运营商统一分配用户名密码,如果更严格一些可以
将IP与用户名 一起绑定进行鉴权。各TTS客户端模块间是相互独立的。
所述代理服务器模块2,主要包括主控单元21、 TTS协议处理单元22、 鉴权单元23和计费单元24,其主要功能是对各SP的TTS请求进行控制 处理,并实现对所述TTS服务器模块的控制,包括各SP的TTS请求进 行鉴权认证,只有申请此功能的SP才能进行TTS转换,保证SP的合法性; 对TTS请求进行协议解析,对来自SP的TTS请求进行内部资源的分配及 路由,维护TTS服务器的负荷并进行负荷分担,转发TTS请求到相应的 TTSAgent单元;才艮据TTS转换结果进行计费,可按转换后的时长计费、 可按文本字节数进行计费等,计费单元可以使用标准的-AAA (Authenticate/Authorize/Account)月良务器进行计费也可以使用内部协议进 行计费。代理服务器^t块根据话务情况可以配置一个也可以配置多个。
其中,所述主控单元功能是与所述TTS客户端模块和所述TTS服务器 模块进行消息交互,完成本模块内部各单元消息的转发;所述TTS协议处 理单元功能是响应来自所述客户端模块的TTS请求,对TTS内部协议进 行解析,分配内部资源,向所述TTSAgent单元发起TTS转换请求;所述 鉴权单元功能是4艮据所述TTS初始化单元的鉴权信息进行用户鉴权,向所 述TTS客户端模块返回鉴权结果;所述计费单元功能是接收来自TTSAgent 转换后的成功/失败消息,并进行计费。
所述TTS服务器模块3,主要包括TTSAgent单元31和TTS服务单元 32,其主要功能是对来自代理服务器模块的TTS请求进行緩存,内部资源 的分配,调用TTS服务单元的转换接口函数进行TTS合成,转换完成后 返回给相应的代理服务器模块并报告转换时长及成功/失败,成功后将合成 后的语音数据通过网络传送到相应的SP客户端的TTS数据接收单元。根 据具体情况TTS服务器模块可以一套也可多套,多套间由代理服务器模块 进行负荷分担处理,如图4所示,为两套TTS服务器模块提供TTS服务。
其中,所述TTSAgent单元的功能是封装不同厂家、不同语言TTS服务器的调用接口,响应来自所述代理服务器模块的TTS请求,通过与TTS 服务单元接口调用完成文本转换为语音数据,向所述代理服务器模块的所 述计费单元发送TTS计费请求,将转换后的语音数据发送到所述TTS客 户端模块的所述TTS数据接收单元;所述TTS服务单元功能是实现TTS 转换功能,由各TTS服务厂商分别实现。
下面结合附图3、图4对本发明TTS统一开发平台的使用方法及处理 流禾呈进^1S羊细"i兌明。
第一步,用户调用TTS合成接口函数。所述TTS初始化单元向所述 鉴权单元发起鉴权请求,成功后进入下一步,否则,向用户报错。
如图4所示,在这个系统SP业务提供商有两个SP1和SP2, SP通过 调用TTS客户端模块的接口函数TTSInit(),组织各自的用户名,密码或本 地IP为鉴权信息,向代理服务器的主控单元发起鉴权请求,并等待结果, 进入下一步。
主控管理单元接收到鉴权命令后,向鉴权单元转发此鉴权命令,由鉴 权单元完成对SP的认证,并通过主控单元向TTS客户端冲莫块的TTS初始 化单元返回成功或失败,如果成功,则进入下一步;否则,提示SP鉴权 失败。
第二步,所述TTS合成单元向所述主控单元发起TTS请求,所述主 控单元将此请求转发给所述TTS协议处理单元,所述TTS协议处理单元 分配内部资源,并向所述TTSAgent单元发起TTS请求。
SP调用TTS客户端模块提供的TTS合成接口函数DoTTS()将需要合 成的文本信息发出到代理服务器模块的主控单元,并等待合成结果。
主控单元接收到合成命令后,向TTS协议处理单元转发此命令,TTS 协议处理单元收到此命令后,首先分配内部通道资源,然后根据如图4所 示的两个TTS服务模块的负荷情况决定由哪个TTS服务器模块来负责此 次TTS合成,即完成TTS服务器模块的分配,并将TTS合成请求进行再
解析,按TTSAgent单元的内部协议要求进行协议封装,最后,将封装后 的消息发向分配的TTSAgent单元,进入下一步。
第三步,所述TTSAgent单元收到TTS请求后调用TTS服务单元的接 口实现TTS的转换,转换完成后进入下一步。
所述TTSAgent单元接收到TTS合成请求后,取出文本信息,并调用 TTS服务单元的相应接口对文本进行语音合成,并将合成结果(包括成功, 失败,合成后的语音时长,字节数)通过消息通知代理服务器模块的主控 单元,并进入第四步;如果合成成功,则TTSAgent单元将合成后的语音 数据分包,并通过网络将语音数据发向TTS客户端模块的TTS数据接收 单元,并进入第五步。
第四步,所述TTSAgent单元根据转换的结果向所述主控单元发起通 知消息,如果成功则由计费单元完成计费,并进入下一步;否则,由所述主 控单元通知所述客户端模块失败信息。所述主控单元接收到来自TTSAgent 单元的合成结果信息时,根据成功或失败决定是否计费,如果成功,则根 据合成后的语音时长或字节数进行计费,并向TTS合成单元返回成功,并 进入第六步;如果失败,则向TTS合成单元返回错误消息。
第五步,所述TTSAgent单元将转换成功后的语音数据发送到所述TTS 数据接收单元,由所述数据接收单元形成wav文件。所述TTS数据接收单 元接收来自TTSAgent的语音数据,成功后将形成最终语音文件,并通知 TTS合成单元,并进入第六步。
第六步,TTS合成单元可能分别收到TTS数据接收单元和代理服务器 模块主控单元的结果消息,当两个消息都成功后,才向调用者(即SP)返 回成功,否则,^^回失败。
本发明的提供语音合成应用统一开发平台的系统和方法由于釆用统一 TTS开发平台,可广泛应用于电信、移动、联通的基于语音的业务范畴, 并将此统一开发平台开放给各SP,由SP完成各种文件转语音的相关业务,
如语音网页等;并且本发明系统采用了分层架构,整个系统可扩展性强, 所述TTS客户端模块、代理服务器模块和TTS服务器模块均可根据容量 进行在线扩容,因此它具备容量大、扩容容易的特点。
应当理解的是,上述针对本发明较佳实施例的描述较为具体,并不能 因此而理解为对本发明专利保护范围的限制,本发明的专利保护范围应以 所附权利要求为准。
权利要求
1、一种提供语音合成应用统一开发平台的系统,其特征在于,该系统包括TTS客户端模块、代理服务器模块、TTS服务器模块;所述TTS客户端模块与代理服务器模块间通过TCP/IP协议连接;代理服务器模块与TTS服务器模块间通过TCP/IP协议连接;TTS客户端模块与TTS服务器模块间通过TCP/IP协议通讯;并且所述TTS客户端模块用于向业务提供商提供TTS转换接口;所述代理服务器模块用于处理各业务提供商的TTS请求,并对所述TTS服务器模块进行控制;所述TTS服务器模块用于对来自代理服务器模块的TTS请求进行缓存,并进行TTS合成。
2、 根据权利要求1所述的系统,其特征在于,所述TTS客户端模 块,包括TTS初始化单元、TTS合成单元和TTS数据接收单元;所述TTS初始化单元用于完成与所述代理服务器模块TCP连接的建 立、参数初始化用户鉴权信息的生成以及向所述主控单元发起鉴权请求;所述TTS合成单元用于对用户提供TTS转换接口 ,根据用户输入的文 本信息向所述代理服务器模块的主控单元发起TTS请求;所述TTS数据接收单元功能用于接收TTS转换后的语音数据,并保存 为wav文件。
3、 根据权利要求2所述的系统,其特征在于,所述代理服务器模块 包括主控单元、TTS协议处理单元、鉴权单元和计费单元;所述主控单元用于与所述TTS客户端模块和所述TTS服务器模块进行 消息交互,完成本才莫块内部各单元消息的转发;所述TTS协议处理单元用于响应来自所述客户端模块的TTS请求,对TTS内部协议进行解析,分配内部资源,发起TTS转换请求;所述鉴权单元用于根据所述TTS初始化单元的鉴权信息进行用户鉴权,向所述TTS客户端模块返回鉴权结果;所述计费单元用于接收来自TTS服务器模块转换后的成功/失败消息,并进行计费。
4、 根据权利要求3所述的系统,其特征在于,所述TTS服务器模 块包括TTS Agent单元和TTS服务单元;所述TTSAgent单元用于封装不同厂家、不同语言TTS服务器的调用 接口 ,响应来自所述代理服务器模块的TTS请求,通过与TTS服务单元 接口调用完成文本转换为语音数据,向所述代理服务器模块的所述计费单 元发送TTS计费请求,将转换后的语音数据发送到所述TTS客户端模块 的所述TTS数据接收单元;所述TTS服务单元用于实现TTS转换功能,由各TTS服务厂商分别实现。
5、 一种如权利要求1所述提供语音合成应用统一开发平台的方法, 其包括以下步骤A、 用户调用TTS合成接口函数,TTS客户端模块的TTS初始化单元 向鉴权单元发起鉴权请求,成功后进入下一步,否则,向用户报错; 'B、 TTS客户端模块的TTS合成单元向代理服务器模块的主控单元发起TTS请求,所述主控单元将此请求转发给代理服务器模块的 TTS协议处理单元,所述TTS协议处理单元分配内部资源,并 向TTS服务器模块的TTSAgent单元发起TTS请求;C、 所述TTSAgent单元收到TTS请求后调用TTS服务器模块的TTS服务单元的接口实现TTS的转换。
6、 根据权利要求5所述的方法,其特征在于,还包括D、 所述TTSAgent单元根据转换的结果向所述主控单元发起通知消 息,如果成功则由计费单元完成计费,并进入下一步;否则,由 所述主控单元通知所述客户端模块失败信息;E、 所述TTSAgent单元将转换成功后的语音数据发送到所述TTS数据接收单元,由所述数据接收单元形成语音文件。
7、 根据权利要求6所述的方法,其特征在于,所述语音文件为WAV 文件。
8、 根据权利要求5所述的方法,其特征在于,所述计费单元根据 TTS转换结果进行计费,按转换后的时长计费或按文本字节数进行计费。
全文摘要
本发明公开了一种提供语音合成应用统一开发平台的系统和方法,该系统包括TTS客户端模块、代理服务器模块、TTS服务器模块所述TTS客户端模块用于向业务提供商提供TTS转换接口;所述代理服务器模块用于处理各业务提供商的TTS请求,并对所述TTS服务器模块进行控制;所述TTS服务器模块用于对来自代理服务器模块的TTS请求进行缓存,并进行TTS合成。本发明系统和方法由于采用了统一TTS开发平台,可广泛应用于电信、移动、联通的基于语音的业务范畴,并将此统一开发平台开放给各SP,由SP完成各种文件转语音的相关业务;并且本发明系统采用了分层架构,整个系统可扩展性强,具备容量大、扩容容易的特点。
文档编号H04L12/14GK101098507SQ20071007619
公开日2008年1月2日 申请日期2007年6月29日 优先权日2007年6月29日
发明者斌 刘, 唐必胜, 玲 景, 聃 王, 王景平 申请人:中兴通讯股份有限公司