数据转换方法和装置的制造方法

文档序号：9418676阅读：362来源：国知局

数据转换方法和装置的制造方法
【技术领域】
[0001] 本公开涉及语音合成技术领域，特别涉及一种数据转换方法和装置。
【背景技术】
[0002] 语音合成技术是通过机械的、电子的方法产生人造语音的技术，而将文字转换为语音是语音合成技术中最为重要的一个方面。
[0003] 相关技术中有一种数据转换方法，该方法首先对文本形式的原始数据进行分析，得到原始数据中的字和词，之后从语音库获取这些字和词对应的基本语音数据，最后将获取的基本语音数据按顺序进行组合得到最终的语音数据。
[0004] 公开内容
[0005] 为了解决相关技术问题，本公开实施例提供了一种数据转换方法和装置。所述技术方案如下：
[0006] 根据本公开实施例的第一方面，提供一种数据转换方法，该方法包括：
[0007] 获取目标文本数据，目标文本数据包括：格式信息，格式信息用于指示目标文本数据的感情色彩；
[0008] 根据预设的格式信息与语气标识的对应关系获取目标文本数据的语气标识；
[0009] 将目标文本数据转化为目标语音数据，目标语音数据带有语气标识指示的语气。
[0010] 可选的，将目标文本数据转化为目标语音数据，包括：
[0011] 根据目标文本数据从预设语音库中获取语音数据；
[0012] 根据语气标识对语音数据进行处理，得到目标语音数据。
[0013] 可选的，根据语气标识对语音数据进行处理，得到目标语音数据，包括：
[0014] 根据预设的韵律特征与语气标识的对应关系获取语气标识对应的目标韵律特征；
[0015] 根据目标韵律特征改变语音数据的韵律特征得到目标语音数据。
[0016] 可选的，将目标文本数据转化为目标语音数据，包括：
[0017] 检测预设语气语音库中是否包含目标语音数据，预设语气语音库中包含带有语气的语音数据；
[0018] 在预设语气语音库中包含目标语音数据时，获取目标语音数据。
[0019] 可选的，该方法还包括：
[0020] 在预设语气语音库中未包含有目标语音数据时，根据目标文本数据从预设语音库中获取语音数据；
[0021 ] 根据语气标识对语音数据进行处理，得到目标语音数据；
[0022] 将处理得到的目标语音数据存储至预设语气语音库。
[0023] 可选的，目标文本数据包含有依次排列的至少一个片段，
[0024] 根据预设的格式信息与语气标识的对应关系获取目标文本数据的语气标识，包括：
[0025] 依次检测目标文本数据中各个片段是否包括格式信息；
[0026] 若第一片段包括格式信息，根据预设的格式信息与语气标识的对应关系获取第一片段的语气标识，第一片段为目标文本数据中的任一片段。
[0027] 可选的，该方法还包括：
[0028] 若第二片段不包括格式信息，将至少一个片段中，与第二片段最接近且包括格式信息的片段的语气标识作为第二片段的语气标识，第二片段为目标文本数据中的任一片段。
[0029] 可选的，格式信息包括：
[0030] 标点，网络符号，字体，字号，字间距和行间距中的至少一种。
[0031] 根据本公开实施例的第二方面，提供一种数据转换装置，该装置包括：
[0032] 数据获取模块，被配置为获取目标文本数据，目标文本数据包括：格式信息，格式信息用于指示目标文本数据的感情色彩；
[0033] 标识获取模块，被配置为根据预设的格式信息与语气标识的对应关系获取目标文本数据的语气标识；
[0034] 转化模块，被配置为将目标文本数据转化为目标语音数据，目标语音数据带有语气标识指示的语气。
[0035] 可选的，转化模块，包括：
[0036] 第一数据获取子模块，被配置为根据目标文本数据从预设语音库中获取语音数据；
[0037] 处理子模块，被配置为根据语气标识对语音数据进行处理，得到目标语音数据。
[0038] 可选的，处理子模块，被配置为根据预设的韵律特征与语气标识的对应关系获取语气标识对应的目标韵律特征；根据目标韵律特征改变语音数据的韵律特征得到目标语音数据。
[0039] 可选的，转化模块，包括：
[0040] 检测子模块，被配置为检测预设语气语音库中是否包含目标语音数据，预设语气语音库中包含带有语气的语音数据；
[0041 ] 第二数据获取子模块，被配置为在预设语气语音库中包含目标语音数据时，获取目标语音数据。
[0042] 可选的，该装置还包括：
[0043] 语音数据获取模块，被配置为在预设语气语音库中未包含有目标语音数据时，根据目标文本数据从预设语音库中获取语音数据；
[0044] 处理模块，被配置为根据语气标识对语音数据进行处理，得到目标语音数据；
[0045] 存储模块，被配置为将处理得到的目标语音数据存储至预设语气语音库。
[0046] 可选的，目标文本数据包含有依次排列的至少一个片段，
[0047] 标识获取模块，被配置为依次检测目标文本数据中各个片段是否包括格式信息；在第一片段包括格式信息时，根据预设的格式信息与语气标识的对应关系获取第一片段的语气标识，第一片段为目标文本数据中的任一片段。
[0048] 可选的，该装置还包括：
[0049] 标识继承模块，被配置为在第二片段不包括格式信息时，将至少一个片段中，与第二片段最接近且包括格式信息的片段的语气标识作为第二片段的语气标识，第二片段为目标文本数据中的任一片段。
[0050] 可选的，格式信息包括：
[0051] 标点，网络符号，字体，字号，字间距和行间距中的至少一种。
[0052] 根据本公开实施例的第三方面，提供一种数据转换装置，该装置包括：
[0053] 处理器；
[0054] 用于存储处理器的可执行指令的存储器；
[0055] 其中，处理器被配置为：
[0056] 获取目标文本数据，目标文本数据包括：格式信息，格式信息用于指示目标文本数据的感情色彩；
[0057] 根据预设的格式信息与语气标识的对应关系获取目标文本数据的语气标识；
[0058] 将目标文本数据转化为目标语音数据，目标语音数据带有语气标识指示的语气。
[0059] 本公开的实施例提供的技术方案可以包括以下有益效果：
[0060] 通过获取目标文本数据中的格式信息，并根据格式信息获取语气标识，最后将目标文本数据转换为带有语气标识指示的语气的目标语音数据；解决了相关技术中的语音数据机械感较强，流畅度较低的问题；达到了转换得到的语音数据带有语气，且自然流畅的效果。
[0061] 应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。
【附图说明】
[0062] 为了更清楚地说明本公开的实施例，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0063] 图1是本公开各个实施例所涉及的一种实施环境的示意图；
[0064] 图2是根据一示例性实施例示出的一种数据转换方法的流程图；
[0065] 图3-1是根据一示例性实施例示出的另一种数据转换方法的流程图；
[0066] 图3-2是图3-1示出的数据转换方法中获取目标文本数据的流程图；
[0067] 图3-3是图3-1示出的数据转换方法中获取语气标识的流程图；
[0068] 图3-4是图3-1示出的数据转换方法中对语音数据进行处理的流程图；
[0069] 图4是根据一示例性实施例示出的另一种数据转换方法的流程图；
[0070] 图5-1是根据一示例性实施例示出的另一种数据转换方法的流程图；
[0071] 图5-2是图5-1所示实施例中的终端操作示意图；
[0072] 图6-1是根据一示例性实施例示出的一种数据转换装置的框图；
[0073] 图6-2是图6-1示出的数据转换装置中转化模块的框图；
[0074] 图6-3是图6-1示出的数据转换装置中另一种转化模块的框图；
[0075] 图6-4是根据一示例性实施例示出的另一种数据转换装置的框图；
[0076] 图6-5是根据一示例性实施例示出的另一种数据转换装置的框图；
[0077] 图7是根据一示例性实施例示出的一种用于数据转换的装置的框图；
[0078] 图8是根据一示例性实施例示出的一种用于数据转换的装置的框图。
[0079] 此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。
【具体实施方式】
[0080] 为了使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开作进一步地详细描述，显然，所描述的实施例仅仅是本公开一部份实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本公开保护的范围。
[0081] 图1是根据本公

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨冬东;冯超;刘山荣;
技术所有人：小米科技有限责任公司;
我是此专利的发明人