一种基于语音合成系统标记记忆库的音频生成方法及装置与流程

文档序号：34121768发布日期：2023-05-11 04:58阅读：70来源：国知局

本发明涉及语音合成，尤其涉及一种基于语音合成系统标记记忆库的音频生成方法及装置。

背景技术：

1、目前，语音合成系统在使用过程中会基于用户个性化需求对文本内容进行标记，如停顿标记、连读标记、重读标记、多音字标记、别名标记等。但是每个用户的个性化要求可能比较相似，在完成一个项目的语音合成后，进行下一个语音项目的合成时，遇到同样需要标记的内容时，还需要再次对相同的文本内容实现同样的标记，这样的操作方式会造成重复劳动，并且过程复杂繁琐。

技术实现思路

1、本发明要解决的技术问题是，如何简化语音合成过程中的重复标记过程；有鉴于此，本发明提供一种基于语音合成系统标记记忆库的音频生成方法及装置。

2、本发明采用的技术方案是，一种基于语音合成系统标记记忆库的音频生成方法，包括：

3、获取待检索文本；

4、基于预先配置的记忆库文本，对所述待检索文本进行检索，以获取所述待检索文本中与所述记忆库文本匹配的标记文本；

5、将所述记忆库文本中对所述标记文本的标记信息，确定为所述待检索文本中的标记文本的标记信息；

6、基于带有标记信息的所述标记文本，生成对应的音频文件；

7、基于与用户的交互过程，确定所述音频文件是否满足用户要求。

8、在一个实施方式中，所述方法还包括：

9、对所述记忆库文本中的部分文本设置对应标记信息。

10、在一个实施方式中，所述方法进一步包括：

11、在所述记忆库文本中，对所述标记信息进行添加、编辑、删除中的至少一种处理。

12、在一个实施方式中，所述基于与用户的交互过程，确定所述音频文件是否满足用户要求，包括：

13、响应于用户对所述音频文件的确认信息，输出当前所述音频文件。

14、在一个实施方式中，所述基于与用户的交互过程，确定所述音频文件是否满足用户要求，包括：

15、响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本进行进一步配置；

16、将重新配置后的标记文本合成为音频文件，用于与用户进一步交互。

17、在一个实施方式中，所述响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本进行进一步配置，包括：

18、响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本中的标记信息进行进一步配置。

19、在一个实施方式中，所述响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本中的标记信息进行进一步配置，包括：

20、响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本中的标记信息进行添加、删除、修改操作中的至少一种。

21、本发明的另一方面还提供了一种基于语音合成系统标记记忆库的音频生成装置，包括：

22、获取单元，被配置为获取待检索文本；

23、检索单元，被配置为基于预先配置的记忆库文本，对所述待检索文本进行检索，以获取所述待检索文本中与所述记忆库文本匹配的标记文本；

24、调用单元，被配置为将所述记忆库文本中对所述标记文本的标记信息，确定为所述待检索文本中的标记文本的标记信息；

25、音频合成单元，被配置为基于带有标记信息的所述标记文本，生成对应的音频文件；

26、交互单元，被配置为基于与用户的交互过程，确定所述音频文件是否满足用户要求。

27、本发明的另一方面还提供了一种电子设备，所述电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上任一项所述的基于语音合成系统标记记忆库的音频生成方法的步骤。

28、本发明的另一方面还提供了一种计算机存储介质，所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项所述的基于语音合成系统标记记忆库的音频生成方法的步骤。

29、采用上述技术方案，本发明提供的基于语音合成系统标记记忆库的音频生成方法，由于内置记忆库功能，可以用于自动检索语音合成文本内容，一旦检测结果与记忆库内容匹配，则会调用记忆库的文本标记功能及方案，实现记忆库中的语音合成效果，避免用户多次重复的人工添加相同的标记。大大减少用户的语音合成工作量。

技术特征：

1.一种基于语音合成系统标记记忆库的音频生成方法，其特征在于，包括：

2.根据权利要求1所述的基于语音合成系统标记记忆库的音频生成方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的基于语音合成系统标记记忆库的音频生成方法，其特征在于，所述方法进一步包括：

4.根据权利要求1所述的基于语音合成系统标记记忆库的音频生成方法，其特征在于，所述基于与用户的交互过程，确定所述音频文件是否满足用户要求，包括：

5.根据权利要求1所述的基于语音合成系统标记记忆库的音频生成方法，其特征在于，所述基于与用户的交互过程，确定所述音频文件是否满足用户要求，包括：

6.根据权利要求5所述的基于语音合成系统标记记忆库的音频生成方法，其特征在于，所述响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本进行进一步配置，包括：

7.根据权利要求6所述的基于语音合成系统标记记忆库的音频生成方法，其特征在于，所述响应于用户对所述音频文件的否定信息，对所述音频文件对应的标记文本中的标记信息进行进一步配置，包括：

8.一种基于语音合成系统标记记忆库的音频生成装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于语音合成系统标记记忆库的音频生成方法的步骤。

10.一种计算机存储介质，所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语音合成系统标记记忆库的音频生成方法的步骤。

技术总结
本发明提出了一种基于语音合成系统标记记忆库的音频生成方法及装置，方法包括：获取待检索文本；基于预先配置的记忆库文本，对待检索文本进行检索，以获取待检索文本中与记忆库文本匹配的标记文本；将记忆库文本中对标记文本的标记信息，确定为待检索文本中的标记文本的标记信息；基于带有标记信息的标记文本，生成对应的音频文件；基于与用户的交互过程，确定音频文件是否满足用户要求。本发明通过记忆库功能，可以用于自动检索语音合成文本内容，一旦检测结果与记忆库内容匹配，则会调用记忆库的文本标记功能及方案，实现记忆库中的语音合成效果，避免用户多次重复的人工添加相同的标记，大大减少用户的语音合成工作量。

技术研发人员：杨静波,汤跃忠,陈龙,刘丹
受保护的技术使用者：北京中电慧声科技有限公司
技术研发日：
技术公布日：2024/1/12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨静波汤跃忠陈龙刘丹
技术所有人：中国电子科技集团公司第三研究所
我是此专利的发明人

上一篇：一种瞬间对冷链食品外包装病毒进行高温消杀的安检机的制作方法
上一篇：崩落充填采矿方法与流程