一种基于BERT特征和风格编码的低资源语音合成系统的制作方法

文档序号:40480485发布日期:2024-12-31 12:48阅读:来源:国知局

技术特征:

1.一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述系统包括:

2.根据权利要求1所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述梅尔谱风格编码模块(200)还被配置为:

3.根据权利要求2所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述梅尔谱风格编码模块(200)包括:

4.根据权利要求3所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述注意力机制和残差连接单元(230)还被配置为:

5.根据权利要求1所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述bert文本编码模块(300)还被配置为:

6.根据权利要求5所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述bert文本编码模块(300)包括:

7.根据权利要求6所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述bert文本单元(310)包括若干个变压器编码、若干个注意力机制头和若干个隐层单元;

8.根据权利要求1所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述对齐框架模块(400)还被配置为:

9.根据权利要求8所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述对齐框架模块(400)包括:

10.根据权利要求1所述的一种基于bert特征和风格编码的低资源语音合成系统,其特征在于,所述标准化融合模块(500)还包括:


技术总结
本申请提供一种基于BERT特征和风格编码的低资源语音合成系统,涉及语音合成技术领域,系统包括用于获取待合成音频数据的音频获取模块,音频数据包括梅尔谱和文本数据;用于根据梅尔谱进行音色预测处理得到风格特征的梅尔谱风格编码模块;用于根据文本数据进行词语语句预测处理得到文本特征的BERT文本编码模块;用于根据梅尔谱和文本数据进行音高对齐预测处理得到音高能量特征的对齐框架模块;用于将风格特征、文本特征和音高能量特征进行标准化融合处理得到目标合成音频数据的标准化融合模块。本申请通过上述系统解决了现有声音合成技术无法在低资源的情况下合成较为准确的人声问题。

技术研发人员:司马华鹏,徐冉
受保护的技术使用者:南京硅基智能科技有限公司
技术研发日:
技术公布日:2024/12/30
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1