基于延迟解码策略的语音翻译方法及装置与流程

文档序号:28803858发布日期:2022-02-09 01:08阅读:来源:国知局

技术特征:
1.一种基于延迟解码策略的语音翻译方法,其特征在于,包括:使用神经网络模型的编码器对输入的源语言语音特征序列进行编码处理;将所述编码器的输出分别输入至所述神经网络模型的语音识别解码器以及所述神经网络模型的语音翻译解码器;所述语音识别解码器执行语音识别任务,以输出源语言文本;以及所述语音翻译编码器延迟于所述语音识别解码器预定时长执行语音翻译任务,以输出目标语言文本;其中,所述语音翻译编码器在执行语音翻译任务的过程中,参考所述语音识别解码器已生成的源语言文本的词语信息。2.根据权利要求1所述的基于延迟解码策略的语音翻译方法,其特征在于,所述语音识别编码器在执行语音识别任务的过程中,参考所述语音翻译解码器已生成的目标语言文本的词语信息。3.根据权利要求1或2所述的基于延迟解码策略的语音翻译方法,其特征在于,所述语音翻译解码器在执行语音翻译任务的过程中,基于已生成的源语言文本的词语信息以及已生成的目标语言文本的词语信息进行当前时刻的预测。4.根据权利要求3所述的基于延迟解码策略的语音翻译方法,其特征在于,所述语音识别解码器在执行语音识别任务的过程中,基于已生成的目标语言文本的词语信息以及已生成的源语言文本的词语信息进行当前时刻的预测。5.根据权利要求1或2所述的基于延迟解码策略的语音翻译方法,其特征在于,当所述编码器的输出进入所述语音翻译解码器时,被赋予预设数量的延迟标签,以指示所述翻译解码器延迟于所述语音识别解码器预定时长执行语音翻译任务。6.根据权利要求1所述的基于延迟解码策略的语音翻译方法,其特征在于,所述编码器包括语音特征序列抽取模块、自注意力模块及前馈神经网络模块;所述语音特征序列抽取模块对输入的源语言语音片段进行特征抽取,以获得相应的源语言语音特征序列;对各个源语言语音特征序列进行位置编码,输入至所述自注意力模块,所述自注意力模块的输出作为所述前馈神经网络的输入;所述前馈神经网络的输出作为所述编码器的输出。7.根据权利要求2所述的基于延迟解码策略的语音翻译方法,其特征在于,对所述语音识别解码器在执行识别任务过程中的识别结果使用柱搜索算法进行解码,对所述语音翻译解码器在执行翻译任务过程中的翻译结果进行解码。8.一种基于延迟解码策略的语音翻译装置,其特征在于,包括:编码器,所述编码器为神经网络模型的编码器,所述编码器对输入的源语言语音特征序列进行编码处理;第一解码器,所述第一解码器为所述神经网络模型的第一解码器,所述第一解码器作为语音识别解码器,将所述编码器的输出输入至所述语音识别解码器,所述语音识别解码器执行语音识别任务,以输出源语言文本;以及第二解码器,所述第二解码器为所述神经网络模型的第二解码器,所述第二解码器作为语音翻译解码器,将所述编码器的输出输入至所述语音翻译解码器,所述语音翻译编码
器延迟于所述语音识别解码器预定时长执行语音翻译任务,以输出目标语言文本;其中,所述语音翻译编码器在执行语音翻译任务的过程中,参考所述语音识别解码器已生成的源语言文本的词语信息。9.一种电子设备,其特征在于,包括:存储器,所述存储器存储执行指令;以及处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行权利要求1至7中任一项所述的方法。10.一种可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现权利要求1至7中任一项所述的方法。

技术总结
本公开提供了一种基于延迟解码策略的语音翻译方法,包括:使用神经网络模型的编码器对输入的源语言语音特征序列进行编码处理;将编码器的输出分别输入至神经网络模型的语音识别解码器以及神经网络模型的语音翻译解码器;语音识别解码器执行语音识别任务,以输出源语言文本;以及,语音翻译编码器延迟于语音识别解码器预定时长执行语音翻译任务,以输出目标语言文本;其中,语音翻译编码器在执行语音翻译任务的过程中,参考语音识别解码器已生成的源语言文本的词语信息。本公开还提供了一种基于延迟解码策略的语音翻译装置、电子设备及可读存储介质。及可读存储介质。及可读存储介质。


技术研发人员:刘宇宸 周玉
受保护的技术使用者:北京中科凡语科技有限公司
技术研发日:2021.11.03
技术公布日:2022/2/8
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1