本公开涉及计算机领域,尤其涉及一种翻译方法、翻译模型的生成方法及相关设备。
背景技术:
1、同步机器翻译(simultaneous machine translation,simt)任务是机器翻译任务的一个子任务,从不完整的源文本开始读取,并逐步产生翻译,以将连续输入的文本流快速翻译成另一种语言。
2、相关技术中,目标主流的翻译模型都采用transformer模型的编码器-解码器架构来实现翻译任务,然而现有的翻译模型在保证翻译质量的同时,降低翻译延迟上存在一定技术瓶颈。
技术实现思路
1、本公开提供了一种翻译方法、翻译模型的生成方法及相关设备,以解决现有技术中至少一种技术问题。
2、一方面,本公开提供了一种翻译方法,包括:
3、获取实时输入文本,从所述输入文本中确定待翻译的当前词语;
4、调用经训练的翻译模型对所述当前词语进行翻译处理,得到所述当前词语对应的中间处理结果,以及所述当前词语的翻译词语并输出;所述中间处理结果包括所述翻译模型中第一解码器输出的第一隐藏状态信息、和第二解码器输出的第二隐藏状态信息;
5、调用所述第一解码器和所述翻译模型中包含所述第二解码器的输出解码模块,对第一词语、所述第一隐藏状态信息和所述第二隐藏状态信息进行处理,得到第二词语的翻译词语并输出;所述第一词语包括所述当前词语和在所述当前词语的词语位置之前的至少一个目标源词语,所述第二词语是经所述第一解码器预测得到的所述当前词语的下一个源词语;
6、将所述输入文本中与所述第二词语的词语位置对应的源词语的下一个源词语作为当前词语,返回所述调用经训练的翻译模型对所述当前词语进行翻译处理的步骤,直至输出所述输入文本中各源词语对应的翻译词语。
7、另一方面还提供了一种翻译模型的生成方法,包括:
8、获取训练样本集,所述训练样本集包括训练源文本和所述训练文本中各样本源词语对应的期望翻译样本词语;
9、从所述训练源文本中确定待翻译的当前样本词语,调用翻译模型对所述当前样本词语进行翻译处理,得到所述当前样本词语对应的中间样本处理结果,以及所述当前样本词语的预测翻译样本词语;所述中间样本处理结果包括所述翻译模型中第一解码器输出的第一样本隐藏状态信息、和第二解码器输出的第二样本隐藏状态信息;
10、调用所述第一解码器和所述翻译模型中包含所述第二解码器的输出解码模块,对第一样本词语、所述第一样本隐藏状态信息和所述第二样本隐藏状态信息进行处理,得到第二样本词语的预测翻译样本词语;所述第一样本词语包括所述当前样本词语和在所述当前样本词语之前输入的至少一个目标样本源词语,所述第二样本词语是经所述第一解码器预测得到的所述当前样本词语的下一个样本源词语;
11、将所述输入样本文本中与所述第二样本词语的词语位置对应的样本源词语的下一个样本源词语作为当前样本词语,返回所述调用翻译模型对所述当前样本词语进行翻译处理的步骤,直至得到所述训练源文本中各样本源词语对应的翻译词语;
12、基于所述训练源文本中各样本源词语对应预测翻译样本词语和相应的期望翻译样本词语,对所述翻译模型进行训练,得到经训练的翻译模型。
13、另一方面还提供了一种翻译装置,包括:
14、文本获取模块,用于获取实时输入文本,从所述输入文本中确定待翻译的当前词语;
15、第一处理模块,用于调用经训练的翻译模型对所述当前词语进行翻译处理,得到所述当前词语对应的中间处理结果,以及所述当前词语的翻译词语并输出;所述中间处理结果包括所述翻译模型中第一解码器输出的第一隐藏状态信息、和第二解码器输出的第二隐藏状态信息;
16、第二处理模块,用于调用所述第一解码器和所述翻译模型中包含所述第二解码器的输出解码模块,对第一词语、所述第一隐藏状态信息和所述第二隐藏状态信息进行处理,得到第二词语的翻译词语并输出;所述第一词语包括所述当前词语和在所述当前词语的词语位置之前的至少一个目标源词语,所述第二词语是经所述第一解码器预测得到的所述当前词语的下一个源词语;
17、迭代翻译模块,用于将所述输入文本中与所述第二词语的词语位置对应的源词语的下一个源词语作为当前词语,返回所述调用经训练的翻译模型对所述当前词语进行翻译处理的步骤,直至输出所述输入文本中各源词语对应的翻译词语。
18、另一方面还提供了一种翻译模型的生成装置,包括:
19、训练数据模块,用于获取训练样本集,所述训练样本集包括训练源文本和所述训练文本中各样本源词语对应的期望翻译样本词语;
20、第一训练处理模块,用于从所述训练源文本中确定待翻译的当前样本词语,调用翻译模型对所述当前样本词语进行翻译处理,得到所述当前样本词语对应的中间样本处理结果,以及所述当前样本词语的预测翻译样本词语;所述中间样本处理结果包括所述翻译模型中第一解码器输出的第一样本隐藏状态信息、和第二解码器输出的第二样本隐藏状态信息;
21、第二训练处理模块,用于调用所述第一解码器和所述翻译模型中包含所述第二解码器的输出解码模块,对第一样本词语、所述第一样本隐藏状态信息和所述第二样本隐藏状态信息进行处理,得到第二样本词语的预测翻译样本词语;所述第一样本词语包括所述当前样本词语和在所述当前样本词语之前输入的至少一个目标样本源词语,所述第二样本词语是经所述第一解码器预测得到的所述当前样本词语的下一个样本源词语;
22、模型训练模块,用于将所述输入样本文本中与所述第二样本词语的词语位置对应的样本源词语的下一个样本源词语作为当前样本词语,返回所述调用翻译模型对所述当前样本词语进行翻译处理的步骤,直至得到所述训练源文本中各样本源词语对应的翻译词语;
23、模型生成模块,用于基于所述训练源文本中各样本源词语对应预测翻译样本词语和相应的期望翻译样本词语,对所述翻译模型进行训练,得到经训练的翻译模型。
24、另一方面还提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现上述任一所述的翻译方法或翻译模型的生成方法。
25、另一方面还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现上述任一所述的翻译方法或翻译模型的生成方法。
26、另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一所述的翻译方法或翻译模型的生成方法。
27、本公开提供的一种翻译方法、翻译模型的生成方法及相关设备,具有如下技术效果:
28、本公开实施例通过经训练的翻译模型先对实时输入文本中待翻译的当前词语进行翻译处理,再次利用该翻译模型中的第一解码器和第二解码器对第一词语、第一解码器和第二解码器上次分别针对该当前词语进行翻译处理所输出的第一隐藏状态信息和第二隐藏状态进行处理,得到第二词语的翻译词语并输出;该第一词语包括当前词语和在当前词语的词语位置之前的至少一个目标源词语,第二词语是经第一解码器预测得到的当前词语的下一个源词语;将输入文本中与第二词语的词语位置对应的源词语的下一个源词语作为当前词语,返回调用经训练的翻译模型对当前词语进行翻译处理的步骤,直至输出输入文本中各源词语对应的翻译词语。从而无需等待实时输入文本的下一个源词语,也无需按源词语顺序读取各源词语进行额外的编码处理,更好的提升同步机器翻译的性能,在保证翻译质量的同时,进一步降低同步翻译延迟。