本公开涉及人工智能,尤其涉及一种文本翻译方法、装置、电子设备及存储介质。
背景技术:
1、翻译记忆检索可以是翻译源文过程中从翻译记忆库中查找用于参考的译文。目前,主要有两种翻译记忆检索方法,一种是基于关键词的翻译记忆检索,另一种是基于向量表示的翻译记忆检索。具体的,基于关键词的翻译记忆检索方法,是指从翻译源文中,根据词频、idf(inversedocumentfrequency,逆文本频率)值等信息抽取关键词,再从翻译记忆库中查找包含这些关键词的翻译记忆的方法;基于向量表示的翻译记忆检索,是指将翻译源文编码到向量空间,在翻译记忆库中使用向量检索技术查找翻译记忆源文向量表示最接近的翻译记忆的方法。但是,上述两种方法主要关注如何查找和翻译源文相似的翻译记忆,对翻译记忆检索结果的参考价值缺少关注,从而导致翻译效率低和翻译准确度低。
技术实现思路
1、有鉴于上述存在的技术问题,本公开提出了一种文本翻译方法、装置、电子设备及存储介质。
2、根据本公开实施例的一方面,提供一种文本翻译方法,包括:
3、获取待翻译文本信息;
4、对所述待翻译文本信息和预设翻译记忆数据中每个待选翻译记忆对对应的未学习短语集进行匹配处理,得到至少一个目标匹配短语集;任一目标匹配短语集中存在未学习短语与所述待翻译文本信息相匹配;任一待选翻译记忆对对应的未学习短语集为所述任一待选翻译记忆对的翻译记忆原文信息中对应的记忆翻译结果与预设机器翻译模型的翻译结果存在差异的短语集合;
5、基于所述预设翻译记忆数据中所述至少一个目标匹配短语集对应的目标翻译记忆对和所述预设机器翻译模型,对所述待翻译文本信息进行翻译处理,得到目标语言文本信息。
6、根据本公开实施例的另一方面,提供一种文本翻译装置,包括:
7、信息获取模块,用于获取待翻译文本信息;
8、匹配处理模块,用于对所述待翻译文本信息和预设翻译记忆数据中每个待选翻译记忆对对应的未学习短语集进行匹配处理,得到至少一个目标匹配短语集;任一目标匹配短语集中存在未学习短语与所述待翻译文本信息相匹配;任一待选翻译记忆对对应的未学习短语集为所述任一待选翻译记忆对的翻译记忆原文信息中对应的记忆翻译结果与预设机器翻译模型的翻译结果存在差异的短语集合;
9、翻译处理模块,用于基于所述预设翻译记忆数据中所述至少一个目标匹配短语集对应的目标翻译记忆对和所述预设机器翻译模型,对所述待翻译文本信息进行翻译处理,得到目标语言文本信息。
10、根据本公开实施例的另一方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述文本翻译方法。
11、根据本公开实施例的另一方面,提供一种计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行上述文本翻译方法。
12、根据本公开实施例的另一方面,提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述文本翻译方法。
13、本公开的实施例提供的技术方案至少带来以下有益效果:
14、获取待翻译文本信息,对待翻译文本信息和预设翻译记忆数据中每个待选翻译记忆对对应的未学习短语集进行匹配处理,得到至少一个目标匹配短语集,其中,任一目标匹配短语集中存在未学习短语与待翻译文本信息相匹配,任一待选翻译记忆对对应的未学习短语集为任一待选翻译记忆对的翻译记忆原文信息中对应的记忆翻译结果与预设机器翻译模型的翻译结果存在差异的短语集合,可以通过未学习短语集实现具有参考价值的翻译记忆对的准确匹配,同时避免匹配到没有参考价值的翻译记忆对导致降低机器翻译成本,再结合预设翻译记忆数据中至少一个目标匹配短语集对应的目标翻译记忆对和预设机器翻译模型,对待翻译文本信息进行翻译处理,得到目标语言文本信息,通过结合上述具有参考价值的目标翻译记忆对进行翻译处理,可以提高翻译效果,提高翻译准确性,同时,通过避免使用没有参考价值的翻译记忆对,从而减少运算成本的浪费,减少系统资源消耗,提升设备性能。
15、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种文本翻译方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述对所述第一翻译短语对集合和所述第二翻译短语对集合进行翻译比较分析,得到所述目标待选记忆对对应的未学习短语集,包括:
4.根据权利要求2所述的方法,其特征在于,所述对所述翻译记忆原文信息和所述目标译文信息进行翻译短语分析,得到第一翻译短语对集合,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一互译分布信息,对所述翻译记忆原文信息和所述目标译文信息进行互译文本抽取处理,得到所述第一翻译短语对集合,包括:
6.根据权利要求5所述的方法,其特征在于,所述第一翻译短语对集合包括第三翻译短语对;所述基于遍历过程中得到的每个原文分词对应的第一翻译短语对,生成所述第一翻译短语对集合之前,所述方法还包括:
7.根据权利要求2所述的方法,其特征在于,所述对所述翻译记忆原文信息和所述翻译记忆译文信息进行翻译短语分析,得到第二翻译短语对集合,包括:
8.根据权利要求7所述的方法,其特征在于,所述基于所述第二互译分布信息,对所述翻译记忆原文信息和所述翻译记忆译文信息进行互译文本抽取处理,得到所述第二翻译短语对集合,包括:
9.根据权利要求8所述的方法,其特征在于,所述第二翻译短语对集合包括第四翻译短语对;所述基于遍历过程中得到的每个原文分词对应的第二翻译短语对,生成所述第二翻译短语对集合之前,所述方法还包括:
10.根据权利要求1-9任一所述的方法,其特征在于,所述对所述待翻译文本信息和预设翻译记忆数据中每个待选翻译记忆对对应的未学习短语集进行匹配处理,得到至少一个目标匹配短语集,包括:
11.一种文本翻译装置,其特征在于,所述装置包括:
12.一种电子设备,其特征在于,包括:
13.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至10中任意一项所述的文本翻译方法。