本申请涉及文本处理,尤其涉及一种信息翻译方法、装置、电子设备及计算机程序产品。
背景技术:
1、目前的翻译方法主要是机器翻译引擎+人工翻译的结合方法,即先通过机器翻译引擎进行初译,再通过人工译员进行后编辑。目前主要使用的机器翻译引擎为神经机器翻译引擎,通过神经机器翻译引擎在进行文档翻译时,首先需要将原文文档拆分成句子进行独立翻译,然后将译文句子合并还原为译文文档。然而,神经机器翻译引擎在翻译每一个句子时只能依据当前句子的信息进行翻译,不能获取到关联句子的上下文信息,对于部分依赖于上下文信息翻译的句子,从而导致了译文信息的错误。句子翻译中最典型的错误信息是性别信息,即原文句子中携带有人名信息,但基于当前句子无法翻译出人名信息对应的性别信息,造成人名信息对应的性别信息翻译错误。
技术实现思路
1、本申请提供一种信息翻译方法、装置、电子设备及计算机程序产品,旨在提升性别信息翻译的准确性。
2、第一方面,本申请提供一种信息翻译方法,包括:
3、对待翻译文档的句子进行分句,得到各个待处理分句;
4、根据各个所述待处理分句中的人名实体信息和性别实体信息,确定各个目标实体信息关系;
5、对各个所述待处理分句进行翻译,得到各个译文分句;
6、根据各个所述目标实体信息关系,纠正各个所述译文分句中的性别实体信息。
7、在一实施例中,所述根据各个所述目标实体信息关系,纠正各个所述译文分句中的性别实体信息的步骤包括:
8、确定各个所述译文分句中的目标译文分句,其中,所述目标译文分句中携带有人名实体信息和性别实体信息;
9、确定所述目标译文分句在各个所述待处理分句中的目标处理分句;
10、根据所述目标处理分句的目标实体信息关系,纠正所述目标译文分句中的性别实体信息。
11、所述根据所述目标处理分句的目标实体信息关系,纠正所述目标译文分句中的性别实体信息的步骤包括:
12、通过词对齐工具将所述目标译文分句与所述目标处理分句进行词对齐,并通过所述目标处理分句的目标实体信息关系,确定所述目标译文分句的目标性别实体信息;
13、通过指代消解模型确定所述目标译文分句中人名实体信息的性别实体信息;
14、根据所述目标性别实体信息,纠正所述目标译文分句中的性别实体信息。
15、所述根据所述目标性别实体信息,纠正所述目标译文分句中的性别实体信息的步骤包括:
16、确定所述目标性别实体信息与所述目标译文分句中的性别实体信息是否一致;
17、若所述目标性别实体信息与所述目标译文分句中的性别实体信息不一致,则将所述目标性别实体信息替换所述目标译文分句中的性别实体信息。
18、所述根据各个所述待处理分句中的人名实体信息和性别实体信息,确定各个目标实体信息关系的步骤包括:
19、通过实体识别模型提取各个所述待处理分句中的人名实体信息;
20、通过指代消解模型识别各个所述待处理分句中人名实体信息的性别实体信息;
21、根据各个所述待处理分句中的人名实体信息及其对应的性别实体信息之间的关联关系,确定各个待处理实体信息关系;
22、根据各个所述待处理实体信息关系,确定各个所述目标实体信息关系。
23、所述根据各个所述待处理实体信息关系,确定各个所述目标实体信息关系的步骤包括:
24、将同一人名实体信息的待处理实体信息关系进行集合,得到各个待处理实体信息关系集合;
25、确定各个所述待处理实体信息关系集合中,各个相同待处理实体信息关系的发生次数;
26、将各个所述待处理实体信息关系集合中发生次数最多的相同待处理实体信息关系,确定为各个所述待处理实体信息关系集合的目标实体信息关系。
27、所述确定各个所述待处理实体信息关系集合中,各个相同待处理实体信息关系的发生次数的步骤之后,还包括:
28、若各个所述待处理实体信息关系集合中,各个相同待处理实体信息关系的发生次数相等,则确定各个所述待处理实体信息关系集合中各个相同待处理实体信息关系的修饰实体信息;
29、根据各个所述待处理实体信息关系集合中各个相同待处理实体信息关系的修饰实体信息,确定各个所述待处理实体信息关系集合的目标实体信息关系。
30、第二方面,本申请还提供一种信息翻译装置,包括:
31、第一确定模块,用于对待翻译文档的句子进行分句,得到各个待处理分句;
32、第二确定模块,用于根据各个所述待处理分句中的人名实体信息和性别实体信息,确定各个目标实体信息关系;
33、第一翻译模块,用于对各个所述待处理分句进行翻译,得到各个译文分句;
34、第二翻译模块,用于根据各个所述目标实体信息关系,纠正各个所述译文分句中的性别实体信息。
35、第三方面,本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述信息翻译方法的步骤。
36、第四方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述信息翻译方法的步骤。
37、本申请提供的信息翻译方法、装置、电子设备及计算机程序产品,在性别信息翻译的过程中,建立了待翻译文档中人名实体信息和性别实体信息之间的目标实体信息关系,在翻译译文分句中的性别实体信息时,将目标实体信息关系作为性别实体信息翻译的上下文信息,根据目标实体信息关系准确翻译出译文分句中的性别实体信息,提升了性别信息翻译的准确性。
1.一种信息翻译方法,其特征在于,包括:
2.根据权利要求1所述的信息翻译方法,其特征在于,所述根据各个所述目标实体信息关系,纠正各个所述译文分句中的性别实体信息的步骤包括:
3.根据权利要求2所述的信息翻译方法,其特征在于,所述根据所述目标处理分句的目标实体信息关系,纠正所述目标译文分句中的性别实体信息的步骤包括:
4.根据权利要求3所述的信息翻译方法,其特征在于,所述根据所述目标性别实体信息,纠正所述目标译文分句中的性别实体信息的步骤包括:
5.根据权利要求1所述的信息翻译方法,其特征在于,所述根据各个所述待处理分句中的人名实体信息和性别实体信息,确定各个目标实体信息关系的步骤包括:
6.根据权利要求5所述的信息翻译方法,其特征在于,所述根据各个所述待处理实体信息关系,确定各个所述目标实体信息关系的步骤包括:
7.根据权利要求6所述的信息翻译方法,其特征在于,所述确定各个所述待处理实体信息关系集合中,各个相同待处理实体信息关系的发生次数的步骤之后,还包括:
8.一种信息翻译装置,其特征在于,包括:
9.一种电子设备,所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的信息翻译方法的步骤。
10.一种计算机程序产品,所述计算机程序产品包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的信息翻译方法的步骤。