基于rnn模型的机器翻译方法和装置的制造方法
【技术领域】
[0001]本申请涉及计算机领域,具体涉及机器翻译领域,尤其涉及基于RNN模型的机器翻译方法和装置。
【背景技术】
[0002]机器翻译是利用机器对用户输入的待翻译语句进行翻译得到目标语句的技术。机器翻译技术基于以下原理:将源语句到目标语句的翻译视为一个概率问题,任何一个目标语言句子都有可能是任何一个源语言句子的译文,机器翻译的任务为查找出概率最大的目标语句作为源语句的翻译结果。在机器翻译技术中,利用循环神经网络RNN进行翻译是被广泛使用的一种机器翻译技术。然而,在使用循环神经网络RNN对源语句进行翻译时,由于词表的庞大,每次计算均需计算词表中所有词语的输出概率,从而造成翻译效率较低。
【发明内容】
[0003]本申请提供了一种基于RNN模型的机器翻译方法和装置,用于解决上述【背景技术】部分存在的技术问题。
[0004]第一方面,本申请提供了基于RNN模型的机器翻译方法,该方法包括:接收输入的待翻译语句,待翻译语句由待翻译词组成;确定待翻译词对应的候选词集合,候选词为待翻译词对应的翻译结果,候选词集合基于预先查找出的候选词生成;第一循环神经网络RNN模型基于待翻译词对应的词向量,生成用于表征待翻译语句的语义的高维向量;第二循环神经网络RNN模型基于高维向量以及候选词集合,确定待翻译语句对应的翻译语句。
[0005]第二方面,本申请提供了基于RNN模型的机器翻译装置,该装置包括:接收单元,配置用于接收输入的待翻译语句,待翻译语句由待翻译词组成;确定单元,配置用于确定待翻译词对应的候选词集合,候选词为待翻译词对应的翻译结果,候选词集合基于预先查找出的候选词生成;生成单元,配置用于第一循环神经网络RNN模型基于待翻译词对应的词向量,生成用于表征待翻译语句的语义的高维向量;翻译单元,配置用于第二循环神经网络RNN模型基于高维向量以及候选词集合,确定待翻译语句对应的翻译语句。
[0006]本申请提供的基于RNN模型的机器翻译方法和装置,通过接收输入的待翻译语句,待翻译语句由待翻译词组成;确定待翻译词对应的候选词集合,候选词为待翻译词对应的翻译结果,候选词集合基于预先查找出的候选词生成;第一循环神经网络RNN模型基于待翻译词对应的词向量,生成用于表征待翻译语句的语义的高维向量;第二循环神经网络RNN模型基于高维向量以及候选词集合,确定待翻译语句对应的翻译语句。实现了在利用RNN模型进行翻译时,仅通过计算候选词的输出概率从而得到待翻译语句的翻译结果,提升了翻译速度。
【附图说明】
[0007]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0008]图1示出了适用于本申请的基于RNN模型的机器翻译方法的示例性系统架构;
[0009]图2示出了根据本申请的基于RNN模型的机器翻译方法一个实施例的流程图;
[0010]图3示出了待翻译词与候选词的对应关系;
[0011]图4示出了本申请的基于RNN模型的机器翻译方法的整体流程图;
[0012]图5示出了根据本申请的基于RNN模型的机器翻译装置的一个实施例的结构示意图。
【具体实施方式】
[0013]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0014]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0015]请参考图1,其示出了适用于本申请的基于RNN模型的机器翻译方法的示例性系统架构100。在图1中,示出了输入端RNN(Recurrent Neural Network,循环神经网络)模型101,以及输出端RNN模型102。输入端RNN模型101的输出结果作为输出端RNN模型102的输入。下面以待翻译语句为“how is the weather today ? ”为例,说明利用输入端RNN模型101以及输出端RNN模型102对待翻译语句进行翻译得到翻译语句的原理:
[0016]首先由输入端RNN模型101读取待翻译语句“how is the weather today ? ”,分别确定待翻译语句中的“110?”、“化”、“访6”、、册让郎”、“切(1&7”、“?”等词语各自对应的词向量。然后可以基于上述词语各自对应的词向量、输入端RNN模型101的输出层与隐藏层之间的连接矩阵,以及输入端RNN模型101的隐藏层与输出层之间的连接矩阵,得到表征整个待翻译语句语义的高维向量H。在图1中,1.73*10 5、2.64*10 4、7.83*10 5等数值为高维向量中的单元值示例。在整个翻译过程中,可以将输入端RNN模型101基于待翻译词对应的词向量生成高维向量H的过程称之为对待翻译语句的“理解”步骤。在通过输入端RNN模型101得到表征整个待翻译语句的语义的高维向量H之后,可以将高维向量H输入到输出端RNN模型102,然后由输出端RNN模型102基于高维向量H以及在当前预测的词语之前已经输出的词语,逐一计算词库中的词语的输出概率,然后将输出概率最大的词语进行输出。例如,“how is the weather today ? ”对应的译文为“今天的天气怎么样? ”。假如利用输出端RNN模型102已经输出词语为“今天”、“的”,此时需要预测下一个输出词语。输出端RNN模型102会基于表征整个待翻译语句的语义的高维向量H以及当前预测的词语之前已经输出的词语“今天”、“的”,分别计算词表中的每一个词语的输出概率,最后将输出概率最大的词语“天气”输出。在整个翻译过程中,可以将输出端RNN模型102基于整个待翻译语句的语义来预测下一个输出词的过程称之为翻译语句的生成过程。
[0017]请参考图2,其示出了根据本申请的基于RNN模型的机器翻译方法的一个实施例的流程200。该方法包括以下步骤:
[0018]步骤201,接收输入的待翻译语句,待翻译语句由待翻译词组成。
[0019]在本实施例中,在接收到待翻译语句之后,可以首选确定待翻译语句中的待翻译词。例如,当待翻译语句为“how is the weather today ? ”时,则待翻译词包括how、is、the、weather、today、?等词语。可选地,还可以预先可以对待翻译语句进行分词操作、词性标注操作、命名实体识别操作等操作,从而将待翻译语句划分为多个待翻译词。
[0020]在本实施例的一些可选地实现方式中,待翻译语句通过以下步骤生成:接收输入的语音信息;将语音信息转化为对应的文字信息;将文字信息作为待翻译语句。在本实施例中,可以首先接收语音信息,然后将语音信息转化为文字信息,将文字信息作为待翻译语句进行翻译,从而实现语音翻译。
[0021]步骤202,确定待翻译词对应的候选词集合。
[0022]在本实施例中,候选词为待翻译词对应的翻译结果,候选词集合基于预先查找出的候选词生成。可以预先获取历史双语互译信息,然后对历史双语互译信息中,待翻译词与译文的对应次数进行统计,挑选出互译次数大于预设数量阈值的译文作为待翻译词对应的候选词,聚合待翻译词对应的候选词,生成候选词集合。
[0023]在本实施例的一些可选地实现方式中,确定待翻译词对应的候选词集合包括:从双语翻译词典中查找出与待翻译词相关联的互译信息,互译信息包括待翻译词以及其对应的至少一个翻译结果;将翻译结果选取为候选词,生成候选词集合。在本实施例中,还可以从翻译作品以及从互联网上获取的双语新闻、双语学习资料中查找出与待翻译词相关联的互译信息。
[0024]请参考图3,其示出了待翻译词与候选词的对应关系。在每一个待翻译词对应多个候选词。可以通过双语词典,查找出待翻译词对应的所有翻译结果即候选,然后将候选词进行聚合,生成待翻译词对应的候选词集合。