机器翻译方法和装置制造方法

文档序号：6634053阅读：163来源：国知局

机器翻译方法和装置制造方法
【专利摘要】本发明提出一种机器翻译方法和装置，该机器翻译方法包括获取待翻译的文本；获取预先建立的机器翻译模型，其中，所述机器翻译模型是根据外部世界场景信息建立的；采用所述机器翻译模型，对所述待翻译的文本进行翻译，得到翻译结果。该方法能够提高翻译结果的准确度。
【专利说明】机器翻译方法和装置

【技术领域】
[0001] 本发明涉及数据处理【技术领域】，尤其涉及一种机器翻译方法和装置。

【背景技术】
[0002] 当需要进行翻译时，翻译设备可以采用机器翻译模型，对词汇进行翻译，得到翻译结果。传统的机器翻译模型，从人工构建的双语训练数据出发，使用统计的方法来计算出翻译概率和目标语言的语言模型概率。
[0003] 但是，采用传统的机器翻译模型难以确定准确的翻译结果，例如，对于英文句子 "give me a shot"，存在多种合理的翻译结果，例如，"给我照相"，"给我打一枪"，"向我击球进攻"等。而单独看这个输入的句子"give me a shot"，采用目前的传统的机器翻译模型是无法确定哪个翻译结果是最优的。

【发明内容】

[0004] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005] 为此，本发明的一个目的在于提出一种机器翻译方法，该方法可以提高翻译结果的准确度。
[0006] 本发明的另一个目的在于提出一种机器翻译装置。
[0007] 为达到上述目的，本发明第一方面实施例提出的机器翻译方法，包括：获取待翻译的文本；获取预先建立的机器翻译模型，其中，所述机器翻译模型是根据外部世界场景信息建立的；采用所述机器翻译模型，对所述待翻译的文本进行翻译，得到翻译结果。
[0008] 本发明第一方面实施例提出的机器翻译方法，通过采用基于外部世界场景信息确定的机器翻译模型进行翻译，可以在翻译时考虑外部世界场景信息因素，得到更符合外部世界场景的翻译结合，提高翻译结果的准确度。
[0009] 为达到上述目的，本发明第二方面实施例提出的机器翻译装置，包括：第一获取模块，用于获取待翻译的文本；第二获取模块，用于获取预先建立的机器翻译模型，其中，所述机器翻译模型是根据外部世界场景信息建立的；翻译模块，用于采用所述机器翻译模型，对所述待翻译的文本进行翻译，得到翻译结果。
[0010] 本发明第二方面实施例提出的机器翻译装置，通过采用基于外部世界场景信息确定的机器翻译模型进行翻译，可以在翻译时考虑外部世界场景信息因素，得到更符合外部世界场景的翻译结合，提高翻译结果的准确度。
[0011] 本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

【专利附图】

【附图说明】
[0012] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：
[0013] 图1是本发明一实施例提出的机器翻译方法的流程示意图；
[0014] 图2是本发明实施例中建立机器翻译模型的流程示意图；
[0015] 图3是本发明实施例中翻译结果的示意图；
[0016] 图4是本发明另一实施例提出的机器翻译方法的流程示意图；
[0017] 图5是本发明实施例中采用一种用户设备时的机器翻译方法的流程示意图； [0018] 图6是本发明实施例中采用另一种用户设备时的机器翻译方法的流程示意图； [0019] 图7是本发明实施例中一种应用场景示意图；
[0020] 图8是本发明另一实施例提出的机器翻译方法的流程示意图；
[0021] 图9是本发明另一实施例提出的机器翻译装置的结构示意图；
[0022] 图10是本发明另一实施例提出的机器翻译装置的结构示意图；
[0023] 图11是本发明另一实施例提出的机器翻译装置的结构示意图。

【具体实施方式】
[0024] 下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0025] 图1是本发明一实施例提出的机器翻译方法的流程示意图，该方法包括：
[0026] Sll :获取待翻译的文本。
[0027] 可选的，所述获取待翻译的文本，包括：
[0028] 接收文本信息，将所述文本确定为待翻译的文本；或者，
[0029] 接收语音信息，对所述语音信息进行语音识别，将语音识别结果确定为待翻译的文本；或者，
[0030] 接收图片信息，对该图片信息进行光学字符识别（Optical Character Recognition，OCR)识别，将OCR识别结果确定为待翻译的文本。
[0031] 待翻译的文本可以包括至少一个字符，例如，待翻译的文本是字，词或者句子。
[0032] S12:获取预先建立的机器翻译模型，其中，所述机器翻译模型是根据外部世界场景信息建立的。
[0033] 可选的，Sll之前还可以包括：建立机器翻译模型。
[0034] 参见图2,所述建立机器翻译模型可以包括：
[0035] S21 :获取外部世界场景信息。
[0036] 其中，可以采用用户使用的设备，对所述用户所在外部世界场景进行识别，得到所述外部世界场景信息，所述用户使用的设备包括：可穿戴设备，或者，移动设备。移动设备例如智能手机，平板电脑等。
[0037] 例如，采用用户使用的设备上的摄像头，对外部世界场景进行拍摄，得到图片，之后对图片进行识别，可以得到外部世界场景信息，外部世界场景信息例如为外部世界场景中包含的事物的分类信息，例如，外部世界场景中包括人脸，相机等信息时，可以确定分类信息是摄影；或者，外部世界场景中包括枪械，军服等信息时，可以确定分类信息是军事；或者，外部世界场景中包括球拍，球棒等信息时，可以确定分类信息是体育运动。
[0038] S22 :建立语言模型以及建立短语翻译模型，其中，所述语言模型和/或所述短语翻译模型是根据所述外部世界场景信息建立的。
[0039] 其中，语音模型可以是对传统的n元（n-gram)语言模型进行处理后得到的。为了更好的理解本发明，首先对现有技术中的传统n元语言模型进行说明。
[0040] n-gram语言模型（n元语言模型）中当前词出现的概率仅和其左边的n-1个词有关系。当n取1、2、3时，n-gram模型分别称为unigram( -元语言模型）、bigram(二元语言模型）和trigram语言模型（三元语言模型）。n越大，语言模型越准确，计算也越复杂，计算量也越大。最常用的是bigram，其次是unigram和trigram，n取大于等于4的情况较少。当n-gram语言模型用到中文网页的时候，得到汉语n元语言模型；当n-gram语言模型用到英文网页的时候，得到英语n元语言模型。例如当n取值为2的时候，当前词的出现的概率仅和其前一个词有关系。例如对于句子：
[0041] S =张三董事长发表了四个优先重要指示的讲话。
[0042] 在2元语言模型下，该句子的概率（衡量该句子的正确性的度量）为：
[0043] P⑶=P(张三|〈s>)P(董事长I张三）P(发表I董事长）P(了 I发表）P(四个了）P(优先I四个）P(重要I优先）P(指示I重要）P(的I指示）P(讲话I的）P(。I讲话）P(〈/s>|。）
[0044] 这里<s>和</s>，是两个人工构造的词，分别代表了句子的开始和结尾。其目的是判断"张三"作为句子开头词的概率，和"。"句号作为句子接尾词的概率。
[0045] 如果是在3元语言模型下，该句子的概率是：
[0046] P (S) = P (张三I <s>) P (董事长I <s>,张三）P (发表I张三，董事长）P (了 I董事长，发表）P(四个I发表，了）P(优先I 了，三个）P(重要I四个，优先）P(指示I优先，重要）P(的I重要，指示）P(讲话I指示，的）P(。I的，讲话）P(〈/s>|讲话。）
[0047] 这里，2元模型中一个概率的计算方法为：
[0048] P (董事长I张三）=count (张三董事长）/count (张三）
[0049] 分子是，"张三董事长"在训练语料（例如大规模网络语料）中出现的频次；分母是"张三"在训练语料中出现的频次。
[0050] 相应地，3元模型中一个概率的计算公式为：
[0051] P (发表I张三，董事长）=count (张三董事长发表）/count (张三董事长）
[0052] 这里的分子是"张三董事长发表"在训练语料中出现的频次，而分母是"张三董事长"在训练语料中出现的频次。
[0053] 上面是对传统的n元语言模型的描述。
[0054] 本实施例中，可以采用外部世界场景信息确定语言模型，可以称为基于外部世界场景信息的n元语言模型，本实施例的机器翻译模型中最终采用的语言模型可以是用基于外部世界场景信息的n元语言模型替代传统的n元语言模型，或者，可以根据基于外部世界场景信息的n元语言模型和传统的n元语言模型得到处理后的语言模型，将该处理后的语言模型确定为机器翻译模型中最终采用的语言模型。
[0055] 本实施例中，基于外部世界场景信息的n元语言模型的数学建模公式可以是：

【权利要求】
1. 一种机器翻译方法，其特征在于，包括：获取待翻译的文本；获取预先建立的机器翻译模型，其中，所述机器翻译模型是根据外部世界场景信息建立的；采用所述机器翻译模型，对所述待翻译的文本进行翻译，得到翻译结果。
2. 根据权利要求1所述的方法，其特征在于，还包括：建立所述机器翻译模型，所述建立所述机器翻译模型，包括：获取外部世界场景信息；建立语言模型以及建立短语翻译模型，其中，所述语言模型和/或所述短语翻译模型是根据所述外部世界场景信息建立的；根据所述语言模型和所述短语翻译模型，建立所述机器翻译模型。
3. 根据权利要求2所述的方法，其特征在于，当所述语言模型是根据所述外部世界场景信息建立时，所述建立语言模型，包括：根据所述外部世界场景信息建立基于外部世界场景信息的语言模型，并将所述基于外部世界场景信息的语言模型确定为用于建立机器翻译模型的语言模型；或者，根据所述外部世界场景信息建立基于外部世界场景信息的语言模型，以及，获取传统的语言模型，根据所述基于外部世界场景信息的语言模型和所述传统的语言模型，确定用于建立机器翻译模型的语言模型。
4. 根据权利要求3所述的方法，其特征在于，所述根据所述基于外部世界场景信息的语言模型和所述传统的语言模型，确定用于建立机器翻译模型的语言模型，包括：对所述基于外部世界场景信息的语言模型和所述传统的语言模型进行线性对数处理，将线性对数处理后的模型确定为用于建立机器翻译模型的语言模型。
5. 根据权利要求2所述的方法，其特征在于，所述获取外部世界场景信息，包括：采用所述用户使用的设备，对所述用户所在外部世界场景进行识别，得到所述外部世界场景信息，所述用户使用的设备包括：可穿戴设备，或者，移动设备。
6. 根据权利要求1-5任一项所述的方法，其特征在于，所述获取待翻译的文本，包括：接收文本信息，将所述文本确定为待翻译的文本；或者，接收语音信息，对所述语音信息进行语音识别，将语音识别结果确定为待翻译的文本；或者，接收图片信息，对所述图片信息进行OCR识别，将OCR识别结果确定为待翻译的文本。
7. 根据权利要求6所述的方法，其特征在于，所述待翻译的文本是非用户语言，翻译结果是用户语言，所述方法还包括：获取用户输入的用户语言的输入语音，所述输入语音包括：当前输入的输入语音，和/ 或，历史输入的输入语音；对所述用户语言的输入语音进行语音识别，得到语音识别结果；根据所述语音识别结果和所述翻译结果，对所述机器翻译模型进行修正。
8. -种机器翻译装置，其特征在于，包括：第一获取模块，用于获取待翻译的文本；第二获取模块，用于获取预先建立的机器翻译模型，其中，所述机器翻译模型是根据外部世界场景信息建立的；翻译模块，用于采用所述机器翻译模型，对所述待翻译的文本进行翻译，得到翻译结果。
9. 根据权利要求8所述的装置，其特征在于，还包括：用于建立所述机器翻译模型的建立模块，所述建立模块包括：第一单元，用于获取外部世界场景信息；第二单元，用于建立语言模型以及建立短语翻译模型，其中，所述语言模型和/或所述短语翻译模型是根据所述外部世界场景信息建立的；第三单元，用于根据所述语言模型和所述短语翻译模型，建立所述机器翻译模型。
10. 根据权利要求9所述的装置，其特征在于，当所述语言模型是根据所述外部世界场景信息建立时，所述第二单元具体用于：根据所述外部世界场景信息建立基于外部世界场景信息的语言模型，并将所述基于外部世界场景信息的语言模型确定为用于建立机器翻译模型的语言模型；或者，根据所述外部世界场景信息建立基于外部世界场景信息的语言模型，以及，获取传统的语言模型，根据所述基于外部世界场景信息的语言模型和所述传统的语言模型，确定用于建立机器翻译模型的语言模型。
11. 根据权利要求10所述的装置，其特征在于，所述第二单元进一步具体用于：对所述基于外部世界场景信息的语言模型和所述传统的语言模型进行线性对数处理，将线性对数处理后的模型确定为用于建立机器翻译模型的语言模型。
12. 根据权利要求9所述的装置，其特征在于，所述第一单元具体用于：采用所述用户使用的设备，对所述用户所在外部世界场景进行识别，得到所述外部世界场景信息，所述用户使用的设备包括：可穿戴设备，或者，移动设备。
13. 根据权利要求8-12任一项所述的装置，其特征在于，所述第一获取模块具体用于：接收文本信息，将所述文本确定为待翻译的文本；或者，接收语音信息，对所述语音信息进行语音识别，将语音识别结果确定为待翻译的文本；或者，接收图片信息，对所述图片信息进行OCR识别，将OCR识别结果确定为待翻译的文本。
14. 根据权利要求13所述的装置，其特征在于，所述待翻译的文本是非用户语言，翻译结果是用户语言，所述装置还包括：修正模块，用于获取用户输入的用户语言的输入语音，所述输入语音包括：当前输入的输入语音，和/或，历史输入的输入语音；对所述用户语言的输入语音进行语音识别，得到语音识别结果；根据所述语音识别结果和所述翻译结果，对所述机器翻译模型进行修正。
【文档编号】G06F17/28GK104391839SQ201410641792
【公开日】2015年3月4日申请日期:2014年11月13日优先权日:2014年11月13日
【发明者】吴先超申请人:百度在线网络技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴先超;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：基于陀螺仪行为特征的智能手机用户身份认证方法
上一篇：网络搜索结果的呈现方法和装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。