1.一种机器翻译引擎测评优选方法,其中所述机器翻译引擎具有多个,其特征在于,所述方法包括:
步骤一、对上传的待翻译文本选择所述待翻译文本的测评字数范围;
步骤二、使用每一个所述机器翻译引擎翻译所述待翻译文本的测评字数范围内的文本,得到对应的译后文本;
步骤三、将所述每一个机器翻译引擎的译后文本根据译文测评、关键字测评和语言模型困惑度测评,得到相应的多个评分;
步骤四、对所述各机器翻译引擎的评分进行加权求和得到所述各机器翻译引擎在所述译后文本上的所述加权和值;
步骤五、选择所述加权和值最高的所述机器翻译引擎输出所述待翻译文件的整篇翻译文本。
2.根据权利要求1所述的机器翻译引擎测评优选方法,其特征在于,其中所述译文测评的步骤为:
1)对所述待翻译文本设置错误类型和错误级别,其中错误类型具有多个子错误类型,以及每个所述错误级别具有相应的罚分分值;
2)对每一个所述译后文本进行修订,对每一处所述修订选择所述子错误类型和所述错误级别,自动生成所述相应的罚分分值;
3)将所述修订中不相同的所述子错误类型对应的所述罚分分值进行求和,得到所述每一个译后文本的评分和值;
4)根据上述评分和值对各所述机器翻译引擎做降序排序;
5)在上述降序排序中,所述各机器翻译引擎的序列即为该机器翻译引擎在译文测评上的得分。
3.根据权利要求1所述的机器翻译引擎测评优选方法,其特征在于,其中所述关键字测评的步骤为:
1)由专业译员给出所述待翻译文本应包含的关键词;所述译后文本、与所述关键字共同组成测评集;
2)检测关键字在所述各机器翻译结果中是否出现,若未出现减一分,其中各机器翻译引擎的初始分数为0;
3)根据上述评分对所述各机器翻译引擎做升序排序;
4)在上述升序排序中,所述各机器翻译引擎的序列即为该机器翻译引擎在关键字测评上的得分。
4.根据权利要求1所述的机器翻译引擎测评优选方法,其特征在于,其中所述语言模型困惑度测评的步骤为:
1)利用所述各机器翻译引擎翻译得到所述译后文本,形成测试集;
2)利用已训练好的的神经网络语言模型对各机器翻译引擎的测试集进行评分;
3)根据上述评分,对所述各机器翻译引擎做升序排序;
4)在上述升序排序中,所述各机器翻译引擎的序列即为该机器翻译引擎在语言模型困惑度测评上的得分。
5.根据权利要求1所述的机器翻译引擎测评优选方法,其特征在于,所述译文测评、关键字测评和语言模型困惑度测评在加权求和的权重分别设置为0.4、0.3、0.3。
6.一种机器翻译引擎测评优选系统,其中所述机器翻译引擎具有多个,其特征在于,所述系统包括:
选择模块,用于对上传的待翻译文本选择所述待翻译文本的测评字数范围;
初始翻译模块,使用每一个所述机器翻译引擎翻译待翻译文本的测评字数范围内的文本,得到对应的译后文本;
测评模块,用于将所述每一个机器翻译引擎的译后文本根据译文测评、关键字测评和语言模型困惑度测评,得到相应的多个评分;
计算模块,用于对所述各机器翻译引擎的评分进行加权求和得到所述各机器翻译引擎在所述译后文本上的所述加权和值;
翻译模块,用于选择所述加权和值最高的所述机器翻译引擎输出所述待翻译文件的整篇翻译文本。
7.根据权利要求6所述的机器翻译引擎测评优选方法,其特征在于,其中所述译文测评的步骤为:
1)对所述待翻译文本设置错误类型和错误级别,其中错误类型具有多个子错误类型,以及每个所述错误级别具有相应的罚分分值;
2)对每一个所述译后文本进行修订,对每一处所述修订选择所述子错误类型和所述错误级别,自动生成所述相应的罚分分值;
3)将所述修订中不相同的所述子错误类型对应的所述罚分分值进行求和,得到所述每一个译后文本的评分和值;
4)根据上述评分和值对各所述机器翻译引擎做降序排序;
5)在上述降序排序中,所述各机器翻译引擎的序列即为该机器翻译引擎在译文测评上的得分。
8.根据权利要求6所述的机器翻译引擎测评优选方法,其特征在于,其中所述关键字测评的步骤为:
1)由专业译员给出所述待翻译文本应包含的关键词;所述译后文本、与所述关键字共同组成测评集;
2)检测关键字在所述各机器翻译结果中是否出现,若未出现减一分,其中各机器翻译引擎的初始分数为0;
3)根据上述评分对所述各机器翻译引擎做升序排序;
4)在上述升序排序中,所述各机器翻译引擎的序列即为该机器翻译引擎在关键字测评上的得分。
9.根据权利要求6所述的机器翻译引擎测评优选方法,其特征在于,其中所述语言模型困惑度测评的步骤为:
1)利用所述各机器翻译引擎翻译得到所述译后文本,形成测试集;
2)利用已训练好的的神经网络语言模型对各机器翻译引擎的测试集进行评分;
3)根据上述评分,对所述各机器翻译引擎做升序排序;
4)在上述升序排序中,所述各机器翻译引擎的序列即为该机器翻译引擎在语言模型困惑度测评上的得分。
10.根据权利要求6所述的机器翻译引擎测评优选方法,其特征在于,所述译文测评、关键字测评和语言模型困惑度测评在加权求和的权重分别设置为0.4、0.3、0.3。