专利名称:特殊语言现象处理技术的制作方法
技术领域:
本发明涉及机器翻译中的特殊语言现象处理技术,属于机器翻译技术领域。
特殊语言现象指成语、固定结构等。机译系统对特殊语言现象处理能力的强弱是衡量其性能好坏的标志之一。有些机译系统采取单独设立特殊语言现象词典的方法,其结果是不仅难以查找,而且也不便于总结归纳。
本发明的目的旨在提供一种特殊语言现象处理技术,该技术符合人们的思维习惯,便于翻译处理机制查找,可提高特殊语言现象的处理效率。
本发明是通过如下方法实现的一种使用计算机进行的特殊语言现象处理技术,其步骤为(一)在字典中建立特殊语言现象规则规则的形式为<头部>-><上下文相关函数>,<右部>,<转换体>
其中<头部>由构成该特殊语言现象的单词或句子成分组成,<上下文相关函数>部分标明该特殊语言现象应用的上下文语境要求,<右部>指明特殊语言现象的语法及语义等特征信息,<转换体>对应于特殊语言现象的译文;(二)翻译处理机制在分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来;(三)对句子进行归约时,若当前归约单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约;(四)翻译处理算法接收一句子时,对句中与每一个单词有关的特殊语言现象进行如下处理(1)对当前单词下的每一条特殊语言现象规则与原句进行匹配,直至有一条规则匹配成功或全部规则匹配完毕时本算法结束。
(2)对每一条特殊语言现象规则,若其头部均为单词,则只需用该规则直接与原句进行匹配,并判定上下文相关条件是否成立即可;若当前特殊语言现象规则头部含有句子成分,则需要首先对单词部分进行直接进行匹配,匹配成功后再调用翻译处理算法对句子中对应部分进行归约,看归约结果与特殊语言现象规则头部的成分是否能匹配成功。头部匹配成功后,再判定上下文相关条件是否成立。
本发明在词典中加入特殊语言现象信息,即把与具体单词有关的特殊语言现象以规则形式直接存储在特殊语言现象中的主要单词的词条下,这样作不仅符合人们的思维习惯,而且便于翻译处理机制查找,便于分散处理和增强区分多义的能力,还可提高特殊语言现象的处理效率。
以下结合附图和发明实例对本发明作详细描述。
图1是本发明算法流程图。
本发明是使用普通计算机实现的,其步骤为
一、在字典中建立特殊语言现象规则字典中的特殊语言现象等价于一条规则。规则的形式为<头部>-><上下文相关函数>,<右部>,<转换体>
其中<头部>由构成该特殊语言现象的单词或句子成分组成,<上下文相关函数>部分标明该特殊语言现象应用的上下文语境要求,<右部>指明特殊语言现象的语法及语义等特征信息,<转换体>对应于特殊语言现象的译文。
同一个特殊语言现象,如果对应于若干个不同的译文,在词典中就表示为若干个不同的特殊规则。
二、翻译处理机制在分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来。
三、对句子进行归约时,若当前单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约。
四、翻译处理算法接收一句子时,对句中与每一个单词有关的特殊语言现象进行处理的具体算法如下(参见图1,图中将特殊语言现象规则简称为规则)1.置当前特殊语言现象规则下标为0。
2.当前特殊语言现象下标加1,即置当前特殊语言现象规则为下一条特殊语言现象规则。若当前特殊语言现象规则下标对应特殊语言现象规则为空,则当前单词对应特殊语言现象规则匹配失败结束。
3.若当前特殊语言现象规则头部均为单词,则用该规则直接进行匹配,若头部匹配失败,则当前规则失败,转步骤2;若头部匹配成功,则调用上下文相关处理算法判定上下文相关测试条件,若条件成立,则直接对该特殊语言现象进行归约,本过程成功结束;若条件不成立,转步骤2。若当前特殊语言现象规则头部含有句子成分(即非单词),则转步骤4。
4.若当前特殊语言现象规则头部含有句子成分,则先将单词部分进行匹配,匹配失败,转步骤2,否则对句子中对应部分进行归约,若归约结果与特殊语言现象规则头部的句子成分不一致,则当前规则匹配失败,转步骤2;否则,调用上下文相关处理算法判定上下文测试条件,若条件成立,则可对该特殊语言现象进行归约,本过程成功结束;若条件不成立,转步骤2。
下面举例说明本发明。
将句子“They put that question into account.”翻译为中文。
现有字典词条1they NP 他们词条2put VP 放词条3put NP into account->,VP,把NP考虑进去.
词条4that Q 那个词条5question NP 问题现有规则规则1Q NP->,NP,Q NP.
规则2NP VP->,S,NP VP.
其中,词条3为成语。
对句子归约过程(1)用词条1将they归约为NP;(2)对put进行归约时,由于put下有成语,首先匹配该成语。成语中的put...into account与句子中的对应单词可匹配。然后看that qustion是否能归约为短语中的NP。
(3)用词条4将that归约为Q。
(4)用词条5将question归约为NP。
(5)用规则1将Q NP归约为NP,与短语中的句子成分一致。因此,put NPinto account成语匹配成功。用词条3将其归约为VP。对句子的第一次归约结果为NP VP。
(6)用规则2将NP VP归约为S,句子归约成功。
最终译文为“他们把那个问题考虑进去了”。
权利要求
1.一种使用计算机进行的特殊语言现象处理技术,其步骤为(一)在字典中建立特殊语言现象规则规则的形式为<头部>-><上下文相关函数>,<右部>,<转换体>其中<头部>由构成该特殊语言现象的单词或句子成分组成,<上下文相关函数>部分标明该特殊语言现象应用的上下文语境要求,<右部>指明特殊语言现象的语法及语义等特征信息,<转换体>对应于特殊语言现象的译文;(二)翻译处理机制在分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来;(三)对句子进行归约时,若当前单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约;(四)翻译处理算法接收一句子时,对句中与每一个单词有关的特殊语言现象进行处理的具体算法如下(1)对当前单词下的每一条特殊语言现象规则与原句进行匹配,直至有一条规则匹配成功或全部规则匹配完毕时本算法结束;(2)对每一条特殊语言现象规则,若其头部均为单词,则只需用该规则直接与原句进行匹配,并判定上下文相关条件是否成立即可;若当前特殊语言现象规则头部含有句子成分,则需要首先对单词部分进行直接进行匹配,匹配成功后再调用翻译处理算法对句子中对应部分进行归约,看归约结果与特殊语言现象规则头部的成分是否能匹配成功。头部匹配成功后,再判定上下文相关条件是否成立。
全文摘要
本发明技术的步骤为:在字典中建立特殊语言现象规则;分析过程中,首先在字典中查找句子中的每个单词,并将各单词下的所有特殊语言现象规则检索出来;对句子进行归约时,若当前单词下有特殊语言现象规则,则首先对与该单词有关的特殊语言现象进行归约。本发明在词典中加入特殊语言现象信息,这样作不仅符合人们的思维习惯,而且便于翻译处理机制查找,便于分散处理和增强区分多义的能力,还可提高特殊语言现象的处理效率。
文档编号G06F17/28GK1172993SQ9711250
公开日1998年2月11日 申请日期1997年7月2日 优先权日1997年7月2日
发明者陈肇雄 申请人:陈肇雄