专利名称:一种数字键盘文本输入的实时翻译方法及系统的制作方法
技术领域:
本发明涉及一种在文本输入过程中的翻译方法和系统,特别是一种数字键盘文字输入过程中进行实时翻译的方法和系统。本发明适用于手机、小灵通、PDA、掌上电脑、IPTV、机顶盒、游戏机等各种数字产品。
背景技术:
长期以来,语言差异是不同民族、不同文化之间交流的主要障碍。随着全球经济一体化的发展,跨文化、跨民族之间的交流日益频繁,交流的方式也趋于多样化、多语言化、国际化,语言差异产生的影响也显得越来越突出。特别是随着手机、PDA、小灵通等通信终端的普及,通过这些数字产品进行浏览、编辑、查询、收发短信已成为时代的潮流。国际之间的含多语种、不同符号的短信和电子邮件已成为一种趋势。不同语言之间的翻译就显得非常必要和常见。尤其是混合短信的编辑和阅读对数字键盘输入技术提出了更高的要求,支持实时翻译功能已经成为手机等产品中的必然的需求。
然而,现行的数字产品中或是不支持翻译功能,或是在手机等数字产品中添加一个双语词典(如英汉词典),进行单字(词)查询和翻译。但是,这些帮助翻译的词典与输入技术是相互脱离的,并不在一个系统之内。在实际应用中,当编辑信息需要翻译时,就必须先退出信息编辑状态,借助功能键进入翻译菜单,启动翻译程序,记下翻译出来的结果,再进入信息编辑状态,输入先前记下的翻译结果。整个过程操作十分繁琐,翻译的范围只能是词典式词汇翻译,无法选定句子、段落或篇章的翻译范围,实现部分内容翻译或全文翻译等。这种翻译与输入技术相脱离的方法没有从根本上解决人机交互过程中对不同语言文字和信息的处理,难以满足短信编辑、输入、阅读过程中翻译的实际需要。
发明内容
本发明的主要目的是为了打破输入与翻译相互脱离的状况,创新一种输入系统中的翻译功能技术。本发明的创新要点在于输入技术和翻译功能使用同一引擎、同一界面,实现在文本输入的过程中进行实时翻译,并可以根据输入、阅读过程中的需要,进行实时、部分、全文等不同翻译模式的翻译。通过输入、选择、翻译等环节和步骤完成翻译操作。本发明实现了人机交互系统中输入和翻译功能的完美结合,满足日益增多的不同语言、不同文字、不同民族之间的交流的需要,克服跨文化、跨民族交流中因为语言障碍带来的困难。
在计算机内部编码技术中,Unicode的产生使文字在计算机内最基本的处理单元(编码字符)在全球范围内和多种语言中得到统一,使全球语言编码能够建立在统一的平面上。Unicode提供了一个统一的编码空间,不同语言文字占用编码空间的不同部分,并且互不重叠。这种平面分层设计,使得不同语言可以统一编码,并且没有冲突,本发明就是在这种内部码的统一性的基础上,提出了一种利用单一核心引擎、同一界面,在文字输入过程中进行实时翻译的方法和系统。本发明利用上述各种语言之间的统一平面和编码关系,使信息技术处理在计算机内部码之间进行不同语言的转换成为可能。在本发明的方法和系统中不论何种语言或者何种编码方案均以统一的编码(Unicode)储存;无论何种语言,均使用一组统一的标准API(应用程序接口)和单一处理逻辑。通过转换模块,使“单一核心引擎”在同一界面上进行输入过程中的实时翻译,并真正做到程序和数据两者的分离。
本发明单一核心引擎的设计原理和主要技术特征是1)使用一组标准API(应用程序接口)和单一处理逻辑无论什么语言,均使用一组统一的标准API和单一处理逻辑,例如输入均为数字编码,输出均为Unicode编码,因此应用程序编程接口兼容不同语言,引擎的实现也只需要遵循统一的规则处理数字编码串,在Unicode数据库中进行搜索,输出匹配的Unicode编码串。统一的处理逻辑和同一套标准API更加易于调用,更加具有一致性。
2)程序和数据分离无论何种语言,输入均为数字编码,输出均为Unicode编码,因此程序的实现仅与数字编码串和Unicode相关,与具体的语言无关。这样,如果需要加入和支持一种新的语言,仅仅需要加入该语言相关的数据库即可,不需要改动程序。同样,如果需要进行程序升级,仅仅需要更新程序文件,不需要改变已有的数据结构。真正实现了程序和数据分离,数据大小可裁剪。
3)模块化设计本发明中的API解决方案面向各种不同的软硬件平台,系统采用模块化设计,各项功能都是单独的模块,模块之间通过接口相连。这种独特的功能模块机制,使得系统可以根据要求将某些模块插入系统或从系统中移走,也根据嵌入式设备的特性和个性需求量体裁衣。
附图1为本发明系统的输入模块、翻译模块和其它模块的关系示意图;附图2为本发明“实时翻译”模式的流程示意图;附图3为本发明“部分翻译”模式的流程示意图;附图4为本发明“全文翻译”模式的流程示意图;附图5为本发明“实时翻译”模式的示意图例;附图6为本发明“部分翻译”模式的示意图例;附图7为本发明“全文翻译”模式的示意图例;下面将通过具体实施例,结合附图详细说明本发明的技术特征及其优点。
具体实施实例参见附图1,依据本发明单一引擎和模块化的设计原理,在本发明的系统中设置有输入装置、输入模块、翻译模块、显示模块等。该翻译模块与输入模块及其他转换、计算等功能模块并存,并共享系统的语言数据库和其它诸如查询、语法、语义、语用、语境、统计、等相关单元模块。在输入文本的过程中,借助本发明中定义的功能键启动翻译模块、锁定翻译的范围等,可实现在输入的同时可以进行多种语言之间的实时相互翻译。
所述输入装置用于将自然语言输入到手机、PDA、机顶盒、IPTV、遥控器等数字键盘终端设备。所述翻译模块主要包括语言数据库、查询模块、分析模块。所述语言数据库指为翻译功能提供的收录了多种语言词汇的数据库。所述查询模块指实现翻译功能,根据输入的文字或选定的内容在语言数据库中搜索目的语言所对应词汇的程序模块。所述分析模块指基于目的语言的语法、语义、语用、语境等规则,根据输入的多个词汇进行诸多方面分析,来调整翻译结果的程序模块。显示模块则用于显示翻译后的信息。
上述分析模块包含词汇分析模块、概率统计分析模块、语法分析模块、语义分析模块、语用分析模块、语境分析模块。所述概率统计模块是指对翻译文字进行概率统计分析,拆分出词汇;所述词汇分析模块是指对拆分出来的词汇进行分析翻译;所述语法分析模块是指按照目的语言的语法规则对词汇进行组合或添加;所述语义分析模块是指按照目的语言的语义对词汇进行搭配分析;所述语用分析模块是指按照目的语言的特征对翻译结果进行词汇搭配的逻辑判断;所述语境分析是指根据使用者输入的上下文内容,分析语法的正确性、时态的合理性的过程。
本发明提供的语言数据库至少包含两种以上语言,且可以实现多语种之间的互译,在扩充语言数据库的情况下还可以完成某一语言的多种方言之间的互译。在进入本系统时,首先设置翻译的源语种和目的语种。无论上述语言数据库中包含哪些语言,这些数据均采用优化的压缩技术,以便节约存储空间。
为了便于清楚的描述本发明的翻译方法,这里以数字产品手机为例,使用0~9十个数字键进行文字语言的输入,并设定如下功能键1.OK(确认)键信息处于可文本编辑状态下(即文字内容可以通过光标的移动确定输入文字的插入、删除位置),使用该键确定开始选择翻译范围;2.“*”键使用该键启动翻译模块,进行翻译;3.左选键在启动翻译模块的状态下,可以使用该键左向移动光标,以选择翻译内容;4.右选键在启动翻译模块的状态下,可以使用该键右向移动光标,选择和确定翻译内容的范围;5.上选键在启动翻译模块的状态下,可以使用该键向上移动光标,以选择翻译内容;6.下选键在启动翻译模块的状态下,可以使用该键向下移动光标,以选择翻译内容;以上功能键的设定仅仅为举例说明,在实际应用中可以根据需要重新定义。
本发明提出的在数字键盘文本输入过程中进行实时翻译的方法主要有以下三种模式一、实时翻译(参见附图1和2)a.通过数字键盘或触摸屏等输入装置输入编码,得到候选字词;b.通过功能键移动光标选择所需翻译的候选内容;c.按下翻译功能键“*”键,启动翻译模块,查询模块以便对语言数据库进行查询,找到与被翻译内容相匹配的目的词汇。此过程采用了优化的查找算法,以便提高查询和选定的速度;d.在查询过程中,得到一个或多个匹配结果,经过词汇分析模块,得到最合理的词汇,显示在候选区内,选择后使之上屏。在完成翻译后系统会自动恢复到原来的输入模式下。
二、部分翻译(参见附图1和3)a.此模式可以在两种状态下实现①在得到文本信息后,打开文本信息,并使其位于文本编辑状态下(即可以通过光标的移动确定输入文字的插入、删除位置)(转换到文本编辑状态下可以通过一定的方式,如转发信息);②通过数字键盘或触摸屏等输入装置输入编码,得到候选字词,按上屏键使其上屏,重复上述过程,得到一段文本信息,此时位于文本编辑状态下;b.将光标移至到所需翻译的起始位置(或终止位置),按下内容选择键OK键,确定开始选择翻译范围,利用方向键将光标移动到需要翻译文字的终止位置(或起始位置),并将其与不翻译的文字部分区别开来,完成文字翻译范围的选取;c.按下翻译功能键“*”键,启动翻译模块,查询模块便对语言数据库进行查询,找到与之相匹配的目的词汇。此过程采用了优化的查找算法,以提高了查询和选定的速度;d.依次经过词汇分析模块、概率统计分析模块、语法分析模块、语义分析模块、语用分析模块、语境分析模块,最终得到最为合理的翻译语句,并显示在候选行中。
三、全文翻译(参见附图1和4)a.此模式可以在两种状态下实现①收到文本信息的状态在得到文本信息后,打开文本信息,并使其位于文本编辑状态下;②直接输入文本信息的状态通过键盘或触摸屏等设备输入编码,得到候选字词,按上屏键使其上屏,重复上述过程,得到一段文本信息,此时位于文本编辑状态下;b.按OK键确定开始选择翻译范围,在不移动光标的情况下,按翻译功能键“*”键,启动翻译模块,确定翻译全部文本信息,将全部文本信息传送给翻译模块;c.翻译模块接收到信息文字后,查询模块便对语言数据库进行查询,找到与之相匹配的目的词汇。此过程采用了优化的查找算法,以提高了查询速度;d.依次经过词汇分析模块、概率统计分析模块、语法分析模块、语义分析模块、语用分析模块、语境分析模块,最终得到最为合理的翻译语句,并显示在候选行中。
下面结合手机的实例(本文以中英文互译为例),具体说明本发明的翻译方法实施例一实时翻译(参见图5)以翻译“工作”为例,描述实时翻译的过程a.使用拼音输入模式(也可以使用其它模式)先输入“工作”;b.通过方向键移动光标,使“工作”被选中(如图5a所示);c.按“*”键,候选区出现work、job、task、labor、employment等内容(如图5b所示);d.通过方向键移动光标选择需要的翻译,通过OK键选择上屏。
e.在完成翻译后系统自动恢复到原来的拼音输入模式下。
实施例二部分翻译(参见图6)以翻译“周日有空吗?来我家吧,一起吃午饭!”中的“来我家吧”为例,描述部分翻译的过程a.使用拼音输入模式(也可以使用其它模式)先输入“周日有空吗?来我家吧,一起吃午饭!”或在得到信息“周日有空吗?来我家吧,一起吃午饭!”后将其改到可文本编辑状态下(即文字内容可以通过光标的移动确定输入文字的插入、删除位置),如通过转发信息;b.在文本编辑状态下,把光标置于“来”前面,按OK键,确定选择翻译范围的开始,移动方向键使光标到“吧,”后面,此时选择了待翻译的字词“来我家吧,”(以反显其颜色为例),并区别不需翻译文字;c.按翻译功能键“*”键启动翻译模块功能,候选窗口中就显示与该词句对应的翻译“Come to my home”。
实施例三全文翻译(参见图7)以将“我现在忙,稍候联系你”译成英文为例,描述全文翻译的过程a.使用拼音输入模式(也可以使用其它模式)先输入“我现在忙,稍后联系你”或在得到信息“我现在忙,稍后联系你”后将其改到可文本编辑状态下(如通过转发信息);
b.按OK键确定开始选择翻译范围,不移动光标,直接按翻译功能键“*”键,启动翻译模块;c.全文被翻译为“I’m busy now,call you later.”,并显示在候选中。
从以上实例可以看出,本发明的实时翻译系统和方法实现了将文字输入与翻译功能融合在同一引擎、同一系统、同一界面中,使输入和翻译得到了有效结合。可以在输入短信或收到短信时,将该短信中的部分内容翻译成需要的其它语言,克服了语言障碍对不同短信的交流所造成的不便,使不同语言文字的输入、浏览、查询、翻译等能够在同一界面上完成。同时,本发明中翻译功能的操作方法简单,更加人性化、系统化。不仅可以支持实时的翻译,同时支持自选的范围翻译,使短信能够顺利完成交互过程中的部分或通篇翻译,克服了字典式翻译功能的局限性,满足国际短信、不同语言混合短信翻译的需要,使人们相互之间的短信交流更加畅通、自然、和谐。
权利要求
1.一种数字键盘文本输入过程中进行实时翻译的方法,其特征在于该方法包括利用数字键盘输入各种文字信息,该输入均为统一的数字编码;利用一组统一的应用程序接口和单一处理逻辑,按照统一的规则处理数字编码串,在统一编码字符的数据库中进行搜索,输出与输入数字编码串相匹配的编码字符串;在进行各种文字输入的同时,利用辅助功能键的操作,启动同一引擎、同一界面下的翻译功能,将不同语言进行实时的相互翻译。
2.根据权利要求1所述的实时翻译的方法,其特征在于在不同的输入状态下,可选择实时、部分和全文的翻译模式。
3.一种数字键盘文本输入过程中进行实时翻译的系统,其特征在于该系统包括有用于输入多种文字和编辑文本的输入装置,该输入装置包括有数字键及输入模块;与所述输入模块处于同一引擎、同一界面的翻译模块,该翻译模块中包括有用于为翻译功能提供多种语言词汇的语言数据库,用于在数据库中搜索目的语言所对应的词汇和内容的查询模块,用于对翻译内容进行词汇、概率统计、语法、语义、语用、语境等分析,得到最合理的匹配候选的分析模块;用于显示输入及翻译后的信息的显示模块;和用于启动所述翻译模块,选择翻译范围的功能键。
4.根据权利要求3所述的系统,其特征在于所述输入模块中包括有语言模块、词根词缀模块、联想模块和智能模块。
5.根据权利要求3所述的系统,其特征在于所述分析模块中包括有词汇分析模块、概率统计分析模块、语法分析模块、语义分析模块、语用分析模块和语境分析模块。
6.根据权利要求3-5中任一权利要求所述的系统,其特征在于所述各功能模块都是单独的模块,模块之间通过接口相连,可根据需要将某个模块插入系统或从系统中拔出。
全文摘要
一种数字键盘文本输入过程中实现实时翻译的技术方法和系统,其创新要点在于输入技术和翻译功能使用同一引擎、同一界面,实现在文本输入的过程中进行实时翻译,并可以根据输入、阅读过程中的需要,进行实时、部分、全文等不同翻译模式的翻译。通过输入、选择、翻译等环节和步骤完成翻译操作。本发明适用于手机、小灵通、PDA、掌上电脑、IPTV、机顶盒、游戏机等数字产品中。
文档编号G06F17/30GK1987744SQ20051013475
公开日2007年6月27日 申请日期2005年12月21日 优先权日2005年12月21日
发明者王孝军 申请人:北京优耐数码科技有限公司