专利名称:数字键盘中印地语的智能输入技术的制作方法
技术领域:
本发明涉及一种数字键盘中印地语的智能输入技术,尤其适用于具有数字小键盘的移动电话以及通过数字小键盘输入文本信息的终端设备,譬如手机、PDA、遥控器、税控收款机、游戏机、学习机等。
背景技术:
印地语作为印度的官方语言之一,仅次于汉语、英语、西班牙语、俄语。
其非常复杂,不次于汉语,有43个辅音,11个元音,每个辅音和元音均可构成“字母组合”,再和其他“字母组合”结合构成“单词”。印地语具有丰富的构词手段,因而具有构成各种新词的巨大能力。另外,印地语的名词和形容词具有性(阴性和阳性)、数(单数和复数)、形式(后面不带后置词的形式和后面带后置词时所用的形式)的变化,代词的形式变化较名词复杂,因为不同的代词有不同的形式变化,动词的语法形式更为复杂,除了上述特点之外,还有时、体、态、式等变化。这些特点给印地语的输入带来了极大的不便,使印度当地的很多人们只会说而不会书写。
随着通信的迅速发展,手机等移动产品的大量涌现,到2002年末,使用印地语的移动用户已达到970万,到2008年,预计用户将增至1.2亿,而短信成为手机增值服务的最重要的功能,已得到广泛的应用,据估计,每天发出的短信有2500万条,这在很大程度上促进了短信的发展。
根据印地语语言的特点和构词规律,现有手机等数字小键盘中的印地语输入技术给键位作了设置,由于有10个辅音不常用,因此把33个辅音、11个元音及变化形态分布在12个键上,有的键位还作为功能键使用,使每个键上分布的字母很多,有的甚至多于5个,这样就使字母组合时重码率高等,而现有的印地语输入技术没有从根本上解决问题,主要体现在以下几个方面1.采用多次按键输入多次按键指除每个键上分布的首字母外都需多次按键,对于每个字母,在每个键上的位置就是所需按键的次数,字母之间依次构成“字母组合”进而生成“单词”,如输入 (水)”,此单词是出组合而成,根据字母所在的键位,需连续按一次“5”键,一次“8”键,五次“4”键,三次“8”键,共需10键。此外,由于印地语时态、人称、单复数、构词等复杂性,多次按键的方法就更加不直观、按键次数更多。
有时输入一个简单的句子,连续按高达50键以上,如 (欢迎来我家)”,共需按59键才可完成,这样一来会严重阻碍短信业务的发展。
2.以印地语字母为编码码元指在输入过程中,以字母为码元进行编码,编码区显示字母,根据输入的字母结合成匹配的单词,罗列在候选区中,而没有根据高频先见的顺序显示。如输入 (水)”,先按 对应的数字键5,编码区显示 接着按 对应的数字键8,编码区显示 的组合,依次类推。由于印地语键盘上分布的字母较多,字母结合的单词也就有很多,这样在选择单词时需要多次选择,多次翻屏,增加了按键次数。另外,在其他语言模式下(如英语),仍然以字母作为码元,如输入“book”,按“b”对应的数字键2,编码区显示“b”。由于各个语言编码的码元不同,在不同模式之间转换时,只能先转换到相应模式下才能输入单词,从根本上不能达成输入一体化。
3.通过移动光标进行选择光标是输入技术中锁定候选项的重要工具,多数被设定在当前屏候选区的左侧,有的在中间,且只能锁定一个候选项,当光标锁定的不是所需的候选项时,现有技术采用通过左、右方向键移动光标到所需的候选项上,然后按确认键才可上屏,这样的操作较繁琐,按键次数较多,选择不方便。
4.基本没有预测功能根据上述介绍,现有输入技术只是根据输入的字母结合成匹配的单词,输入几个字母作为码元,在结合的单词中就只有这几个字母,而没有根据单词组合的规则预测出可能的单词,这样要输入一个单词,就必须输入此单词的所有码元。
5.没有联想在现有输入技术中,以字母为码元进行编码,通过输入字母才能结合单词,因此选择确认单词后候选区中没有联想,对于一个词组,只能一个一个单词输入,逐字选择确认。为了解决这样输入带来的不便,有的技术提供了单字联想,即确认单词后候选区中显示与其匹配的单字。但在印地语中,有很多常用的词组、短语、甚至短句。其本身的复杂性在输入单词时需按键次数很多,单字联想也不能解决输入按键次数多的问题。
6.存储空间很大印地语本身的习惯规则使其具有非常丰富的变体形式(如前缀、后缀、不规则动词等),如一个动词的变体形式就可能有40多种。现有技术除了收录词根外,还把变体形式也都收录在词汇库中,就需要很大的存储空间,一般的终端设备很难达到它的存储要求。另外,复杂的变体形式经常被忘记怎样拼写,因此无法输入正确的单词,不能顺利地完成当前操作。
7.在混合短信中转换模式复杂国际之间的交流使人们经常往来于各国之间,含有英语、印地语、数字等多种文字和符号的混合信息非常普遍,而现有输入技术需分别转换到相应的输入模式下才能完成,输入数字时也需要转换到单独的数字模式下,且数字上屏后没有联想,而数字经常有量词、符号等跟随,如“10 (点)”, (分钟)”等,且其他语言模式之间也需要先转换,再输入,而这种输入模式转换的过程比较繁琐,增加操作步骤和按键次数,影响了输入速度,并且使输入不连贯。
可见,现有输入技术具有的上述特点,已不能与高速发展的通信行业相适应,这就迫切需要一种智能的印地语输入技术来满足时代的发展。
发明内容
本发明的目的是为了弥补现有数字键盘印地语输入技术中按键次数多、没有预测和联想、操作复杂等不足,提供一套高效实用、界面同一、操作简单、更符合数字键盘、特别是数字小键盘印地语特点的智能输入技术。本发明以手机小键盘为例。
本发明把手机小键盘的12个键分布如下1-7上分布了33个辅音字母,1 2 3 4 5 6 7 数字键8上分布了10个元音字母,8 由于元音字母在组合过程中形态会发生变化,所以数字键9上面设置了元音字母的变化形态(有的叫短元音),9 数字键0 是特殊元音, 既不是元音也不是辅音,但在某些单词中必须出现。其他的键作为不同的功能键使用。
本发明的特点主要体现在以下几个方面1.以数字为中心,模块化设计,一次按键为了解决现有技术中以字母为码元输入不统一的问题,本发明创新了以数字为中心,采用模块化设计。在任何一种语言模式下,输入时都以数字为码元进行编码,只需根据语言的基本组合规律,直接、连续按所需字母所在的数字键,无论数字键上有几个字母,每个字母只需按一键,无需在一个键上的几个字母间进行多次按键确认所需的字母。在编码区,都是用数字0-9来显示当前已输入的文字、数字等编码,而非这些字母本身,如输入“ (来)”,按字母所在的数字键为849,编码区显示数字849(见图3中3-2),而非字母 系统会根据所按数字键对应的字母自动生成相匹配的候选内容,在候选区以高频先见的顺序显示“ (来), (来), (阿努布(男孩名)), (高兴), (灵魂), (孤独)(见图3中3-4)”。
本发明以数字为中心,除了以数字作为码元进行编码,编码区显示数字外,每个候选项都有数字序号与其对应(见图3中3-6),按所需字词对应数字序号的数字键,将其直接上屏,如本例中按“ (来)”对应的数字键1,即可上屏,而无需借助方向键移动光标进行选择,从而减少了移动光标带来的按键次数。
另外,在任何输入模式下,由于编码区以数字显示,无论编码区的数字对应有无候选,或候选内容如何,借助“*”键使编码区的数字直接上屏,而无需转换到数字模式下输入,这也是本发明的创新特点之一。
本发明提供了同步多行显示,指在输入过程中,每增加或减少一键,候选区中就自动变化成与当前编码相匹配的候选并以高频先见的顺序显示。增加显示数量,使较常用的字词、所需的字词出现在当前屏,当前屏不能完全显示合理匹配时,在候选区中有翻页符,通过尽量少的翻屏即可找到候选内容;浮动显示,指显示结果区的位置随着光标的移动而移动,且保持同步,更加人性化,这样就不会由于手机显屏小、输入内容多而导致候选内容覆盖所输入的信息。
另外,本发明多种功能特点均采用模块化设计,方便裁剪和移植。
2.混合短信中各种输入模式之间快速临时转换任何含有数字、符号、多种语言等的混合短信已成为普遍现象,手机等移动产品中都具有两种以上的输入模式,本发明编码区显示数字的特点使同一数字编码在不同的语言模式下显示不同语言的候选。在当前语言模式下输入其它语言,均可在当前模式下先按所需内容对应的数字键,再按“#”键快速转换到所需语言模式,系统根据数字编码自动转换成此语言模式下相匹配的候选内容,并依据高频先见的顺序显示在候选区中,选择上屏后,系统自动恢复到原来的语言模式。这种临时转换的功能实现了多种输入模式之间的无缝转换,使输入一体化。
3.智能预测功能本发明根据印地语语言的构词特点,提供了预测功能,无需完成所有字母的按键,根据所按字母及组合规则,系统自动预测匹配出最合适的单词,甚至短语、短句,并以高频先见的顺序出现在候选区中,选择上屏即可。如果未全部输入使所需的候选不在当前屏出现,可以继续输入下一个字母对应的数字键,使所需内容优先出现,提高了输入速度。另外,印地语有时态、性(阴性、阳性)、单复数等变化,系统根据上下文信息,智能分析预测出接下来输入词汇最合理的形式,减少了按键次数,大大提高了输入速度。
4.强大的联想功能印地语中有常用的词组、短语、甚至短句,一个一个单词的输入比较繁琐,本发明提供的联想功能从现有技术的无联想、单字联想扩展到词组、短语、短句的联想,输入第一个单词上屏,同时系统自动联想出与该词匹配的常用单字、词组、短语、短句,并显示在候选区中,按所需内容对应的数字键上屏,或可继续输入。
另外,本发明还提供了数字联想,借助“*”键使数字直接上屏后,系统自动联想出与该数字匹配的常用单词、符号等,显示在候选区中。目前手机等移动产品的应用已从简单的通话扩展到上网、收发电子邮件等丰富多彩的内容,经常需要输入网址、邮箱等常用的专用词汇,本发明提供了专用词汇的联想功能。
对于复杂的印地语来说,通过上述的预测和联想功能使输入更方便快捷、高效实用。
5.词根+词缀自动生成新的词汇印地语的构词极为复杂,由于主语人称的不同(指单、复数;阴性、阳性),时态的变化(现在未完成时,现在进行时,过去进行时,过去未完成时,将来未完成时,将来进行时),与人关系程度不同(亲密的,认识的,尊重的)等等,使一个动词的变体形式就可能有40多种,大量的单词占有庞大的存储空间,现有手机等移动产品终端基本无法满足存储要求,本发明依照印地语的构词规律,尤其是词根和词缀构词的普遍规律和强大的组合能力,在系统词汇库中只收录词根和词缀,并由系统引擎自动将词库中的词根和词缀组合生成大量的词汇,从而节省了存储空间,同时又涵盖更多的词汇,是一套规范、高效实用、界面友好、更符合数字键盘特点的输入技术。
除了上述特点之外,本发明还提供了两大辅助功能翻译和计算。
本发明提供的翻译和计算功能均与输入在同一模式下,采用同一引擎,同一界面,直接、连续地在信息输入过程中实现。
另外,本发明还有其他特点功能,如根据语境判断单词上屏后是否添加空格,按“*”键显示标点符号页,还支持自学习功能,可以自行增加词汇库中不存在的字词,确认增加内容后,系统自动把该字词添加到词汇库中,再输入该字词的数字编码后,候选区中即可出现该词,体现了人性化、个性化特点。
在上述所提到的数字键和功能键的设置,可以重新设定或混合复用。
图1印地语字母和英语字母在数字小键盘上的键位设置及功能键的设置图2举例说明以数字为中心,一个字母只按一键而构成单词的实现过程图3印地语模式下输入、显示装置界面示意4印地语模式下工作流程5显示文本示例,说明印地语字词的预测和联想图6显示文本示例,说明印地语中数字上屏后的联想功能图7显示文本示例,说明如何实现混合短信的快速输入(临时转换功能)图8显示文本示例,说明印地语的“词根+词缀”功能具体实施方式
本发明是通过数字小键盘中的印地语模式来进行输入、显示、转换、翻译、计算等文字处理的。下面结合附图详细说明文字处理过程。
图1显示了数字小键盘上12个键与印地语、英语之间的对应关系,完全依照手机等移动产品的标准数字键盘上的分布设定。与印地语的对应情况如1 2 3 4 5 6 7 8 9 0 与英语的对应情况如2abc/ABC;3def/DEF;4ghi/GHI;5jkl/JKL;6mno/MNO;7pqrs/PQRS;8tuv/TUV;9wxyz/WXYZ。功能键的对应情况印地语和英语模式下,“*”键支持数字直接上屏,同时控制标点符号页,在计算时,控制数学常数和符号表;“#”键滚动式临时转换输入模式。在有大小写之分的语言中(如英语、法语等),“*”还支持快速转换大小写。另外,英语模式下,“0”键还作为空格键,“1”键起特殊符号作用。其他的键也给予了功能设定计算时,右方向键和上翻键启动计算模块;翻译时,上翻键启动翻译功能。这些键的具体应用方案在以下内容里有充分的体现。
图2通过举例来详细说明本发明以数字为中心,一个字母只按一键而构成单词的实现过程。如输入 (来)”,此单词是由字母 组成,且这三个字母分别位于“8、4、9”键上,在输入时只需连续按这三个键,编码区显示数字849,候选区中显示与其相匹配的所有候选字词并以高频先见的顺序显示,且在输入过程中,每增加或减少一键,候选区中就自动变化成与当前编码相匹配的候选并以高频先见的顺序显示。如本例中按数字8键,候选区中显示“21”(见图2)即 (今天), (这个), (别的), (上帝), (他的)等候选,前10个是数字8键上的字母,后面的是根据智能预测功能,预测出与8键上的字母结合的常用词汇,并以高频先见的顺序显示;继续按数字4键,候选区中自动变化成符合84编码的常用组合词汇“22”,并以高频先见的顺序显示,即 (这个), (那个), (这个的), (来), (还是), (还有)等候选;再按数字9键,候选区中自动变化成符合849编码的常用组合词汇“23”,并以高频先见的顺序显示,即 (来) (来), (阿努布(男孩名)), (高兴), (灵魂), (孤独)等候选,按 (来)”对应的数字键1,将其上屏。
可见,在输入过程中,无论字母在键位上的位置如何,只需按所需字母对应的数字键,并且候选内容随着输入编码的变化而自动改变,当输入的编码不符合编码规则时,候选区中保留最后一次符合规则的候选,充分体现了人性化、智能化、方便快捷等特点。
图3简要说明显示界面的各部分内容,“31”指当前模式为印地语;“32”用数字显示当前的编码;“33”指候选区,用于显示候选内容;“34”指符合当前编码的内容,并以高频先见的顺序显示在候选区;“35”指光标,光标锁定候选项,此候选项反显其颜色;“36”指数字序号,在候选项前与其对应,通过按序号,与此序号对应的候选项上屏;“37”是翻页符,指当前屏未全部显示所有符合编码规则的候选,还有下一页,通过按下翻键,翻到下一页;“38”指短信内容区。
图5-1举例说明本发明在输入过程中,根据高频先见和预测功能,候选区提前出现所需文字,选择上屏;上屏后系统自动联想出与其相匹配的单词、短语、甚至短句。
如输入“ (印度)”,此单词是由“ (对应数字键496496)”组合而成,连续输入49649,由于智能预测功能,“ (印度)”提前出现在候选区中(图5-1),按“ (印度)”对应的数字键1,将其上屏;同时候选区中联想出与“ (印度)”匹配的常用词汇,并以高频先见的顺序显示(图5-2) (妇女), (国旗), (钱币), (文化)等。
图6介绍了借助“*”键使数字直接上屏及上屏后的联想情况。本发明以数字为中心,在编码区以数字显示,当光标在编码区时,按“*”键编码区的数字直接上屏到短信息内容中,同时候选区中联想出与数字匹配的合理内容,并以高频先见的顺序显示。
如图6中,按数字键10,再按“*”键数字10直接上屏,同时候选区中联想出与其匹配的词汇,并以高频先见的顺序显示 (点), (分钟), (卢比), (分), (米), (杯), (月), (年)等。
图7说明了混合短信的输入过程。
如在印地语模式下,输入含有数字、印地语和英语的混合短信“10 Linda (10分钟后打电话给Linda)”,其具体操作步骤如下,参见图7-1,图7-2,图7-3,图7-41)根据印地语语法规则,先连续按键10,然后按“*”键,数字10直接上屏;2)10上屏后,系统自动联想出相匹配的词汇,“ (分钟)”出现在候选区中(见图7-1),按其对应的数字键2,“ (分钟)”上屏;3)依次按“ (后)”的组合字母“ ”对应的数字键59459,“ (后)”出现在候选区中,按其对应的数字键1,“ (后)”上屏;4)在当前印地语模式下,依次连续直接按“Linda”对应的数字键54632,此时候选区中显示与54632对应的印地语文字,按“#”键滚动式转换到英语模式下,系统自动转换成与54632对应的英语文字,“Linda”出现在候选区中(见图7-2),然后按该英文单词对应的数字键2,“Linda”上屏,系统自动转换到原来的模式(印地语模式);
5)按 (给,到)”字母组合 对应的数字键19,该词出现在候选区中(见图7-3),按其对应的数字键1,将其上屏;6) (电话), (打)”按上述方法输入即可(见图7-4)。
如在英语模式下输入印地语、数字等内容的混合短信,同样通过先直接按该地语单词字母组合对应的数字键,借助“#”临时转换到印地语模式下,候选项就变换成与当前编码区数字组合相对应的印地语词汇,然后按所需字词对应的数字键,将其直接上屏,由于借助功能键“#”的转换是临时性的,因此上屏后系统自动恢复到原来的模式。
图8介绍了词根+词缀功能如输入 (意思说、讲话)”,指现在进行时,主语为复数时用此变体形式,系统中只收录了词根 (说)”,由系统引擎自动生成其变体形式 具体操作步骤1)连续直接按 (说)”的字母组合 对应的数字键679,该词出现在候选区中;2)按其对应的数字键1,启动词根+词缀功能,由系统引擎自动生成其变体形式,并以高频先见的顺序出现在候选区中(见图8)1 (词根),2 (现在未完成时,主语为单数、阳性),3 (现在未完成时,主语为复数、阴、阳性),4 (将来未完成时,主语为复数、阴、阳性),5 (现在进行时,主语为复数、阴、阳性),6 (将来未完成时,主语为单数、阳性);3)按 对应的数字键5,将其上屏即可。
权利要求
1.一种通过数字键盘,特别是数字小键盘实现输入、显示、转换、预测、联想、翻译、计算等功能的印地语智能输入方法。其特征在于1)键盘上有0-9十个数字键,其键位设置为,1 2 3 4 5 6 7 8 数字键9上面设置了元音字母的变化形态(短元音),9 0 键位也可以重新设置;2)以数字为中心,模块化设计;3)一次按键输入;4)候选项以高频先见的顺序显示在候选区中,并具有智能预测、同步多行显示功能;5)具有文字、符号、专有词汇等的同步联想功能;6)支持数字直接上屏,并具有数字联想功能;7)临时转换输入模式;8)“词根+词缀”自动生成新的词汇;9)在输入过程中直接完成翻译和计算。
2.根据权利要求1所述的数字为中心,模块化设计,其特征在于1)以数字为码元进行编码,在编码区用数字显示当前已输入的文字、数字等,而非这些字母本身;2)每个候选项都有数字序号与其对应,按所需字词对应数字序号的数字键即可上屏;3)每个功能采用模块化进行设计,方便裁剪和移植。
3.根据权利要求1所述的一次按键,其特征在于无论数字键上有几个字母,每个字母只需按一键。
4.根据权利要求1所述的智能预测,同步多行显示,其特征在于1)无需完成所有字母的按键,根据所按字母及组合规则,系统自动匹配出符合该编码组合规律的单词,短语、甚至短句;2)在输入过程中,候选项随着输入数字编码的变化而变化,每增加或减少一键,候选区中就自动变化成与当前编码相匹配的候选;3)所有候选以高频先见的顺序在同一界面上同时显示;4)采用多行显示,可以增加显示数量,减少翻页次数。
5.根据权利要求1所述的联想功能,其特征在于选择所需的文字、符号、专有词汇等上屏,同时系统自动出现与其相匹配的内容,并以高频先见的顺序显示在候选区中。
6.根据权利要求1所述的数字直接上屏和数字联想,其特征在于在任何输入模式下,无论编码区的数字对应有无候选,或候选内容如何,按“*”键即可使编码区的数字直接上屏,且上屏后同步显示相匹配的联想字词,并以高频先见的顺序显示在候选区中。
7.根据权利要求1所述的临时转换输入模式,其特征在于在当前语言模式下输入其它语言,均可在当前模式下先按所需内容对应的数字键,再按“#”键转换到所需语言模式,系统根据数字编码自动转换成此语言模式下相匹配的候选内容,并依据高频先见的顺序显示在候选区中,选择上屏后,系统自动恢复到原来的语言模式。
8.根据权利要求1所述的“词根+词缀”,其特征在于在系统数据库中只收录了印地语文字的词根部分,通过系统引擎自动生成其变体形式。
9.根据权利要求1所述的翻译和计算功能,其特征在于采用同一引擎、同一界面,在输入过程中完成,与输入达到同步进行。
10.权利要求中所用的数字键键位的设置和功能键的设定,可以重新定义或混合复用。
全文摘要
本发明涉及一种印地语的智能输入方法,通过单一引擎“同步预测”“同步显示”,即在同一界面上可以实现字词预测,又可以进行翻译、计算等。在任何输入模式下,均可不转换输入模式而直接输入包括印地语、英语、数字、特殊符号及其它内容的混合信息,并支持数字直接上屏。通过已输入的词根和功能键,系统可自动生成该词根对应的派生词。任何信息上屏后在候选区域都会显示其联想字词,每个候选字词前有相应的序列号。本发明尤其适用于手机、PDA、小灵通、掌上电脑等通过数字键盘进行人机交互的装置。
文档编号G06F3/023GK1983129SQ20051013034
公开日2007年6月20日 申请日期2005年12月12日 优先权日2005年12月12日
发明者王孝军 申请人:北京优耐数码科技有限公司