音形汉字无重码输入法的制作方法

文档序号:6482205阅读:312来源:国知局

专利名称::音形汉字无重码输入法的制作方法
技术领域
:本发明涉及一种计算机汉字输入法,特别涉及一种音形汉字无重码输入法。
背景技术
:随着计算机、手机、商务通等信息设备应用的普及,汉字的输入处理已越来越受到人们的重视。目前,汉字的输入方法有上千种,按编码的分类主要有拼音码、拼形码、形音码(或音形码)等,但便于使用的并不多。拼音码是最常用的汉字输入法,主要有全拼、双拼、智能ABC、搜狗拼音、谷歌拼音、QQ拼音等,它简单易学。但其不足之处也非常明显,由于汉字中同音字极多,拼音码的重码率很高,输入速度较慢,同时也要求使用者汉字的读音要准。形码输入法从汉字的字形出发,把字形按照不同的构成规律进行分类,形成所谓的字根,并把这些字根与相应的键位相对应,从而实现对汉字的编码。形码由于可以自由地布局键盘的空间,它可以根据字根的使用频率,把形码的键盘布局经过反复的调整,合理地布局键盘,使方案具有较低的重码率和字均击键数,从而具备了快速输入的突出优势。形码的突出代表为"五笔字型"。形码的通病是字根的划分和选取随意性大,缺乏客观标准,且字根数量较多,布局难以做到科学合理,记忆难度大。如98版的五笔字型字根数达250个之多,虽然每一字根对应区位的规律性很强,但是每一字根对应键位的规律性很弱,如五笔字型折区"V键"的字根为"女,刀,九,〈〈〈,3,臼",所以不容易记忆。另外形码的拆字较复杂,如五笔字型的末笔识别码以及"成、减、越、瓦、瓶、瓷"等汉字的末笔定为"撇"和"折",不符合人们的思维习惯,增加了输入法使用的难度。形码学会很难,如果长时间不用,也很容易忘记。另一方面,在使用形码的过程中,由于字根于键位处于形象上的映射关系,大脑的负担很重。形音码(或音形码)是取汉字的字形特征与拼音信息进行编码。它取二者5的优点而舍弃二者的不足,使它既有形码的高速度,又具有拼音码的易学性。近几年,形音码获得了长足的发展,其突出的代表有一根码、一码、新民码、沈码、字典码、自然码、e码、两笔输入法、大众形音码等。但现有的形音码在输入速度、易学性、客观性方面仍有待提高。
发明内容为了解决现有汉字输入法存在的上述技术问题,本发明提供一种键位设置合理、无重码、易记忆、输入速度快的音形汉字输入法。本发明解决上述技术问题的技术方案包括以下步骤l)将汉字的笔画归纳为"横、竖、撇、捺、折",并用分别用字母"a、o、e、i、u"分别表示;2)将汉字拼音的首字母作为汉字的第一编码码元,首字母为元音时用字母"V"作为码元;3)将汉字拼音的韵母作为汉字的第二编码码元,韵母只有一个元音时,取该元音,韵母有2个或2个以上元音,按"o、e、a、u、i"的顺序依次取元音;4)将汉字的首笔画与声调的组合作为第三编码码元,用字母"a、o、e、i"分别代表声调的和阴平、阳平、上声、去声,首笔画与声调的组合码为GH63:Tia:YU3:BF了60:Rio..PU0:cD06:Kwie:NXai:Soi-ehQii:Mui-Z勤A06U:Eiu:IU5)将汉字的第二个笔画作为第四编码码元;6)将汉字的末笔画与频序的组合作为第五编码码元,频序是对汉字前7个位的组合按字频排序,相同组合从高频到低频依次排序得到序号为l(a)、2(o)、3(e)、4(i),末笔画与频序的组合码和步骤4中相同;7)在键盘上依次输入该汉字的编码码元。上述的音形汉字无重码输入法中,词组及短语的输入步骤为二字词组,取首字的前三码,取末字的第一、三个编码;二字词组,取首字的第一、三个编码,取末字的前三码;二字短语,取第一个字的第一、第三码,取第二个字的第一、第三、第三码;三字词组,首字前三码+次字和末字的首码;三字词组,取首字的第一、三个编码,取次字的第一、三个编码,取末字的首码;三字短语,取首字的第一、三个编码,取次字的第一、三个编码,取末字的首码;四字词组,取首字的前两码,其它字的首码;四字词组,取首字的第一、三个编码,次字、第三个字和末字的首码;四字短语,取首字的第一、三个编码,次字、第三个字和末字的首码;五字及以上词组,取首字的前二码,次字、第三字和末字的首码;五字及以上短语,分别取前四字的首码和末字的首码。上述的音形汉字无重码输入法中,采用数字键"1、2、3、4、5"作为输入码元时,'<',,3、0、6、1、U分别用"1、2、3、4、5,,表示,辅音个数字表示,其对应关系如下11:G21:H31:T41:Y51:B12:F22:J32:R42:p52:c13:D23:K33:W43:N53:X14:S24:L34:Q44:M54:z15:A25:035:E45:I55:u。上述的音形汉字无重码输入法中,采用数字键"0、1、2、3、4、5、7、8、9"作为输入码元时,只需将元音字母和辅音字母指定到对应的数字键盘上,再依次输入汉字的码元即可。一种音形汉字无重码输入法,包括以下步骤1)将汉字的笔画归纳为"横、竖、撇、捺、折",并分别用字母"a、o、e、i、u"分别表示;2)将汉字拼音的首字母作为汉字的第一编码码元,首字母为元音时用字母"V"作为码元;3)将汉字拼音的韵母作为汉字的第二编码码元,韵母只有一个元音时,取该元音,韵母有2个或2个以上元音,按"o、e、a、u、i"的顺序依次取元音;4)将汉字的首笔画与声调的组合作为第三编码码元,用字母"a、o、e、i分别代表声调的和阴平、阳平、上声、去声,首笔画与声调的组合码为犯Goa:H6&Tia:YU3rB30:F00:J60:Rio:PUO:C36:D06:K66:Wie:NU6:Xai..sei-QMui..z3U:A0Eiu-IUU:u5)将汉字的第二个笔画作为第四编码码元;6)将汉字的末笔画与频序的组合作为第五编码码元,频序是对汉字前7个位的组合按字频排序,相同组合从高频到低频依次排序得到序号为1(a)、2(0)、3(e)、4(i),末笔画与频序的组合码和步骤4中相同;7)用语音读入该汉字的编码码元。本发明的技术效果在于本发明的汉字编码没有重码,编码科学、合理,选取的编码信息如声母,音素,首、次、末笔,以及字频均较为客观,不会引起歧义。采用不同的编码形式进行编码,有效解决了单字与词组的重码问题;码长采用五码,大大扩大了词汇的数量,在现代汉语认可的词组范围内,可实现单字与词组无重码输入。各种不同的输入形式适用于不同的使用群体。在汉字的输入应用中,输入快速,符合思维习惯,每输入一字,各类设备可以发出"码音",使用户加深、加速对每个字编码的记忆,学会后难以忘记。本发明可处理所有汉字,可以在标准键盘、各种数字键盘、各种电子设备上进行应用,编码具有广泛的可移植性。本发明为每一个汉字都赋予了"码音",采用"见码识音"的方式,可快速读出每个字的发音,读音带有声调,每一个编码"听"起来很接近普通话,感觉就像中国某地的一种方言。通过使用编码的语音形式,可实现不同对象间进行对话交流,如人与人、人与智能设备的交流。图1为本发明中的编码码元在标准键盘上的键位分布。图2为本发明中的编码码元在5个数字键盘上的键位分布。图3为本发明中的编码码元在8个数字键盘上的键位分布实施例1。图4为本发明中的编码码元在8个数字键盘上的键位分布实施例2。图5为本发明中的编码码元在9个数字键盘上的键位分布实施例1。图6为本发明中的编码码元在9个数字键盘上的键位分布实施例2。图7为本发明中的编码码元在10个数字键盘上的键位分布实施例1。图8为本发明中的编码码元在10个数字键盘上的键位分布实施例2。具体实施例方式(一)单字编码l.单字的编码方法定义"aoeiu"为元音,分别对应按标准分法的五种笔画"横、竖、撇、捺(含点)、折"或数字"1、2、3、4、5"。定义26个英文字母中除"aoeiu"夕卜,其它字母均为辅音字母。定义汉字的拼音中第一个辅音字母为"辅音声母",以元音开头的拼音为"零声母",零声母用"V"表示。定义汉字的拼音中韵母的一个核心元音为"音素",其中"U"归于"u"。如"他",拼音为"ta",音素为"a";"江",拼音为"Jiang",音素为"a";"多",拼音为"duo",音素为"o"。定义单字的标准码码长为五码,位数为8位。第一、三、五码分别对应2个位,第二、四码分别对应l个位,见下表。<table>tableseeoriginaldocumentpage9</column></row><table>第一、二、三、四、五码分别为字的声母(辅音字母)+音素(元音字母)+首笔和声调组合(辅音字母)+次笔(元音字母)+末笔与字频序号组合(辅音字母),构造成为形如"势Sisot"、"红h0CUg"的标准码,构造形式为"辅元辅元辅"。在计算机中的输入步骤为a.输入第一码(第l、2位)在每个字最常用的拼音中,按实际拼写形式取第一个辅音字母。如"我,W0",取"W";"zh、Ch、Sh",分别取Z、C、s;零声母用"v"代替,如"儿,er",声母取"v"。b.输入第二码(第3位)取音素,按实际的拼写,韵母只有一个元音,取该元音;韵母有2个或2个以上元音,按"o、e、a、u、i"的顺序依次取元音,各韵母的音素见音素表(附后)。多音字取最常用的读音,拼音中如果没有"音素"可取,如呒(m)、嗯(ng),音素用"V"代替。音素的选取中,五个元音按不同的顺序选取视为不同的实施例。c.输入第三码(第4、5位)取首笔与声调的组合,得到辅音字母,见键位对应图。取首笔代号取每个字的首笔为第4位,如"二"首笔为横,取"a";"线",首笔为折,取"u"。取声调代号定义a、o、e、i分别由代表声调的和阴平(1)(含轻声)、阳平(2)、上声(3)、去声(4)。如"我",声调为第三声,取"e"。第4、5位组合成第三码的组合表如下位与位的组合表ll(aa)G21(oa)H31(ea)T41(ia)Y51(ua)B12(ao)F22(oo)J32(eo)R42(io)P52(uo)C13(ae)D23(oe)K33(ee)W43(ie)N53(ue)X14(ai)S24(oi)L34(ei)Q44(ii)M54(ui)Z15(au)A25(ou)035(eu)E45(iu)I55(uu)U上述组合的键位分布见图1。QWRT为e(撇)区,依次对应ieoa(4321)为顺序号;YP丽为i(捺)区,依次对应aoei(1234)为顺序号;SDFG为a(横)区,依次对应ieoa(4321)为顺序号;HJKL为o(竖)区,依次对应aoei(1234)为顺序号;ZXCB为u(折)区,依次对应ieoa(4321)为顺序号。键位对应图如图1所示。从键盘上看,20个辅音在键盘上分布在"横(l,a)、竖(2,o)、撇(3,e)捺(4,i)、折(5,u)"5区,每个辅音在区中又有一个位号分别为a(1)、o(2)、e(3)、i(4),即形成5个元音在各区中与位号两两组合后与辅音按键形成对应关系。每个元音字母不纳入分区,组合形式为本身与U(5)的组合。V为零声母代号,特定场合用U的组合代替。d.输入第四码(第6位)取第二个笔画代号,如"中",次笔为"折",取"u"。e.输入第五码(第7位、第8位)取末笔与频序的组合,组合后得到辅音字母的规则与第三码相同。取末笔(第7位)代号如果末笔为"点",归到"撇"类,其它的笔画仍按"横竖撇捺折"归类。如"术",末笔为"点",取"e";"彦",末笔为"撇",取"e";"木",末笔为"捺",取"i";"中",末笔为"竖",取"o"。取频序(第8位)代号在第7位取完后,对汉字前7个位的组合按字频排序,相同组合从高频到低频依次排序得到序号为1(a)、2(0)、3(e)、4(i),每个字的频序即为第8位。对于频序相同的字,先按笔画数排序,再按"横、竖、撇、捺、折"依次排序。如果相同组合超过4个,从第5个组合开始,相同组合的第五码(含第7、8位)由字母"A、0、E、I、U"依次代替。如果相同组合超过了9个,从第10个开始,在26个英文字母中去掉前面已取完的9个字母,把剩下的17个字母依次排序,在这17个字母中与其它前6位相同的组合统筹考虑取第五码,其步骤为从17个字母的第一个幵始预选,如果与"其它前6位相同的组合"的第五码相同,则选下一个,直到不相同为止,做到每一个汉字只有一个唯一的标准编码。如"全"字,从第1位到第8位的输入步骤见下表。<table>tableseeoriginaldocumentpage11</column></row><table>2.单字的各种编码形式标准码码长为五码,各码的组合依次为,声母+第3位+第4与第5位组合+第6位+第7与第8位组合,如"全",标准码为"QARIG<table>tableseeoriginaldocumentpage12</column></row><table>精简码码长为四码,在标准码的基础上,将第3位移位到第6位前,第3、第6位的元音组合成辅音为精简码的第三码,如全,Q+A+R+I+G,移位后成Q+R+(A+I)+G,即:QRSG(AI的组合为S)。省略码码长为四码,在标准码的基础上,省略第四码(第6位)如"全",去掉标准码"QARIG"中第四码"I",得到省略码为"QARG"。简码为提高输入速度,按字频顺序在每个字的标准码中取简码,码长为一至四码不等,如"我",简码为"W0";"阳",简码为"YAC"。不同码长的简码如下一码简码如"的",简码为"D";二码简码如"到",简码为"DO";三码简码如"动",简码为"DOS";四码简码如"掉",简码为"D0S0"。输入码:用于快速输入的各种码长的简码统称为输入码。(二)词汇及整句形式词组是现代汉语认可的词语,词汇是词组加短语。短语由人名、地名、诗词、科技名称、来自于网络的用语等构成,如刘备、欲穷千里目、费尔巴哈、奥地利、山丹丹花开红艳艳、全世界无产阶级联合起来、战争与和平等,这些都作为短语。词汇和整句的编码形式如下l.码长为五码,在标准码中取码。二字词组,形如"辅元辅辅辅"取首字的前三码,取末字的第一、三个编码,如计算J頂+SQJ頂SQ二字词组,形如"辅辅辅元辅"取首字的第一、三个编码,取末字的前三码,如计算JM+SAQJMSAQ二字短语,形如"辅辅辅辅辅"取第一个字的第一、第三码,取第二个字的第一、第三、第三码(重复第二字的第三码),如LP+BQ+QLPBQQ首字前三码+次字和末字的首码,如J頂SJ取首字的第一、三个编码,取次字的第刘备三字词组,计算机三字词组,'、三个编码,计算机三字短语,'、三个编码,奥地利四字词组,兴高采烈形如"辅元辅辅辅"JIM+S+J形如"辅辅辅辅辅"取末字的首码,如JM+SQ+J形如"辅辅辅辅辅"取末字的首码,如VQ+DS+L形如"辅元辅辅辅"XI+G+C+L四字词组,形如"辅辅辅辅辅"个字和末字的首码,如兴高采烈XY+G+C+L四字短语,形如"辅辅辅辅辅"个字和末字的首码,如费尔巴哈FZ+V+B+HJMSQJ取首字的第一、二水编码,取次字的第VQDSL取首字的前两码,其它各字的首码,如XIGCL取首字的第一、三个编码,次字、第三XYGCL取首字的第一、二水编码,次字、第三FZ糊五字及以上词组,形如"辅元辅辅辅"取首字的前二码,次字、第三字和末字的首码,如中华人民共和国Z0+H+R+GZ0服G五字及以上词组,形如"辅辅辅辅辅"分别取前四字的首码和末字的首码,如中华人民共和国Z+H+R+M+GZ服MG五字及以上短语,形如"辅辅辅辅辅"分别取前四字的首码和末字的首码,如战争与和平z+Z+Y+H+PZZYHP山丹丹花开红艳艳S+D+D+H+YSDDHY2.码长为四码,在精简码中取码,均为"辅辅辅辅"形式二字词汇(词组加短语)取每个字的前两位编码,如计算JM+SQJMSQ三字词汇(词组加短语)取首字的第一、第三码和最后两字的首码,如:计算机JM+S+JJMSJ四字词汇(词组加短语)取各字的第一码,如兴高采烈X+G+C+LXGCL四字以上词汇(词组加短语)取前三字和最后一字的首码(前三末一),如中华人民共和国Z+H+R+GZ服G3.整句形式,码长不定。选择标准编码的前1个或前2个或前3个或前4个或前5个编码连续进行编码。例每字均取前三码,如"我是中国人"WOW+SIL+ZOH+GOJ+RER,整句形式为W0WSILZ0HG0JRER;今天的天气非常好JIT+TAG+DET+TAG+QIQ+FEH+CAJ+HOX,整句形式为JITTAGDETTAGQIQFEHCAJHOX。其它码长的整句编码同理可得。(三)单字语音形式以"见码识音"的方式,读每个字的简码或标准码或罕见字的表音六码(见罕见字的编码方法),也可以几种编码混读。如经济形势,简码为jijimxifsisot,读音为/ji〃jim〃xif〃sisot/;标准码为jibugjimihxifatsisot,读音为/jibug〃jimih〃xifat〃sisot/。紅,表音六码为"ZIMG0G",读音为/zimgog/。在实际的用中,元音带有声调。对非罕见字的各种输入码,第一个元音的声调为该字原来拼音的声调,第二个元音的声调取汉语拼音第一、第二、第三、第四声中的一种,几种声调可以混合使用。如,"取","QUD0T",带调读音为/qfid6t/或/qild(3t/或/qfid6t/或/qtid6t八罕见字表音六码的带调读音,第一、二个元音各取四种声调中的一种,组合形成16种读音。如,"紅",表音六码为"ZIMG0G",带调读音/zlmg6g/或/zImg6g/或/zImg6g/或/zImg6g〃zimg6g/或/zimg(5g/或/zimg6g/或/zimg6g〃zimg5g/或/zimg6g/或/zimg6g/或/zImg6g//zimg6g/或/zimg6g/或/zimg6g/或/zimg6g/。(四)罕见字的编码形式不认识读音的字为罕见字。1.方法一,直接打"aoeiu"按笔画顺序输入笔画,与各种编码形式混合使用。2.方法二,以宋体字型为二维图形,拆分成两部分视为"二字词组"进行编码,构造成编码形如"辅元辅辅元辅"的表音形式,根据不同输入模式的需要省略第一个或第二个元音。定义笔画形式根据构造编码形式的需要,"横、竖、撇、捺、折"在特定的位置可以为"H、S、P、N、Z",也可以为"A、0、E、I、U"。定义"笔画两两组合中,与《折'的组合得到的字母为原笔画名的声母"如"横折"组合得到字母"H";"竖折"组合得到字母"S",其它同理类推。定义笔画块笔画块是构成部件的最小单位,是笔画按交叉、相连、依附、离散4种形式分布的最小集合体。单笔画是汉字拆出包含的成字后自然生成的一种特殊笔画块。笔画块组合成部件,部件构成成字。交错型笔画块一一笔画间相互相交或相交相接混合,不含认识读音的成字。例如"亏巿弔少两尹主北全待夬矛肃肅李宍卄廿升册大屮內世冊卍乜匁匁S毋矢中乂夂L乂3弗両菌亜"等等。相连型笔画块——笔画间相互连接,没有相交,不含认识读音的成字。"一、I、、、j、乙"5个单笔画与成字相连,可再拆。如"韭",可拆成成字"非"、"一"、;"夂",可拆成"J"、"又"。例如"匚巳巳门^々U円3广卩(S戶勺丄互^〃久q爿丁^M爿"等等。依附型笔画块——相交或相连笔画附带单笔画,不含认识读音的成字。例如"《^;L尤1:纟才、"等等。离散型笔画块——笔画间互不相交相连,不含认识读音的成字。例如"V十、、、、、工^乡、?S个.〈《7"小、氺"等等。定义汉字拆成两部分的原则本身符合笔画块特征的独体字不再拆分,依附特征(单笔画加成字,但不相交)的独体字拆成单笔画加成字,如"酉、壬"(本身为笔画块的成字一定是独体字,独体字不一定是笔画块,有些独体字可以继续拆分为笔画块的组合);合体字(或部件)分为上下、左右、包容3种类型,按"成字取大优先"的原则拆分成两部分;在不影响总体结构类型划分的情况下,按"笔画块取小优先、先写优先"原则确定第一部分,笔画间相连、相交不拆分,如橐,上下结构,第一部分为前7笔;呷,左右结构,第一部分为"口";麽,包容结构,第一部分为"麻"(成字取大优先)。成字和单笔画不相交可拆,相交不可拆。成字可拆为为一个单笔画加成字,如辄、旧、虬、玍;不能拆成一个单笔画加非成字的笔画块。对于"一",如果和另外的成字相连,则可拆出成字"一"(如"韭","非"+"—"),体现"成字优先";如果不与其它笔画相交、相连,则为成字"一",不参与其它笔画构成笔画块,如"兴"的前四笔、"前"的前三笔;如果与其它笔画相交、相连或与单笔画相离,则视为笔画,与其它笔画构成笔画块,如"二"视为笔画块,不再拆。两横、三横的笔画全部与另外的笔画块相连(不相交),则不拆出成字"二"、"三",如遐、音亂,不拆出成字"二"、"三"。定义罕见字拆分成两部分以后对部件的处理方法对拆分后的部件,如果是罕见字优先作为成字处理,也可作为非成字部件处理。成字不再拆分,非成字以笔画块为单位再进行拆分,规则与第一次拆分相同,直到拆到"最小"限度。根据上述拆分规则,罕见字的编码方法如下-单笔画"横竖撇捺折"分别用"HSPNZ"(辅音位置)和"A0EIU"(元音位置)代替。如果是独体字,则取前5个笔画,笔画不足从首笔到末笔依次循环取,按"辅元辅辅辅"或"辅辅辅元辅"的方式构成编码。独体字根据输入模式的需要把第一码或第四码扩充构造成"HE,SU,PE,NA,ZE"以加入"音素",构造成统一的"表音六码"形式。如果是合体字,按上述拆分原则,拆成l、2部分。对于第1部分,构造成"辅元辅"的形式。如果是单字,则打该字标准编码的前三码(形如辅元辅);如果是单笔画块,取首、次、末三个单笔画(形如辅元辅,笔画不足循环取)。其它情况,按成字"取大优先"、笔画块"取小优先"的原则再分,有字取字、无字取块,以构造成"辅元+辅"为原则对于"块",以"取前两笔组合加末笔"构成"辅元",以"前两笔的组合"构成"辅";对于"字",取标准码中的前两码构成"辅元",取前一码构成"辅"。对于第2部分,构成规则与第一部分相同。1、2部分组合成"辅元辅辅元辅"的表音六码形式,根据不同输入形式的需要,分别省略第一个元音或第二个元音,形成罕见字的输入形式,码长均为五码。对1、2部分的成字,认识读音的按成字处理,不认识读音的,既可按成字处理,也可拆成笔画块处理。在语音形式中,用罕见字的表音形式,读音为"见码识音"。罕见字编码举例溧,合体字方法一直接打笔画,"iiaaouooaaoei"。方法二视三点水为一笔画块,首、次、末笔画"NIH"+成字"栗"前三码"LIS",编码为NIHLIS。语音输入为"NIHLIS",读音为/nihlis/。廿,独体字方法一直接打笔画,"aooa"。方法二独体字输入笔画,笔画不足循环取,"横竖竖横横",编码为"HSSAH"或"H0SHH"。语音输入为"服SSAH"或"H0SHEH"(第一、第四码扩充为"HE"),对应读音为/hessah/或/hosheh八呼,合体字方法一直接打笔画,"ouaouaao"。方法二1、2部分均为常用成字"口,甲",编码为"K0KJAK"。语音输入为"K0KJAK",读音为/kokjak厶紅,合体字方法一直接打笔画,"uuiiiiaoa"。方法二1部分分解为两个笔画块,分别取第一部分的前两笔和末笔、最末部分前两笔的组合;2部分为成字"工",G0G。完整编码为ZIMGOG,语音输入为"Z頂G0G",读音为/zimgog/。儂,合体字方法一直接打笔画,"600U訓,3雄i,,o方法二1部分为笔画块,取首、次、末笔,组合成POS;2部分为"曲qu+辰c"。完整编码为"POSQUC",语音输入为"POSQUC",读音为/posquc八(五)不同实施例1.实施例一此为标准大键盘输入形式,包括单字的输入码、精简码、省略码和标准码,包括罕见字,词组和短语输入选择已定义的相应形式。将20个辅音的分解和组合,归纳为20个字母组合-Qei,Wee,Reo,Tea(茶),Yia,Pio,Nie(捏),Mii(密),Sai(塞),Dae,Fao,Gaa,Hoa,Joo,Koe,Loi,Zui(最),Xue(学),Cuo(搓),B胆o设定一码简码26个"全、为、人、他、一、品、是、的、发、国、禾口、经、开、了、在、行、产、而、不、年、民"为一码简码,对应码为"Q、W、R、T、Y、P、S、D、F、G、H、J、K、L、Z、X、C、V、B、N、M",共21个;设定"没、有、我、好、上"为一码简码,对应"工、A、E、U、0",这5个字的首笔分别是"点、横、撇、折、竖"。设定二码简码100个,识记口诀为于元有一业,在这主中资,破普配品牌,全企确桥区。贸民们面目,老了来理路,日入人容然,到对大的地。你女年能农,现小需行学,经决就家教,产出成从次。关国个规,困可开口。而欧府,为我务外,安分发否?并不报本办。特同他推体,说是水上生,会后化和。呒嗯。各种不同的输入形式如下,单字在每种输入形式中均可用"aoeiu"对应"横竖撇捺折"直接打笔画进行输入。(1)普通形式常用方式,为普通用户使用,编码简单、易学、难忘,输入快速。a.普通形式一,码长为五码,不足五码按确认键结束,特征为统一词组为"辅元辅辅辅"形式,不处理短语。单字取单字的输入码、省略码、精简码和标准码,罕见字选取"辅辅辅元辅"形式。选取二字词组的"辅元辅辅辅"形式;选取三字词组的"辅元辅辅辅"形式;选取四字词组的"辅元辅辅辅"形式;选取五字及以上词组的"辅元辅辅辅"形式。b.普通形式二码长为五码,不足五码按确认键结束,特征为充分扩展所处理词汇的数量,词汇均以"辅辅"结束。单字取单字的输入码、省略码、精简码和标准码,罕见字选取"辅辅辅元辅"形式;选取二字词组的"辅元辅辅辅"形式;选取二字短语的"辅辅辅辅辅"形式;选取三字词组的"辅辅辅辅辅"形式;选取三字短语的"辅辅辅辅辅"形式;选取四字词组的"辅辅辅辅辅"形式;选取四字短语的"辅辅辅辅辅"形式;选取五字以上词组的"辅辅辅辅辅"形式;选取五字以上短语的"辅辅辅辅辅"形式。c.普通形式三码长为五码,不足五码按确认键结束,特征为统一单字(含罕见字)均为"辅元"开头,词汇均以"辅辅"开头。单字选择输入码、精简码、省略码、标准码,罕见字取"辅元辅辅辅"形式。选取二字词组的"辅辅辅元辅"形式;选取二字短语的"辅辅辅辅辅"形式;选取三字词组的"辅辅辅辅辅"形式;选取三字短语的"辅辅辅辅辅"形式;选取四字词组的"辅辅辅辅辅"形式;选取四字短语的"辅辅辅辅辅"形式;选取五字以上词组的"辅辅辅辅辅"形式;选取五字以上短语的"辅辅辅辅辅"形式。(2)高级形式适合对输入速度要求较高的用户,单字码长均为四码。a.高级形式一码长为五码,不足五码按确认键结束,特征为充分利用省略码的"四码"码长较短和五码词汇数量较多的优势。单字选择输入码、省略码,以"辅元"开头的单字输完4码后自动上屏,不处理精简码、标准码和罕见字,词汇均以"辅辅"开头。选取二字词组的"辅辅辅元辅"形式;选取二字词语的"辅辅辅辅辅"形式;选取三字词组的"辅辅辅辅辅"形式;选取三字短语的"辅辅辅辅辅"形式;选取四字词组的"辅辅辅辅辅"形式;选取四字短语的"辅辅辅辅辅"形式;选取五字以上词组的"辅辅辅辅辅"形式;选取五字以上短语的"辅辅辅辅辅"形式。b.高级形式二码长为四,不足四码按确认键结束,特征为把单字、词汇统一为四码处理,减少了字均击键数,达到专业输入的要求。单字选择输入码、精简码,不处理标准码、省略码和罕见字。选取二字词汇(词组加短语)的"辅辅辅辅"形式;选取三字词汇(词组加短语)的"辅辅辅辅"形式;选取四字词汇(词组加短语)的"辅辅辅辅"形式;选取四字以上词汇(词组加短语)的"辅辅辅辅"形式;输入方式表如下,F代表辅音,A代表元音。<table>tableseeoriginaldocumentpage21</column></row><table>键位图如图1。2.实施例二此为整句输入,码长不定,按确认键结束。a.整句形式一单字、罕见字、词汇均形如实施例一中普通方式二;整句每个字均选择标准编码的前3个编码连续输入,通过程序自动解码把字母串转换成文字串。例我是中国人W0W+SIL+Z0H+G0J+RER,整句形式为W0WSILZ0HG0JRER;今天的天气非常好JIT+TAG+DET+TAG+QIQ+FEH+CAJ+HOX,整句形式为JITTAGDETTAGQIQFEHCAJHOX。b.整句形式二单字、罕见字、词汇均形如实施例一中普通方式三;整句每个字均选择标准编码的前3个编码连续输入,通过程序自动解码把字母串转换成文字串。例我是中国人W0W+SIL+Z0H+G0J+RER,整句形式为W0WSILZ0HG0JRER;今天的天气非常好JIT+TAG+DET+TAG+QIQ+FEH+CAJ+HOX,整句形式为JITTAGDETTAGQIQFEHCAJHOX。3.实施例三用于小键盘、PDA、其它手持设备。如果在手机中采用触摸屏、外接键盘等标准大键盘方式,输入方法与计算机中的标准大键盘方式一致。(1)5键将实施例一中标准大键盘形式的单字编码或词组编码或短语编码或整句编码中每个辅音字母分解为两个元音的组合(见位与位的组合表),元音字母不变,元音在小键盘中用五个按键代替,如"1、2、3、4、5"(或"6、7、8、9、0",或10个数字中的任意5个,不同的取法视为不同的实施例)分别代替"aoeiu",按确认键结束。用U(55)代替V。如"奥林匹克运动会己在北京召开",标准大键盘输入码为"V0Q、LIF、PID、KES、YUS、D0S、HU、YIXA、ZA、BEK、JIYA、ZOZ、KA",把辅音字母分解为元音后每个字的编码分别为"uuoei、oiiao、ioiae、oeeai、iauai、aeoai、oau、iaiuea、uia、uaeoe、ooiiaa、uioui、oea",对应的小键盘编码分别为"55234、24412、42413、23314、41514、13214、215、414531、541、51323、224411、54254、231";"奥林匹克运动会"作为短语输入,标准大键盘输入码为"VLPKH",把辅音字母分解为元音后的编码为"uuoiiooeoa",对应的小键盘编码为"5524422321";"我是中国人"作为整句输入,标准大键盘输入码为"W0WSILZ0HG0JRE",把辅音字母分解为元音后的编码为"eeoeeaiioiuiooaaaoooeoeeo",对应的小键盘编码为"3323314424542211122232332"。a.码长为S码,不足8码按确认键结束。单字春眠不觉晓,CUGAMAJBUJEPX0K,uouaaa+iiaoo+uau+ooeio十ueooe,小键盘编码为525111441225152234553223;二字词汇计算,JM+SQ,JMSQ,ooiiaiei,小键盘编码为22441434;三字词汇计算机,JM+S+J,JMSJ,ooiiaioo,小键盘编码为22441422;四字词汇兴高采烈,X+G+C+L,XGCL,ueaauooi,小键盘编码为53115224;五字及以上词汇中华人民共和国,Z+H+R+G,ZHRG,uioaeoaa,小键盘编码为54213211。b.码长9码,不足9码按确认键结束。单字春眠不觉晓,CUGAMAJBUJEPX0K,uouaaa+iiaoo+uau+ooeio+ueooe小键盘编码为525111441225152234553223;二字词组:计算,JIM+SQ,JIMSQ,ooiiiaiei,小键盘编码为224441434;三字词组计算机,JIM+S+J,JIMSJ,ooiiiaioo,小键盘编码为224441422;四字词组兴高采烈,XI+G+C+L,XIGCL,ueiaauooi,小键盘编码为534115224;五字及以上词组中华人民共和国,Z0+H+R+GZ0HRG,uiooaeoaa,小键盘编码为542213211。c.码长为10,不足10码按确认键结束。单字春眠不觉晓,CUGAMAJBUJEPXOK,uouaaa+iiaoo+uau+ooeio+ueooe,小键盘编码为525111441225152234553223;二字词组:计算,JIM+SQ,JIMSQ,ooiiiaiei,小键盘编码为224441434;二字短语刘备,LP+BQ+Q,LPBQQ,oiiouaeiei,小键盘编码为2442513434;三字词汇(词组加短语):计算机,JM+SQ+J,JMSQJ,ooiiaieioo,小键盘编码为2244143422;四字词汇(词组加短语):兴高采烈,XY+G+C+L,XYGCL,ueiaaauooi小键盘编码为5341115224;五字词汇(词组加短语)战争与和平,Z+Z+Y+H+P,ZZYHP,uiuiiaoaio,小键盘编码为5454412142。d.码长为不定长,按确认键结束。单字春眠不觉晓,CUGAMAJBUJEPXOK,uouaaa+iiaoo+uau+ooeio十ueooe,小键盘编码为525111441225152234553223;二字词组:计算,JIM+SQ,JIMSQ,ooiiiaiei,小键盘编码为224441434;二字短语刘备,LP+BQ+Q,LPBQQ,oiiouaeiei,小键盘编码为2442513434;三字词汇(词组加短语):计算机,JM+SQ+J,JMSQJ,ooiiaieioo,小键盘编码为2244143422;四字词汇(词组加短语):兴高采烈,XY+G+C+L,XYGCL,ueiaaauooi,小键盘编码为5341115224;五字词汇(词组加短语)战争与和平,Z+Z+Y+H+P,ZZYHP,uiuiiaoaio,小键盘编码为5454412142;整句形式我是中国人,W0W+SIL+Z0H+G0J+RER,WOWSILZOHGOJRER;eeoeeaiioiuiooaaaoooeoeeo,小键盘编码为3323314424542211122232332。键位图如图2。(2)8键将实施例一中标准大键盘形式的单字编码或词组编码或短语编码或整句编码中每个编码字母与每个键位上的字母一一对应进行输入,码长为不定长,以确认键结束。例如单字,春眠不觉晓,标准大键盘输入码为cugamajbuj印xok,8键方式对应按键284262528537965;二字词组,计算,jim+sq,jimsq,对应按键54687;二字短语,刘备,lp+bQ+q,lpbqq,对应按键57277;三字词汇(词组加短语),计算机,jm+sq+j,jmsqj,对应按键56875;四字词汇(词组加短语),兴高采烈,xy+g+c+l,xygcl,对应按键99425;五字词汇(词组加短语),战争与和平,z+z+y+h+p,zzyhp,对应按键99947;整句形式,我是中国人,wow+sil+zoh+goj+rer,wowsilzohgojrer,对应按键969845964465737。键位图如图3。每个键位对应不同的字母视为不同的实施例。例如"春眠不觉晓",标准键盘单字输入码为"cugamajbuj印xok",8键中另外一种字母对应形式的按键为"283252428436964",其它词组、短语、整句的对应方式同理类推。键位图如图4。(3)9键将实施例一中标准大键盘形式的单字编码或词组编码或短语编码或整句编码中每个编码字母与每个键位上的字母一一对应进行输入,码长为不定长,以确认键结束。例如单字,春眠不觉晓,标准大键盘输入码为cugamajbuj印xok,9键方式对应按键173151417426854;二字词组,计算,jim+sq,jimsq,对应按键43576;二字短语,刘备,lp+bq+q,lpbqq,对应按键46166;三字词汇(词组加短语),计算机,jm+sq+j,加sqj,对应按键45764;四字词汇(词组加短语),兴高采烈,xy+g+c+l,xygcl,对应按键89314;五字词汇(词组加短语),战争与和平,z+z+y+h+p,zzyhp,对应按键99936;整句形式,我是中国人,wow+sil+zoh+goj+rer,wowsilzohgojrer,对应按键858734953354626。键位图如图5。每个键位对应不同的字母视为不同的实施例。例如"夜来风雨声",标准键盘单字输入码为"yemlafetyudoseg",9键中另外一种字母对应形式的按键为"925513279826723",其它词组、短语、整句的对应方式同理类推。键位图如图6。(4)其它键数及相同键数、不同字母对应的形式。可以自行确定按键数和按键上字母的分布,只要将实施例一中的单字、词组、短语、整句的编码与按键上的字母一一对应输入,产生的各种输入形式为不同的实施例。下图为字母在10个按键上不同分布中的一种情况,例如"夜来风雨声",标准键盘单字输入码为"yemlafetyudoseg",10键对应按键为"025412270825723",其它词组、短语、整句的对应方式同理类推。键位图如图7。IO个按键上字母不同分布中的另一种情况,例如"夜来风雨声",标准键盘单字输入码为"yemlafetyudoseg",对应按键为"036613380927834",其它词组、短语、整句的对应方式同理类推。键位图如图8。4.实施例四此为文字书面应用,用于书写、排序、检索等方面。特征在于能有效加深使用者对各输入码、标准码的记忆,实现快速输入;可以用此文字在大脑中进行思维,脱离了电子设备也可以进行"编码",增强了汉字输入的生动性,减少了学习时间,提高了编码的生命力。(1)按实施例一的规则取输入码,字与字间以空格隔开。人的生应这样渡过当回首往事的时deyiS6yiyZ6yasdumigosdahhujsonsisdesij候,他不因虚渡年华而悔恨,也不至因hoqobuyihxuhdumiV6hemi,yexbuzisuyih过去的碌碌无为而羞愧;在临死的时候gosqusdeluselusewufwevexuykumi;zalijsiddesijhoqo他能够说,我的整个生命和全部精力都献tanegoquso,wodezedogesemiqheqabumjiye1izdogxasow给了世界上最壮丽的事业。gexlesisojelsazulzamaflisodesisye。(2)按实施例一的规则取输入码,单字间空格,词组连续书写。人/的/一生/应/这样/渡过当/回首/往事/的/时候,他/不/因/虚渡/年华/而/像浪,'也/不/至/因/过去/的/碌碌无为/而/羞愧;在/临死/的/时候,他/能够/说,我的/整个/生命/和/全部/精力/都/献给/了/世界/上/最/壮丽/的/事业。redeyiseyiyzeyasdumigos:dahhujsonwawsisdesijhoqo,tabuyihxuhduminaharvehunhemi,yexbuzisuyihgosqusdeluselusewufwevexuykumi;zalijsiddesijhoqo,tanegoquso,wodezedogesemiqheqabumjiyelizdogxasowgexlesisojelsazulzamailisodesisye。5.实施例五此为语音输入,在手机或其它PDA设备、电子设备中,通过对标准码或输入码或罕见字的六码表音形式按"见码识音"的原则"读"进各种设备。特征在于可用编码的语音形式在不同对象之间进行交流,使汉字输入符合思维习惯,并在速度上实现质的飞跃。例根据实施例一的规则读每个字的简码或标准码或表音六码,也可以各种形式的编码混读。如经济形势,简码为jiJimxifsisot,读音为/ji〃jim〃xif〃sisot/;标准码为jibugjimihxifatsisot,读音为/jibug〃jimih〃xifat〃sisot/。紅,表音六码为"ZIMGOG",读音为/zimgog/。在实际的用中,元音带有声调。对非罕见字的各种输入码,第一个元音的声调为该字原来拼音的声调,第二个元音的声调取汉语拼音第三声。如,"取","QUD0T",带调读音为/q0d6t八罕见字表音六码的带调读音,第一、二个元音均取第四声。如,"紅",表音六码为"ZIMGOG",带调读音为/zimg6g/,采用不同的声调可有效区别罕见字与非罕见字。语音输入中,可以逐字读出各输入码或标准码,也可将词组的输入码、标准码连读,增强输入的流畅性。第一、二个元音不同的取声调方式视为不同的实施例。<table>tableseeoriginaldocumentpage27</column></row><table>权利要求1、一种音形汉字无重码输入法,包括以下步骤1)将汉字的笔画归纳为“横、竖、撇、捺、折”,并用分别用字母“a、o、e、i、u”分别表示;2)将汉字拼音的首字母作为汉字的第一编码码元,首字母为元音时用字母“V”作为码元;3)将汉字拼音的韵母作为汉字的第二编码码元,韵母只有一个元音时,取该元音,韵母有2个或2个以上元音,按“o、e、a、u、i”的顺序依次取元音;4)将汉字的首笔画与声调的组合作为第三编码码元,用字母“a、o、e、i”分别代表声调的和阴平、阳平、上声、去声,首笔画与声调的组合码为aaGoaHeaTiaYuaBaoFooJeoRioPuoCaeDoeKeeWieNueXaiSoiLeiQiiMuiZauAouOeuEiuIuuU;5)将汉字的第二个笔画作为第四编码码元;6)将汉字的末笔画与频序的组合作为第五编码码元,频序是对汉字前7个位的组合按字频排序,相同组合从高频到低频依次排序得到序号为1(a)、2(o)、3(e)、4(i),末笔画与频序的组合码和步骤4中相同;7)在键盘上依次输入该汉字的编码码元。2、根据权利要求1所述的音形汉字无重码输入法,词组及短语的输入步骤为二字词组,取首字的前三码,取末字的第一、三个编码;二字词组,取首字的第一、三个编码,取末字的前三码;二字短语,取第一个字的第一、第三码,取第二个字的第一、第三、第三码;三字词组,首字前三码+次字和末字的首码;三字词组,取首字的第一、三个编码,取次字的第一、三个编码,取末字的首码;三字短语,取首字的第一、三个编码,取次字的第一、三个编码,取末字的首码;四字词组,取首字的前两码,其它字的首码;四字词组,取首字的第一、三个编码,次字、第三个字和末字的首码;四字短语,取首字的第一、三个编码,次字、第三个字和末字的首码;五字及以上词组,取首字的前二码,次字、第三字和末字的首码;五字及以上短语,分别取前四字的首码和末字的首码。3、根据权利要求1所述的音形汉字无重码输入法,采用数字键"1、2、3、4、5"作为输入码元时,"a、o、e、i、u"分别用"1、2、3、4、5"表示,辅音字母用两个数字表示,其对应关系如下11:G21:H31:T41:Y51:B12:F22:了32:R42:p.52:c13:D23:K33:w43:N53:X14:S24:34:Q44:M54:z15:A25:035:E45:I55:u。4、根据权利要求1所述的音形汉字无重码输入法,采用数字键"0、1、2、3、4、5、7、8、9"作为输入码元时,只需将元音字母和辅音字母指定到对应的数字键盘上,再依次输入汉字的码元即可。5、一种音形汉字无重码输入法,包括以下步骤-1)将汉字的笔画归纳为"横、竖、撇、捺、折",并分别用字母"a、o、e、i、u"分别表示;2)将汉字拼音的首字母作为汉字的第一编码码元,首字母为元音时用字母"V"作为码元;3)将汉字拼音的韵母作为汉字的第二编码码元,韵母只有一个元音时,取该元音,韵母有2个或2个以上元音,按"o、e、a、u、i"的顺序依次取元音;4)将汉字的首笔画与声调的组合作为第三编码码元,用字母"a、o、e、i"分别代表声调的和阴平、阳平、上声、去声,首笔画与声调的组合码为aa:Goa:Hea:Tia:Yua:Bao:F00:Jeo:Rio:PUO:C£16DOS:K66wie-NU6:Xai:soi:ei-Qii:Mui:Za_u:AOU:06U:Eiu..IUU:u5)将汉字的第二个笔画作为第四编码码元;6)将汉字的末笔画与频序的组合作为第五编码码元,频序是对汉字前7个位的组合按字频排序,相同组合从高频到低频依次排序得到序号为1(a)、2(o)、3(e)、4(i),末笔画与频序的组合码和步骤4中相同;7)用语音读入该汉字的编码码元。全文摘要本发明公开了一种音形汉字无重码输入法。它包括以下步骤将汉字拼音的首字母作为汉字的第一编码码元;将汉字拼音的韵母作为汉字的第二编码码元;将汉字的首笔画与声调的组合作为第三编码码元;将汉字的第二个笔画作为第四编码码元;将汉字的末笔画与频序的组合作为第五编码码元;在键盘上依次输入该汉字的编码码元或用语音读入该汉字的编码码元。本发明编码科学、合理,选取的编码信息如声母,音素,首、次、末笔,以及字频均较为客观,不会引起歧义,并且没有重码,有效地解决了汉字输入中单字与词组的重码问题。文档编号G06F3/023GK101587381SQ200910043719公开日2009年11月25日申请日期2009年6月19日优先权日2009年6月19日发明者丹肖申请人:丹肖
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1