专利名称:动态分音汉字输入法的制作方法
技术领域:
本发明涉及一种汉字输入方法。
背景技术:
目前,已发明的汉字输入方法很多,但真正被广泛采用的却不多。最流行的有拼音法和拼形法。拼音法把汉字的拼音作为编码,几乎不需学习就能掌握,因而被普遍采用。然而,汉字的发音总共才400种左右,必然出现大量的重码,一个汉字往往要经过多次翻页才能找到,因此输入速度较慢。拼形法把汉字分解为字根或笔型,并规定各字根与笔型的代码。字根码重码少,输入速度较快。但其编码规则复杂,需经专门的学习才能掌握,而且死记硬背的东西多,容易忘记。笔型码编码原则相对简单一些,但靠增加码长来降低重码,影响了输入速度。
发明内容
为了做到简单易学,记忆量少,码长短,重码少,不用翻页选字,可以快速输入,本发明创造了动态分音汉字输入法。该法将汉字分为若干个字素,字素包括汉字和偏旁部首,取各字素读音的拼音首字母为音码,按照字素在汉字中的书写笔顺排列各个音码,若干个音码的组合即汉字的编码。一个汉字若包含的字素少于3,同时又有剩余零笔画,则取最前的笔画的音码作为补码。全部码长不超过3。取码时遵循采用不固定大小的字块作为字素的动态取码规则,使得取码更加完整,全面,同时避免了对汉字的过分分拆。
采用本发明编码,一,二级汉字50%无重码,41%重码数为2--3,9%重码数为4--6。而对于常用汉字(一级汉字)则更是达到63%无重码,33%重码数为2--3,仅4%重码数为4--6。
具体实施例方式
1.分音将汉字拆分为几个音,故而称为分音法。针对汉字的结构特点,将汉字拆分为称作为字素的若干个字块,每个字素的自然读音的拼音首字母就是其音码。其中发音为yi,wu,ü的音码分别取i,u,v。若干个音码的组合即汉字的编码。音码排列的先后次序由各字素的首笔画的书写笔顺决定。笔顺严格按照汉字标准书写规则。
(1)字素字素的范围包括汉字和偏旁部首。
所有具有组字能力的汉字都可以作为字素。可以是少笔画的人,卜,日,中,刀等,也可以是多笔画的我,高,孙,青,叟等,后者可分别组成饿,篙,逊,氰,瘦等。
偏旁部首也可以作为字素。简单的有宀,刂,氵,廴,阝等,较复杂的有虍,巛,匚,疒,攵等。
(2)音码汉字的音码取其读音的拼音首字母。例如,人(ren-r),卜(bo--b),中(zhong--z),爱(ai-a)。
偏旁部首尽可能取约定俗成的名称,例如,宀(宝盖头--宝b),冖(秃宝盖--秃t),刂(立刀旁--立l),氵(三点水--点d),囗(国字框--国g),廴(建字底--建j),阝(耳字旁--耳e),虍(虎字头--虎h),巛(三折儿--折z),匚(区字框--区q),疒(病字旁--病b),攵(反文旁--文w)。
笔画指单笔零笔画,本发明规定了8种笔画,其名称与音码分别是横(h),竖(s),撇(p),捺(n),点(d),钩(g),折(z),弯(w)。若一个汉字包含的字素少于3,而且除了字素之外还剩有零笔画,则零笔画音码也将作为汉字编码的组成部分。
2.组码总的组码原则是尽可能将汉字完整拆分为3个(不行则2个)字素,以便不出现或少出现零笔画。尽可能让所有结构笔画都参与编码。
具体方案(1)只能分为3个以上字素的,取第1,2及末字素的音码。
例如噩,5个字素依次为王,口,口,口,口,取第1,2,5字素王,口,口,丢弃当中2个口,故编码是噩-wkk。若还有剩余零笔画的,也一起丢弃。
(2)可以整分为3个字素的则最理想。
例如宵--bxy,湾--dig。
若有剩余零笔画,则丢弃,例如俞--ryl,丢弃零笔画一横。
(3)只能整分为2个字素的,若2个字素内不再包含其他字素,就取这2个字素的音码。例如便--rg,芮--cn。
若包含其他字素的,取位于最后的1个尽可能大的内含字素的音码作为补码。
例如佐--rzg,左里面包含1个工(g)。荠--cqw,齐里面包含1个文(w)。
(4)分出1个或2个字素后还有剩余零笔画,则按笔顺取位于最前的零笔画的音码作为补码,补满3码为止,补不满3码的则补完为止。
例如班--wwd,2个字素王(w),再补零笔画点(d),多余1撇。
乏--zp,1个字素之(z),再补1撇(p),补码已经用完,码长仅为2。
有--yhp,1个字素月(y)再补2个零笔画音码横(h)撇(p),正好补完。
(5)无法拆分的独体字,取该字本身为唯一字素,该字素的音码为第一码,再以该字最前2个笔画的音码作补码。本发明规定不可拆分的汉字有下列3种类型交叉结构,例如我,里,必,事等。
包围或半包围结构内的连笔结构与外围结构有2个或2个以上连接点的,例如田,日,巨,月等。
字内不包含任何字素的,例如人,八,州等独体字的编码如我--wph,补撇横2码。田--tsz,补竖折2码。州--zdp,补点撇2码。乙--iw,该字为极少数的一笔字,因此只能补1码弯本规定可以避免将汉字拆分得七零八落而面目全非。
(6)左右结构的,左侧尽可能取1个完整字素;上下结构的,若下部含2个字素的,则上部尽可能取1个完整字素。
例如剧,左侧取1个完整字素居,再取右侧刂(立刀旁l),再补1个位于最后的最大包含字素古(而不是口),故编码为剧--jlg。
再如繁,下部含幺和小2个字素,上部敏就不再拆分,故编码为繁--mjx。
本规定可以减少重码。
3.动态取码所谓动态取码是指,不规定死固定的字素,不限定死字素的大小,而是采取灵活动态的取码方法,以便遵循尽可能将汉字完整拆分为3个(不行则2个)字素,尽可能让所有的结构笔画都参与编码的组码原则。
例如,品,3个字素是口,口,口,编码品--kkk,然而对于操而言,口不再作为基本字素,而是组合成一个品字作为字素参与编码,因此编码为操--tpm,正好整分成3个字素。若固定不变地以口作为字素,就会多余2个口被丢弃。
再如,解,3个字素是角,刀,牛,编码为解--jdn,而对于廨,应该分为广和解2个字素,再加1个补码牛,编码为廨--gjn,若拆分成4个字素的话,必然要丢弃1个字素。
动态取码避免将汉字过分分拆,有利于保持汉字基本结构的完整,同时使得取码能够更加全面完整地反映汉字的结构,有利于减少重码。
4.词组编码词组码长一律固定为4,而单字码长≤3,因此字词编码互不干扰,输入时不用转换,直接输入即可。
2字词组2字各取前2码。例如苏(cbl)州(zdp)--cbzd。
3字词组第1字取前2码,后2字各取前1码。例如列(dlx)车(chz)员(kbr)--dlck。
4字词组4个字均取第1码。例如超(zdk)级(jj)大(dhp)国(gvw)--zjdg。
多字词组第1,2及最末2字各取第1码。例如美(bwd)利(hlm)坚合众(rrr)国(gvw)--bhrg。
权利要求
1.一种动态分音汉字输入法,将汉字分为若干字素,汉字的输入编码由各字素的音码组成,其特征是字素包括汉字和偏旁部首,字素读音的拼音首字母即字素的音码,各音码的排列次序由汉字书写笔顺决定。
2.根据权利要求1所述的动态分音汉字输入法,其特征是分为3个以上字素的,取1,2及最末字素的音码;分为3个字素的,就取这3个字素的音码;整分为2个字素且不再内含其他字素的,就取这2个字素的音码,若还内含其他字素,则取位于最后的尽可能大的内含字素的音码作补码;分出1或2个字素后还剩有零笔画的,按笔顺取最前的零笔画的音码作补码,补满3码或补完为止;独体字本身的音码为第一码,再以前2个笔画的音码作补码。
3.根据权利要求1所述的动态分音汉字输入法,其特征是不固定死字素的大小,采用灵活动态的取码方法,以便尽可能将汉字整分为3个(不行则2个)字素,尽可能让所有结构笔画都参与编码。
全文摘要
本发明为一种动态分音汉字输入方法。该法将汉字分为若干字素,字素包括汉字及偏旁部首。字素读音的拼音首字母即为其音码,将音码按照各字素在汉字中的书写笔顺排列即成该字编码。若字素不足3而且除字素外还剩有零笔画,则零笔画的音码也须参与编码。本发明采用的动态取码方法使得取码更加完整全面并可避免对汉字的过分分拆。单字码长≤3,词组码长为4,字词输入不用转换。用本法编码,对于常用汉字,63%无重码,33%重码数为2-3,仅4%重码数为4-6,无须翻页选字。本法简单直观,一学就会,不需记忆,可以快速输入。输入过程有利于熟悉汉字结构与书写规则,对学习汉字亦有益处。
文档编号G06F17/28GK1760815SQ20041008546
公开日2006年4月19日 申请日期2004年10月17日 优先权日2004年10月17日
发明者杨明煜, 曹乃玲 申请人:杨明煜, 曹乃玲