专利名称:一种汉字拼形编码计算机输入方法
技术领域:
本发明涉及一种汉字输入法,是一种汉字拼形编码输入法,属计算机中文信息处理技术领域。
背景技术:
随着计算机技术的不断发展,用户对计算机汉字输入技术的要求越来越高,汉字编码方案的规范性、易学性、自然性等,逐渐成为用户选择该编码输入法的重要依据。目前的汉字编码输入法存在的主要问题是
1、形码方案大多采用字根编码输入法或笔画编码输入法。字根编码输入法中涉及的字根数量多,汉字拆分规则复杂,虽然在一定程度上解决了重码率的问题,且一旦掌握,即可见字输字,其输入速度较快,但难学、难记却是字根编码输入法难以克服的障碍。笔画编码输入法虽然简单易学,但取码速度慢、重码率高却是笔画编码输入法的主要难题。因此,形码方案的编码过程复杂、记忆量大、容易忘记等一系列问题,是影响用户选择的重要因素。2、音码方案对于不认识的汉字或者读音不准确的汉字则难以录入,并且因为汉字只有400多个音节,重码率极高(如全拼、双拼等方案),选字择字相当费时、费眼力,很大程度上影响了汉字的输入速度及输入效率,甚至无法输入不会读的汉字,不能适应各地区、各层次人员对汉字的输入要求,并且上述种种问题在拼音编码方案中是无法克服的。随着计算机应用领域的逐步扩大和应用程度的不断深入,计算机汉字输入方法存在的上述问题,已成为制约汉字处理技术发展的主要因素之一,因此,有必要探索更为简单,更容易学会,更加规范、快速的汉字编码输入方法。
发明内容
本发明的目的在于提供一种汉字拼形编码计算机输入方法,只要掌握汉字的简单结构、笔画分类和汉字拼音的首字母,就可以快速完成汉字的拆分和输入,且不会遗忘。本发明的技术方案是依据汉字的自然结构,将汉字分为三体字结构、二体字结构、独体字结构三类,再依据汉字笔画,将汉字分为横(提)、竖、撇、点(捺)、折五类,其中三体字结构为上中下结构、左中右结构、上下或左右或内外或合体汉字的其中一部分能够继续拆分的结构,具体有下列六种三体字上中下结构;左中右结构;左右结构,且左边或右边仍能按规则继续拆分;上下结构,且上边或下边仍能按规则继续拆分;内外结构,且内部仍能继续按规则拆分;合体结构,且其中一部分仍能继续按规则拆分。二体字结构为上下结构;左右结构;内外结构;合体结构。独体字结构为按自然结构不能进行拆分的汉字。本发明结合汉字的特点,设计了三体字结构、二体字结构、独体字结构的编码规则,从而实现了汉字编码方案的简单、易学、高效、低重码。本发明的编码方案仍然使用原有的英文字母键盘,无需做任何改动。
本发明所述的拼形编码规则如下
一、三体字结构的编码规则为 第一码汉字的拼音首字母; 第二码汉字第一体的拼音首字母; 第三码汉字第二体的拼音首字母; 第四码汉字第三体的拼音首字母;
二、二体字结构的编码规则为 第一码汉字的拼音首字母; 第二码汉字第一体的拼音首字母; 第三码汉字第二体的拼音首字母; 第四码汉字末笔画的拼音首字母;
三、独体字结构的编码规则为
按汉字笔画书写顺序,将独体字分为一笔画的字、二笔画的字和三笔画及其以上的字, 各类笔画的字按下列规则编码
1、一笔画的字
第一码汉字的拼音首字母;
第二码第一笔画的拼音首字母;
第三码字母0,即不足四码时,用字母0结束;
2、二笔画的字
第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母; 第三码第二笔画的拼音首字母; 第四码字母0;
3、三笔画及其以上的字 第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母; 第三码第二笔画的拼音首字母; 第四码汉字末笔画的拼音首字母。按以上规则,在对三体字或两体字进行编码时
1、当汉字的第一体或第二体或第三体为成字时,取该成字的拼音首字母;
2、当第一体或第二体或第三体为非成字但该体为表2所列的偏旁部首时,取该偏旁部首对应的拼音首字母;
3、当第一体或第二体或第三体非成字且又不属于表2所列的偏旁部首时,按表3取第一体或第二体或第三体首笔画的拼音首字母;
4、按以上三体字、两体字和三笔画及以上的独体字的编码方法(S卩先取整字的拼音, 再取各体的拼音,简称为“先整后零”,下同),把汉字拼音的首字母作为最后一码,其余三码依次向前顺移,独体字中的一笔画字、二笔画字的汉字拼音的首字母移到字母0前,其余编码依次向前顺移(即先取各体的拼音,再取整字的拼音,简称为“先零后整”,下同),增加了输入汉字的灵活性,对于不认识的汉字也能进行输入,从而达到混合输入的目的。
本发明具有下列优点和效果采用上述方案,可自然、高效、快速完成汉字的拆分和输入,且重码率低,只要熟悉汉字的基本结构和汉字读音声母的首字母,就可输入汉字, 适应期短,掌握后不会遗忘。本发明具有拆分汉字简单、直观、记忆量小、学习周期短等特点,可应用于计算机汉字编码输入领域。适合于任何层次的人员学习和使用,既适用于识字教学阶段的同步学习,也适用于已经掌握汉字、具备汉字拼读能力的人员使用。
具体实施例方式下面结合实施例对本发明做进一步描述。 实施例本发明依据汉字的自然结构,将汉字分为三体字结构、二体字结构、独体字结构三类,再依据汉字笔画,将汉字分为横(提)、竖、撇、点(捺)、折五类,其中
一、三体字结构有下列六种
1、上中下结构,如“意、宽”等;
2、左中右结构,如“树、瓣”等;
3、左右结构,且左边部分能继续按规则拆分的汉字,如“剖、数、励”等,或右边能继续拆分的汉字,如“结、编、倍、涯”等;
4、上下结构,且上边部分能继续按规则拆分的汉字,如“智、驾”等,或下边能继续拆分的汉字,如“籍、崮”等;
5、内外结构,且内部能继续按规则拆分的汉字,如“同、厢、周、阃”等;
6、合体字,且其中之一仍能继续按规则拆分的汉字,如“或、迥”等。二、二体字结构为
1、上下结构,且其中任何一部分按自然结构不能再拆分的汉字,如“字、类”等;
2、左右结构,且其中任何一部分按自然结构不能再拆分的汉字,如“任、利”等;
3、内外结构,且其中任何一部分按自然结构不能再拆分的汉字,如“凶、国”等;
4、合体结构,且其中任何一部分按自然结构不能再拆分的汉字,如“成、在、左”等。三、独体字不能拆分的汉字,如“大、中、重、一、十、乙”等。本发明的编码方案仍然使用原有的英文字母键盘,无需做任何改动。本发明的拼形编码规则如下 一、三体字结构的编码规则为 第一码汉字的拼音首字母; 第二码汉字第一体的拼音首字母; 第三码汉字第二体的拼音首字母; 第四码汉字第三体的拼音首字母; 如
上中下结构“意”的编码为:ylrx ;“奔”的编码为:bdsh ; 左中右结构“树”的编码为smyc ;“堆”的编码为dtrd ; 上下结构,且上边部分能继续按规则拆分的汉字“驾”的编码为jlkm; 上下结构,且下边部分能继续按规则拆分的汉字“籍”的编码为jzlx ;“剖”的编码为=Plkd ; “结”的编码为:jssk; 的编码为:tshk ; “氮”的编码为dqhh。
笔画的字、二笔画的字和三笔画及其以上的字,
左右结构,且左边部分能继续按规则拆分的汉字左右结构,且右边部分能继续按规则拆分的汉字内外结构,且内部能继续按规则拆分的汉字“同合体字,且其中之一仍能继续按规则拆分的汉字二、二体字结构的编码规则为 第一码汉字的拼音首字母; 第二码汉字第一体的拼音首字母第三码汉字第二体的拼音首字母第四码汉字末笔画的拼音首字母如
上下结构的汉字“舌”的编码为sqWi 左右结构的汉字“村”的编码为cmcd 内外结构的汉字“国”的编码为g yh 合体汉字“差”的编码为cygh。三、独体字结构的编码规则为 按汉字笔画书写顺序,将独体字分为
各类笔画的字按下列规则编码 1、一笔画的字 第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母; 第三码字母0 ;
如“一”的编码为yho ;“乙”的编码为yZ0。2、二笔画的字
第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母; 第三码第二笔画的拼音首字母; 第四码字母0;
如“十”的编码为=Shso ;“九”的编码为jpzo。3、三笔画及其以上的字
第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母第三码第二笔画的拼音首字母第四码汉字末笔画的拼音首字母;
如“土”的编码为:thsh ;“五”的编码为=Whsh ;“本”的编码为:bhsh ;“果”的编码为 gszcL在对三体字或两体字进行编码时
1、当汉字的第一体或第二体或第三体为成字时,取该成字的拼音首字母,如“地”中第一体为“土”,编码为“t” ;“突”第三体为“犬”,编码为“q” ;
2、当第一体或第二体或第三体为非成字但该体为表2中所列的偏旁部首时,取该偏旁部首对应的拼音首字母
如“代”中的第一体为“4 ”,编码为“r”; “袖”中第一体为“卒”,编码为“y”; “虎”的第一体为“严”,编码为“h”;
3、当第一体或第二体或第三体非成字且又不属于上述偏旁部首时,按表3取第一体或第二体或第三体首笔画的拼音首字母
如“石”的第一体为“广”,不成字且不属于表2的偏旁部首,其首笔画为“一”,对应的拼音首字母为“h”;“冗”的第一体为“"”,其首笔画为“、”,对应的拼音首字母为“d”;“党” 的第一体为“#”,其首笔画为“丨”,对应的拼音首字母为“S”;
4、按以上三体字、两体字和三笔画及以上的独体字的编码方法(S卩“先整后零”),把汉字拼音的首字母作为最后一码,其余三码依次向前顺移,独体字中的一笔画字、二笔画字的汉字拼音的首字母移到字母0前,其余编码依次向前顺移(即“先零后整”),在输入过程中不用进行切换,增加了输入汉字的灵活性,从而达到混合输入的目的
如‘<_■”按“先整后零”的编码为yho,也可以按“先零后整”的编码为hyo“十”按’‘先整后零’的编码为shso,也可以按‘‘先零后整”的编码为hsso“土”按'‘先整后零’的编码为thsh,也可以按‘‘先零后整”的编码为hsht“王”按'‘先整后零’的编码为whhh,也可以按‘‘先零后整”的编码为hhhw“李”按'‘先整后零’的编码为lmzh,也可以按‘‘先零后整”的编码为mzhl“材”按'‘先整后零’的编码为cmcp,也可以按‘‘先零后整”的编码为mcpc“例”按'‘先整后零’的编码为lrdd,也可以按‘‘先零后整”的编码为rddl“型”按'‘先整后零’的编码为xkdt,也可以按‘‘先零后整”的编码为kdtx“编”按'‘先整后零’的编码为bshs,也可以按‘‘先零后整”的编码为shsb“别”按'‘先整后零’的编码为bkld,也可以按‘‘先零后整”的编码为kldb。表1为不同类型汉字编码实例。表2为偏旁、部首拼音首字母编码表。其中,表2中选用的22个偏旁部首进行编码,均为相应偏旁部首读音声母的首字母,无需特别记忆。不在表2中所列的其它偏旁部首按成字或其首笔画取码。表3为笔画拼音首字母编码表。表1部分汉字编码实例
权利要求
1.一种汉字拼形编码计算机输入方法,其特征在于依据汉字自然结构,将汉字分为三体字结构、二体字结构、独体字结构三类,再依据汉字笔画,将汉字分为横(提)、竖、撇、点 (捺)、折五类,其中三体字结构为上中下结构、左中右结构、上下或左右或内外或合体汉字的其中一部分能够继续拆分的结构,三体字结构有下列六种上中下结构;左中右结构; 左右结构,且左边或右边仍能按规则继续拆分;上下结构,且上边或下边仍能按规则继续拆分;内外结构,且内部仍能继续按规则拆分;合体结构,且其中一部分仍能继续按规则拆分;二体字结构为上下结构;左右结构;内外结构;合体结构;独体字结构为按自然结构不能进行拆分的汉字。
2.如权利要求1所述的汉字拼形编码计算机输入方法,其特征在于所述的拼形编码具有下列规则一、三体字结构的编码规则为 第一码汉字的拼音首字母; 第二码汉字第一体的拼音首字母; 第三码汉字第二体的拼音首字母; 第四码汉字第三体的拼音首字母;二、二体字结构的编码规则为 第一码汉字的拼音首字母; 第二码汉字第一体的拼音首字母; 第三码汉字第二体的拼音首字母; 第四码汉字末笔画的拼音首字母;三、独体字结构的编码规则为按汉字笔画书写顺序,将独体字分为一笔画的字、二笔画的字和三笔画及其以上的字, 各类笔画的字按下列规则编码(1)、一笔画的字第一码汉字的拼音首字母;第二码第一笔画的拼音首字母;第三码字母0,即不足四码时,用字母0结束;(2)、二笔画的字第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母; 第三码第二笔画的拼音首字母; 第四码字母0;(3)、三笔画及其以上的字 第一码汉字的拼音首字母; 第二码第一笔画的拼音首字母; 第三码第二笔画的拼音首字母; 第四码汉字末笔画的拼音首字母。
3.如权利要求2所述的汉字拼形编码计算机输入方法,其特征在于在对三体字或两体字进行编码时(1 )、当汉字的第一体或第二体或第三体为成字时,取该成字的拼音首字母;(2)、当第一体或第二体或第三体为非成字但该体为表2所列的偏旁部首时,取该偏旁部首对应的拼音首字母;(3)、当第一体或第二体或第三体非成字且又不属于表2所列的偏旁部首时,按表3取第一体或第二体或第三体首笔画的拼音首字母;(4)、按以上三体字、两体字和三笔画及其以上的独体字,先取整字的拼音,再取各体的拼音,即先整后零,再把汉字拼音的首字母作为最后一码,其余三码依次向前顺移,独体字中的一笔画字、二笔画字的汉字拼音的首字母移到字母0前,其余编码依次向前顺移,即 先取各体的拼音,再取整字的拼音,即为先零后整。
全文摘要
本发明涉及一种汉字拼形编码计算机输入方法,属计算机文字信息处理领域。本发明依据汉字自然结构特点,把汉字分为三体字、二体字和独体字三类,按汉字笔画分为横(提)、竖、撇、点(捺)、折五类。三体字第一码为汉字拼音的首字母,第二码、第三码和第四码分别为第一体、第二体和第三体拼音的首字母;二体字第一码为汉字拼音的首字母,第二码和第三码分别为第一体和第二体拼音的首字母,第四码为汉字末笔画拼音的首字母;独体字第一码为汉字拼音的首字母,第二码、第三码和第四码按汉字书写笔顺为第一笔画、第二笔画和末笔画拼音的首字母,不足四码用字母O结束。本发明具有拆分汉字简单、直观、记忆量小、学习周期短等特点,可应用于计算机汉字编码输入领域。
文档编号G06F3/023GK102339140SQ201110359520
公开日2012年2月1日 申请日期2011年11月14日 优先权日2011年11月14日
发明者施冰, 李锟华, 段利华, 王斌, 陈本辉 申请人:大理学院