形母码汉字输入法
【技术领域】
[0001] 本发明属于计算机信息处理技术领域,是对汉字形母码输入方法的改进。
【背景技术】
[0002] 汉字的编码是对汉字进行检索的基本依据。特别是随着电子计算机应用的普及, 如何通过标准键盘上的几十个按键输入成千上万个汉字,成为许多人所关注的课题,也出 现了许多种汉字输入法。
[0003] 各种名目的汉字输入法,主要可分为两大类:依照字音编码和依照字形编码。依照 字音编码主要是按照汉语拼音进行汉字输入,没有多少创新的空间。这种方法简单,易于掌 握使用。其缺点是重码率高,难以提高速度。对于不会汉语拼音和发音不准确的人难以使 用。所以人们更多考虑创新的方向是依照字形编码。
[0004] 多少年来,人们设计的属于计算机信息处理技术领域各种依照字形编码的汉字输 入法侧重于解决汉字的计算机输入问题,尽量降低重码率,减小平均编码长度。由于汉字结 构的复杂性,各种依照字形编码的输入法都比较难学,不宜掌握。
[0005]CN1054448C公开了一种汉字形母码输入方法,该方法使用26个字母键和10个数 字键输入汉字和词语的特征编码信息,具有记忆量小、简单易学等特点,特别是率先提出了 汉字输入法要与中文的教学相结合,尤其是与中小学的基础教育相结合,符合汉字书写笔 顺,因此受到国家有关部门的重视,并在大庆等地教育系统进行推广的试点工作。
【发明内容】
[0006] 本发明的目的是提供一种形母码汉字输入法,使用26个字母键输入汉字和词语 的特征编码信息,是对汉字形母码输入方法的重大改进。
[0007] 本发明的目的是通过以下技术方案实现的:
[0008] -种形母码汉字输入法,包括如下步骤:
[0009] -、将汉字输入键盘时的拆分单元分为基本形母、普通形母和组合形母,其中:
[0010] 1)、基本形母包括26个码,分配在计算机键盘的26个英文键名上:
[0011] A:马、B:贝、C:寸、D:刀、E:人、F:丰、G:弓、H:火、I:匕、J:金、K:可、L:了、M:木、 N:女、0 :口、P:片、Q:犬、R:日、S:水、T:土、U:目、V:山、W:亡、X:小、Y:月、Z:止;
[0012]2)、普通形母包括146个码,分配在计算机键盘的26个英文键名上:
UPP;酉:UK;朿:VM;束:0M;
[0041] 二、利用上述基本形母、普通形母和组合形母,进行汉字编码的方法为:
[0042](一)单字输入:
[0043] 1)、基本形母单独成字时,其编码是:基本形母所在键名后加字母V。
[0044] 2)、"虫"、"已"、Q "、"心"、"王"、"鸟"这六个形母组字时,如果是字的最后一个部 件,且编码小于四码,则在末尾附加其末笔画的编码。
[0045] 3)、普通形母单独成字时,其编码是:普通形母所在键名后加字的汉语拼音首字 母;
[0046]特例:
[0047] ①单笔画普通形母单独成字时,不加汉语拼音首字母。
[0048] ②"〇、一、四、五、七、八、九、儿"单独成字时,属"一级简码",不再保留附加汉语拼 音首字母的全码形式。
[0049]③普通形母中有一些在现代汉语中不单独成字,而只用做偏旁部首,如、 孑八、等,对于这些字,只能按单笔画编码。
[0050] 4)、两码组成一字时,其编码是:输入两码所在键名的字母。对于一部分常用字可 以在两码后附加字的汉语拼音首字母以避免重码的选择。
[0051] 5)、三码组成一字时,其编码是:输入三码所在键名的字母。
[0052] 特例:由三个相同的基本形母或普通形母构成的"品字形"的字,要附加末笔画编 码。
[0053] 6)、四码组成一字时,其编码是:输入四码所在键名的字母;
[0054]7)、超过四码组成一字时,其编码是:输入"首、二、中、末"四码所在的键名。
[0055] (二)词组输入:
[0056] 1)、对于由两个字组成的词组,依次取每个字的首、末码;
[0057]2)、对于由三个字组成的词组,依次取前两个字的首码和第三个字的首末码;
[0058] 3)、对于由四个或四个以上字组成的词组,依次取前四个字的首码;
[0059](三)简码输入:
[0060] -级简码:包括"一、快、看、他、她、它、不、把、吧、没、每、吗、四、想、要、否、非、发、 更、该、给、来、里、啦、五、子、在、儿、如、若、你、能、呢、的、地、得、六、为、无、旁、将、第、从、 除、此、比、以、及、七、都、走、我、〇、着、和、还、或、是、所、说、八、做、作、学、些、谢、去、却、 请、因、出、国、九、既、就、也、有、呀"78个最常用的字。它们大部分是按字的汉语拼音的首 字母定义其编码,有少数是按字的韵母字母定义其编码,或根据字的编码包含的形母的字 母定义其编码。
[0061] 本发明具有如下优点:
[0062] 1、汉字输入与汉语学习相结合。
[0063] 本输入法不仅适合用于汉字输入,而且适应汉语教学,特别是中小学基础教育。它 的拆分、编码完全符合汉字的部件组成及笔顺,符合汉字的字理。
[0064] 2、本输入法的设计完全考虑到符合国家标准的规定。主要有:
[0065] 识字教学用通用键盘汉字字形输入系统测评规则(教育部规GF-2011);
[0066] 信息技术通用键盘汉字输入通用要求(国标GB/T19246-2003);
[0067] 现代常用字部件及部件名称规范(教育部规范GF0014-2009);
[0068] 现代汉语通用字笔顺规范(语委会1997);
[0069]GB13000. 1字符集汉字笔顺规范(语委会GF3002-1999)。
[0070] 3、简单易学。
[0071] 本输入法选择26个笔划简单、有代表性、组字频率高的汉字部件作为组字的码 元,在本输入法中称之为"基本形母"。根据这些字的汉语拼音特性,对应定在键盘上的26 个英文字母键上,学者只需要几分钟就可以记住了。
[0072] 根据26个基本形母,通过"形"、"音"、"义"的联想,将其它常用字部件做出了衍伸 的定义,称为"普通形母"和"组合形母"。《现代常用字部件及部件名称规范》中所收录的汉 字部件共有514个。对于"普通形母"和"组合形母",需要做一点必要的学习和练习,但不 必死记硬背,通过"形"、"音"、"义"的联想,很容易掌握。用本输入法对汉字拆分、编码和录 入,就很容易实现了。
[0073] 4、本输入法所定义的形母全部是规范的汉字部件,这是其它很多种汉字输入法, 包括原始版本的形母码输入法所未能做到的。这对于学者准确地认识汉字的结构、字理是 很有好处的。
[0074] 5、本输入法对汉字的拆分、编码,完全符合汉字书写笔顺的规范,这对于正确地学 会汉字的书写是很有益的。
[0075] 除了使用本输入法设计的编码对汉字进行输入之外,同时也可以使用单笔画的方 式进行汉字输入。两种方法可以根据自己的习惯任意混合交替使用。这既可以解决初学 者遇到不会拆分的汉字无法输入的问题,又为学习汉字的人提供了练习汉字书写笔顺的环 境。
[0076] 6、按照国标GB/T19246-2003的规定,使用26个字母键输入汉字和词语的特征编 码信息,这是对形母码输入法(CN1054448C)的重大改进(CN1054448C使用26个字母键和 10个数字键输入汉字和词语的特征编码信息)。
[0077] 7、本输入法根据所包含的字符集的不同又分为三个版本。
[0078] 首先是以国标GB2312《信息交换用汉字编码字符集》收录的6, 763个汉字为基础, 又根据2013年国家最新颁布的《通用规范汉字表》8, 105个汉字做了补充,也保留了 1988 年版《现代汉语通用字表》中的字,即《信息交换用汉字编码字符集》、《通用规范汉字表》和 《现代汉语通用字表》的并集,共计8, 243个汉字。
[0079] 在此基础上简化出一个子集,只包括《通用规范汉字表》中一级字表的3, 500个常 用汉字的版本。它适合于初学汉语的人使用。
[0080] 在此基础上又收集了国标GB18030-2000规定的27, 533个汉字(包括部首、部件 等),合起来编制成共计27, 719个汉字的版本。它适合要求使用繁体字、异体字的人。
[0081] 本输入法为提高汉字录入的速度,还收录了常用词汇约5万条。
[0082] 8、平均码长和重码率。
[0083] 对于8, 243字符集的版本,本输入法收录的字、词共57, 977条,计135, 696字,将 全部字词录入一遍,共需击键282, 230次(包括重码选择的辅助信息输入击键),计算出平 均码长为2. 080键/字。
[0084] 选择议论文、散文、诗歌、故事等几种体裁的文章共9篇,11,107个汉字(所有汉字 都在国标GB2312范围内,不分段,无标点,无疑难字,无特殊符号,无专业术语),将全部资 料录入一遍,共击键23, 767次(包括重码选择的辅助信息输入击键),计算出