专利名称:左部右部笔画数字编码汉字电脑输入法及其键盘的制作方法
技术领域:
本发明属于汉字电脑输入法及其键盘,特别是将左右(含左中右)结构的汉字分为“左部”和“右部”,称这些汉字为“左右字”,把其它所有的汉字作为“整体字”的一种电脑汉字输入法。
目前,数字键盘的应用范围十分广泛,如手机、电话、收款机、掌上电脑、电子字典、PC机等设备都使用了数字键盘。汉字输入的数字化,已成为人们日常生活中的一种需求。目前有不少的数码汉字输入法,CN1264859A的“五笔数码键盘汉字电脑输入法及其键盘”就是其中的一种。这种输入法的最大特征就是把汉字中的“上下、上中下、左右、左中右、包围、半包围”结构的汉字一分为二——“首部”和“余部”。本发明人认为,采用这种方法,一个很重要的目的就是在“跳跃技术”(如先取某字的前3码加最后2码,而不是直接连续取5码,这种方法称为“跳跃技术”)帮助下,降低重码率。事实上,这种输入法的“键选率”也大大低于国家标准。但是,由此而产生一个问题,即增加了学习难度和降低了使用效率。其主要表现在以下两点一是在划分“首部”和“余部”时产生了严重的二义性,该发明人不得不增加规则,约定之类的东西,加以阐述和定义,但还是有二义性的地方。人们要记住这些规则、约定,确实有一定的困难;二是对90%以上的合体字,采用了二次跳跃技术(一次是“首部“,一次是“余部”),也给人们带来了难度,降低了使用效率。总之“五笔数码”还是没有很好解决“易学”与“重码”这一长期困扰众多编码工作者面前的矛盾。
本发明的目的,就是提出一种全新的“左部右部笔画数字编码汉字电脑输入法及其键盘”的技术方案,以克服现有技术中“易学”与“重码”的矛盾,做到规则简单明了,记忆量少,重码率低,使含有数字键盘的设备,如PC机、掌上电脑、记事本、电子字典、手机、电话、收款机等有一种行之有效的汉字输入法。
本发明首创的“左部右部笔画数字编码汉字电脑输入法及其键盘”,是用数字键盘上的1、2、3、4、5五个数字键分别代表汉字的横(提)、竖(竖左钩)、撇、捺(点)、折五种笔画,并在6、7、8、9、0五个数字键位上安排了五组且每组“形意”相似的部件,其特征是将汉字中能够清楚划分的左右(含左中右)结构的字,从结构上划分为“左部”和“右部”,称这些汉字为“左右字”,把其它的汉字全部看作“整体字”;由“左部”的前二笔画(部件)、“右部”前二笔画(部件)或前三笔画(部件)和最后一笔画(部件)构成的“左右字”数字编码,再加上“整体字”的前四笔画(部件)和最后一笔画(部件)的“整体字”的数字编码,而构成完整的汉字数字编码。
众所周知,数字键盘上只有10个数字键可用于编码,编码空间有限,而大键盘有26个以上的按键可用于编码。因此,数字编码的重码率不大可能低于大键盘输入法的重码率。基于这种情况,本发明始终把“易学性”作为第一位来考虑,其次再考虑重码率的问题。要做到易学易用,就必须定义清楚,在实际使用过程中不能有二义性,规则或约定要少,尽可能减少记忆量等。从这一思路出发,本发明人经过长期的研究发现,“左右”(含左中右)结构的汉字,其“形状”最容易被人们辩认,在划分“左部”和“右部”时不产生“二义性”,并具有很好的离散能力。本发明人把这一认识用于编码的实践,成功地解决了现行技术方案中对汉字划分的“二义性”严重、规则或约定多的问题,并在五组精选的部件的帮助下,大大降低了重码率,提高了输入速度和使用效率。
“左部”是指对于“左右字”,按书写顺序,先写到的那一部分,例如 本发明的数字键盘与笔画和部件的对应关系如下一、按照国家标准,把“横(提)、竖(竖左钩)、撇、点(捺)、折(所有的折)”分别安排在数字键盘上的“1、2、3、4、5”上,其中“折”用“乙”象征性代表;二、部件与数字键6、7、8、9、0的对应是“6”——十、ナ、メ、 九、力、七、 又、廴、 即只要记住一句话,所有连续两笔画相交的部件;“7”——、 、扌、 丰、 卄、 ,即只要记住一句话,所有的二横、三横、二竖、三竖被一笔画穿透的部件,且这些笔画必须连续写成的。
“8”——人、亻、,八、 ,即“人”的变形,“八”的变形。
“9”——、冂、凵、 匚、、 几,即所有连续两笔画组成的三面包围。这三面包围的两笔画必须是第一笔画的起笔处和第二笔画的起笔处都处于同一位置;“0”——二、亠、。
采用这五组且每组“形状”极为相似的部件又是本发明的一个重大特征。它有三大作用一是便于记忆,大大增加易学度。在现有的技术方案中,一般都是直接选取使用频度比较高的部件(如日、月、口、目),来加强编码的离散能力,提高输入速度。但对部件之间的形状和规律缺乏足够的研究与分析,所选取的部件多,且部件之间的“联想性”差,其直接的后果是大大增加了记忆量和学习难度大。本发明不仅考虑到如何用部件来提高速度,降低重码率,而且也充分考虑到它们的“易学性”、“易记性”和“易用性”。例如日、月、口、目这几个使用频度较高的部件,现有的很多技术方案都是“全盘接收”。其实这四个部件的外形有一个共同的特点,即外围的形状都是“, ”。选取这两个部件就代表了“日、月、口、目、ㄇ、 ”这七个部件,就记忆而言,只要记住一个,即“连续两笔画组成的三面包围”,延伸出来的自然会联想到“ㄇ、冂、凵、匚、几、 、、冖、 ”等部件。再如“钅”与“亻”这两个部件,其“外形”都是“人”的变形,只要记住一句话“人”的变形,自然就可能延伸出“人、亻、”这三个部件。总之,本发明所选取的五组部件,每组“形意”都非常相似,便于记忆,易学度极高,这与传统技术中多直接采用高频的部件有着质的区别。
二是把汉字的笔画(部件)较为平均地分配在10个数字键上,并大大降低了重码率。本方案主要从两个方面来考虑降低重码率。一方面是,由于汉字的五种笔画只占用1——5五个数字键,且这五种笔画的数量大小差别较大。如何把数量比较大的笔画,以部件的方式分离出来,分配到6、7、8、9、0这五个“空闲”的数字键上,尽可能使这10个数字键各自所表示的笔画(部件)的数量相接近,以达到平均分配、减少重码的效果。另一个方面是必须同时考虑这些部件能够离散因上下、上中下、包围结构的汉字与“独体字”一样当作“整体字”看待而产生的重码。例如在国家一、二级字库中,用“”作为“上部”的汉字就有114个,按照“整体字”的取码规则前4末1,单“上部”的“”就占了4码,只剩下1码来完成114个汉字的重码离散工作,即使是最平均地分配到0——9十个键位上,也会产生10组且每组有11.4个汉字的重码。象这样的“上部”就占用了3——4个码,且使用频度较高的汉字还有不少。如 、、亠、艹、ナ”等部件在汉字“上部”的几率极高,仅“上部”就占用了2—4码,若不把它们当作一个部件取一码,只剩下1—3码来离散含有这些部件汉字的重码,重码率必定很高。把它们作为部件取一码后,还有4码来离散这些汉字其余的笔画结构,降低了重码率。
三是大大减少了拆字取码的“二义性”。众所周知,由于长期存在的汉字书写顺序的因人而异,任何用笔画作为码元的汉字输入法,都面临着汉字书写的“二义性”问题。传统的做法往往是从取码的位置来寻找解决的方法,即多采用选取前几笔和后一、二笔(因为前后笔画书写顺序写错的可能性比较小,同时具有较好离散编码的能力),而忽略了把这些容易写错的“笔画对”作为一个部件取一码来解决问题。如 类似这些问题不解决,势必增加一部分人的学习难度。若用容错码解决,这将大量增加实际使用中的重码率。本发明把类似这样的部件,当成一个整体取一码,就成功地解决了这一问题。
当字集比较大时,为了减少重码,“左右字”的取码规则为左部的第一、二笔画(部件),加上右部的第一、二、三笔画(部件)和最后一笔画(部件),最大码长为6码,不足六码的有多少取多少。
本发明的取码规则1、对于“左右字”,按书写顺序,先取“左部”的第一、二笔画(部件),再取“右部”的第一、二笔画(部件)和最后一笔画(部件),不足五码的有多少取多少。
2、对于“整体字”,按书写顺序,先取第一、二、三、四笔画(部件),再取最后一笔画(部件),不足五码的有多少取多少。
约定1、在取码时,按书写顺序,有部件的先取部件,没有部件的取笔画,即部件优先于笔画。
2、部件是相对独立的。若是部件中的任何一笔画被其它的笔画穿透,则该部件就不算为本方案中所述的部件。例“中”“”被“丨”穿透,所以此时的“”不算为本方案中的部件“”,而是应将其拆成笔画。其正确的编码是“中”——丨、乙、一、丨——2512,而不是、一、丨或、十;“广”由于“亠”中的任何笔画没有被“丿”穿透,所以“亠”是本方案所述的部件,其编码是“广”——亠、丿——03;“甘”字中的“艹”和“二”都没有被任何笔画穿透,所以按书写顺序所取的“艹”、“二”,仍是本方案中的部件,其编码是“甘”——艹、二——70。
图1是本发明所用到的数字键盘输入键位图。
下面结合附图和具体实施方式
对本发明作进一步的详细说明。
一、左右字 二、整体字 本发明若应用到PC机、手机、电话上,可用其中的“/、+、-、*、 del、C等作为重码字选择、空格、断码、翻屏等功能键和数字、词组、符号的引导键。
例在PC机上“/”作为重码字选择的引导键和数字的引导键。如“6”对应的汉字有1、十;2、力;3、九;4、又;输入6/3,则选中了“九”字。
输入/1234597/则认为是输入“1234597”。
输入∥816444则认为是输入“伟大”。
“+”、“-”作为翻屏键。
“*”作为断码键或空格键和标点、英文字母、符号的引导键。如6对应的汉字有1、十;2、力;3、九;4、又输“6*”,则选中了“十”这个字。
若输入**,则认为是输入空格键。
若输入“*00”,则认为是输入“,”。
若输入“*26”,则认为是输入“a“。
“del”相当于大键盘上的“backspace”键。
在手机上“#”作为重码字选择的引导键;“*”作为空格键; 作为翻屏键;“c”相当于PC上的“backspace”键。
词组的取码规则是1、两字词,取第一个字的前2码和第二个字的前4码共6码;当第一或第二个字的最长码长不足2码或4码时,重复取该字的最后一个码,直到取足为止。例“同意”的两个单字编码分别是“同—9191”,“意—08194”,则“同意”的编码是“91+0819”—“910819”;“伟大”的两个单字编码分别是“伟—81152”,“大—64”,则“伟大”的编码是“81+6444”—“816444”。
2、三个字以上(含三个字)取第一、二字的前2码和最后一个字的前2码,若所取的各字的最大码长不足2码时,重复取该字的最后一个码,直到取足为止。例“计算机”的各个单字编码是“计—456”,“算—09012”,“机—689”,则“计算机”的编码是“45+09+68”—“450968”;“一心一意”的各个单字编码是“一—1”,“心—4544”,“意—08194”,则“一心一意”的编码是“11+45+08”—“114508”。
以3755个国家一级字为例,本发明的根本特点和重大的技术进步,可以从本发明与现有技术方案进行比较中可以看出来。
表格注明一、所有技术指标都是简码后得到的;二、现有技术方案中的各项数据是从其使用说明书和编码宝典中统计出来的;三、单字的使用频度取自李公宜、刘如水主编的《汉字信息字典》;四、“跳跃技术”是指取码时,不连续取足码长,而是非连续取码。这种技术可降低重码率,但会增加拆字取码难度。
总之,本发明无论在“易学性”,还是在降低重码率、提高输入速度和使用效率方面都比现有方案有了实质性的突破,特别是“易学性”方面更是显而易见。另外,现有技术方案在拆字取码时,由于笔画书写顺序“二义性”,如
要么增加容错码,但这势必增加实际使用的重码率;要么有一些人无法正确拆字取码,增加了学习的难度,推广应用范围受到了限制;而本方案都把它们当作一个部件取一码,不存在二义性。
权利要求
1.一种左部右部笔画数字编码汉字电脑输入法及其键盘,利用数字键盘上的1、2、3、4、5等数字键来分别表示汉字五种笔画,并在0-9十个数字键在安排汉字的组字部件,其特征在于将汉字中左右结构(含左中右)的合体字从结构上分为“左部”和“右部”两部分,称这些合体字为“左右字”,把其余的汉字全部看成“整体字”;由左部的前二笔画(部件)、右部的前二笔画(部件)或前三笔画(部件)和最后一笔画(部件)构成的“左右字”汉字笔画(部件)数字编码,再加上“整体字”的取前四笔画(部件)和最后一笔画(部件)的“整体字”汉字笔画(部件)的数字编码而形成的完整的汉字数字编码体系。
2.如权利要求1所述的汉字电脑输入法及其键盘,其特征是在数字键位1、2、3、4、5分别表示汉字的横(提)、竖(竖左钩)、撇、点(捺)、折(所有的折),数字键位6、7、8、9、0所表示的部件如下键位6——所有连续两笔画组成的两笔画相交,即十、ナ、メ、 九、力、七、 又、廴、 键位7——所有的二横、三横、二竖、三竖被一笔画穿透,这些笔画必须连续写成,即 扌、 丰、 卄、 键位8——“人”的变形,“八”的变形,即人、亻、,八、键位9——所有的连续两笔画组成的三面包围,即ㄇ、冂、凵、 匚、、 几;键位0——二、亠、。
3.如权利要求1、2所述的汉字电脑输入法及其键盘,其特征在于数字键上的部件可根据字集的大小需要在键位之间相互调换或适当的增减。
4.如权利要求1、2所述的汉字电脑输入法及其键盘,其特征在于根据字集的大小需要,编码时,“左右字”的“右部”可选择3码或4码,以构成最大码长为5码或6码的编码体系。
5.如权利要求1、2、3、4所述的汉字电脑输入法及其键盘,其特征在于使用数字键盘上数字键以外的“*、+、-、#、 del”等符号键或组合键构成功能键,以实现重码选择、断码、翻屏、空格引导、数字引导、词组引导、符号引导、删除等功能。
6.如权利要求1、2、3、4、5所述的汉字电脑输入法及其键盘,其特征在于本发明可广泛应用于中文手机、电话机、笔记本电脑、PC机、掌上电脑、电子记事本、电子字典、机顶盒、收款机及上网等场合。
全文摘要
一种左部右部笔画数字编码汉字电脑输入法及其键盘,其最大的特征是将左右结构的汉字从结构上划分为“左部”和“右部”两个部分,把其它所有的汉字都当作“整体字”,并在数字键上安排几组“形意”极为相似的部件,按照取码规则而形成10键5码(或6码)左部右部笔画数字编码汉字输入法及其键盘,本发明极其简单,重码率低,使用效率高,可应用于通讯、信息、管理、网络等系统。
文档编号G06F3/023GK1327188SQ01121568
公开日2001年12月19日 申请日期2001年6月30日 优先权日2001年3月2日
发明者郑岩松 申请人:郑岩松