专利名称:《三笔码》汉字输入法的制作方法
第一章概述本发明涉及汉字信息处理的键盘和汉字信息键盘输入的编码方法。如CN85100087A,CN1076039A,CN1085332A中揭示的以及其它现有编码方案存在或者部分地存在以下缺陷①汉字输入键盘设计缺乏充分的规律性。
②字根布局缺乏内在逻辑,需记几十至百余无理分配的字根分配。
③拆字无统一依据,易发生歧义,拆字难度大。
④组码过程和键位选择缺乏必然和直接的联系,和指法脱节。
⑤把汉字拆分得支离破碎,极不符合人们对汉字的习惯认识。
本发明利用简单易学的键盘和字根布局和简单易行的汉字拆分原则,克服汉字输录技术中“易学不快,快不易学”的难题。
本输入方法同时具有以下几大特点①键盘布局按简单、统一的原则进行,学习一遍后即可记住。
②字根的寻位过程遵循简单易学的原则。既可以临时生成,也可记忆。为学员从初学到熟练提供了连贯统一的输入方法。
③汉字的拆分有规可循,而且字根和我们熟悉的偏旁部首基本吻和,符合汉字的习惯认知心理,突破了汉输入技术中“汉字拆分瓶颈”的难题,有助于汉字字根(部件)的标准化。
④字根的分布及寻位过程完全和指法相统一,容易达到极高的输入速度。
⑤可选择使用声音属性做为识别码,也可不用,进行纯形码输入。既兼容了声码和形码的双重优势,又使用户不必为某些字的输入感到困难,实现了用户可进行互不干扰的双向输入方法的自由选择。第二章汉字的拆分在许多汉字输入方法中,字根是由输入方法的发明人所硬性指定的。字根的获得既没有一定的规则,也和大家习惯的“偏旁部首”有较大的差异。导致输入人员必须死记住哪些是这个专家选中的字根,哪些又不是。给初学者带来极大的记忆负担,使汉字输入学习成为一件繁重的劳动。有些输入法具有较为明确的拆分规则,但是把汉字拆得支离破碎,和汉字的传统认识相抵触,既为人们难以从心理上认同,也大大地影响了输入速度。
一个好的汉字拆分方法应具备两个必要条件一是拆分要有明确的、固定的规则;二是,拆分出的字根要尽可能和大家习惯认知的汉字部件(即,偏旁部首)保持一致。本方法约定的拆分规则简单、明确,而且拆分出的字根和我们通常所说的“偏旁部首”高度吻合,基本上覆盖了《新华字典》中五笔以下的所有偏旁部首。学员基本上可以按照一般的习字方式拆分汉字,从而大减少了汉字输入学习的难度。拆分方法达到了“无法之法”的境界,这是对汉字输入技术中“汉字拆分瓶颈”的一个突破。所以,初学者在学习汉字拆分之前就可以先试着进行汉字输入练习。第一节笔画和字根一、笔画按照习惯的分类方法把三十多种笔画归为“横(提)、竖、撇、捺(点)、折(弯、勾)”五种形态的基本笔画。这五种笔画又进一步归为三大类横、竖两种笔画形态平直,被叫做“直笔”,撇、捺两种笔画形态倾斜,被叫做“斜笔”,而折笔的形态有明显的转折,被叫做“折笔”。二、部件和字根笔画按照一定的方式组成相对稳定的笔画组合叫做部件。我们通常所说的“偏旁部首”也就是被大家认可的汉字组成部件。所以,我们说,笔画构成部件,部件组成汉字。部件一般应具有两个或以上的笔画。
字根是按照某种约定的汉字拆分方法所拆得汉字的最小部件。所以,字根的大小和种类的划分具有比较严格的规则。而部件是一个宽泛、笼统的概念。比如我们可以说“韶”字是由“音”和“召”两个部件组成的,也可以说它是由“立、日、刀、口”四个部件组成。三、字根的分类(一)、按笔画组合方式分按照笔画的组合方式,我们把字根分为交叉字根和接合字根两种。1、交叉字根含有交叉关系笔画的字根叫做交叉字根,如象“九、丰、土、木、又、禾”。交叉类字根因具有交结点而比较稳定,包含了“土、木”等元素的部件,故又称“硬质部件”。2、接合字根不含交叉关系笔画的字根叫做“接合字根”。如“八、立、亥、亦、衣、日、皿、巳”就是属于接合字根。接合类字根没有交结点,结构松散,故称“软质部件”。(二)、按笔画数分类我们按照一个字根所包含的笔画数目对字根进行分类,比如,把两个笔画组成的字根叫做两笔字根,三笔和四笔组成的部件分别被叫做三笔字根和四笔字根。单笔画是一种特殊的组合形式,我们把它叫做“单笔字根”。比如“工、子、山”都是三笔字根,“火、木、戈”都是四笔字根。另外,我们把象“弗、立、衣”等字这种五笔及以上的字根都叫做“五笔以上字根”,简称“五笔字根”。(三)、按起笔分按照字根的起笔种类把字根分为三大类。直笔起笔的字根叫做“直起笔字根”,斜起笔的字根叫“斜起笔字根”,折起笔的字根叫“折起笔字根”。(四)、按成字与否分类按字根是否是一个现成的汉字,把字根分为成字字根和非成字字根。成字字根是字根的一种特殊情况,我们也把它叫做“根字”。第二节汉字的构型拆分汉字的拆分先按照构型拆分为不同的部件,然后再对部件进行拆分,拆出一个汉字的字根。构型拆分以汉字构型为参照,按照左右、包围等汉字的典型构型把汉字拆为不同的部件。一个字可能是由多种构型复合而成,要进行层层分解。如“韶”,首先分为由“音、召”左右构型两部分,“音、召”分别按上下构型又分成“立、日、刀、口”四个部分。一、左右构型的拆分凡是以左右关系结合在一起的部件均要拆分开来。如“构”字,首先要按照左右构型拆分为一个“木”和一个“勾”。象“北、亿、以、引”这样的字或部件也要拆为左右两部分。二、包围构型的拆分包围构型是指以“口”型框包围形成的汉字构型,如“日、目、因、国”字。包围构型的拆分也极易掌握,只有以下两条简单易行的规则1、包围要拆一般包围构型中含有三笔及以上笔画,这时必须拆分如“国、因、回”字,其“口”形框内包围的笔画在三笔或三笔以上,必须先拆分出一“口”形方框,然后再拆其内部部件。2、包围单元不拆包围框内的笔画不到三笔的包围构型,称为包围单元。包围单元不拆分。如“口、日、日、目、四、田”等字或部件是不拆分的部件,即字根。三、其它构型的拆分除上述的不会混淆的左右和包围构型外,其它构型的字要参照构型,结合部件的拆分规则来拆分。第三节汉字的部件拆分在进行了上述构型拆分之后,就要对拆分得到的部件进一步地拆分。一、交叉部件的拆分1、交叉笔不拆相互交叉笔画在任何情况下均不能拆分开,如“十、九、又、车、丰、弗、册、夷”等。只由相互交叉的笔画组成的字根叫做纯交叉字根,如“九、十、丰、弗”。2、陪笔不拆依附于纯交叉字根部件上孤立的单一笔画就叫做“陪笔”。陪笔依附在交叉笔画上,临近没有可以和它组合成独立部件的其它笔画,和交叉笔画一齐被称为“带陪交叉字根”,为交叉字根的一种。一个字根可以包含不止一个陪笔,如“王、牙、天、失”字的首笔和末笔都属于孤立的单一笔画,都是陪笔,又如“来、米”中就有四个陪笔。二、接合部件的拆分接合类部件一般不拆分。
1、三笔以内(含三笔)均不拆分三笔以内的接合部件均不拆分。如“八、工、尸”。
2、三笔以上三笔以上的接合部件一般也不拆分,如满足下面三个条件之一者须拆分①含三笔及以上成字在接合类部件中,如果包含有三笔或三笔以的成字,这些成字具有相对的稳定性和独立性,要单独拆分出来。如“亚、示、尔”。②含两个两笔成字要拆拆到不同时含有两个两笔成字时。③含一两笔成字且必须和其它部分开书写者所谓必分开书写是指其上下间隙是由两横或两个横笔画段形成,这种间隙是书写不可忽视的。“比如“亢、厄”中的两笔成字和其它笔画之间的间隙是由横笔或横向笔段形成,必须分开书写,否则将会失去原样,所以必须拆分成两个部件。而“贝、云、六”等字也含有两笔成字,但是在两笔成字和其它的间隙处可以相接或者相接后字型仍基本正确,故不再拆分。三、归一原则在拆分发生歧义出现几种可能拆法时,要按照归一原则处理。归一原则是一个优先顺序的原则,拆分的优先顺序是“较大成字、成字、较大字根,兼顾直观”。第三章字根在键盘上分布一、键盘字根键盘为标准键盘的26个英文字母键。如附
图1所示,键盘分三排,左右两部分。分别从键盘的两端向中间方向,把键盘的左右各分为5列。数字键1、2、3、4、5对应的五列就是左部的第一、第二、第三、第四、第列,数字键6、7、8、9、0对应的五列就是右部的第、第二、第三、第四和第五列。二、字根分布(一)、分布原理1、左右分配键盘的左半部安排接合类部件,右半部分安排交叉类部件。也即,凡是交叉类字根均分配在右半部分,由我们的右手来敲击,而不含交叉笔画的字根则分配在左半部分,由我们的左手负责。因此左右分配“左手软、右手硬”。2、列数分配列数按照字根的笔画数来分配,一定笔画数的字根分配在相应的列数上面。即分配在某个键上的字根的笔画数应和该键在键盘上的列数相等。这样,使得部件的笔画数和指法相吻合,也即,小指姆负责1列的1划字根,无名指和中指分别负责2笔和3笔的字根输入,食指除了负责4划的字根外,还负责5划及以上的字根。3、行位分配横和竖起笔的字根安排在第一排键上,叫做“直起笔字根”;撇和捺起笔的字根安排在第二排键上,叫做“斜起笔字根”;“折起笔字根”安排在第三排键上。折起笔部件的2、3画交叉部件上移到第二排。4、“土、木、水、火、人、口”的分布如附图1所示,按字母A的形态,把“人(八、)”字根安排在其上。安读音,“(方框)”安排在K键,而“口”安排在K键左边的J键上。按原理,“水”位于“V”键,把“(三点水)”安排在该键上,“火”紧临其右,安排在B键上,与之对称地,N、M上分别安排“木”和土,这样,正好以左部的“水、火”和右部的“木、土”形成对称,代表“软”“硬”两大类部件。(二)、分布实例附图1列出部分字根的分布示意,其它均按分布原理自行归位。
工接合、横起类,三画,左部3列上位E键。
亥接合、点起笔、五划(以上),左部5列中位G键。
水接合、折起笔、四划,左部四列三行位V键。
大交叉、横起笔、三划,右部三列上位I键。
禾交叉,五划且首笔为撇,故在右部5列中位H键。
弗交叉、折起笔、五划(以上),右部5列三行位N键。第四章汉字的输入第一节单字输入一、单字的编码前三个字根的编码+最后一字根编码。二、纯形码输入法即按上述编码输入,不足四码的字用“;”键结束,完成一汉字的纯形码输入。三、声码输入法在上述输入字根编码如不足四码时,在其后补如该汉字的声母代码。声码即是该字汉语拼音的声母代码,大部分直接对应到键盘上。“zh、ch、sh”分别用“A、U、I”三个键来表示。无声母的汉字以韵母首字母代替。若输入声母识别码后仍不足四码,则要用空格键来结束该字的输入。五、成字字根(根字)的输入如果输入的汉字正好是一个字根本身。那么,输入该字根编码后,要输入其末笔作为字根编码,最后输识别码。第二节简码输入法一、一级简码一级字根简码第一码十空格键。
一级拼音简码声码+P键。
“的”字只须按“;”键一次,即输入“的”字。
“是”字只须按“P”键一次,即输入“是”字。二、二级简码前两码+空格键。三、三级简码前三个编码十空格键。第三节词组的输入双字词首字的首两码和次字的首两码。三字以上词首两字的首码和末字的前两码。第四节快速输入方法基于上述输入方法的键盘设计,可以和双拼结合实施一种快速输入方法。其特征是采用两个字根码和两个拼音码相结合。比如字根码,可以是上述编码的首两码,也可采取首、末码。拼音在前形成先声快码方案,如,双拼码+两个字根码,形码在前形成先形快码,如,首、末两个字根码+双拼码。快速码的简码也有上述两种,而其二级简码为声码+首字根码,三级简码可选择两种,一种是声码+两个字根码,也可是双拼码+一个字根码。
权利要求
1.一种汉字输入方法,包括键盘布局、字根的分类和分布的方法,其特征是先把字根分两大类,相应地把字母键盘分为左右两部分,字根再分为五类,相应地键盘的每一部分从两端开始向中间对称地分为五列,最后,字根再区分为三类,相应地键盘分三行,每一列就有三位,字根分别对应到第一、二、三行位上,这样三次分得30个键位,从而形成一个规则明确、简单易记、符合指法规范的汉字输入字根布局键盘。
2.一种基于权项1的字根的分类和分布的方法,其特征是把字根分为交叉型(包括带陪笔的交叉字根)和接合类字根(非交叉型)两类,相应地分配到字母键盘左右两部分,左边分布非交叉型字根,右边分布交叉类字根;然后,字根按笔划数分为1画、2画、3画、4画、5画字根5类,相应地键盘分布到键盘的5列,字根按笔数分布在对应数字的列上;字根再按其起笔形态分为“直起笔、斜起笔和折起笔”三类,键盘每一列有三位,字根按直起笔、斜起笔、折起笔并分别对应到第一、二、三行位上,折起笔的二、三画字根向上移到第二位;从而形成一个规则明确、简单易记、符合指法规范的汉字输入字根布局键盘。
3.基于权项1为用户设置的可选择输入方式,包括补加声母代码和一个纯形码结束标志“;”,供输入人员在输入过程中自由选用纯形码还是形声码输入方式。
4.基于权项1增加的一种和拼音编码结合的快速输入法,其特征是双拼码和字根码混合组成输入编码。
全文摘要
《三笔码》汉字输入法,属汉字编码键盘输入。它解决了汉字输入“易学不快”和“快不易学”的矛盾。主要特征是键盘左右两分,各分布一类字根(交叉和非交叉),每部分有5列,分布1到5笔画字根;每列分三位,依字根起笔三类型定键位。汉字拆分简单、规整,符合汉字习惯认知,字根在键盘的分配简单、规整且和指法一致,既可即刻生成也可记忆,用户可选择地使用声母代码。学习极容易,输入速度极高,适用于专业和非专业人员使用。
文档编号G06F3/023GK1151544SQ9512009
公开日1997年6月11日 申请日期1995年12月1日 优先权日1995年12月1日
发明者卢从文 申请人:卢从文