专利名称:逻辑拼形码计算机汉字编码输入法及键盘的制作方法
技术领域:
本发明涉及一种计算机汉字编码输入方法及键盘。
现有技术的计算机汉字编码输入方案已为数不少,从形码看,对字的拆分(部件与拆分)大都是在图1所示的第Ⅱ层和第Ⅲ层范围内进行。实践证明,这样的拆分量较大,部件与拆分的不确定(不规范)性是它的致命缺陷;同时,也不符合国家语委作为文字规范公布并实施的《汉字部件规范》另一方面,可以看出图1中第Ⅰ层次的拆分是汉字最大部件的拆分,也就是最少的拆分,它简单直观、拆分容易,部件有明确的定义,并与识字教育背景知识一致,且符合《汉字部件规范》。
本发明的目的是从文字学的角度,设计出一种客观存在的统—形码,部件是统一的(《汉字部件规范》中的基础部件),如果能找到客观性与唯一性均能得以证明的部件分类方法,那么统一形码的存在,就是可能的。逻辑拼形码就是这种编码。
本发明所述逻辑拼形码计算机汉字编码输入法包括按照汉字部件最大形体结构分类得到的46个逻辑拼形字母,简称拼形字母;与拼形字母形状相似的部件定义元拼形部件。
由拼形字母经过适度变形、变换,应用多笔画优先规则推导出的多笔画拼形部件及其复合部件;由元拼形部件或多笔画拼形部件,应用交叉不拆规则推导出的交叉拼形部件及其复合部件;上述拼形字母、元拼形部件、多笔画拼形部件及其复合部件、交叉拼形部件及其复合部件组成了汉字输入码元,即本发明所称的“块”,它们列于下表。
部件表 将上述码元定义到计算机通用键盘的相应键位上,采用下述规则在所定义的计算机键盘上利用相应键位输入汉字1、取码规则a、笔顺规则,即按汉字书写笔顺取码;b、取少规则,即一个汉字以取码最少为原则取码;c、取小规则,即当一个汉字有两种拆分且取码数相同时,部件小的先取;2、编码输入规则(一字四码)一码字拼形字母码+“G”键码+该字汉语拼音第一个声母码并重复一次;二码字第一拼形字母码+第二拼形字母码+该字汉语拼音第一个声母码并重复一次;
三码字第一、第二、第三拼形字母码+该汉字汉语拼音第一个声母码;四码字第一、第二、第三、第四拼形字母码;四码以上字第一、第二、第三及最后一个拼形字母码。
为了获得最快的编码反应速度和击键速度,本发明特别设计了如下表所列的拼形字母键位分布表并使用拼形字母的逻辑读音 键位表每个键位分有如图2所示的英文键名区(1)、拼形字母读英文键名区(2)、拼形字母读中文字音键名区(3)、拼形字母按英文读音与中文读音安排在相应键位的键名区内。
以下对本发明做出进一步说明。
本发明是在本人《逻辑拼形码及其键盘与热键显示法和无意识学习技术》(申请号97108270.7)基础上的改进与突破。
《汉字部件规范》业已公布与实施。对既定的规范部件进行科学的分类是输入法成败的关键。一般是按照汉字的属性(音、形、义)进行分类。可以证明只有形分类才是完备的。(《汉字部件规范》中560个基础部件,近一半是非成字部件,即无音、无意。)同时还可以证明只有最大形体结构分类才是客观唯一的(因而是统一的),并有强大的社会基础。
46个“拼形字母”是部件的最大形体分类结构①,并客观地存在于汉字部件之中。部件与拼形字母之间的关系是最大包含关系。一种是非交叉“包含关系”,一种是交叉的“包含关系”。
例如,非交叉包含关系 纟非交叉包含[ ] 非交叉包含[山] 非交叉包含[水][ ][山][水]是拼形字母,是部件的最大形体分类结构。同时也是汉字的逻辑编码。
绿纟 (“块”部件规范部件。物理拼形)[ ][山][水] (逻辑编码·拼形字母,逻辑拼形)W 山水 (逻辑读音②拼形字母的逻辑读音)又例如,交叉包含关系 交叉包含[又] 交叉包含[疋][又][疋]是拼形字母,是部件的最大形体分类结构。同时也是汉字的逻辑编码。
婕 (“块”部件规范部件,物理拼形)[又][疋](逻辑编码拼形字母,逻辑拼形)A疋(逻辑读音拼形字母的逻辑读音)我们可以证明部件与拼形字母是严格的最大非交叉包含或交叉包含关系(逻辑基础)。同时也有强大的社会基础。(汉字与部首也是这种最大非交叉包含或交叉包含关系)。同时,我们可以证明,拼形字母存在的客观性与唯一性。(即按“最大形体结构”分类原则对部件进行分类,大体上会得到同一结果。)注①我们已经证明了形体分类是“包含关系”。显然,我们定义最大形体分类结构的概念(最大包含关系),那么分类就是唯一的。如包含“亠”的部件集{亠亡方言·立 辛音·广疒鹿麻},客观地存在3个“最大形体分类结构”[亠][立][广](拼形字母),即[亠]→{亠亡方言}每个部件均包含最大形体分类结构[亠](拼形字母)[立]→{立 辛音}每个部件均包含最大形体分类结构[立](拼形字母)[广]→{广疒鹿麻}每个部件均包含最大形体分类结构[广](拼形字母)形体结构就是包含关系,它是客观确定的,而最大形体分类结构则是唯一的。[亠]并不能代表部件集{立 辛音}的分类形体。只有用比[亠]更大的[立]才能代表部件集{立 辛音}的形体结构特征。同时,不存在比[立]更大的形体分类结构(即[立]是最大的形体分类结构(唯一性))。[立]的形体是由部件{立 辛音}的形体包含关系决定的,而不可能是其他的非包含关系的形体(客观性)。
同理,部件{又文( }非交叉包含或交叉包含最大形体分类结构拼形字母[又]。
部件{疋( 非交叉包含或交叉包含最大形体分类结构拼形字母[疋]。
需要特别强调指出拼形字母的形与数量是由部件的形(形包含关系)与数量决定的,从而证明了拼形字母存在的客观性。而最大形体分类结构决定了拼形字母的唯一性。这样,拼形字母就完成了部件的形分类(如同部首完成了对汉字的形分类),分类是客观的、唯一的。因而,也是科学的、统一的。
②拼形字母的逻辑读音见0-6。
应说明的是,前述第一表中所列拼形字母为46个,是将其中的同源部件并为一个了,例如 与“卜”同源(新华字典中亦是如此分类), ”与“刀”同源等等,将二者合称为一个部件了。前述第一表1所列码元,即本发明的“块”,它包含了国标189个标准部首、交叉结构、常用搭配部件等拼形字母存在于汉字字形之中,是汉字的逻辑编码(作用),因而是汉字的固有属性。汉字由部件组成,而部件包含拼形字母,故汉字包含拼形字母,汉字基本属性是音、形、义。汉字字形中客观存在“音符”、“义符”与“形符”、“形符”就是拼形字母,就是汉字的逻辑编码。
(1)“音符”“昌”决定了下列汉字的读音昌→{菖、阊、猖、娼、鲳、倡、唱}都读“昌”音。
(2)“义符”{艹、门、犭、女、鱼、亻、口}决定了以上汉字的“义”。
(3)“形符(拼形字母)”{[艹]、[日]、[冂]、[犬]、[又]、[刀]、[人][口]}决定了下列汉字的逻辑编码菖[艹][日][日]阊[冂][日][日]猖[犬][日][日]“犬犭”同源娼[又][日][日]鲳[刀][日][日]“刀”同源倡[人][日][日]唱[口][日][日]“形符(拼形字母)”就是汉字的逻辑编码。每个汉字本身具有音、形、义三方面的特征或属性,而每个汉字本身存在拼形字母(形符),故拼表字母(形符)成为汉字本身所具有的特征即汉字的属性。这一汉字固有属性是信息化社会对汉字字形属性的重大发明与发现(汉字存在“形符”)。
上述的“音符”、“义符”、“形符”都客观地存在于汉字的字形之中(形包含关系)。即形声、形义、形符。但“音符”、“义符”还不能成为汉字的形属性,并不是每个汉字都存在“音符”、“义符”。只有“形符”是每个汉字本身所具有特征,因而是汉字的属性。
而“形符”就是拼形字母,就是汉字部件的最大形体结构分类,就是汉字的逻辑编码并存在于汉字之中,因此成为汉字的重要形属性。这种固有的形属性,(“拼形字母、逻辑拼形方案”)尤如或等同于“拼音字母、拼音方案”对文字学、识字教育、信息化社会的贡献。所不同的是,一个是从汉字的形属性出发,一个是从汉字的音属性出发。
当一个汉字能写出其形时,我们可以写出它的拼形字母,即拼形字母客观地存在字形之中,字形本身包含形字母(客观记录字形的符号系统)。字形的存在是第一性的。从而我们可以发明一套以拼形字母为核心的拼形方案(拼形字母同时也是汉字字形的逻辑编码,拼形字母共计46个)。人人会写规范汉字,这就是拼形方案的社会基础,也是汉字输入法形码的真实而可靠的社会基础。而这一社会基础远远超过了音码的社会基础。汉字的拼音字母是主观地规定在汉字上的,而拼形字母则是客观地存在于汉字字形之中的。
我们已经看到了部件的形体结构分类(拼形字母)客观存在于汉字部件之中,即部件非交叉或交叉地包含拼形字母。
逻辑拼形经过简单的学习,是人人都能学会的,并有强大的社会基础(汉字与分类的部首也是这种形体结构非交叉或交叉的包含关系)。
经逻辑拼形得到了汉字的逻辑编码,这一切竟与任何编码无关,也无需特别的记忆。拼形字母的逻辑读音也是一个简单的学习与记忆过程。需强调指出,对任何一个汉字都能进行逻辑拼形,并按拼形字母的逻辑读音去击键。至此,我们已经完成了逻辑拼形码的设计,同时也得到了“统一形码”。
逻辑拼形码实实在在是新一代形码也是统一形码。逻辑拼形是克服记忆之苦的利器,是统一形码的核心,正是由于它与任何编码方案无关,并成为文字的形属性时,才使它真正成为统一形码。
拼形字母的逻辑读音,是为了有最快的编码反应速度与最快的击键速度而设计的。
当我们看见汉字时,直接从汉字字形中读出拼形字母的逻辑读音,并按读音去击键。这样,我们就达到了上述目的。
拼形字母的固有属性是形、音。如[T][ ][匚][冂]……是形,而[立][戈][大][刀]……是有读音的,我们根据以下两条原则来设计或定义拼形字母的逻辑读音。
(1)与英文字母形相似的拼形字母的逻辑读音就是英文字母的读音。
例如[T]→T([T]读作英文字母“T”)(T键位)[Y]→Y([Y]读作英文字母“Y”)(Y键位)→O([口]读作英文字母“O”)(O键位)[尸]→P([尸]读作英文字母“P”)(P键位)[匚]→C([匚]读作英文字母“C”)(C键位)等等。
(2)除了(1)以外,按拼形字母对应的中文读音。其声母的第一个字母就是其键位。→立([立]读作“立”)(L键位)[戈]→戈([戈]读作“戈”)(G键位)[疋]→疋([疋]读作“疋”(pi))(P键位)[大]→大([大]读作“大”)(D键位)[刀]→刀([刀]读作“刀”)(D键位)等等。
这样我们就得到了拼形字母的逻辑读音与键位安排,如前述第二表所列。
每个键位的四个区的定义如图2所示。例如对Q键位而言,“ ”读作“Q”;“犬”(犭)读作“犬”(Quan)。拼音字母“u”非声母而是韵母,故“ ”读作“5”(u);“月”读作“月”(ue);“月”不是拼形字母,是为了减少重码而设置的;同理,“瓦”、“ ”也不是拼形字母,但这并不影响逻辑读音与使用;而“疋”读作“疋”(pi)。
本发明的取码和编码输入规则具体说明如下。其中取码规则包括1、笔顺规则每个汉字的拼拆就象拼图一样,按书写的顺序进行。如“可”是先写“一”而此时,已将“丁”这个部件带出了,因此,“可”的编码是“TO”,又如“来”是“M2”,如在书写汉字时笔顺有二义性,则以国家语委的《现代汉语通用字笔顺规范》为准。
2、取少规则一个汉字以取码最少为原则。例如“意”只能取“音”、“心”2码,而不能取“立”、“日”、“心”3码。“音”是部件。又例如“喜”可取码“十”、“豆”、“口”3码,而不是“土”、“口”、“ ”、“口”4码。
3、取小规则当一个汉字有二种拆分,且取码数一样时,则按部件小先取。例如“午”可拆取“丿”、“干”,也可取“”“十”,都是二码。按取小原则,“丿”“干”为“午”的取码。显然,“丿”比“ ”要小。又例如“主”应为“丶”、“王”,而不是“亠”、“土”,显然“丶”比“ ”要小,这一条非常重要,务必深刻体会,它能有效地克服二义性,逻辑拼形码按以上三条原则取码是没有二义性的。
逻辑拼形码一般是取4码一字。其编码输入方法前已述及,例如一码字如“食”编码为KGSS,其中G没有什么含义,必须用此占位。SS为汉语拼音“食”字的声母第一字母并重复一次。这样处理是为了减少重码,如不会拼音,则打KG加空格重码选择即可。
二码字如“棋”编码为MBQQ,其中Q为汉语拼音“棋”字的声母并重复一次。如不会拼音,则打MB加空格选择即可。
三码字如“路”编码为PAOL,L为汉语拼音“路”字的声母,不会拼音,则打PAO加空格无重码则自动上屏,有重码则可选择。
四码字如“照”编码为RDO4。
四码以上字如“巅”字取1,2,3,末即可,SXBT而不是SXB2T。输入汉字可分为两步1.从汉字“块”部件中找出既定的46个部件最大形体分类结构即拼形字母。这一过程称之为逻辑拼形。2.读拼形字母的逻辑读音去击键。例如 缔W立山(逻辑读音)WLS(键位或编码) 酣开日(逻辑读音)KR(键位或编码) 瘅广Y(逻辑读音)GY(键位或编码) 棣木广水(逻辑读音)MGS(键位或编码)我们已经看到了部件的最大形体分类结构(拼形字母)客观存在于汉字部件之中,即部件非交叉或交叉地包含拼形字母。
逻辑拼形经过简单的学习,是人人都能学会的,并有强大的社会基础(汉字与分类的部首也是这种形体结构非交叉或交叉的包含关系。)经逻辑拼形得到了汉字的逻辑编码(客观而唯一,这就是统一形码)。而拼形字母的逻辑读音则完成了逻辑编码与英文键盘的映射,也是一个简单的学习与记忆过程。需要强调指出,对任何一个汉字都能进行逻辑拼形,并按拼形字母的逻辑读音去击键。至此,我们已经完成了逻辑拼形码的设计,同时也得到了“统一形码”。
逻辑拼形码实实在在是新一代形码也是统一形码。逻辑拼形是克服记忆之苦的利器,是统一形码的核心,正是由于它与任何编码方案无关,并成为文字的固有属性时,才使它真正成为统一形码。汉字输入方案的优劣是可以客观比较与评测的。(《通用键盘汉字编码输入方法评测规则》GB/T 14159-93,1993-08-01国家技术监督局发布、实施)由以上可知,本发明为一种逻辑拼形码计算机汉字编码输入法及键盘,它以国标189个部首为基础,与我国基础汉字工程全面接轨,实现计算机汉字编码输入的块处理,取码规范,逻辑结构体系简单、唯一、合理,且推理性强、容量大,易学易会,输入速度快,重码率低。
图1是汉字结构四层次模型图;图2是键位分区结构图;其中1-英文键名区2-拼形字母读英文键名区3-拼形字母读中文字音键名区
权利要求
1.一种逻辑拼形码计算机汉字编码输入法,包括按照汉字部件最大形体结构分类得到的46个拼形字母;由拼形字母经过简单变换而产生的,或是与英文字母象形或逻辑联系产生的元拼形部件;由拼形字母经过适度变形、变换,应用多笔画优先规则推导出的多笔画拼形部件及其复合部件;由元拼形部件或多笔画拼形部件,应用交叉不拆规则推导出的交叉拼形部件及其复合部件;上述拼形字母、元拼形部件,多笔画拼形部件及其复合部件、交叉拼形部件及其复合部件组成了汉字输入码元,它们列于下表部件表 将上述码元定义到计算机通用键盘的相应键位上,采用下述规则在所定义的计算机键盘上利用相应键位输入汉字1)取码规则a、笔顺规则,即按汉字书写笔顺取码;b、取少规则,即一个汉字以取码最少为原则取码;c、取小规则,即当一个汉字有两种拆分且取码数相同时,部件小的先取;2)、编码输入规则一码字拼形字母码+“G”键码+该字汉语拼音第一个声母码并重复一次;二码字第一拼形字母码+第二拼形字母码+该字汉语拼音第一个声母码并重复一次;三码字第一、第二、第三拼形字母码+该汉字汉语拼音第一个声母码;四码字第一、第二、第三、第四拼形字母码;四码以上字第一、第二、第三及最后一个拼形字母码。
2.根据权利要求所述的逻辑拼形码计算机汉字编码输入法,其特征是所述键盘上拼形字母的分布如下表所示 上述每个键位分有英文键名区、拼形字母读英文键名区、拼形字母读中文字音键名区,拼形字母按英文逻辑读音与中文字音逻辑读音安排在相应键位的键名区内。
全文摘要
本发明按部件最大形体结构分类得到46个拼形字母,并由此经逻辑演绎推理产生若干元拼形部件、多笔画拼形部件与交叉拼形部件及其复合部件,它们组成码元并定义到计算机相应键位上,按依笔顺、尽可能最少取码、部件小的先取的规则取码,四码字取其四个拼形字母码,不足四码字以汉字拼音首个声母为补码,四码以上字取1、2、3、末拼形字母码;每键分有英文键名区(1)、读英文键名区(2)、读中文字音键名区(3),拼形字母按逻辑读音分布在相应键位的键区中。
文档编号G06F3/023GK1307265SQ0011325
公开日2001年8月8日 申请日期2000年1月31日 优先权日2000年1月31日
发明者李格 申请人:李格