专利名称:《有理键盘》和《中心码》汉字编码系列的制作方法
技术领域:
本发明涉及汉字信息处理的键盘和汉字信息键盘输入的编码方法。
如CN8510087A,CN1076039A,CN1085332A中揭示的以及其它现有编码方案存在或者部分地存在以下缺陷①汉字输入键盘设计缺乏充分的理性规律,属于无理或半无理键盘。
②字根布局缺乏内在逻辑,需记几十至百余无理分配的字根分配。
③拆字无统一依据,大小字根交叉包含,编码唯一性差,过程复杂。
④组码过程和键位选择缺乏必然和直接的联系,字元定位均未能完全脱离双向对接的模式,输入人员一方面要意识和把握汉字的属性特征,另一方面还要意识到键盘的字元分布位置,两个方面对接上才能输入一码。这种双向式的输录方式大大地影响了汉字输入潜力的充分发挥,只有经过长期专业训练的操作人员,才可能在下意识里形成一个字元分布的键盘图象,达到单向操作,实现高速输入的目的。
本发明旨在利用一种具有内在逻辑而且简单易学的有理键盘和有理字元布局和提出一个统一的汉字拆分原理,通过上述问题的解决,克服汉字输录技术中“易学不快,快不易学”的难题。有理键盘本发明提出一种遵循递进归位原理的有理键盘。键盘不再被视为由一些键所组成的简单集合,而是给它附加包含内在逻辑的结构。所谓“递进归位”是指这种结构能为汉字信息的键盘处理提供一个从汉字属性到码元再到其键位这一过程相吻合的递推原则。而且,只要掌握这一十分简单的递推原则就可以顺利地进行汉字信息的键盘输录。
我们从标准键盘的主键区部分(见附
图1)选取三行九列,分3个区,从左至右1、2、3区。每区有三列,从左至右1、2、3列。每列有三位,从上至下分别在1、2、3行上面,叫作1、2、3位。这样,可以由所在的区号加上列号和行号就给27个键编得由1、2、3组成的三位码。由此就把键盘设计成一个3×3×3=27个键组成的键盘结构。这里,3×3×3不是一个简单的乘法算式,而是表达一种递进式的三维结构。只要记住三个中心键,初学者可以在三个中心键贴上醒目标志,如有可能还可以把2区的键打上不同的颜色标志,也可以生产适宜于中心码输入方法所要求的这种简单区分的键盘。根据其相对位置就可以确定每个由1、2、3组成的三位数对应的键位。图2标示了1区的9个键位的数字代码。但是,实际操作中并不需要学员去记住这些数码和分配。
同时设计一个0行和一个0列(见附图1),0行是对应在三区上方的9个数字键,可分归到对应的3个取,和中心键相照应。0列设在3个区的最左或最右方,附图1中0列排在最左面。只要能在汉字集合中寻找到或抽象出类似的三维结构,那么就可以给汉字输入进行编码,可以很容易地把汉字的多种属性相结合产生笔划、拼形及组合型系列编码方案。
本发明设计的另一种递归键盘是在“3×3×3递归键盘”的基础上简化地的。每个区有一个中心,每个中心四面分布了4个键位,八方分布了8个键位,设计出一种3×5或3×9的递归有理键盘。这种键盘特别适合于本发明提出的“构型末笔交叉识别码”。例如,利用3×5或3×9键盘设计一种字型末笔交叉识别码。把汉字的构型分为三类,并以1、2、3号名之,它对应于键盘的三个区,而每个区内根据3×5或3×9制式的键盘可以安排5或9种末笔形态。附图3所示是一种以末笔形态特征来布置的一种构型末笔交叉识别码键盘任意的一个区,该键盘简单、形象、完全符合人们心理对这些笔划方向形态的印象,学一遍都能记住。该构型末笔交叉识别码特别适合用在不同的编码方案中减少重码。
实施例一宽式中心码(ZK码)宽式Z码是利用3×3×3附加0行0列制式键盘(参见图1)和递进归位原理而设计的一种汉字输入方案。宽式Z码基本上是一种不需要任何专门学习的汉字输入方法,适宜于专业人员和非专业人员。
首先笔划分属于三种笔号,横提为1号(或高号笔)笔,竖撇为2号笔(或中号笔),其它的笔划均归为3号笔(或低号笔)。
汉字的编码采用“无根码”,即不需强记任何“字根”,而是采用递进归位的有理键盘和组码原理来输入汉字的。每三个笔划为一组,对应有3个笔号。两笔组没有第三笔,为0号。单笔组在0列上,单笔节的编号为00X(X=1、2、3)。
输入汉字时,按照自己对汉字的认知习惯方法,尽可能按照正常书写顺序依次输入笔划组合即可。输入方法如下1、一笔的号选择区,二笔的好定列,三笔定键位。如“汉”字,第一节编码333;第二节320(第三笔空缺,笔号为0)。第一笔是3号则把击键范围缩小到3区内,意识到对应的3区中心,右手做好准备;第二笔也是3号,则向右退一位到3列,对应的小指做好准备;第三笔还是3号笔,则由准备好的手指击打下位键,完成一组笔划的输入。接着输入余下的二笔组320,定在3区2列0位,0位即最高位上的“9”数字键,这样就输入了一个“汉”字的全部编码。2、拆字也有一个要求,就是“构型不乱,力求直观”。“构型不乱”就是指,在组合笔划时不能把汉字明显的左右、上下、包围结构打乱,不能相互挪用笔划。如“语、冷、信、以”字的首码就不能取足三笔,不能到右部去挪用笔划。同样,如“划”字取“戈”字后剩余的一点不能和右部的笔划组合,而要一点单独输入。包围笔划先输入“口”字形,再输入里面的笔划组。
可能有几种拆分方式的字和某些因书写习惯不一致有不同拆解而编码不同的字,系统都会予以承认。自然,编码拆分方法要完全容纳按照现行中小学语文教学规范的拆分法。 ZK码允许选择单用户封闭方式,该方式对于单用户来说,若连续以某同一方式输入某个汉字的次数超过一定的数量N(如N=30、50、100),系统具有学习适应用户的能力,会逐渐地减少重码,提高输入速度。
以“可”为例,既可以按笔序拆解为“一、口、”,也可依直观性拆为“丁、口”,这两种输入方法均可输入“可”字,如选择单用户封闭输入方式,连续N次以“丁、口”的拆解方式输入,则系统会自动把该拆解方式作为“可”字的唯一拆解法固定下来,时间一长必然有大量的字由多码变为唯一码,逐渐减少重码,不知不觉中就提高了输入速度。3、只有一码的字需要补击两次“K”键后输入其声母代码。4、初学者可以通过默想每个笔划对应的数字寻找键位,也可以利用高、中低笔号的相对关系,以“高进,低退,中正”的方法方便地输入汉字。因为递归式键盘分布规律性极强,高是向左向上的,低向右向下,从1区的1列1位的第一个键到3区3列3位最后一个键形成一条下滑的对角线就形象地表征了键位的高低关系。而且,随着时日的增加很快就会转换到靠汉字的笔划组合整体形象确定键位,即便是一时忘记了某个构型的键位,立即可以通过组码原则把它确定。这既便于初学者很快掌握全部输入规则,易学易记,而且适宜于熟练者的快速输入。可为不同层次和水准的用户提供一种内在统一的的汉字输入方法。
根据递进规位原理,可以组合出一个由汉字的常见笔划组合构成的键盘,如果初学者在学习和练习组码的同时记一记这个键盘,无疑可以大为提高其输录汉字的速度。如果不想去强记它,也没有关系,因为只要记住了该方法的递进原理,自己经过一段时间的应用会自然而然地记住它们。5、数字、高频字、标点和词组输入数字数字键+空格高频字26个高频字,首码(26个字母键)+空格输入。标点标准键盘上被占用的三个西文标点符号键,击键后补空格键就输出对应的汉字标点符号。如汉字的逗号(“,”)输入“,”+空格。双字词首字的首尾码和次字的首尾码三字以上词首两字的首码和末字的首尾码6、识字中心码和上述ZK码方法一样,只须剔除不符合先行中小学语文教学规范汉的编码部分,并利用软件技术增强一些适宜于语文教学需要的功能。这样就可以避免学生采用不规范的识字拆字习惯并得到匡正,而且重码会大大地减少,输入速度可比宽式中心码要快得多。这种方案也可以作为实用型输入方法,特别是适用于中小学生今后走上社会作为一种标准、规范、快速的汉字输入方法。因为实施方法和ZK码完全一样,故不必重述。实施例之二窄式中心码(ZZ码)窄式中心码是在宽式Z码的基础上,对汉字拆分进行一定的规范,把ZK码以笔划输入为主的方式转换为以拼形部件为主利用笔划和递进原理键盘的对应来分配这些拼形构件而实现一种极其简单又可高速输入的汉字输入方案。准确地说,是通过笔划在递进原理键盘上的映射来给每一个拼形字元挂号,所以可以叫做“挂形码”。所它和ZK码一脉相承,利用同样的递进归位原理和编码方法,可以在掌握了宽式码的基础上向窄式码转换。两种方法适宜于从非专业向专业水平的转换,特别适宜于从学校规范教学向社会实用的过度转换,解决目前汉字输入要么片面地为了教学而和社会需要错位,要么因片面地追求速度而使输入方法无法和现行教学接轨。这两种方案,可以很好地把学习的容易性、规范性和快速性、实用性统一起来。
ZZ码利用3×3×3加上0列共30个键组成汉字输入的特征键盘和本发明提出的汉字拆分方法输入汉字。
为了解决两笔构件的输入,ZZ码使用笔划关系代号作为虚拟的第三笔。两笔划间有三种关系和代号。上下关系为1号、左右关系为2号,相交围为3号。“汉、动、计、者、墙”末两笔关系代号是3(交、围),“只”末两笔和“年、包、卷”首两笔代号都是2(左右),而“冬”的末两笔以及“读、伶、冷”的首两笔代号为2(上下)。1、汉字的拆分先按照汉字的构型分体,然后大于三个笔划的体再分节。
分体以汉字构型为参照,按照上下、左右、四围、三围、二围的构型把汉字拆为不同的体。一个字可能是由多种构型复合而成,要进行层层分解。如“意”,首先分为由“音、心”上下构型两体,“音”又分成“立、日”上下两体。
照习惯拆字方法,某些字属于“字架”造型,如“夹、来、巫、平、乘、爽、承、坐、永、函、幽、亚、乖、隶”字。字架结构要单独分成一节,如“巫”为“工、人、人”的结合,“夹、来、平”是“夫、未、干”加两点。“乘”先取“撇”笔,然后取“木”字架,而后把对称双方的笔划和在一起再拆分,余一个“北”字。
分体时ZZ码只有一个规定特例,含“戈”形的字大多由左右结构演变而来,“戈”趋向于自成一体。如“我、栽、咸、藏、戍、咸、成”中的戈字形的横笔要从中间截断,视为左右合体字型。如“载”字要裂变为“土、车、戈”的和体。
一般来讲,“节”是指有2笔以上连续书写并能和其它节从相接处区分出类似上下或左右构型关系笔划构件。分节按照“三笔优先”的原则,如“去”字,上下结构不明显,但分上下两节,且首节是一“土”字。分节有以下规定①孤笔依附在交和围构件上单一的撇和点,因交、围结构的独立性强,被疏远为孤笔。孤笔在大于3笔划的体中要单独分为一节。如“专、牙、戈、乒、甫”的末笔和“牛、生、自、毛、乒”的首笔。②陪笔以接的形式依附于全交结构上单一的横等非点非撇的笔划叫“陪笔”。如“开、灭、天、无”的首笔和“木、生、五”的末笔。依附在大于3笔的成字上的陪笔,因3笔成字的独立性较强,变异成孤笔。如“天、灭、王、歹”中均含有一3划以上的“大、火、土、夕”成字,故为两节字。而“开、五”是单节字。③交笔凡交叉的笔划不能拆,要单独为一节。如“十、九、又、车、丰、弗、册、夷”。④包围因围具有比较强的内聚能力和独立性而导致排它性,凡和包围构件的“口”字形周边相交的笔划因受到包围结构的排斥而从向其相交的上下方位被挤出。如“西、酋、要、典”的上交笔从上方挤出。“果”向下挤出一个“木”字。
但是要注意,对于上下穿通包围结构的字,如“事、串、革、曳、更、重、束、惠、吏、央”的中竖因自然重力作用下移到脱离相交结构位置。“事”就成了“一、口”字形和 的结合。
三围结构的部件结构有次于四围结构的内聚和独立性。象“雨、再、两、内”等字中和围交叉的笔划结构要向其开放的下方挤出。如“愚”字视为“日、冂、 和心”四个构件。而“两”字则是由“一、冂、人、人”组成。与四围结构不同,因独立性弱于四围,要同时挤出连带的笔划。⑤如果是严格的“口”字围成,除“口”字外的笔划不足三划时,“口”不单独提取,而作为一个3号笔和内部的笔划组合。这些部件有“口、日、日、目、四、田、回、 、 、 、 ”。⑥离散笔在字中连续书写的游离笔划要集合到一起来分节。遵循“三笔优先,平正直观,留单不拆”的原则。如“立”,先取前三笔,因为“平正直观”的要求,分节也只能在四、五笔之间,但这样又只留下一单笔“横”,所以“立”为单节。同样原理,“产、心”字的首节是前四笔。而“兰”字已经形成上下构型,首节为两笔(三笔成字不能拆分)。又比如“言”字的首节也只有一点。“”视为单节。
单一离散的笔划若不影响分节和直观要并入其前的两笔划构件(多笔优先)。如“命、令、合、同、会”。⑦点离散的点要单独成体,相接的点要组成构件成节。在横笔上的点要依照横笔的和其下笔划的聚合形式而定,“陪笔”上的点视为离散点单独成节,如“并”字的首节为两点,次节是“开”,因为两点下的横是一陪笔。而在孤笔横上的点要和孤笔和为一节,如“关”字的两点要和横组成一个3笔划的节,“主”的首节为点横。显然和一个三笔构件相临又无可组合的其它笔划的的点视为离散点,如“文、太、犬、尤、龙、戈”。而“礻、衤、疒”含点的部件要作为一节。2、节的挂号(挂形法)所谓“挂号”,就是指对每一个拆分得到的字元利用递进归位的原理向键盘的映射方法。依照汉字的书写顺序,取字元的前三个笔划为挂号依据,其对应方法和ZK码中汉字的输入方法完全一样。只是,两笔的节要加上笔划关系代号成为虚拟的三笔节。每一节按笔划顺序,对应其笔号可得到一个只由1、2、3组成的一个3位数。两笔节的第三个数是笔划关系代号。单笔节的编号为00X(X=1、2、3)。所有的汉字拼形单元“节”都映射到对应的键位上,就形成了一个类似其它输入方法的字根键盘,并可编制相应的助记口诀。附图3列出了常见的字根组成的中心码汉字键盘。虽然可不强记任何“字根”,也采用递进归位的有理键盘和组码原理来输入汉字。但是,我们建议专业人员应尽可能地用一定时间来记忆这个字元分布的常用部分。3、ZZ码编码每个汉字取前三节和末节,一节一码,对号入座。只有一码补加“G”后输入声母代码个,两码的字可以用空格键结束也可以补加一次“G”键后输入其声母代码,可大大减少重码出现的几率。
如“汉”字,第一节编码333;第二节323(末两笔交叉关系代号为3)。第一节输入后,接着输入余下的一个二笔节323,在3区2列的3位(“.”号),就输入了“汉”字的全部编码。4、标点、高频字和词组输入标点和ZK码相同。
高频字首码+空格双字词首字的首节代码和次字的首末两节的代码三字以上词首两字的首节代码和末字的首尾节代码初学者可以通过默想每个笔划对应的数字寻找键位,但随着时日的增加很快就会转换到靠汉字的节的整体构型来确定键位,即便是一时忘记了某个构型的键位,立即可以通过组码原则把它确定。这既便于初学者很快掌握全部输入规则,易学易记,而且适宜于熟练者的快速输入。可为不同层次和水准的用户提供一种内在统一的的汉字输入方法。实施例之三中心音码该方案是利用中心码来改进现有的双拼输入法。输入双拼码后,第三码利用字的声调来选区,比如,上声在1区,去声在2区,平声(阴平、阳平)为3区,然后由字的首笔代号定列,末笔代号定位。如输入“末”字,输入双拼编码MO后,因为是去声,那么定在2区,首笔为1号,在1列,末笔代号1,为上位键。这样就完成了一个字的输入。实施例之四中心音型码该方案也是利用中心码来改进现有的双拼输入法。它通过递归有理键盘把声调、末笔和汉字构型作为组合一码输入。汉字构型被分成三类并用1、2、3三个号表示,分别表示上下、左右、杂合三类构型。输入双拼码后,第三码利用字的声调来选区,比如,上声在1区,去声在2区,平声(阴平、阳平)为3区,然后由字的首笔代号定列,末笔代号定位。如输入“末”字,输入双编码MO后,因为是去声,那么定在2区,末笔代号1,在1列,构型是杂和,击打下位键,就完成了一个字的输入。实施例之五中心声码把汉字的声母代码和某些选择性的中心部分码相结合可以得到一种中心声码输入方案。如可以是声+ZZ首码+ZZ次码+ZZ末码。该方案可以很容易地把字型和笔划或者其它属性组成一码输入。例如可以用末两笔和构型结合一键输入。实施例之六汉字序化按照笔划顺序和汉字拼形构件“节”依照笔划挂号所得的顺序都可以对汉字进行序化处理,分别对应于ZK码和ZZ码两种输入方法。如以ZZ码所属的方法,排序方法如下1、笔划排序在3个笔号序列的基础上,完全按照习惯法把汉字的笔划归为31类,并照现有习惯的排序方法进行排序,排列出这31个笔划的顺序,在3号笔末尾加上“口”字,就组成了32笔划序列。2、字节的序化每个键位上的字节按照笔序进行排序。这样排列的结果是形成一张十分规整的汉字字形字元表。3、汉字的序化按上述的键盘顺序来给汉字的字节排序后,由字节码元的左右上下秩序排出汉字的顺序,也可以按照码元的西文习惯秩序对汉字进行排序。因为,对于我们来说,原西文键盘的字母布局失去了其实用性,如有可能,可以专门生产完全按照从左到右从上到下的顺序来按排26个西文字符,这使汉字序化和计算机以及我国传统的笔划和部首排序法输入相一致,可能最终解决汉字现代化的难题。
递归式关系有理键盘的建立为汉字输入的多种方法提供了前提。利用3×3×3递归键盘和3×9递归键盘或者附加上0行0列,可以把汉字的多种属性特征进行分类,综合出多样的组码方案,也可以对多种现有字、词和句输入方案进行改造优化。可以利用该方案拆分得出的汉字拼形字节为依据对汉字进行序化、检索。利用《有理键盘》设计的编码方法与其它编码方法相比具有以下优势1、编码具有内在的逻辑规律,建立了一种“理性(原理)键盘”,可以从根本上解决学习者的记忆量大的难题。并由于本发明提出的拆分方法也是按照统一原理来进行,也大大地减少了学员的记忆量,并解决了字根的相互交叉和包含的难题。2、只需记三个码的含义,就可以按简单的递推原理组码输入汉字,在其它编码方案中,一般需要记住几十到百余甚至更多的字根及其无理布局。3、本方案同CN1085332A中揭示的“小基法”相比,因为递归定位方法的利用,使本方案的编码思维方式发生了改变,本质上,小基码只是一种笔划输入方法,而本发明的方法不仅适宜于笔划,而且包含了拼形、拼音及其可能的多种组合方式,其特征在于巧妙地利用了原理键盘从中心递推的原理,通过人们对递推原理和三个中心的认识来达到输入汉字的目的。本方案记忆量大为减少,更符合键盘操作的心理习惯,更有益于快速输入,更有规范性。虽然“小基法”的部分字元可以根据一定的坐标系进行组合,但这种组合是在整个键盘大的坐标范围内进行,不具备可行的递归原则,而且其任何组合必须是建立在记住11个基本码及其在键盘上的具体位置的基础之上的,其实它仍然要求记住30至40个键位的代码定义。本方案的定位坐标只在中心的临近1位选择,而小基法要到3排10个纵向键位中去定位,记忆量仍然很大,不可能实现单向递推的模式。本方案引入了“笔划关系代号”从而使得两笔笔划组和三笔笔划组在统一的键盘区输入,汉字输入特定键盘只有“小基”法的七成,数字输入无须特殊变换,可大大地增加键盘的操作功能和通用性。和“小基法”相比,本方案提出了汉字的拆解方案,使汉字的拆解有规可寻,可以由此得到一分汉字拼形的构件清单或字元谱图,有益于汉字的序化、检索和自动化处理,而且本方案提出单用户封闭输入方式可以适应用户,特别是大多数非专业人员的迫切需要,可作为一种普及型输入方式大为推广。4、本方案较充分地把组码、寻码和击键的心理和汉字的特征相结合,可以形成一种汉字输入的规范方法。特别适宜于中小学先行的计算机汉字输入和常规语文识字写字教育,为学校教育和社会化两个方面的完全统一接轨提供了一种很好的方案。5、本方案把“笔划法”和“部件法”更充分地协调起来,初学人员只要几分钟时间了解本方案的“3×3×3键盘”、汉字三种笔号以及“一笔区,二笔列,三笔位”的原则,就可以开始输入汉字。而且由于该方法同时实现了大小码元的统一,经过一定时间的训练就可以从单笔分解汉字的思维方式自动转换为组合部件的思维方式,又可以在较短的时间里达到快速输入汉字的目的。这就提供了一种具有“人机互长,自我加速”机制的统一输入方法。6、本发明提出的中心递归键盘的突出优势还在于可以把笔划、字型、字音甚至字义及语法特征混和在一起,实现一码同时输入。
附图4是按窄式中心码方案,遵循“一笔区、二笔列、三笔位”的原理进行布局所得到的字根键盘图。
权利要求
权利要求1、由递进归位的原理设计的一种3×3×3或3×5或3×9制式的汉字输录特征键盘及其汉字输入方法,其特征是把标准键盘分为3个区,每区有一中心和3列、3行,每个中心分出四面或八方,包括附加一个0列和0行,然后一键依次输入汉字或者汉字构件的一、二或三种属性特征的有序组合或者某一属性的三个有序取值来实现汉字输入。
2.一种根据权利要求1中的3×3×3为主要结构的递归键盘实施的递归式中心码汉字输入方案,其特征是选取笔划或者笔划关系特征来为拼形单元向键盘的递进式映射挂号,一笔定区、二笔定列,三笔定位,两笔拼形构件用其关系代号虚拟第三笔来挂号。
4.一种根据权利要求1中的3×3×3附加0列0行的递归键盘设计的宽式中心码(ZK码)方案及和中小学语文教学完全统一的中心识字码方案,其特征只要识别三种笔划类型,并理解递归键盘“一笔定区,二笔定列,三笔定位”的原理就可以开始汉字输入。
4.根据权利要求1中的3×3×3为主的递归关系键盘,设计的中心音码方案,其特征是在双拼的基础上,把汉字的声调属性和汉字的笔划结合,一键输入两个笔划和一个声调。
5.根据权利要求1中的3×3×3为主的递归关系键盘,设计的中心音型码方案,其特征是在双拼的基础上,把汉字的声调属性和汉字的笔划和汉字构型相结合,一键输入声调、末笔和构型。
6.根据权利要求1中的3×3×3为主的递归关系键盘,设计的中心声码方案,其特征是用汉字声母代码选择适当的中心码部分组合输入汉字。该方案也可以把字型用来和其它选择方法得到的两个笔划,或者一个笔划和加上另一个属性组成一次的虚拟笔划组。
全文摘要
《有理键盘》和《中心码》汉字编码涉及汉字输入键盘和汉字输入及序化。提出全理性键盘和中心码输入法(Z码)。特征是将键盘分3区3中心,每区3列,每列3、4位,一键输入汉字三个有序属特征性值。字元在键盘的分配既可即刻生成也可专门记忆,适用于专业和非专业人员使用。ZK码在众输入法中最简单,并和中小学教学接轨,无需专门记忆,速度快。ZZ码结合把部件和笔画法的优势,有特别易学且速度快的双重优点,宜广泛普及推广。
文档编号G06F3/023GK1139773SQ9510781
公开日1997年1月8日 申请日期1995年6月30日 优先权日1995年6月30日
发明者卢从文 申请人:卢从文