专利名称:免拆分易学高效汉字形码计算机手机一体化输入技术的制作方法
免拆分易学高效汉字形码计算机手机一体化输入技术本发明的名称为"免拆分易学高效汉字形码计算机手机一体化输入技术", 简称"一体化汉字输入技术",属于汉字信息处理技术研究领域。用计算机、手机输入汉字,存在效率低下、难学易忘、违反汉字规范、不利 于手写汉字的学用等问题,长期未能解决,影响了汉字信息处理技术的发展和计 算机应用的普及。本发明包含"一体化字母形码"和"一体化数字形码"两种输 入法,具有良好的规范性、易学性和快速性,两种输入法的字母与数字是顺序对 应关系,用户只要在计算机汉字输入中学会字母形码,也即会进行快速的手机汉 字输入,以一体化方式解决当前汉字输入所存在的问题。计算机汉字输入法的现状堪忧。由于快速性好的形码输入法难学易忘、不符 合汉字规范,现在大多数人使用拼音输入法,输入效率不高,智能拼音整句输入 有局限性,对一些文本返回修改过多,不适合应用,不能满足快速输入的需要。 另外,使用拼音输入依靠在同音字中挑选汉字,长期使用形成依赖,造成使用者 手写汉字困难,提笔忘字,错别字增多。中国社会科学院语言研究所所长沈家煊 指出"使用键盘书写将对我国语言生活发生极其深刻的影响。 一方面,拼音输 入的普及有利于普通话的进一步普及,汉字难写的弊端也得到克服;另一方面, 手写汉字对越来越多的人来说将变得困难,……最近有报导说, 一个大学生二百 多字的手写求职信居然出现12个错别字。这说明我们的母语教学存在很大的问 题,也跟键盘书写有关系。"(语言文字网《对语言生活、语言规范的思考》)手机汉字输入法使用数字码输入汉语拼音效率更低;而且手机嵌入式汉字输 入技术和市场卯%被国外产品垄断,每年专利使用费数亿元,已经花掉了几十个 亿。单独开发数字形码用于手机,效果不佳。"一体化汉字输入技术"总体设计的技术特征是①"一体化字母形码"选择以26个字母作代码的部件式形码,供计算机汉字 输入使用。为保证字母形码具有最好的规范性和易学性,本发明遵守各种汉字规 范和汉字使用习惯,釆取多项措施与部首检字法衔接,以求实现学用汉字和学用 输入法相辅相成。例如我们现在有了先进的电子词典,但大多数人查生字时不能 依据字形直接输入该字,仍然要通过査部首、数笔画,再靠目力找到所要査的生
字,效率极低,与现代信息技术的发展不相适应,解决的方法就是要借助于汉字 形码直接输入该字。从原理上看,任何一种汉字编码都可以拿来为汉字排序编电 子字典,但在事实上很多汉字输入法的编码是不适用的。音形码或形音码不适合 用来输入生字;笔画式形码输入速度慢;数字码承载信息少,重码太多,使用效 果不佳;只有用字母编码的部件式形码最合适。一体化字母形码应用新的编码技术,实行双码部件理据性表达法,不搞拆分直接编码;对全部编码部件进行有理据的表达,不需要背助记口诀;编码规则最 简化,不学识别码;单个汉字输入和词组与单字混合输入都具有良好的快速性;做到规范性、易学性和快速性俱佳。②由"一体化字母形码"的字母代码与数字进行顺序对应转换所得到的"一 体化数字形码",是经过多种转换方案的优选和对两种编码的关联调整最后确定 的,使用方便,保证重码少输入效率高。使用一体化数字形码有一个前提,即字 母形码的输入操作不能对键位指法有所依赖,否则编码印象模糊,由字母转换为 数字会有困难。本发明应用汉字兔拆分直接编码,利于一体化数字形码的使用。依据本专利技术编制完成以下编码库,本说明书从中引用了有关数据资料① 一体化字母形码GB2312-80汉字及词组编码库,为计算机汉字输入常用档;② 一体化字母形码GBK汉字编码库,为计算机汉字输入备用档;③ 一体化字母形码GB2312-80汉字编码库,用于编制电子字典;④ 一体化数字形扭GB2312-80汉字编码库,用于手机汉字输入。 对于今后汉字内码标准的变化,也将以常用和备査两档处理。一体化字母形码的技术特征(1)对全部编码部件进行有理据的表达,不背助记口诀 ①对有读音信息的编码部件用汉语拼音第一个字母表达i. 成字部件用该字汉语拼音第一个字母表达,如贝-B,寸-C,大-D,方-F, 口-K,立-L,木-M,女=化人-R, 王-W,又-Y。例字树-MYC,全-RW,如-NK。ii. 对有名称的部首取其特征字的汉语拼音第一个字母表达,如病字旁,广-B;竹字头,Z;犬字旁,3 -Q;走之儿,i_-Z; 立刀旁,Ij-D;双耳旁,IS -E;宝盖儿,A-G;单人旁,4 -R。例字符-ZRC,防-EF,位-RL,达-DZ,狂K2W。iii.横、竖、撇、捺和点、提六种笔画用其名称的汉语拼音第一个字母表达-横,一-H;竖,l-O (此系代码借用,下面④介绍);撇,J-P;捺和点,VN, 、-N;提,z-T。 例字合-RHK,引KK),血-PM,主-NW,或-GKT (弓-G,皿-M,戈-G)。上述方法需经过选择有限使用,不是不加选择地对同音部首一律用同一个代 码表达,例如*、虫、车不能都C表达,以避免出现大量重码。② 对某些没有读音信息的部件采用"同形对应法"表达,即用与其形状相近 的字母直接表达,如U-U, r-T, 3-E, q—Y。例字画-HTU,寻-EC,页-TB,叫-KY。这些部件在国标汉字基本集中不是字,有的在GBK字库中是汉字,如7""、 M, 但很少有人认识。同形对应法简捷直观,符合汉字学习的心理特点。3可以出现在字的上、下、中、右各部位,.在寻、灵、当、雪、归、急、邹 字中都含有3,若用寻字头或雪字尾来命名并不切贴,用表形的方法效果最好。③ 对汉字折笔规范中25种折笔笔形按形归类,用同形对应法表达 L形折 L厶〈-L, A=ZL, 包括折笔规范中5.4-5.8, 5.11和5.19; Z形折乙飞-Z,亿二RZ, 包括折笔规范中5.12-5.14, 5.16, 5.22; 半Z形折"In Z,买《ED,包括折笔规范中5.1-5. 3,以及5.15; S形折: 力乃-S,夸DES,包括5.17, 5.18, 5.20,5.21,5.23-5.25; 撇钩折 P, >=PN,包括折笔规范中5.9,在GBK字库中出现。现在流行的五笔画法将所有折笔归为一类,将提笔归于横,这样简化处理适 合于计算笔画多少和表示笔顺,但不利于在汉字编码中区分字形,而25种折笔笔 形在编码时难以区别和表达,应用不便,以同形对应法归类表达适合编码需要; 笔画提和横不难区分,独立使用有利于区分字形。dHt码借用和零声母处理在上面的编码部件表达方法中,字母I、 0、 U、 V、 A的用处很小,需要让这5 个字母发挥作用i. 借用據达水、?和I (竖),如泉-BO,沽-OSK,引-GO;(白-B,十-S)ii. 借用V表达手和孑,如搿二VRHV,批^VBB;(匕-B)iii. 借用A表达"^和乂 (叉),如花-ARB,义^NA;iv,对拼音为yi、 yin、 ri的编码部件和拼音为yu、 yue的编码部件实行零声母 处理,即工(衣字头)、弋、尹和日等部件用I表达,羽、月等部件用U表达, 如京-IKX,代-RI,郡=1征,时^IC,翅《YU,明^IU。(小-X, & -E,又-Y)代码借用和零声母处理的方法在各种拼音输入法中多有使用,本编码使用量 少,不会造成记忆困难。
(2)使用"双码部件理据性表达法",不学拆分规则长期以来,汉字形码的编制始终沿袭早期的"拆字输入"、建立"汉字键 盘"等理念。这种编码理念要求把每个字根(编码部件)分配到键盘上,输入汉 字即是把汉字拆成字根,再用"汉字键盘"把各个字根键入。实际上,汉字输入的实质是向计算机键入汉字的编码,所谓用"汉字键盘" 输入字根只是一种比拟化表述,当初因为字根表达的无理性和汉字拆分的复杂 性,需要借助这种比拟化思维来构思。现在由于《汉字部件规范》已经确立了汉 字拆分的基本原则,给出了 "汉字基础部件表",编制部件式形码不应再重新制 订拆分规则,故本方案对用户不引入"拆分汉字"和"汉字键盘"等概念,只学 习如何表达编码部件,如何对汉字编码输入,这有利于编码技术的创新,也会使 学习得到简化。新的编码技术能够解决拆分规范性、表达理据性与减少重码的矛盾,达到三 者俱佳的目标,现以实例说明如下:《汉字部件规范》规定对止、重两个独体字不准进一步拆分。若把止、重两 字都选作编码部件,分配在Z键上,符合规范,易学易记,但有重码字趾=踵, 芷= 。而为了减少重码,就出现了违规拆分重字、自定拆分规则的编码, "重"、"踵"两字在各种输入法中的拆分及编码如下五笔字型重-j一日土 =TGJF,踵-口止j土 -KHTF 二笔码重-Z j — I 1— -ZQGZ, 踵=2口 j 一 I 1 =ZLQG 郑 码重=千日二=MEKB, 踵=足千日二 =JIKB (郑码用双码,千-ME,足-JI)一体化字母形码采用的技术是遵守汉字部件规范,不拆分"重"字,取其为双码部件,用ZT来表达,其中前码Z是重字的汉语拼音第一个字母,后码T是 重字的下部结构特征土字的汉语拼音第一个字母,于是可以直接编码 踵-KZZT,趾-KZZ,(足-KZ)符合规范而不重码。这种方法称为"双码部件 理据性表达法"。由比较可知,对"重"这样的独体字,使用"双码部件理据性表达法"符合 规范,不用学习拆分规则,表达有理据容易学习记忆,对踵字采用直接编码用户 不会产生困难。而其它几种形码,由于拆分的复杂性和表达的无理性,要学会拆 分才能进行编码。在其它形码中需要作复杂拆分的独体字,在一体化字母形码中都不拆分,取为双码部件,其表达的方法是前码是该字汉语拼音第一个字母,后码依据该字 下部结构特征或末笔笔画名称取其汉语拼音第一个字母表达,如矛-MP,牙-YP (末笔为撇); 夷=汉,两=1义,内-NR (下部为人);
毛-MQ (下部为七); 年-NS,平-PS (下部为十);里-LT,重-ZT (下部为土)。双码部件理据性表达法又叫二维表达法,因其可以配置在由前码(竖列)和 后码(横列)构成的二维平面上,具有直观性,配置情况(局部)如下-A......P Q R S T......ZL 两 里M 矛毛N 内年汉字部件规范含有汉字基础部件560个,其中属于国标汉字基本集448个,不 搞违规拆分,编码部件的数量较多,按传统方法分配到键盘上(一维表达),必 然会造成大量重码,所以对一部分独体字进行二维表达是很关键的技术措施。虽 然编码部件数量较多,但学习有理表达的编码部件不需要从头背诵记忆,见到了 能够识别即可,属于心理学中的"辨认法",学习难度不大;只有学习无理表达 的编码才需要用"记忆复现法",死记硬背,难记易忘。利用"双码部件理据性表达法"能够方便地把合体字部首取作双码部件,如 鱼-UH,齿-CU,麻-ML,与部首检字法一致,并能避免出现"角"(无尾鱼) 这样的部件。(3) 编码规则最简化一体化字母形码中组合字、单码部件字和双码部件字的编码规则最简单① 组合字的编码规则按照汉字编码部件之间的自然划分,用代码表达编码部件,依照笔顺取前面三码及最后一码,不足四码在输入时补空格键结束。例如树-MYC,理-WLT,嗓-KYYM,疆-GTHH,(弓-G, 土-T)。 在组合字编码时,双码部件是取两个码,还是只取前码或后码,由前三后一的规则来确定,不增加任何特殊规定。例如含有双码部件"车"的汉字,车的取码为(车-CS, iL-Z,小-X,兀-W, ^-G,鱼-UH)连-CSZ,轮-CSRB,军^GCS,挥-VGCS——车取双码CS; 鲢-UHCZ~~车之前有两码,第三码按顺序取车之前码C,第四码取Z。 辉-XWGS——车之前已有三码,第四码取最后一码即车之后码S。② 单码部件字的编码规则编为三码,在单码部件的代码后按首笔和末笔笔 形补加两个代码。如木-MHN,厂《HP,方-FNP,匕-BPL, 口-KOH。③ 双码部件字的代码即是其编码。(4) 补码避重简单易行 ① 一体化字母形码对三码字不加补码,如但-RIH,设-YJY,也不需设三 级简码。② 对两码组合字按照两个部件的末笔笔形补加两码,如 对-YCNN,讨-YCZN,训-YCZO;(又-Y,寸-C,言-Y,川=0 他-RYOL,信-RYOH,佣-RYOO,仅-RYON (也-Y,用-Y)。 空下的两码码位用以配置简码字。此例中的简码字是,对-YC,他-RY。(5)单个汉字输入的快速性在计算机汉字输入法研究中有人把单个汉字输入视作"初级阶段",整句输 入才是"高级阶段",忽略了单个汉字输入的基础性和广泛适用性,对解决汉字 输入问题极为不利。一体化字母形码能够进行高效率的单个汉字输入,适用于各种文体、文本;而且常用汉字只有三千多个,使用单字输入可以较快达到不假思索地熟练使用, 并可在单个汉字输入的层面有效实现一体化汉字输入。汉字输入共有三个步骤编码、键入和重码字键选, 一体化字母形码针对以 上三个步骤采取提高快速性的措施① 减少编码用时一体化字母形码保持独体字、部首等汉字基础部件的完整,字形信息保留得 多,故识别快编码快。若违规对独体字进一步拆分,则字形信息减少,拆分更费 时间,编码时间加长。② 减小平均码长i. .精心配置一码字和两码字汉字的使用频度极不平衡,根据国家语委编制的《现代汉语通用字数据统计 表》中的"使用度"数据计算,国标基本集汉字使用度总和为940万;排在使用 度前30位的汉字,其使用度之和占总和的23%;前500位占77%。为减小输入文件的平均码长, 一体化字母形码用一码和两码的码位配置高频汉字的简码字一码字26个,如大-D, T=L,人-R,上-S,为-W,要-X,和-K; 两码字500多个,如过-CZ,防-EF,安-GN,种-HZ,最-IY,新-LJ。 通过计算, 一体化字母形码一码字和两码字的使用度之和(覆盖率)高于其 他形码一码字使用度总和大于20% (五笔字型19%,郑码17%); 两码字使用度总和大于48% (五笔字型35%,郑码41%); 两项之和大于68% (五笔字型54%,郑码58%)。ii. 三码字不加补码
一体化字母形码的三码字不加补码,减少了四码字,已如前述。m.单码部件字只补首尾两个笔画码为三码字,而多数形码补三个笔画码。以上三项措施使得一体化字母形码在单个汉字输入时平均码长最小。③ 降低重码率,单个汉字输入时重码字键选率小于1%在国标汉字基本集,单个汉字输入的重码字键选率,相当于重码字使用度之和,经计算小于0.6%,在各种形码中最低(五笔字型小于2%,郑码为3.8%以 上),使用1%的指标是留有余量的。虽然单个汉字的字库重码率为5% (五笔字 型8%,郑码7%),但多数是二级汉字,影响键选率较小。④ 符号等同汉字输入在国标汉字基本集的编码库中编入各种符号,可以象汉字一样地输入,以节 省插入的时间。例如,可以方便地输入(1)、 (2)、 (3); .'.Zp^Zy;气温3 2°C,等等。(6) 词组输入复盖率高重码少 输入规范的现代汉语文件使用词组较多,但收入词组过多会增加重码率。只选常用词组,既保持低重码率又能达到高覆盖率,是两全选择。在国标汉字基本 集字库中编有两万多条复盖率高的常用词组,以两字和四字词组为主,与一级汉 字不重码,重码率低,为4%左右,故一体化字母形码具有双重的快速性。词组 的编码规则如下两字词组[第一字首码][第一字末码][第二字首码][第二字末码]三字词组[第一字首码][第二字首码][第三字首码][第三字末码]四字词组[第一字首码][第二字首码][第三字首码][第四字首码]多字词组[第一字首码][第二字首码][第三字首码][最末字首码]两字词组中对每个字取首、末两码的方法与双码部件字取前码、后码的方法具有一致性,便于两字词组编码。一体化字母形码的输入效率与拼音输入法相比可以提高l倍至几倍,主要取决于输入文本的情况。输入规范的现代汉语连续文本,智能拼音使用整句连续输 入返回修改少,平均码长3-4; —体化字母形码用单字与词组混合输入,平均码 长约为2,基本无重码,效率约提高一倍左右。如果是离散文本或古文、诗词, 则效率可以提高数倍。(7) 对国标扩展字库一体化字母形码仍为四码国标扩展字库(GBK大字库)含有汉字字符21003个,由于字数比基本集多了 两倍,为了减少重码,有的输入法用于GBK字库时将码元数增加到5个,如98王
码国际版中,铬-QPWWK (五笔字型'熔-OPWK)。 一体化字母形码用于GBK 字库仍为四码,与国标基本集字库相同,^=JGBK (熔-HGBK),重码字不需 翻页寻找,影响输入速度较小。对国标扩展字库需要增加基本集字库所没有的编码部件,如卯、鬥、戸; 繁体字部件(贝)、車(车)、飛(飞)、堯尭(尧)、齒歯(齿),等等,对于普通用户可以有需要时再去学习。(8)能够实现学用输入法与学用汉字相辅相成一体化字母形码遵守汉字部件规范、笔顺规范、折笔规范等,并注重与部首检字法有较好的衔接,表现在以下三个方面① 注重编码部件与字典部首的衔接,国家语委推荐的《汉字统一部'首表(草 案)》中的部首,凡列入汉字基础部件者全部被选作编码部件,重要的合体字部 首,如鱼、齿、麻、髟等也被选作编码部件,占部首表的80%;② 在编码部件的归并上与部首检字法一致,如,、、、归入火,々归入lj, B归 入卩,兰字头归入八,反字边归入厂,中归入聿;手矛、水?、心十同部,(D如果用一体化字母形码编制电子字典,因部首位于左侧和上侧的同部首字 靠近排列,双码部首的字更加集中,对常用部首依据其音、形特征信息来表达, 故可与部首检字法比照衔接。用于电子字典的一体化字母形码检字法的片段将具有如下形式 (G-工弓千瓜戈《《(a一, GP—广,革-GS, GU—骨,拼音后的数字表示声调, 略去解释)GKC 强qiang2 GKCN犟jiang4 GKK宫gongl GKT 或huo4GPCS库ku4 GPD庆qing4 GPDL庵anl GPDN廨xie4GSRB靴xuel GSTT鞋xie2 GSXU鞘qiao4 GSYD鞅yanglGUSC髑du2 GUSK骷kul GUSN骶di3 GUWK骼ge2GXE 宛wan3 GXED宛!]腦l GXU 宵xiaol字典的形式, 一体化字母形码在前,汉字后为汉语拼音。对于非拼音文字的 汉字,前有由拉丁字母组成的形码表达字形信息,后有由拉丁字母组成的汉语拼 音表示读音,使汉字在形、音信息的表达方面都具备科学性,适合信息社会的需要。在电子字典中用一体化字母形码检字法査生字,速度会比用部首检字法或笔 画法快几倍,能够超过用英文字典査单字的速度;教会学生使用一体化字母形码 检字法,也就教会了学生用计算机和手机输入汉字,学用汉字与学用输入法相辅 相成,而且没有导致提笔忘字的弊病。违反《汉字部件规范》的编码不能与部首检字法衔接,如从"段"字和 "追"字中拆出"小",违反规范,与部首检字法相矛盾,若在社会上普遍应 用,汉字的基础知识就会发生混乱。一体化数字形码的技术特征一体化数字形码GB2312-80汉字编码具有规范、易学、快速的特点 ①字母代码与数字代码是顺序对应关系,转换方案系经过优选和反复调整而 确定,由于字母形码运用了汉字免拆分直接编码,输入操作不依赖键位指法,故 数字形码易于学用,用户学会一体化字母形码即会使用数字形码,对应关系很有 规则A、B、C-1,D、E、 F-2,G、H、I-3,J、K—4,L、M -5,N、0—6,P、Q、R-7,S、T、 U-8,V、W、X-9,Y、Z—0。②一体化数字形码经过对相互关联的两种编码进行反复调整,各组重码字少于IO,输入1-4个数字后即可直接选到所需汉字,不用翻页寻找,输入效率比国 外专利高2-4倍。 输入实例如下输入汉字字母形码输入对应数字 输入后提示 选择观 YJ 04 l:调2:占3:观4:航 3(调-YK-04,航-ZJ-04,占-ZK-04) 哈 KRHK 4734 l:哈2:啥3:铪 1(铪-JMK-4734,啥-KRGK-4734)《免拆分易学高效汉字形码计算机手机一体化输入技术》专利用途如下-① 可供信息产业的厂家开发自主品牌的计算机和手机系列产品;② 可供有关院校创建具有特色的计算机应用专业;③ 可供使用拼音输入有困难的方言地区解决汉字输入问题之用;④ 在国家制定解决汉字输入问题的计划时,可以作为选择方案之一。
权利要求
1.“免拆分易学高效汉字形码计算机手机一体化输入技术”简称“一体化汉字输入技术”,用以解决当前计算机、手机输入汉字所存在的效率低下、难学易忘、违反汉字规范、不利于手写汉字的学用等问题;“一体化汉字输入技术”总体设计的技术特征是该输入技术包含“一体化字母形码”和“一体化数字形码”两种输入法,其字母与数字是顺序对应关系,用户只需在计算机汉字输入中学会字母形码,亦即会使用手机汉字输入的数字形码;两种形码都具有良好的规范性、易学性和快速性,能满足社会各类用户和学生的需要;一体化字母形码的技术特征是“一体化字母形码”选择以26个字母作代码的部件式形码,供计算机汉字输入使用;应用“双码部件理据性表达法”,对汉字直接编码输入不搞拆分;对全部编码部件进行有理据的表达,不需要背助记口诀;编码规则最简化,没有难学的识别码;遵守各种汉字规范和汉字使用习惯,注意与部首检字法有较好的衔接,能够做到学用输入法与学用汉字相辅相成;单个汉字输入码长最短,重码最少,输入GB2312-80国标基本集汉字,重码字键选率低于1%,常用词组复盖率高,重码少,使用单个汉字输入或字、词混合输入都具有高效率,输入各种汉字文本比用智能拼音提高1-3倍,高于现有各种形码;一体化数字形码的技术特征是对GB2312-80国标基本集汉字,一体化数字形码的代码与字母形码的代码具有顺序对应关系,系经过多方案优选、反复调整而确定A、B、C-1,D、E、F-2,G、H、I-3,J、K-4, L、M-5, N、O-6,P、Q、R-7,S、T、U-8,V、W、X-9,Y、Z-0;用数字形码输入国标基本集汉字,各组重码字小于10,操作时只需输入1-4个数字即可直接选到所要的汉字,不用翻页寻找,简单易学,输入效率比国外专利高2-4倍;一体化字母形码其编码部件与字母代码的表达关系如下(1)用于GB2312-80国标基本集汉字的编码部件表B-八白匕贝疒 BA=必 BH=本 BL=巴 卜=BN BS=卑 BX=不C-虫厂寸册丑臣川朿屮匚 CC=长 CH=垂 CI=曹 CN=斥 CO=串 CP=才髟 CR=尺 CS=车 CU=齿(C)A-艹乂AA=凹 AW=敖D-大刂丁东丹歹癶 DD=刀 DQ=电E-阝卩二冫儿彐 EE=耳 EX=尔F-方丰飞缶口市父ナ FF=甫 FM=采 FO=弗 FR=夫 FS=非G-工弓瓜戈巛宀冖 GA=更 GE=甘 GG=艮 GM=果 GO=干 GP=广 GS=革 GU=骨 GV=鬼H-火灬一回户 HH=黑 HM=禾 HO=乎 HQ=虍I-弋亠尹日 IL=已 IR=夷 II=衣衤J-金钅甲井几见廴臼 JJ=斤 JA=及 JD=夹 JF=巨 JG=戋 JR=久 JL=己 JO=巾 JX=柬 JZ=九K-口 KO=开L-立了林鹿纟糸乚 LB=龙 LL=力 LM=来 LN=耒 LP=耂 LR=两 LS=吏 LT=里 LX=乐M-木母皿民 MF=目 ML=麻 MM=米 MP=矛 MQ=毛 MX=末 MZ=门N-女廿鸟农廾丶冂 NN=牛 NP=乃 NR=内 NS=年P-丿彡片爿丬勹 PP=皮 PR=彳 PS=平Q-犬犭七千且 QF=曲 QH=丘 QN=求QQ=佥 QZ=气R-人亻冉 RN=入S-石十世豕上三卅ㄅ SA=史 SE=事 SF=四 SL=巳 SN=书 SS=食饣 SP=尸 SQ=氏 SU=山 SX=示礻(S)O-水氵束丨士(S)V-手扌厶VP=身 VV=申T-土田天ㄒ TG- TQ-屯 TT-凸U-月羽聿玉凵 UG-戉 UH-鱼 UO-雨 UR-臾 UN=禺 UV-禹W-王亡夂攵瓦韦为兀丸 WA-文 WG-我 WN-戊 WP-万 WX-未X-心忄辛西习夕小乡 XH-熏 XN=下Y-言讠尢又用也业 YY=羊 YD=央 YH=亚 YI=酉 YO=永 YP=牙 YT=由 YW=尧Z-子州之中爪止丈辶乙 ZA=专 ZD=制 ZE=乍 ZF=自 ZO=兆 ZQ=豸 ZT=重 ZZ=舟另有归类部件,如丷(八)(厂)(川)镸(长)(卩)(冫)彑(彐)(口)巜(巛)戶(户)(日)(柬)(廿)()(豕)罒(四)丆(丅)(月)肀(聿)(心)(小)(又)(用)(羊)(止)爫(爪)氺(水)(2)扩展至GBK汉字添加编码部件,如B-G-冎I-L- N-乁U-U- W-BS-畢 DD-鬥 GL- HS-華ML-黽 W-爲為 QM-YY-丱ZD-夨 WX-卍卐繁简对应、异体对应部件,如貝(贝) 冊(册) 長(长) 車(车) 齒歯(齿) 東(东) 黒(黑)見(见) 夾(夹) 糹(纟) 龍(龙) 馬(马) 門(门) 鳥(鸟) 卄(廿)僉(佥) 飠(饣) 魚(鱼) 烏(乌) 昜()堯尭(尧)非G列汉字编码部件,如戸(户) 亊(事) 曺(曹);利用上述编码部件和字母代码之间的表达关系对汉字编码后输入计算机,其规则和步骤如下单个汉字按以下规则编码输入①按照组合字各编码部件之间的自然划分,用代码表达编码部件,依照笔顺取前面三码和最后一码,不足四码者在输入时加一个空格键结束;②单码部件字,在单码部件的代码后按照首笔和末笔笔形补加两个代码;③双码部件字,两个代码即是其编码;④对两码组合字按照两个编码部件的末笔笔形补加两个代码;输入后如有重码字,按照重码字前的序号,键选所需汉字;高频汉字另有易记的一码简码或两码简码;在GB2312-80字库中编有两万多条词组,按以下规则编码输入①两字词组[第一字首码][第一字末码][第二字首码][第二字末码]②三字词组[第一字首码][第二字首码][第三字首码][第三字末码]③四字词组[第一字首码][第二字首码][第三字首码][第四字首码]④多字词组[第一字首码][第二字首码][第三字首码][最末字首码]输入后如有重码,按照重码词组前的序号,键选所需词组。
2 .编码技术"双码部件理据性表达法",在权利要求1中对于突破"拆分 汉字"、建立"汉字键盘"等传统设计理念,解决规范性、易学性和快速性三者 之间的矛盾,起到重要作用,其技术特征是-① 对编码部件中造成重码的独体字不迸行违规拆分,取为双码部件,如重 =ZT,牙-YP,柬-JX,前后两个码都是理据性表达,其中前码是该字汉语拼音第 一个字母,后码是对该字下部结构特征或末笔笔画名称取其汉语拼音第一个字 母;② 双码部件在组合字中是取两个码,还是只取前码或只取后码,由组合字 "前三后一"的编码规则来决定,不因采用双码部件增加任何特殊规定;③ 双码部件的两个代码即是该汉字的编码,使用非常方便;其前后取码的方 法与两字词中对每个字取首尾两码的方法具有一致性,便于两字词编码。
全文摘要
本发明包含一体化字母形码和一体化数字形码两种输入法,其字母与数字是顺序对应关系,用户在计算机汉字输入中学会使用字母形码,也即会进行手机汉字输入,两种输入法都具有良好的规范性、易学性和快速性。一体化字母形码应用双码部件理据性表达法,不搞拆分直接编码;编码部件易学易记,不背助记口诀;编码规则最简化,不学识别码;遵守各种汉字规范和汉字使用习惯,注意与部首检字法衔接,能够做到学用汉字和学用输入法相辅相成;输入单个汉字重码字键选率小于1%,常用词组复盖率高,输入效率高于现有各种形码,比智能拼音提高1-3倍。一体化数字形码系经过方案优选及对两种编码进行相互关联的调整而确定,用于手机汉字输入重码少,效率高,键入1-4个数字不翻页即可选定所要的汉字,输入效率比国外专利产品高2-4倍。
文档编号G06F3/023GK101158884SQ20071009414
公开日2008年4月9日 申请日期2007年10月15日 优先权日2007年10月15日
发明者敬永权 申请人:敬永权