《中日韩统一汉字》字形操作码的制作方法

文档序号:6469924阅读:2256来源:国知局

专利名称::《中日韩统一汉字》字形操作码的制作方法《中日韩统一汉字》字形操作码本发明属于汉字编码电脑键盘输入技术。本发明是专利号为ZL94111115.6《汉字自然部件编码》键盘输入技术进一步与汉字排序、汉字检出、汉字教学、汉字信息化相统一的一个具体实施方案。《中日韩统一汉字》就是《CJK统一汉字》。它包含了中日韩各自有关标准字集,是现在收字量最多(20902字符),已进行了统一编码与二进制数相连的一个国际标准字集。《中日韩统一汉字》的统一编码叫"信息交换码"。它是一种单字排队编码,用于电脑与电脑之间的信息交换。《中日韩统一汉字》字形操作码,是一种部件随机编码,用于人脑与电脑之间的信息交换。一、汉字编码变成了汉字输入上个世纪80年代,国家科委推广"五笔字型",中国人对汉字编码进行了第一次全面的实践。汉字成为国家法定文字是21世纪的第一年发生的。20世纪80年代,汉字的法律地位并不明确,学术的土壤还没有培育出政界"汉字拼形"的理想,国家明确提出"汉字编码是走向汉字拼形的阳光大道"条件尚未具备,相应的技术也没有及时发明。历史长河行舟,进退相伴而生。今天,"汉字输入法"无声地主宰着电脑键盘输入技术的全局,编码的起步字集不能采用国际标准,部件不能全部拼复被拆单字,编码之间不能完全消除重码,"汉字编码"的几个硬指标被完全搁置。互联网里"北大中文论坛"还只有一个"中文信息处理"的板块和"输入法讨论专区"。"中文信息化"的概念尚未形成。"中文信息处理"的出路是"中文信息化","中文信息化"的关键是"汉字信息化","汉字信息化"的基础是"汉字编码"。输入法不等于汉字编码。汉字编码作为最基础的信息化技术,连一个讨论的地方都不存在,人们的奋斗完全偏离了推广"五笔字型"原来理想的目标!形成今天这种局面的原因是多方面的。重新阐明"编码技术"与"输入技术"的主次关系,可能为汉字编码带来一线新的生机。在"汉字编码键盘输入技术"中,汉字编码是技术的前提,技术的条件,技术的基础;键盘输入是编码的应用,编码的检验。汉字编码键盘输入技术,其本质就是一种汉字编码的技术。从"汉字编码键盘输入技术"中抽掉"编码"二字,变成"汉字键盘输入技术",技术的前提、条件、基础等的限制都不存在了。这种处理手法,虽然绕过了汉字编码的技术难题,但完全改变了技术创新的本质内容,是汉字技术创新一种逃跑主义的表现。积重难返,政界、学界、技术界、投资者、媒体重新明确汉字编码的目标、任务和意义,是当前中国信息化的一件大事。二、汉字编码远景目标的宣示汉字编码分为整字排队编码和部件随机编码。汉字部件随机编码的远景目标,就是要建立一套可以线性操作的代码符号作为汉字的影子,实现中文汉字的信息化。1、编码是汉字信息化基础工程什么是汉字的信息化?先看看什么是"信息"。"信息"在《现代汉语词典》中有两个义项"①音信;消息。②信息论中指用符号传送的报道,报道的内容是接收符号者预先不知道的"。中文汉字信息化的"信息",当然是指用符号传送接收者预先不知道的报道,指令,声音,图片、数字等。信息化的"符号传送"是一个十分复杂的过程。因为"音"的符号是瞬时的,传送距离十分有限。信息化的"传送符号"一般采用字形符号一(数字或字母)代码符号一(二进制)数字符号一(电位正负)状态符号。它们形成一条信息化的"传送符号链"。讲汉语的人传送语言信息使用的是字形符号,称作中文。讲英语的人传送语言信息使用的是(字母)代码符号,称作英文。电子软件编写程序使用的是代码符号,数字符号;电子硬件,通讯线路工作过程中使用的是状态符号。由此可见,中文汉字要成为信息化"传送符号链"的"终端符号",它和英文相比,多出了一道程序,即汉字先要转化为代码符号。汉字随机编码就是为汉字转化为统一的代码符号创造条件。汉字有了自己统一的代码符号与(二进制)数字符号相连,汉字就实现了信息化。2、汉字应走完发展的第三阶段上个世纪的汉字"拉丁化"与"一语双文"都被本世纪第一年的语言文字法否定了。但汉字拉丁化并不是"空穴来风"。汉字到底存在什么问题?国人必须重新睁大眼睛,探个究竟!世界上古代四种自源文字,初期都是象形文字,用图画表意。人类用"语言"进行思想表达交流。这个时期的思想表达交流分为音表达交流与形表达交流,也就是"语言分为音表达交流与形表达交流"。那时的音表达交流与形表达交流是否沟通对应,没有肯定或否定的根据。音表达交流与形表达交流各自的发达水平,也无法进行考证。这是语言发展的初始阶段,时间是十分漫长的。后来在文字中渐渐分化出"意符"(类符)和"声符",表明音表达交流与形表表达交流开始对应沟通,文字开始表音。这是语言发展的第二阶段,时间应以千年为单位来计算。到公元前两千年左右,闪米特(塞姆)人撇开当时的传统文字形式,开始用字母记录讲话的辅音(不单独记录元音),音表达交流(讲话)的单词出现了形代码,形代码的内部是以字母为单位线性排列。从信息"传送符号链"的角度看,传统的文字分化出一种"代码符号文字"(属于"传送符号链"的第二个环节)。代码符号文字的内部单位可以线性操作,成为文字的第三种重要属性。表意、表音与内部单位线性操作又称作文字的三大功能。英文是世界流行的文字,汉语要走出中国。中文的汉字与英文的单词在三大功能上作一番对比是有益的。表意,中文的象形字,指事字,会意字,百分之八十以上的形声字"类符"都是表意的。英文的单词中只存在一些性数等变化表意。可以看出,中文汉字只是从完全表意退縮为部分表意,英文单词基本上靠音表达词表意,形表意萎縮了。表音,中文单字用"声符"表音,汉语词典需要用汉语拼音注音;英文单词用"字母"表音,英语词典需要用国际音标注音(俄文等不要注音)。线性操作,中文单字内部单位是面性排列,无法线性操作。英文单词内部单位是线性排列,可以线性操作。从上面的文字发展和对比可知,对于"字形符号文字",表意是文字发展的第一阶段,表音是文字发展的第二阶段,内部单位能够线性操作,特别是电脑时代,是属于字形符号文字——汉字还未发展成熟的第三阶段。所以,汉字现在只缺内部单位的线性操作。对于"代码符号文字",字母表音与内部单位线性操作两者同步而来,不存在第二阶段和第三阶段。所谓"表意一表音一拼音(也是表音)"文字发展三阶段论,纯粹是"传送符号链"上字形符号与代码符号串接的两类文字中表音一种属性嫁接的结论,是一种主观愿望。文字的本质是符号。字形符号文字与代码符号文字,各有自己发展的形式。汉字完成了内部单位线性操作的第三阶段发展,它比代码符号(拼音)文字更胜一筹。三、汉字编码方案的部件建设汉字编码电脑键盘输入方案的技术设计,大致分为四个步骤部件建设,代码建设,部件与代码对应,单字按部件代码编码。四个步骤的每一个步骤都有技巧可施,各个步骤所施技巧数量的多少和质量的高低,合起来就是汉字编码电脑键盘输入方案技术的优劣。汉字编码用键盘输入电脑,不是所有汉字(包括尚未发现的汉字)都要进行随机编码。随机编码字集的选择,最大以五万多字的《汉语大字典》,最小以二万多字的《中日韩统一汉字》两个字集为目标比较切合实际。《汉语大字典》以外的字,解决的办法可使用"插入"与"信息交换码"。1、字集的选择汉字随机编码,首先应该选取可能是最大的字集。因为部件和部件的代码是随机编码的依据。最大字集的部件选准了能拼复全部被拆单字,能保证没有重码。比最大字集小的不同字集,所选的部件及单字的编码也就都包含在最大字集的成果之中。如果选取的字集不是最大,比如选的是国家标准6763字,随机编码时,国际标准20902字的部件就不一定内含6763字的部件。当国际标准字集随机编码成功了,为了统一汉字编码,国家标准字集随机编码成功就没有意义了。这是致力于汉字编码的专家学者,必须坚持的一种"战略思考"。本方案选择《中日韩统一汉字》字集作为随机编码的起步目标。但部件代码表的设计,部件的选择都是从《汉语大字典》字集做起的,留有升级的余地。2、部件的定义部件的定义,有人说部件是大于笔画,小于成字的笔画结构块,有人又说部件是相离、相交、相接等的笔画结构块,莫衷一是。这种思考,是在为部件而定义部件。本方案采用为汉字信息化的目标而定义部件:部件是承担表意、表音、线性操作三项任务的汉字内部单位。这样,中文汉字的表意、表音、线性操作功能,完全由内部单位——表意、表音、保证线性操作的部件来实现,而汉字则是具有若干义项的一种载义体。3、部件的拆分本方案根据部件的上述定义,单字尽量按照指事、象形、会意与形声的造字规律,拆分为成字,左右偏旁,字头字底,字省构件和辅助笔画五种部件,即部件具有五种身份。象形字指事字一般不拆。具体的拆分方法如下"到"。《说文》"到,至也。从至,刀声。"——《汉语大字典》縮印本141页。"到"拆分为"至lj"两个部件。"五笔字型"拆分为"一厶土U"。"羸"。《说文》"羸,少昊氏之姓。从女,羸省声。"——《汉语大字典》縮印本886页。"羸"拆分为"Bi女"两个部件。是"羸"省出来的构件。部件的字省构件身份由此而来。"五笔字型"把"羸"拆分为"^L口、"。"含"。"含,口嗛也。从口,今声",形声字。"今,是时也。从仝(变形为^),从7。7,古文及"。"含"拆分为7口"三个部件。"五笔字型"拆分为"人、7口"。"藏"。"藏,匿也。从!H1,臧声",形声字。"臧,善也。从臣,戕声",形声字。"戕,槍也。他国臣来弑君曰戕。从戈,爿声",形声字。"藏"拆为"廿臣戈爿"四个部件。"五笔字型"拆分为"廿厂LJ"。"舔"。"舔,以舌擦拭。从舌,忝声",形声字。"舌,所以言也。从千,从口,千亦声"。"忝,辱也。从天,心(变形为小、)声"。"天,颠也。至高无上。从一、大"。"舔"拆为"千口一大小、"五个部件。"五笔字型"拆分为"J古一小"。(本方案汉字最多拆分为五个部件。这是汉字部件总表、部件主码辅码表选择与设计好的)。成字,左右偏旁,字头字底,字省构件和辅助笔画,成为本方案汉字编码部件建设的特征,也成为汉字教学、汉字规范的一条新思路。在这里作一特别说明,部件选择成字有特殊的意义。成字在层次上大于部件。部件中的成字是被矮化了的成字。它并不与"汉字有笔画——部件——成字三个层次"相矛盾,而是一种实事求是的解决办法。成字成为第一位的部件,理由是汉字多数字除了部首还有余部,有的余部又可分为部首和余部,多数余部是成字。部首的数量依赖于分类的详略,成字的数量决定于单字的余部。部件中多数部件是成字也就理所当然。实践证明,部件的成字选得越多,部件的总量就要得越少。它是本方案攻克《中日韩统一汉字》两万多字部件拼复率为百分之百的关键。本方案部件的成字约占67%,它也是本方案的重要特征。4、拆分与拼复部件有造字部件和拆分部件之分。造字部件发明在先,拆分部件发明在后。造字部件拼复出来的是一个汉字。拆分部件,在此之前,还没有人提出在设定字集内拼复全部被拆单字的要求。但汉字的拆分与拼复,是创新汉字过程中相互依存的两个方面。如果汉字没有拆分,拼复的问题就不会出现;如果汉字没有拼复,拆分就没有了充足的理由。有拆分就要有拼复,这也算辩证法里的一种对立统一规律。只拆分,乱拆分,不拼复,不符合创新思维。拼复是保证汉字"客观形态"与"主观形态"统一的原则措施。刻画的,写出的,印刷的,显示的汉字是一种客观形态,脑子里映象的汉字是一种主观形态,两种形态是汉字相互依存的两个方面。使用玛雅文字的民族被殖民者消灭了,玛雅文字的主观形态不存在了,玛雅文字也就消亡了。字形信息不能达到百分之百的编码过程,在脑子里形成一个缺笔少画的映象(主观形态),不但会引起"慢性消亡之道"的嫌疑,还违反了汉字规范的要求,直接影响书写学习与汉字使用的态度。本方案选定的部件,对《中日韩统一汉字》中被拆单字的拼复率为百分之百。其中,部件拼复字量最多的顺序是口2164字,廿1378字,?1198字,才923字,日849字等,有12个部件拼复字量是一个字。5、部件的总量本方案部^T的总量是可以论证的。以《汉语大字典》为例,它所收的字有五万多,使用的部首是两百多。"水r'可算作一个部首,但形体和身份不同,应算作两个部件。这样,《汉语大字典》作为部首的部件就有三百二三十个。假设"部首"与"余部"半对半,在《汉语大字典》字集内,能拼复全部被拆单字的部件,应该是六百多个。六百多个部件算不算多?如果与许慎《说文解字》九千多字使用的起步部首字540个相比,《中日韩统一汉字》字集二万多字,使用六百多个部件,作为"汉字信息化"的起步部件并不算多!本方案最后选定的部件是638个。它们按起笔和各自身份排列如下(一)、成字(1)、《现代汉语词典》选收字(329个)一二三示亏云豆更可鬲王玉干馬雨兩爾酉两工正贡丁耳長匿臣比不万石頁页百而面至兀五豕歹瓦死愛平牙厂辰厭十丰車车韦甫声臺士鼓土青直古專本木末耒來麥束囊東未走赤七屯寸在大夫夷犬左友龙戊戌戍弋戈或戋革葱萬華蓋蘭共其黄廿井昔世(107)少小光黨业H卜非韭山豐上卜止齒齿鹵虎此北冉婁冊捋目央四鬥門冏骨曰曷口品足只是日旦目鼎蜀里黑回邑田黽昇且皿貝贝中内肉由曲虫巾申电曳見见(65)火心必行儿川豸爲八分系谷我禾秉千夭手重毛缶气乍矢欠牛片生先多月風殳几夕各角魚鱼兔勿鳥鸟匕旨九丸的隹段丘身白自卑鬼卯臼人入僉倉金食乎斤斥瓜爪舟愛(71)六主亡言京方亦交亥广慶鹿麻之户永衣立辛产音章龍文齊蜜充牽门為羊前米斗头寅賓憲寧穴(40)敢了子予矛疋马乙胥又飛羽民己巳巴尸尹艮尋丑弓弔刀力夬韋隶聿弗皮也爿卯出水能乡鄕厶幺母毋毋女奴(46)。(2)、《汉语大字典》选收字(98个)T^髟匸匚匝苜丌豕无牛直垂朿茭亏大大犮尤先^升六(24)少业延支貞步丄门冋冊A能昜口內内内曲豊(19)乡《S壬产夂角昆勺乂X菱匕眞朱豕^冡軍豕自H舎仝釆广(26)亩廣广咅囟羊尹尚^(9)弓叕^5_穴刁卩匁聿飞U4屮屮^糸〈歸互(20)。(二)、左右偏旁(41个)5县b::fc才卞才iJ足火十禾夂华月34金韦省亇来询言i氺丰^茅7孑P艮糸纟。(三)、字头字底(32个)而A水卄卅小、1,卜止产冃凹"、、JIL八儿土A7夕个《i亦古v芏;L丑[l氺小、。(四)、字省构件(124个)至哀丐丽与7T[]"E臨lr耳牛車丰志主茧离少t毛恵夫夹夹戈弋戋允茈苗胜丑(34)i|ij水氺告尘荧卞^^"&豕pn円冈闪闬ra闲M因离困早口龜n且兄巾闳生血中#(36)歪Ar舰J]几穴夂^乂炎丹密力氺衣^f'白CP刀臼胸龃氽义(27)圭^古u乂关、、/X;(9)7尋走〕尸3:i具3尹夬韋申兼Dc眠h母(18)。(五)、辅助笔画(19个)Z|、V7ULLJh4J。6、部件的类别部件一般用四种方式进行分类。(一)、部件以"起笔"作为标识进行分类。部件和字一样,也有"横竖撇点折"五种起笔,相应地也有"横竖撇点折"五种起笔部件。"豆"是横起笔部件,"田"是竖起笔部件,"矢"是撇起笔部件,"音"是点起笔部件,"矛"是折起笔部件等。部件以"起笔"作为标识进行分类,是部件分配到九个数字上与之对应的根据。但它还有不足之处除了点起笔外,"横竖撇折"对应的数字是双歧的,还要继续寻找窍门使之成为单一对应。(二)、部件以"起笔续笔特征"作为标识进行分类。起笔是第一笔,续笔是第一笔以后的各笔。起笔续笔特征就是起笔与续笔的相对位置与相互连接关系。部件以"起笔续笔特征"作为标识,如横起笔部件还可以分出两个层次。以"豆工石十大其"等部件为例第一个层次,"豆工石"是横不出头部件(对应一);"十大其"是横出头部件(对应二)。这一层次使部件分配到数字实现了单一化。第二个层次,"豆"是横不出头相离部件,"工"是横不出头竖接部件,"石"是横不出头撇接部件,"十"是横出头竖交部件,"大"是横出头撇交部件,"其"是横出头多交部件等。这一层次是部件分配到27个键位(形成27个族)与之单一对应的重要手段。(三)、部件以"起笔"按书写顺序标识进行分类。部件分为起笔续笔兼用部件,续笔专用部件。起笔续笔兼用部件,如"革"是鞍(革A女)字的起笔部件,是霸(雨革月)字的第一续笔部件,是絛(i夂革)字的第二续笔部件,是鞏(工几、革)字的第三续笔部件。续笔专用型部件,如"夂"不做任何字的起笔部件,它是政(正夂)字的第一续笔部件,是教(央子夂)字的第二续笔部件,是激(?白方夂)字的第三续笔部件,是薇(廿4尘几夂)字的第四续笔部件等。在638个部件中有175个是续笔专用部件,有463个是起笔续笔兼用部件。本方案的部件,按起笔、起笔续笔特征、起笔部件形成部件族,分配给九个数字所产生的27个主码,使汉字部件、汉字具有"横起一二竖三四,撇始五六点在七,折画八九数相替,续笔还论接交离"的起笔对应规律,为汉字按部件进行数字编码打下了基础。7、部件的认证汉字编码,国家标准6763字,国际标准20902字,《汉语大字典》5万多字,不同的编码专家,完成上面三大字集的编码,可能各有一套不同的部件,到底选哪位专家的哪套部件为好?应该说,只有经过几个方面的检验认证才能使选出是客观的,高标准的。(一)、理据认证。汉字的造字部件大多数是有理据的。汉字的拆分部件追求与造字部件的一致,应该是汉字编码的一个原则。汉字造字部件的理据,在《汉语大字典》"解形"条目中多有讲述,许慎的《说文解字》是讲述部件理据的主要典籍。理据认证的直接结果是部件有了五种身份。即部件应选自被矮化了的成字,左右偏旁,字头字底,字省构件和辅助笔画。它是本方案部件选择的主要特征。本方案对全部638个部件进行了理据论证,并对部件拼复的单字进行了排列。排列的"起笔部件字"用于编制"起笔部件字库"。排列的"续笔部件字",用于表达部件的拼字能力,显示部件的造字规律。下面节选《中日韩统一汉字字形操作码》书稿中的二个部件,用以说明论证的形式与内容。其中"(2)、(3)"两项中的"12、13、1/'等的含义是这样的主数字"1",表示部件是拼字中的第一个部件,右下标"2、3、4"表示该字的部件总数。"22",主数字"2"表示部件是拼字中的第二个部件,右下标"2"表示该字的部件总数。其余类推。126北(bM)(1)选择原因《说文》"背。从肉,北声"。"北"是背等字的表音部件。"驥、骥"等己经是以"北"为部件的四部件字。按一般不拆笔画相连结构的原则,"北"最多只能拆为两个部件。这时的"骥驥"已是五部件五码重码字。"北"应选为部件字。(2)起笔部件字12邶北背輩13都冀14覽(7字)。(3)续笔部件字22緋茈乖乘23揹借褙褙剩呢垂24懷骥驥33驟涞凍嵊34桄(19字)。482>7[人(r6n)字头](1)选择原因《说文》"产。从人在厂上"。"負。从人守貝有所恃也"。"刍。从人在臼上"。"色。从人,从P"。"复。从复,从人在穴上"。《積微居小學述林》"久,即灸之初字也。从卧人。末画象以物灼体之形"。考察字头是的字,尽管并非全然从人,但大部分从人。近代字典部首目录都把"々"作为"刀"的变体,"々"应正名为"人字头",更有利于字义的理解。(2)起笔部件字-12久亇負负包灸籴色刍免争象龜麁13玺親迩奐奐龟亀奐劾欽鵠鹐急雏邹皱燄勉14煞复复15觭觴(37字)。(3)续笔部件字23诤铮诤静挣挣峥踭睁狰錚铮诤諍铮净浄铮鬃筝珎趂称称你銶祢称弥妳輅培掐啗蝤焰馅餡餡馅諂谄滔陷萏窖閻阎玖欵玖畋沃玖疚E羑輓挽挽鞔晚晚俛脱鯢俛銳浼浼娩娩莬艳飽艳滟艷艷脃铯絶艴絶绝橡蟓蟓蟓像錄橡淥豫賴賴偵嫫莨赖趋诌驺绉24瑛換喚煥換渙突瘓换唤焕渙痪搀馋谗喼稳隐媲嫩蓟衡梅您阉陥25瞜觼讒瓊蔓晚繳34瓛獺瀨懶獺襯瀨嬾懒籟籟癩獭濑籁癞櫚櫚咽爛調櫞蔬滟瀧瀧灘滟柩畝櫞猕瀞镁瞰羑冕35藕蘅寳瘾(180字)。(二)、拼复认证汉字编码方案,首先应有自己的编码数值字库,或编码字母顺序字库。这是使中文汉字的代码符号与英文单词代码符号媲美的一个基本保证。汉字编码方案应在自己的编码数值字库,或编码字母顺序字库的每一个单字后面,注明拆分与拼复的部件,以表示被拆单字的拼复率是百分之百。本编码方案的拼复认证,详见后面的编码数值字库。(三)、编码认证汉字为什么要拆分为部件?部件是为编码服务的部件给定一个代码,单字就可以按部件的代码进行编码。编码认证是部件的目标认证。理据认证、拼复认证只是部件的功能认证。如果在编码方案中,所选择的部件理据认证、拼复认证都过关了,但编码认证没有过关,在指定的字集里编码有重码,所选的部件就不能完成随机编码的任务。即使有一张许多人认可的部件表,它的存在也没有实用意义。这和一枚发射卫星的火箭一样,它的零部件通过检验都符合设计要求,工作人员都满意。但卫星送不上天,零部件还没有接受最后的一次实践检验,两者是同一道理。本方案编码之间的重码率为为百分之零,详见后面的编码数值字库。四、汉字编码方案的代码建设代码的选择对汉字随机编码的成功也是一个关键。编码专家为什么对汉字随机编码总是毫不犹豫地使用线性排列的字母?如果当年的化学专家也只使用线性排列的字母,不越雷池一步,今天的学生就没有分子式来表示物质的结构!同样,如果今天的编码专家也只使用线性排列的字母,不越雷池一步,明天的学生就没有编码来表示汉字内部的线性操作!1、代码的起源约四千年前,闪米特(塞姆)人用"表示"辅音的字母线性排列,"记录"讲话时的音表达词,线性排列的字母便成为音表达词的代码,或叫单词代码。这是人类使用代码的开始。单词代码通过语法的组合便形成"代码文字"。"代码文字"后来分化为用字母表示元音与在辅音字母上加附标表示元音的两种形式。代码文字开始形成线性系列和附标系列。英文属线性系列代码文字,阿拉伯文属附标系列代码文字。如果把字母代表讲话时音表达词的音素叫"一次代码",英语中的"d"、"o"就是"一次代码"。讲话时的音表达词"do","dog"就是"二次代码"。縮略词"爱滋病"就是"三次代码"。2、代码的形式代码并不属于拼音文字专用,它的身影遍及文理各科。数学里的"代数",实际是一门代码数学。a+b=c,可以是2+3=5,也可以是3+4=7。化学里的分子式K203三氧化二钾、KN03硝酸钾也是一种代码。由此可知代码的形式是由代码事物的实际需要设计的。3、本方案的代码本方案选用数字码。四位数字码最多只有9999个整数,对于有20902个字符的《中日韩统一汉字》,进行排队编码也是不够用的。本方案对普通数字进行了"扩容"和"层次"的设计。(一)整数的容量数字在起源阶段是一二三四五六七八九十。它们叫"基数字"。当古人掌握进位后,数字出现了十一十二……形成了自然数。数字用数轴图象表示后,基数字改为0123456789,在图象上称为"分格数字"。图象继续发展,便有了(二维)平面坐标一(三维)立体坐标一(四维)时空坐标。因为数字只用于计算,坐标中不同数轴的分格数字只能统一,不能区分。否则,数字计算就不能进行。这样的数字用于表序时,二维、三维、四维数字全部变为一维数轴上的数字。从数字表序的需要出发,扩容设计的措施就是把(四维)时空坐标四根数轴的分格数字用附标进行标记,形成附标数字码元,如图1所示:标记法是四根数轴的—分格数字分别加上()、(一)、(V)、(八)"无横钩帽"顺序的附标,形成37个附标数字01Ui22g^33334iM5^56弱g7n8弱g9的9。零是坐标图象的原点,加附标没有数学i义。附;示数^的读音与汉语四声一致<table>tableseeoriginaldocumentpage11</column></row><table>这样,原来一位数的整数,"0"除外,总共只有9个。通过"扩容"之后,四根数轴上表序的整数就有了36个。原来二位数的整数是IO——99,总共是90个。通过"扩容"之后,"i"与"r,,"1"与"J","1"与"1","1"与"2","1"与T,"1"与T等等,都可以组合为二位数表序的整数,数量由90个猛增至1332个。在X数轴上,从l——4位,整数的容量是9999个,从l——5位,整数的容量是99999个,属万级容量。在XYZT坐标系,从l——4位,整数的容量是1823508个。从l——5位,整数的容量是67469796个,属亿级容量。整数"扩容"达到了空前的水平。汉字编码用26个字母作代码,可以看作数字在数轴上的"扩容",分格数字由9个扩大到25个,进位由"十进制"扩大到"二十六进制"。但"扩容"的效果,许多编码专家都试过了,解决不了汉字编码的重码问题。本编码方案在37个附标数字中选择01"22^3234^5§§6^7^8^99作为部件的代码,总共27个,比用26个字母作代码的容量大得多。(二)数字的层次.汉字五种起笔,如果像"五笔字型"那样分配给25个字母代表,部件起笔代码的确定,至少是一种五项选择。起笔分配给9个数字代表,部件起笔代码的确定,最多是一种两项选择。五项选择正确的概率是20%。两项选择正确的概率是50%。如果是一项选择,正确的概率就是100%。在部件的类别中,本方案以起笔、起笔续笔特征为层次。为了使部件对应数字都是一项选择,数字也分为不带附标与带附标的两个层次第一层次0123456789。第二层次0Uii2^33334^5^6柳7Zn8柳9柳。(三)代码的码元本编码方案代码的码元,如图2"汉字部件主码辅码表"所示,是在第二个层次的数字中选取的27个附标数字26个字母所形成的代码一和编码,只是^母一数轴上一个li间的整数点。本方案这些码元所形成的代码和编码,都是四维坐标空间的点、线、面、体。它们是本方案使重码率变为0%的重要技术措施。代码系统的码元,是四维坐标系四根数轴用附标进行了区别的分格数字,成为区别所有编码方案的特征。五、部件与代码对应本方案部件与代码对应的特点是1、部件形成部件族与代码对应部件按起笔、起笔续笔特征、起笔部件三个层次分为27个族(见图2)。它们是左表眉1U22323234全45§§6g§7ZZ9经。"横竖撇折"四种起笔对应的数字是二歧的,如"横起一二",细分为起笔续笔特征"横不出头"au)、起笔续笔特征"横出头"(2^2),消除了数字的二歧对应。其中"iu"再细分为横离"i"族,横竖接"r,族,横撇接"i"族。保证了每一族部件与第二层数字单一对应。如图2中所示,横离"i"族的部件是:"一z示至二亏云豆更裒可鬲王玉5干馬丐雨兩爾两而酉两丽"。横竖接"r,族是"工T正贡丁5弓耳T長县髟匸匿匚"E[]臣匝臨比bb"等。每一个族的部件又按部件的"形近"形成联想结构(见图2)。横离"1"族中的"二亏云"、"王玉玉"等是联想结构。部件联想结构有两个用途。直接用途是帮助记忆部件的代码。间接用途是扩大部件族的部件容量。本方案部件族的部件容纳最多是27个。每一个部件都有它自己单一的代码。例如,"金"(矮化成字)的代码是"§4","金"(左右偏旁)的代码是"§4","韦"(左右偏旁)的代码是"w。c:(字省构件)的代码是"w,夕的代码是"§4"等(见图2)。部件与部件的代码,比部首检字区别细致得多,完全准确到与课堂讲课的每一个细小的区别。这是本方案的一个特征。每一个部件都有它自己单一的代码。它的第一个好处是,部件与代码的对应是单一的,可逆的。知道了部件"金",就可以确定代码是"§4"。知道了代码"§4",就可以确定部件是"金"。它的第二个好处是,编码的技术细节,都限定在"单字、部件"各自的层面内,与拼音文字的音素拼音相当。这也是本方案的一个特征。"五笔字型"的字根总表,一个键位的字根,有十多个的不少。例如,键位Q代表的字根是金韦C勺夕夕々……Q到底代表谁?不能确定,一开始就进入了模糊状态。"五笔字型"的字根没有确定的代码,只有确定的键位。这样,单字只是按字根击键,单字不是按字根编码。"五笔字型"虽然也有编码,在技术上,字根的"击键码",单字的"字型识别码",单字的"末笔识别码"等等,凑合而来,在编码的过程中不存在单字与字根两个层次的区别,时而是字根提供的根据,时而是单字提供的根据,难免增加学习上的困难。2、代码分主码和辅码与部件对应代码按它的功用分为主码和辅码,形成部件的复代码(见图2)。左表眉1U44《5"6§§7n8g§99是主码,上表眉1"3234全45§§6g§7ZZ8§§999是辅码。复代码的形成方法,与看表的方法是一致的。以横竖接"1"族表芯内的部件"丁"为例,"丁"的复代码是先向左取"I",再向上取"2",合起来就是"丁"的复代码"i2"。其余类推。横起笔各族部件的复代码己都推出在表上。复代码的主码代表"部件族"对单字进行编码,复代码的辅码代表"部件序"消除单字编码的重码,形成在部件层次有多个选择的消除重码机制,大大提高了消除重码机制的效率,从而保证了单字编码之间不会产生重码。具体地说,因为复代码是数学平面上的一个点,两个部件构成的字,单字编码绝对无重码(单字编码方法见后面说明)。三个部件构成的字,补充辅码可以有三个选择。例如,"霭"拆为"雨i曷",《中日韩统一汉字》中还有"靄",拆为"雨言曷"。如果它们都补充第一个部件的辅码,便产生了重码。"靄",补充第一个部件"雨"的辅码,编码为"1747"。"霭",改为补充第二个部件的辅码编码为"1743"。如果再有重码,还可以补充第三个部件的辅码,留有选择的余地。复代码使部件与代码之间的转换具有唯一性和可逆性。复代码在部件升级为成字层次时,代码也随之升级为编码层次("五笔字型"是连敲四下键),形成成字层次的"代码字"(见编码数值字库横离"1"族"0——1§",如1一,10十,li示,U称[2示]等)。本方案正是因为有补充辅码的多种选择,轻而易举地实现了《中日韩统一汉字》的重码率为百分之零。3、代码码元与键位对应(一)台式标准键盘右手操作区键位N——1,M——-i,[<,]一—i,H——2,J——2-g,L——[<,],Y—i手操作区键位B—一3,U——3,I——3,o~—4,P——~i,[〖—5,G~-§,'r——-§,v-——6,F-——S,R--1—7,D——2,E——Z,-9。上排数字键1——i,X——8,S——§,w———8,Z——9,A—2——2,3——3,4——4,5——5,6——5——2,8——§,9——§。汉字按部件随机编码输入,总共使用27个键,其中只有一个"^"键,安排在上排数字键,其余都是原打字键。汉字按声韵双拼加起笔部件(或再加第一续笔部件)起笔码输入,i纟3殳5s:^3才会全部使用。(二)手持标准键盘手持标准键盘,对于附标数字,比如?882字[a子]1232型[一升ij土],可化为7v882—字[a子]12八32型[一升U土],数字与附标分开输入。因为编码数字有连续输入,而附标符号没有连续输入,三个附标键可以与功能键共键。手持标准键盘输入,虽然击键的次数有所增加,但可以不需要用屏幕拣字。六、单字按部件代码编码单字按部件代码编码,本方案只设计了一张表和一条规则,单字就可以按部件代码进行编码。一张表就是"部件主码辅码表",它是需要记住的。一条规则就是"排列主码,补充辅码"。部件代码是单字编码直接的唯一根据。单字编码成为汉字信息化"传送符号链"第二个环节直接与二进制数符号相连的代码符号,将来也可能是汉字代码的唯一形式。本方案单字按部件代码的具体编码方法如下1、一部件字一部件字就是"部件主码辅码表"里的字,又叫表内字或部件字。一部件字的编码就是表内的复代码。比如"臣"部件的代码(见图2)是"18","臣"字的编码也是"18"。这是部件主码辅码表确定的,字与码之间是可逆的。2、二部件字"设"拆分为殳"两个部件。"设"就是二部件字。"设"第一个部件"i"的代码(见图2)是"73",第二个部件"殳"的代码是"§g"。前面的是主码,排列主码就是"7§"。后面的是辅码,补充两个辅码为四码。"设"的编码就是"7§^"。二部件字的编码,相当于一个平面上两个点确定的一条线段,是确定的,绝对无重码。二部件字,包括下面的三四五部件字叫编码字。3、三部件字"编"拆分为"乡户冊"三个部件。"编"就是三部件字。"编"的第一个部件"纟"的代码(见图2)是,g",第二个部件"户"的代码是"Zi",第三个部件"冊"的代码是"4^"。排列主码是,Z4"。补充辅码,一^补充第一个部件的辅码。"编"的编码就是"9Z4g。"紇"拆分为三个部件"糸—乙"。第一个部件"糸"的代码(见图2)是12",第二个部件"—"的代码是"54",第三个部件"乙"的代码是"85"。排列主码是,8"。如果补充第一个部件的辅码t,编码为"柳r。它与"铤"的编码1582"是重码。"紇"的编码只能补充第二个部件的辅码"4"。于是有",4紇[糸"乙]"。"*"是非一般补充辅码的标记。4、四部件字"输"拆分为"车仝冃IJ"四个部件。"输"就是四部件字。《中日韩统一汉字》中还有"輸"字,拆分为四个部件"車仝冃u"。它们是简体与繁体的差别。在电脑里有简体与繁体之间的相互转换,简体与繁体可以共一个编码。但它属于二次性操作。在字库里排序,只能使用一次性操作,每个字必须有一个编码作坐位。汉字编码才不限于只作键盘输入之用。四部件字一般只排列主码,成为四码编码。如有重码时,再补充一个部件的辅码消除重码。一般补充第一个部件的辅码,成为五码编码。"输"与"輸"的具体编码方法如下"输",部件"车"的代码(见图2)是"22","仝"的代码是"§3","冃"的代码是"43","U"的代码是"32"。排列主码是"2g43"。因"车"在部件主码辅码表中排在"車"的后面,取补充辅码为编码。于是有"2§432输[车仝冃]IJ"。"輸",部件"車"的代码(见图2)是"22","仝"的代码是"§3","冃"的代码是"43","ij"的代码是"32"。排列主码是"2§43"。于是有"2§43输[車仝冃]ij"。由此可知,汉字编码完全选择为4码出字并不切合实际。本方案选择从l——5码出字。5、五部件字"乌蒙磅礴走泥丸"中有一个"礴"字,拆分为五个部件"石*甫寸","石"的代码(见图2)是"U","廿"的代码是"^1",",,的代码是"Z7","甫"的代码是"24","寸"的代码是"29"。五部件字的编码只排列主码。在《中日韩统一汉字》字集中,五部件字所有的重码,都在设计"部件主码辅码表"时,在部件分布位置上作了统一处理。"礴"排列主码是"i^22"。于是有"in22礴[石廿?甫寸]"。6、部件重复字"瓔"拆分为"52貝女"三个部件。"瓔"就是部件"貝"的重复字。"瓔"的第一个部件"5"的代码是"1§",第二个部件"貝"的代码是"i『,第三个部件"女"的代码是"38"。排列主码是"119"。因为"貝"有两个,取"貝"重复一次的意思,在"4"上加一点为"4"。排列主码变为",",补充辅码,一般补充第一个部件的辅码。于是有"1|9§瓔[52貝女]"。"霎"拆分为三个部件"雨3口女","雨"的代码是"17","口"的代码是"48","女"的代码是"98"。因为"口"有三个,取"口"重复二次的意思,在"4"上加二点为"4"。排列主码是"149"。补充辅码,一般补充第一个部件的辅码。于是有"l497霎[雨3口女]"。代码字的部件重复按上面形式处理,如"i4哥[2可]"、"i[S覊[3馬]"。部件代码最多只加二点。字内有四个部件重复的,在设计"部件主码辅码表"时全部选作了表内部件,如4§能,8§叕。字本身是四个部件重复的,如《说文解字》148部部首字"g(zhdm)",在《中日韩统一汉字》中没有以为部件的字,而在《汉语大字典》中有以"S"为部件的"襃"(zh6n)字。《说文》"襃,(古代王后)丹穀(细绢)衣也。从衣,g声"。本方案处理为11§、2工2工]。但在"部件主码辅码表"的"r'族中,留有放置部件"g"的空格,为字集升级留有余地。本方案单字按部件的代码进行编码,实现了部件拼复被拆单字的拼复率为百分之百,单字编码之间的重码率为百分之零。单字按编码数值排序,自然形成与单字按汉语拼音排列相似的《中日韩统一汉字》编码数值字库。单字按起笔部件排序,自然形成与单字按部首笔画排列相似的《中日韩统一汉字》起笔部件字库。最后特节选《中日韩统一汉字字形操作码》书稿中的《编码数值字库》(简称《编码字库》)与《起笔部件字库》(简称《起笔字库》)的首尾部分于下页,用以对照图2"部件主码辅码表",检查《中日韩统一汉字》编码完成的实际情况。字库中右上角带"A"号的字是《说文解字》的部首字)。《中日韩(CJK)统一汉字》编码数值字库l横起笔字[1U]1起笔部件一二亏云豆更可鬲王5干雨爾而酉丽代码112121313121414151§161718181919g斌[5—犬止]21騸[馬雨才目]5耍[5而大]27飩[雨云屯]2§瑰[5而*木]29酐[酉一于]:30豇[豆工],32頭[豆頁]31瑨[5—业日]3§剽[而示ij]12驛[馬而日十]429醒[酉而日十]:站驅[馬匸品]4卞酾[酉一2门2、]49釅[酉雨3口]:49醒[酉匸品]:§0玨[5工]邻环[玉不]:§2玎[玉丁].§2頊[5頁];§g顼[5页]l"3——U6gLi§3珥[玉耳]靂[雨厂2未止]Li&5壢[5厂2禾止]Ll§4珂[玉可]Li^壏[5臣Ar皿]Li5§環[玉2王必]Ll巧珏[玉玉]Li5§璦[J亘心夂]U§§孫[5豕]Ll§6圩[玉干],瑪[5馬]:J站琉[5瓦].1§6§飘[而示几><]L1H靝[雨云气米].J§I平[5平].15§,影[而示乡].l弱,飄[而示風]-i§8I牙[5牙]Li59琵[王比]^§9i比[玉比]預[干頁]Li63顸[干页]1§§4驅[馬尸,口]18弱,驟[馬穴弓免]18弱9醱[酉穴弓殳]1§8§ll[馬a又]1§郎.骣[馬尸3子]1卵§馬建[馬聿L]1§9J配[酉己]189§醑[酉胥]18§§払、[5八厶]1§9§碌[J丑氺]1§%,騄[馬丑氺]189§醱[酉叕]1581§9Z酏[酉也]1899醇[酉2氺]聊巫[一《《工]。U,[一《〈工頁]1913到[一〈(〈工ij]晉[一2厶一日]1&S戬[一2厶—日戈]121§鵄[一〈《工鳥]啦逕[一《〈工iJ19175,[一〈〈(工古瓜]鹏勁[一《〈工力]1920至[一〈(〈土]鹏寧[玉2幺戍]192g亍[二J]1929酔[酉九十],璣[5《(田木]194§培[玉厶口]。1§J貫[5毋貝]19站駘[馬厶口]1249醏[酉幺月]l附JL[5U,璏[5互矢比]1953王允[安厶*儿]1§5§酸[酉厶'、夂]1§5§&駿[馬厶'、夂]195§,駄[馬厶儿]l的g*騃[馬厶矢]l毀g駒[而女勿]1邪§豫[5互汆]l躬5,驂[馬3厶人多]l躬59驂[酉3厶人乡]1逃6瑙[玉〈《l!]X],互[二U]1能8要[而女]l郷婴[丽女]0〇00零★11—A10士aU示a一Uf,2示]i2吞[2二]12亏1§云13旦12更14可ai4哥』2可]14鬲a15王ai5玨、王]15玉"16干ai6幵:[2干]1§馬1884——1,K银[2馬][3馬]2颥[雨而页]4瑶[玉ir匚]田]站騮[馬TT[]田]§孺[5雨而]§玲[5弓一]§驃[馬而示]§.駐[馬不一]§.颗[馬丌[]]7顬[雨而頁]§顥[而示頁]9醪[酉而示]9醮[酉雨而]f:曩雨兩爾两而酉两丽〕一6177100oo一00>9919>1<table>tableseeoriginaldocumentpage18</column></row><table>起笔部件不万石苜頁百而面至丌兀五豕豕歹瓦耳牙无厂辰厭代码uJ2i2J313i4i5i6i7J8i9i9i——J§,J100——訓★M瓦a珏[石玉]iHi硒[石一曲]i§死a砾[石豕]U4i砸[石匚巾]i不aJZ夔J1J6犴[石干]JJ4i碾[石辰冃]il万n平JU6硏[石2干]Jl全2磾[石而日十]ii石a18牙a碼[石馬]Jl非厄[兀王]ii節[2石]i§无aiUS石瓦[石瓦]ii躬展[兀豕]U磊[3石]i§规[2无]JU砰[石平]u站甅[瓦厂里]J2苜aJ9厂"iii8砑[石牙]菌菲[丌[]]12頁ai9辰aUJ9砒[石比]碾[石厂2禾止]页;9厭i^i研[石一升]J』i石監[石臣&皿]J3百L00丕[不一]UH硬[石而大]U5封尶[兀臣&皿]:3節a[2百]L(U歪[不正]ii^礪[石厂萬]i巧6新[豕2干]13而"i]uo紅[石工]Jlg2赋[石一弋止]U§9厦[厂苜夂]13面"i]Lli礤[石而示]JW3研』[石一升U]UH確[石雨隹]i4至ai]UJ孺[石雨而]確確[石雨才目]U§3瓸[瓦百]:4暨[2至]UJ砺[石厂万]im羿[2頁丌]US35^I豕厂白小]M丌"U2石丁[石丁]iW5碌[石王*升]i166礮[石馬X乂]a兀i〗碩[石頁]i1^研[豕一升]J17i礮[石馬交]i§豕ai〗"3硕[石页]il巧i攀[石一升手]J180邳[不一卩]称[2豕]J〗硬[石更]1129厨[厂豆寸]ua瓶[石厂巳]i§豕J]U4H[石可]Ui0碩[石工*貝]U§4鬵[2无鬲]i6歹i〗u《孤[石兀]碼[石雨田]U8i環[石臣又貝]161iH4——i,iH4礒[石羊乂口]i811磴[石穴豆]J84J踊[石7闬]鹏厄[厂巳]i,磺[石关、艮]郝硖[石夬]J846啓[石又*口]卵础[石出]J7M琅[石、艮]好[石子]J84Z郅[至卩]卿姆[石母]JZ8i礎[石户乙]鹏頋[厂巳頁*]i§4Z擗[石尸口辛]J9i7泵[石水]n§i石兼[石e兼]i鹏顾[厂巳页*]J8481殛[歹了口又一]讽7'脉[石水]i7§4瑭[石广申口]码[石马]i8Sj砀[石,2y]J92J砕[石九十]i78§礅[石古孑夂]旭4艰[石艮]i蹈g耙[豕巴]激磯[石2幺戍]iZ^豕庶[豕户乙]i§;4肆[石聿]J^4豭[豕艮]鹏碜[石厶大多]i8迓[牙Ui8J5g[石乙]i阳J確[石羽白]耍[而女]i,確[石衣八厶]i§i5砩[石弗]J§63埭[歹隶]殆[歹厶口]i79i石広[石广厶]破[石皮]J§64肆[歹聿]碜[石3厶人多]i^磁[石乂2幺]卿厩[厂艮无]J8§5璆[石羽人乡]i逃6碯[石《〈白X]JZ94厗[厂辛]勉磉[石3又木]i滩Z耶[瓦卩]J97i脉[石水、]iZ9§龎[厂龍]卿碾[石尸丑Dc]i87i径[石7、工]i卿孬[不女子]i躬礤[石乂2幺心]劻[面力]i88Z邪[牙卩]卿壓[厭女]i§10劢[万力]鹏碾[石尸+冃]i卵o历[厂力]i§io劢[石力]逾7弼[百2弓]i§9J碌[石丑氺]19<table>tableseeoriginaldocumentpage20</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table>9124——997J舸[爿可]卿戕[爿戈]呢g獎[爿夕寸大]滩n椠[屮自辛米]崎祟[出示]925^奘[爿士火]9§222槳[爿夕寸木]滩Z8擘[屮自辛子]91!3晋[屮一日]92§2鉴[爿士金]的^2獎[爿夕寸犬],胖[爿羊]蚩[屮一虫]92^牆[爿土2人刚9蹈蟹[爿夕寸虫]9^始瀚[水?廿巾2入]砉[水石]92Z2裝[爿士衣],收[q夂]944粜[出米]姜[屮一女]9277垒[水土]9鄉漿[爿夕寸水]9771氷[水、]頮[水升*页]92§2奘[爿士女]的4軟[出欠]97§4牖[爿广申闬]鄉7頮[水升頁]9176畓[水田]9§23艙[爿倉]9滩糴[出米羽隹]牀[爿木]9477沓[水曰]9§27浙[爿斤]9826収[4又]奘[爿士大]9478沓[水口]滩43奮[屮隹冏]9830术"屮八]92^群[爿士升]9!7§盗[水皿]9§70炎[水人]9873杼[水予]鹏)l渠[爿世木]9§21醬[爿夕寸酉]9gZ2檗[屮自辛木]9郷妝[爿女]鄉狀[爿犬]9§22壁[爿夕寸土]邻Z3鋅[屮自辛]997J凼[水LI]9226壯[爿士]9蹈將[爿夕寸]邻Z4蟹[屮自辛虫]241<table>tableseeoriginaldocumentpage21</column></row><table>9——的,9112——9i8i〈〈"[2〈]簡纭:纟云]2130姬[女一*业]997〈《,釘:乡丁],縉[糸一业日]9能a,她:乡辰寸]213紹缙[纟一业日]§1,卵女",缛:纟辰寸]9J35熱[((〈歹ij'、、、]乡的效[2女],澳:糸而大]w紹乡西[,乡一曲]^鄕98姦[3女],绠:糸更]^紹,纜[糸臨見]W糸a逃奴绠:纟更]9M2,缠[糸厂里]的絲厶[2糸]弱嫿,紹[乡百]9148嫗[女匸品]92糸毀乂簡緬:糸面]9J48始[女不口]纟9112縹[糸而示],缅:纟面]Wi9姻[女一田U]§3厶"9Ug縷[糸雨云*],喊:女一弋止]'緻[糸至夂]的AA[2厶]91J2'襦[糸雨而],孀:女雨冲目]'鑑[乡臣&皿]9U5嫣[女正弓'、、、]2124絰:纟至]2i^女辱[女匸矢心]93AA9117娉[女雨*亏],绖:纟至]9J5§'缦[乡亘心夂]9118嫖[女而示],綑:糸兩]9i58^i[女匿心]94幺",缥[乡而*示],妩:女一尤]9Jg3,嫄[糸厂白小]丝"2幺]91J8孀[女雨而],妍:女一升]9W38嫄[女厂白小]§4絝,纡[纟一*士],娌:女厂2土],妪[女匸承X]94^,紅[紅]9i28娓!女辰寸]^明女皆[女比白]95母,红[纟工],姨:女而大]2172'纊[糸丽鹿]的毋a乡不[糸不],緬:糸酉]9178嬙[女丽鹿]96毋ag122纟垔[纟而土]"9掭:女一大小、],釭[女工]9§^A,紆[糸一t],紕|:线]2i80钚[女不]§7〈A9122'纭[糸云],纰|:纟比]2181免E[女正]242<formula>formulaseeoriginaldocumentpage22</formula>《中日韩(CJK)统一汉字》起笔部件字库1横起笔字[Hi]1起笔部件—亏云豆更可鬲王5干馬雨爾而酉丽代码11212121314151§16171819始页242424192501484廼[一曲*1_]1490醇一巾U]1全96画[一田*|_|]1502灭[一火]I150415全0靣[一Z回]l两1§03戸[—尸]■巫[一《〈工]聰頸[一〈〈〈工頁]到[一〈(〈工ij]1^11晉[一2厶一曰]lh紹戬[—2厶一日划,鵄[一〈《〈工鳥]聰逕[—〈〈〈工1_]13115,[一〈〈〈工训鹏勁[—〈〈〈工力]Ilg20至[一〈(〈土]2二a—i2=[2二]1gi2戴[二弋貝]247丽1699酖[酉力L]1巧9醉[酉穴乍]1799醵[酉麻糸]鹏酸[酉厶'、夂]1U9酸[酉^工]17$2醉[酉丄2人十]181^醱[馬穴一光]l躬59醪[酉3厶人多]1^9酧[酉^寸]l卿酡[酉^*匕]18§5醪[酉羽人多]丽1739醵[酉麻非]17"醵[酉麻米]18弱9醱[酉穴弓殳]1§丽1Z钌9釀[酉衣2口胜]1H9醚[酉米;L]配[酉己]175§膨[丽鹿多]1719醯[酉古日]17§4醣[酉广申口]18的醑[酉胥]17§§鸛[丽鹿鳥]1^9醮[酉囟内]1789醇[酉古子]189§醱[酉叕]邐[丽鹿:L]鹏醸[酉衣八S]17§9酿[酉、艮]1§9Z酏[酉也]1789酈[丽鹿卩]152醃[酉音心*]1Z的醅[酉咅]1§99酴[酉丑氺]17卵麗[丽鹿]醯[酉古见皿],酙[酉斗]1929酔[酉九十]l毀8婴[丽女]159酼[酉古JIL]聰迺[酉;L]lg49醑[酉幺冃]2500o箭[-一大日月]13!8鄧[一-业日卩]戴[--戈*貝]1350恶[一-业心]1jl卿焉[匿-大鳥],丐[一十4]3三"3—],形[-一升多]l柳丙厶[-一内]lg02天[一J大]l卿鴉[-一升鳥]西a[-一曲]l卿开[一刑l卵2荧[--升火*]畺[3—2田]l卿无[—-尤].l卿碓[--升隹]l邻6帀a[-一巾]戰于厶[-一于],迂[画一于;L]弼[一.内一2弓]1208勿[—-亏]l柳迗[-一大;L]l鄉畐a[-一口田]1§20弍[--弋二]1280邗[-一t卩]14全3副[一.口田ij]卿武[—-弋止]l卿邢[画—升|5]14弱鵾[一-口田鳥]1^30刑[一-升ij]12§0丟[画-土厶]i4455聽[2画—2口2田'"g32型[—-升'J土]lg90忝[-—大'J、、]l顿逼[—-口田iL]鹏離[—-弋止虎]lg92泰[画-大*氺]l柳鳾[—.巾鳥]鹏鵡[—-戈止鳥]1,再[画一冉]l柳丽[一.2门2、]lg柳鹉[—-弋止鸟]1306亚[-一业]柳迺[一做]12!0盂[—-t皿]1320垩[--业土]l挑彫[一2门2、多]lg40吞[-知]13全0晋[-一业日]鹂[—-2门2、鸟],吞[—-大日]鹏戬[-一业日戈]柳通[一-巾承;L]lg邻蚕[--大虫]1318鄧[-一业日卩]14打逦[一.2门2、iJW邻螢[2一2大虫]13!0晋[-一业日]148丽卩[一.2门2、|5]i糾蠶[2--2大曰2虫]13全3戬[-一业日戈]l邻0丙W—-内卩]1<table>tableseeoriginaldocumentpage24</column></row><table><table>tableseeoriginaldocumentpage25</column></row><table>代码ii3i7始页253254255不万石A不u石AUJ9石比[石比],環[石臣又貝]i不A附2石]UW研[石一升]邀經[石一〈《〈工]jioo丕[不一]磊[3石]U3i硬[石而大]砵[石本]歪[不正]j〗uo豇[石工]UW礪[石厂萬]WU琳[石2木]J180邳[不一卩]i]礤[石ffi示]Jig5武[石一弋止]J2U磽[石3土兀]ii的蔞[不而女]i]Ui孺[石雨而]i^3研J[石一升iJ]wu硃[石末],突[不大]i〗Ui砺[石厂万]国孀[石雨冲目]JglJ骑[石大可]i408否[不口]j〗耵[石丁]Jlg5碌[石王*升]J3U硗[石戈兀]i柳盃[不皿]i〗碩[石買]J1弱J挈[石一升手]J2J2碑[石車]覔[不見]i〗硕[石页]U全O磧[石工*貝]J2j2砗[石车],磚[不鳥]i]硬[石更]磘[石雨田]UJ2硖[石夫]J§20焉[不;i牛]i]U4石可[石可]i1^硒[石一曲]BJ2磕[石蓋]訓还[不1_]i〗孤[石兀]JUi砸[石匚巾]^J4珙[石共],孬[不女子]i]珏[石玉]iJ4J礪[石辰目]JW4磺[石黄]万i〗碌[石豕]Jl全2磾[石而日十]J2J5微[石牛万夂]万i]矸[石干]鹏櫪[石厂2禾止]g』l磺[石廿臣Ar皿]虿[万虫]i-]LJ6硏[石2干]U§1礮[石臣&皿]J2JS赫[石赤]J419是[万足]i]碼[石馬]ii§i耀[石雨隹]J2i§疲[石菱]im迈[万ui〗砥[石瓦]J166礮[石馬X乂]J^7硅[石2土]劢[万力]i〗砰[石平]J17J礮[石馬交]wn碏[石昔]石i〗U8砑[石牙]ua砚[石厂巳]PJ§磧[石青]253辰厭,厕[厂贝*u]鹏願[厂白小頁]i巧5愿[厂尹欠心]唇[辰口]i顿4曆[厂日夂卜口]"35愿[厂白小心]鹏黡[厂^欠鳥]鹏歐[辰夂]J469J5E[厂口匕]i§39原[厂白小]卿厥[厂尹欠]厭J4§9厮[厂口斤]卿愚[3厂3白3小]厗[厂辛]厭訓厚[厂日子]鹏贗[厂4鳥貝]n的龎[厂龍]U躬靨[厭面]1191厘[厂里]卿臈[厂4鳥]固頋[厂巳頁*]卿潔[厭木]磨[厂2未石〗鹏贋[厂4隹貝]鹏顾[厂11页*]卿壓[厭土]J5^9厘[厂千卄土]J超I9赝[厂4隹贝]厩[厂艮无]i42§厣[厭n牛]卿歷[厂2未止]i超9雁[厂l隹]历[厂力]J傲黡[厭黑]跑9曆[厂2未日]i§90仄[厂人]厄[厂巳]懕[厭心]J579甩[厂y七]鹏厫[厂僉]辰卿摩[厭手]i391麻[厂2未]卿原[厂白水]辰A饜[厭食]i5M届[厂缶]i巡薬[厂^欠木]鄢[辰寸P]l鹏魘[厭鬼]i§%作[厂乍]卿劂[厂尹欠ij]鹏辱[辰寸]卿饜[厭女]i§99薦[厂鳥],魔[厂尹欠足]J4g3脣[辰冃]i^79底[厂〔弋、]i鹏藍[厂^欠虫]J紹5蜃[辰虫]<table>tableseeoriginaldocumentpage26</column></row><table>力夬韋隶串聿申弗皮也<table>tableseeoriginaldocumentpage26</column></row><table>4爿屮屮出水鄉8戕[爿戈]§3鄉[3屮]929252奘[爿士火]91全3皆[屮—日]滩JA9g卯92紹裝[爿士金]9143蚩[屮一虫]97水"94IT92^牆[爿土2人回]9193娄[屮一女]。7林厶[2水]96以裝[爿士衣]9830术a[屮八]§7淼[3水]99収a92^奘[爿士女]屮9Z氺卿Z收[H夂]9§21醬[爿夕寸酉]92屮9J7J砉[水石]9826収[4又]呢2壁[爿夕寸土]WA[2屮]9gJ3頮[水升*页]a爿9蹈將[爿夕寸]的鄉a[2艸]92J7頮[水升頁]919蹈獎[爿夕寸大]9柳奮[屮隹冏]9277坐[水土]9i匕的222槳[爿夕寸木]檗[屮自辛木]9全76畓[水田]9J9gg2獎[爿夕寸犬]醉[屮自辛]9477沓[水曰]92月蟹[爿夕寸虫]邻Z4璧[屮自辛虫]9478沓[水口]漿[爿夕寸水]滩ZI築[屮自辛米]9i7g盗[水皿]舸[爿可]9蹈艙[爿食]滩Z8擘[屮自辛子]9§70炎[水人]9221牀[爿木]9§27浙[爿斤]a出9^始凝[水?廿巾2入]奘[爿士大]胖[爿羊]94出a9771氷[水、]92^非[爿士升]97§4牖[爿广申用]914i祟[出示]9873杼[水予]9巡牒[爿世木],妝[爿女]軟[出欠]997J凼[水u]鄉狀[爿犬],944粜[出米]92^6壯[爿士]93屮a糴[出米羽隹]3359<table>tableseeoriginaldocumentpage27</column></row><table>能丄乡郷糸a能躬i5飨[乡食]91lg緩[糸雨云勺9129紕[乡比]9能a9668鄕[乡白匕卩]9U2,襦[糸雨而]gl3全,縉[糸一业日]柳5蟹[能虫],邻^乡P],紅[紅]2H2乡西[糸一曲]那0J熊a[能"、、]卿l郷[乡艮卩],乡不[糸不]§1紹,纜[乡臨見]§502樊[能火]鄉§122'綞[乡而土]§U2'缠[糸厂里]9503態[能心]^鄕,紆[糸一于]2"2緻[糸至^]乙糾5蠻[郷虫]9123,坛[糸云]9i5i,鑑[糸臣&皿]354i嚮[郷7冋]9"2釘[糸丁]2J5§,缦[糸S心夂]柳2矢[丄大]躬J5饗[鄕食]9i22'縟L乡辰寸]9i§3a源[糸厂白小]毀io久[Z人],響[鄉音]鍥[糸而大]§172'纒[乡丽鹿]的ll丝[2zl2Z—]糸9122,绠[糸更]§182娵[糸耳又]鸶[2丄2Z—鸟]92糸"9i23紹[糸百],經[糸一〈〈〈工]乡的絲厶[2糸]纟面[糸面]毀U'缉[乡廿*耳]乡32乡,絰[乡至],繞[糸3土兀]^83郷[乡耳*|5]94絝,綑[乡兩]毀12'綺[糸大可],蜜[乡虫]§112'縹[糸而示],緬[糸酉]毀1§'紺[糸廿*—]3363§18娃[女入王]2紹38孅[女2人戈韭],婚[女C弋日]%28嫂[女闩十又]毀28嫁[女^木]■嬝[女自田丌]毀M飨[女仝口升]2g428褓[女寸口木]毀43綸[女^*冊]報438鍮[女仝冃ij]毀148婚[女仝函曰]%站嫫[女^日六]%|8媲[女口刀田]逃站綿[女白巾]躬48始[女^口]3§|8蟠[女釆田]的488媳[女仝口羽]鹏媳[女仝冃2〈]卿l燋[女隹*"、、]9§52《i[女《7士]毀528姙[女寸7士]%5全娘[女丘""八]%55女|[女自*心]%58猊[女臼儿]毀58姚[女人J门的§8耀[女《缶]%5§姨[女fif八]卿l媲[女白X比]躬63嫒[女-^友]鹏3瀏[女R]金iJ]鹏8娼[女《臼]%7§8繳[女白方夂]逃8i維[女隹]毀81钤[女个7*]9§83殮[女僉]卿4焓[女个7口]968§姊[女朱]站8§姗[女2升]%郎婢[女卑]逃8§媿[女鬼]柳7妍[女斤]%88嬋[女軍]站88嫂[女2隹又]9§88铃[女^S7]躬蹄义孝[女^*子]9§的嬡[女愛]9698躭[女少L]%98姒[女4以]躬98嫒[女-女]M128綻[女a—疋]^18綜[女^示],搓[女,工]9ZJ8嫁[女a豕]^19蝤[女、^酉*]9Z^婊[女立""木],8嬉[女a二日]織[女音*戈]媳[女广廿'、、、]^28姅[女v牛]9^8鎂[女笑大]9^8女并[女^升]W站s捲[女v夫a]娴[女门*木]9738嬤[女麻非],娘[女a目]3il婵[女、^早]^42嫡[女tr门古]3Z^8孃[女衣2口S]9Z458娩[女、/口儿]W全8嬗[女亩旦]編[女户冊],婶[女一申]嬢[女衣八兹]^§28鳞[女米夕牛]^57姹[女^/七]97§8炕[女工几]9Z58^t[女音心]3"8姥[女a谷]g§8嬢[女兰我]97§88镟[女方—疋]W站8婉[女^夕巳]375§嬷[女麻7厶]W的嫉[女广*矢]976i女亭[女古^丁]9巧i嬸[女^釆田]9Z6邦婦[女tr^巾]9巧58嫔[女—丘八]9H48繕[女羊乂口]97§蠊[女广"兼]W8i炷[女主]27§1娘[女、*艮]^81妒[女户]M8i媚[女前]9783女言[女言]933焙[女咅]^84夂京[女京],媳[女广申闬]9785妨[女方]9Z的嫜[女章]9M58娣[女、/弔7]^86姣[女交]W蹄嫁[女亥]奴[女文],妫[女、力、]97明婶[女、艮|5]W卵婊[女广隶]M昭嬪[女賓]^§8嫌[女"兼]9789嫲[女麻]媳[女為]^89獰[女寧]M928燥[女?九木]W24妓[女丄幺*]9^5^i[女乂2幺心]9798嬤[女麻幺]§巧8妓[女a女]郭15i嫿[女申一"、、皿]9818婀[女(5可]超i8娓[女尸至]9819嫒[女穴*豆],嬾[女卩左冃]9828猱[女矛木]站28媚[女尸古]鹏8娜[女刁夫卩],媚[女尸氺蜀]鹏8媚[女尸目]蹈48婦[女M巾]毀49妬[女刀*口]9858怒[女子心]超§8娓[女尸毛]9的58繆[女羽人乡]9蹈8耀[女羽隹]蹈68妮[女尸匕]逃73媳[女弓i幺]啦8嫋[女2弓2H^80娘[女民]蹈8J妃[女己]毀81炔[女夬]9882好[女子]把[女巴]與82嫜[女韋]9883女予[女予]互奴988佳妈[女马]毀84妇[女3]卿§婿[女胥]卿§綴[女叕]卿6妞[女丑],郊[女P]卿Z她[女也]卿8^^[女八厶]卿8録[女丑氺],媸[女屮一虫]9943娟[女厶*冃]的48始[女厶口]§卿娱[女厶矢],孅[女乡白巾]的85姆[女母]卿6姒[女以]互站互A鹏彘[乜矢比]邪3§,彙[互^田木]鹏3劁[互豕2虫iJ]卿§蠡[互豕皿]^6"蠡[互豕2虫]卿§01鑑彖[互汆]S讽彝[且米分升]9鹏葬[互米糸升]剝[互氺lj]彔[互氺]奴弱奴毀乂砮[奴石]駑[奴馬]3鄉胬[奴肉]9柳帑[奴巾]柳2怒[奴心]卿3拏[奴手]^卿駑[奴鳥]卿o努[奴力]卿2孥[奴子]i鄉驽[奴马]卿7弩[奴弓]权利要求1、一种汉字编码电脑键盘输入技术,是专利号为ZL94111115.6《汉字自然部件编码》键盘输入技术进一步与汉字排序、汉字检出、汉字教学、汉字信息化相统一的一个具体实施方案。它以国际标准《中日韩统一汉字》20902字符为编码对象,用638个部件作为拆分与拼复单字的内部单位,用37个附标数字中的27个作为部件的主码与辅码,通过一个具有直角坐标性质的二维表格,使部件与主码、辅码对应,形成汉字部件的复代码。单字按部件复代码排列主码补充辅码的规则进行编码,形成汉字按部件代码的线性操作系统。其特征是,部件按起笔、起笔续笔特征、起笔部件形成部件族,分配给九个数字所产生的27个主码,使汉字与汉字部件具有“横起一二竖三四,撇始五六点在七,折画八九数相替,续笔还论接交离”的起笔对应规律。代码系统的码元,是四维坐标系四根数轴用附标进行了区别的分格数字。复代码的主码代表“部件族”对单字进行编码,复代码的辅码代表“部件序”消除单字编码的重码,形成在部件层次有多个选择的消除重码机制,从而保证了单字编码之间不会产生重码。部件与代码之间的转换具有唯一性和可逆性,部件代码是单字编码直接的唯一根据。编码成为汉字信息化传送符号链上第二个环节的直接与二进制数符号相连的代码符号。2、根据权利要求1所述的汉字编码电脑键盘输入技术,其特征是,部件选自被矮化了的成字,左右偏旁,字头字底,字省构件和辅助笔画。它们成为部件的五种身份。部件经过理据、拼复和编码三道检验的认证。3、根据权利要求1所述的汉字编码电脑键盘输入技术,其特征是,代码的码元,符合汉语的四声规律,具有汉字的合体功能。4、根据权利要求l所述的汉字编码电脑键盘输入技术,其特征是,单字按起笔部件排序,自然形成与单字按部首笔画排列相似的《中日韩统一汉字》起笔部件字库。5、根据权利要求l所述的汉字编码电脑键盘输入技术,其特征是,单字按编码数值排序,自然形成与单字按汉语拼音排列相似的《中日韩统一汉字》编码数值字库。全文摘要《中日韩统一汉字》字形操作码是一种汉字编码电脑键盘输入技术。它是发明专利《汉字自然部件编码》键盘输入技术进一步与汉字排序、汉字检出、汉字教学、汉字信息化相统一的一个具体实施方案。它选择638个部件,27个附标数字,部件按起笔、起笔续笔特征、起笔部件分族,附标数字分主码、辅码,放在一个具有直角坐标性质的二维表格中,使部件与主码、辅码对应,形成部件的复代码。单字按部件复代码排列主码补充辅码的规则进行编码,形成《中日韩统一汉字》20902字符部件拼复率为100%,编码重码率为0%的汉字线性操作系统。实现了国际标准中文汉字的信息化。文档编号G06F3/023GK101339466SQ20081021241公开日2009年1月7日申请日期2008年8月18日优先权日2008年8月18日发明者曹述交申请人:曹述交
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1