专利名称:《部首—三分—两类—音形通用码》汉字输入系统的制作方法
本系统简称《部首码》,涉及的是对汉字结构新的认识基础上所创造的一个易学、难忘、规范、快速的部件全息码方案。只要粗知汉语拼音和普通话,稍加学习都可以掌握。该输入系统思路独特、音形规范、规则严密、拆分唯一。用同一方法及其基础代码可以通用于字典检索、电报传输、索引编制等有关领域。此外,还特别适用于识字教育阶段帮助小学生和外国人在规范化基础上加快汉语文字的学习。
1.本编码系统是由一个“部首查字法改革方案”支撑的。该方案将汉字分为有旁字和“无旁字”两类。按照这个改革方案,原统一部首查字法里的部首+单笔部首+难检字的传统公式已改为有旁字+无旁字的公式。包括《康熙字典》在内的大、中、小型字典,有旁字规定上、下、左、右、主件为一级查字部位,左上角为二级查字部位。其中主件查字部位的创制和一条交叉结构一律不拆分的规定,为提高汉字查字、编码的准确性和规范性,为在理论上把芜杂的交叉结构字都归入“无旁字”提供了一个依据,从而在方便定部和拆分等方面起了不可缺少的重要作用。本来无旁或没有规定的旁以及字旁所在位置不合规定的,统归“无旁字”类,归类后按起笔并结合笔划数实行扫描查字。每字都只有一个固定的查法。
2.在这个新的“部首查字法改革方案”基础上创立的《部首码》,按编码特点制定相应的方案和规则,分汉字为多结构字和一结构字两类。多结构字(相当于字典的有旁字)首先确定部首,并根据“一分为三”的原则,结合有关规定按3、4、5、6、7、2结构的顺序拆分,取1、2末三个部件组码。如“赣”按自然结构划分,可以拆分为3-9个结构;按《部首码》规定为四个结构字,“立”为左上角部首,取“立、早、贡”三个部件组码。成字部首部件按本音定音,非成字部首部件按《部首部件定音表》的规定定音。二结构字增加一个第二结构起、末笔坐标码。一结构字(相当于字典的“无旁字”)取1、2笔和3、4笔两个坐标码加末笔笔形称谓码进行编码。从标码按附图
(坐标码标准键位图)规定方法取码。所有汉字第一码均为整字音码。全部国标一、二级汉字和电报码上所有汉字的拆分都具有唯一性。
3.字、词编码方案(1).字码三(及以上)结构字整音+1部件音+2部件音+末部件音二结构字整音+1部件音+2部件音+2部件起、末笔坐标码一结构字整音+1、2笔坐标码+3、4笔坐标码+末笔笔形称谓码(不足四个笔划的一结构字只有一个坐标码,在末笔笔形称谓码之后追加一个双拼韵母码;其中“一、乙”两个单笔字,其坐标码是该单笔的重复,即首、末笔。)(2).词码设计二字词首字整音+2字整音+首字1部件音+2字1部件音三字词首字整音+2字整音+3字整音+首字1部件音四字(及以上)词首字整音+2字整音+3字整音+末字整音(如是一结构字,取1、2笔坐标码代替1部件音码。)(3).字、词码简码设计①.字简码一级简码整音+空格键。选取最常用的高频字26个。
二级简码整音+1部件音+空格键。
(三码字的新用途本编码采用经国家批准的含40000词的标准词库,在实际操作中,不能组词的单个字输入量很少,原设计取4个码的字码改为取前3个码加空格键,遇重码响铃后追加第4码。)
②.词简码二字词简码首字音+2字音+/一键+/作为最常用的词、词组、短语或句子等的简码,由用户自己定义。
(4).字码、词码、简码在键盘输入时的区分①.字简码均以空格键作为结束键。
②.词简码均以“/”键作为结束键。
③.词码均为四等长码,不加结束键。
④.字码为三码加空格键。遇重码响铃后追加第四码。
(5).字、词识别码设计字、词码遇重码时(均以四码为准),响铃后追加一个识别码,取码统一规定如下字码取首结构起笔和末结构末笔坐标码。
词码取首字首结构起笔和末字末结构末笔坐标码。
(这种均衡提取信息的取码方式,将使在组词上由于“一头沉”而出现重码的现象得以改善。)(6).字音查找公式设计不知字音的字,先键入“V”代替该字音码,然后按原规则依次输入该字的其余各码,屏幕底部的选字区中就出现该汉字及其读音,以供选用。如无重码,该汉字将自动进入正文。
4.关于坐标码附图是在标准键盘上按规范化标准设计的一个坐标码标准键位图,其含意如下(1).将键盘分为左、右两部份,左边三排,右边两排,每排五键,共25键(N键不用),每键对应于一对坐标。
(2).坐标的第一个数字代表排,第二个数字代表列。
(3).汉字的笔划共分为五种横、竖、撇、捺、折(挑属横,点属捺, 属竖, 属折),分别对应于坐标的1、2、3、4、5。
如二结构字“码”的第二部件为“马”,起、末笔为“ 、一”,对应于坐标51,坐标码是H;一结构字“电”的一、二笔为“丨、 ”,三、四笔为“一、一”,对应的坐标是25、11,坐标码是G、Q。
5.几项具体规定(1).关于部首的规定①.多结构字严格依形定部,部首的规定位置为上、下、左、右主件、左上角。一个字同时有两个部首时,按“先上后下,先左后右”的顺序定部。如“思”取上面的“田”为部首。上、下、左、右、主件5个一级部位都无部首时,以左上角作为二级取部位置。少数字的规定的取部位置上没有部首,拆分后以第一部件代作部首,如“皂、畅、奏、整”分别以“白、申、 、束”代作部首,“够、弑”分别以“ ”代作部首。
主件的定义为凡是占据整个方块结构、上下左右都顶头的部件称为主件。如“问、国、乘、巫、栽、武、头”中的“门、口、禾、工、戈、弋、大”都是主件。
②.两个部首叠合时,取多笔划的复合部首。如“空、摩、喜”部首分别为“穴、麻、土”。
③.拆字时首先确定部首。凡部首一律不拆分。部首不在规定的位置上时,按部件处理。个别情况部首在规定的大体位置但并不规范的,不算部首,如“旭、岛、翅、弑”中的“日、山、羽、弋”就不算部首。而“左、右、有、友”的部首按规定应在上部,均为“ ”。
(2).关于部件的规定①.部件分为成字部件、非成字部件和无音部件三种。成字部件按本音定音;非成字部件主要从形、音两个方面向成字部件挂靠来定音。如“奉”字,上部“夹”定为“春”字音,代码为“C”,下部“ ”定为“丰”字音,代码为“F”,“段”的左部、“姊”的右部分别定音为“D、Z”,“认半边”。不好挂靠的“四不象”部件定为“V”音。非成字部件字音后一律不再拆分,视为特定部件,如“僵、养、黑”都是二结构字,其中的“ 、美、黑”都不能再拆分。另有几个结构有意不给定音,为无音部件,以避免部件拆分过于零散。如“言、月、业、严、勿”等字中等长的两横、两竖、两撇都是无音部件,“百、面、页”的上部也是无音部件,这些字都不能拆分。同理,“迹、赫、弯、蛮”等都是二结构字,不能再拆分。“予、矛”上部是个定音部件,但下部无音,整字是一结构字。
②.部件拆分有二义性时,先取小部件,后取大部件,即先小后大(部首有时在后面,部件先小后大的序性不变)。
③.部件必须由两个或两个以上的单笔组成。两个或两个以上的部件才构成多结构字。如“乱、羌”二字,“舌、 ”本是部首,但在此处已失去部首的意义,因不构成二结构字的条件。正确的拆法是将“舌、 ”拆为两个部件(“千、口”、“ ”),再加上一个单笔部件( )而构成三结构字。
(3).关于单笔作为部件处理的规定①.单笔不能以自然形态参加组码。凡单笔必须先跟前或后的一个部件试着相结合,成为一个新部件。如“孔、轧、乏、旦、亘、司、今”等都是一结构字。“忍、共、忘”上部的部首都是一个单笔相结合,成为一个新的非部首结构。
②.左右两个对称的单笔也须结合成一个部件。如“半、平、夹、柬”都是二结构字“ (土、 、回)、肃(肀、八、 )”是三结构字。
③.不能结合的单笔才算是一个独立的组码部件,有以下几种情况
a.“同、合、画、函、买、弟、压”等,都是三结构字,其中的单笔(一、 、丿、丶)都是独立的组码部件。
b.“筒( )、瑰( )”为四结构字,第三结构为单笔部件。
c.“涵、卖、冤”按规定应拆分为四个结构(“氵、 、水、 ”、“十、 、大”、“ 、丶”),其中的单笔不能跟前或后的一个部件相结合。别的拆分方法都不符合“三分”的序性原则。“读、赎”是三结构字,分别拆为分“贝、十、买”、“讠、十、买”。
(4).关于零散部件的合并规定①.“木”在字里的不同位置上常有两种写法下面两笔或为“人”或为“八”,笔形、代码都不规范,有时也分不清。规定“木”及下列类型结构一律不拆分木、束、东、乐、果、来、禾、末、未(一结构字);刺、刺、来、余、米(二结构字);茶(三结构字)。
②.“水、火”都是一结构字。“水”字的类型结构一律不拆分 (定音部件);隶、求、承、丞、永(一结构字)。“火”字左右两个单笔不对称,笔顺写法也不同,不能合并成一个部件。
③.有意设定几个结构不给定音,使其成为无音部件,也是合并部份零散部件的办法。
(5).笔形、笔顺、修饰笔形、根顺的统一规定①.笔形分为横、竖、撇、捺、折五种,其称谓码分别为H、S、P、N、Z,其中、属捺, 属横, 属竖, 属折。
②.笔顺编码的笔顺跟书写的笔顺基本一致。不同的是,编码严格按所拆分部件的顺序定笔划的顺序。凡部件先写了第一笔,就须写完这个部件再写下个部件。如二结构字“成、围”应拆为“戈、 ”、“口、韦”,其末结构末笔分别为“ 、丨”;三结构字“何、荷”应拆为“亻、丁、口”、“艹、亻、可”,末结构末笔分别为“一、 ”。另外“戈、戋、我”等字,末笔为“丿”而不是“丶”,先上后下。
③.根顺即构成汉字的部件(结构)的顺序,遵照汉字先上后下、先左后右的约定俗成的顺序。个别划分整齐的上、下两三个层次的字,先取上部的中间结构。如“樊”,第一部件为“爻”。
④.修饰笔形按《新华字典》归纳为a.月肉旁在左、右部位时起笔为撇(丿),如“肌、期”;在下方时起笔为竖(丨),如“肩、 ”。
b.“用”字在相关字中起笔为撇,跟用字一样,如“拥、痈”;而在“甬”字的相关字中起笔为竖,跟甬字一样,如“通、痛”。
c.在下面一些字及相关字中,左方或左下方的一竖笔均为撇川、州、开、井、升、弄、册、丹、舟、周、齐、肃、赤、赫、亦、迹、戎、戒、邦、绑、卅、……(变、峦、蛮、恋、鸾、銮……,竖笔居中时仍为竖笔,不在此规定之内。)。
6.《部首码》的总体设计思想和目标以全部部件为字母,变方块汉字为线性化类文字,作为汉字存在的另一种形式,成为人人可以方便学习、使用的现代化信息工具。总体设计构思如下(1).建框架汉字音形码的中心任务是部件的合理拆分。《部首码》多结构字拆分的最高准则是一分为三(或者说“三分天下”),并按三结构-四结构-五结构-六结构-七结构-二结构的序性原则拆分后取1、2末三个部件组码。因此,部件的划分数目不是纯自然形态上的意义,而是按有关规定和“三分”的序性原则可以拆分的具有代码性质的部件数目。部件拆分的规则只有一条凡属交叉结构一律不拆分(包括单笔不能分割)。这条规则同时也是人们所习惯的界定部件的主要依据。不能拆分为多结构字的叫做一结构字。这批字在传统的部首查字法中,大多是按单笔或免强按某一部首检索后又归入“难检字表”的一些字,也是各类音形码、形码中难以合理地、唯一地拆分并进行编码的字。《部首码》把一个汉字的定性、定量工作做好,加上把五个单笔也纳入部件(字母)的思路轨道上去处理,才可望为汉字拆分的唯一性难题的解决奠定一个坚实的基础。所谓定性,就是首先分清是多结构字或是一结构字;定量是指按有关规定多结构字应当拆分的结构数,再取1、2、末三个部件组码(二结构字追加一个坐标码),前面都冠以一个整字音码。
(2).立主脑以部件化和“三分”的序性原则为核心的基本框架的建立,加上一结构字问题的解决,为汉字拆分的唯一性创造了必要条件。但仅此尚不足以解决结构复杂、合分自如的汉字在拆分中的二义性难题。部件的拆分必须进入到以部首为主脑去调控、限定其它部件的拆分,同时又严格限定部首自身的高层次上,才可望把平面的、松散的、纯部件之间的关系转化为立体的、有主次和内在制约关系的部首-部件关系,拆分的唯一性才可望实现。《部首码》规定拆字时首先确定部首,凡部首一律不拆分。两个部首相叠合时,取多笔划的复合部首。部首中共有约40个可以拆分,不在规定的部首位置时按部件处理。其余部件在拆分上有二义性时,实行先分后合,即先取小部件后取大部件,以此解决拆分上的唯一性难题。
例如“贡、则”二字,从部件水平上看,可以是二结构字也可以是三结构字。按《部首码》规定,“贝”在“贡”字中是个部件,按“三分”的序性原则拆分,是个三结构字(工、冂、人);而“贝”在“则”字中居于部首位置,不能拆分,为二结构字(贝、刂)。又如“彭、鼓”二字,“彭”字部首在右边,左边应拆分为“十、豆”两个部件,是个三结构字;“鼓”字部首在左上角,应取复合部首“土”,是个四结构字(土、口、 、支),而不应取“十、豆、支”组成三结构字。再如“离、禽”二字,“离”取“文”为部首,是三个结构字(文、 );而“禽”为四结构字(人、 、凶、内)。以上“贡、则、彭、鼓、禽、离”等六字,在检索、编码中取部都一样。
(3).线性化类文字方块汉字跟拼音文字有很大不同。汉字部件的书写跟拼音文字字母的书写都具有序性这一点,看来是汉字实现现代化唯一可能的出路。但是,汉字在部首-部件水平上和小部件-大部件拆分上解决了二义性问题,还不等于汉字现代化的实现。音形码的《部首码》要作为方块汉字的相对稳定的线性存在形式,成为中国人和外国人都可以方便学用的一种类文字,并在英文键盘上按汉语拼音的读音准确实现出来,还需要在拆分唯一性的前提下具备下列一般性条件和要求①.编码规则要反映汉字结构的特点和规律性,拆分要合理、唯一、方便,以不违反汉字的自然结构形式为原则。
②.定音要规范。成字部件按本音定音;非成字部件的定音原则是一要方便记忆,二要限制数量。要坚持理解记忆和降低重码并重的原则。
③.形体要规范。包括笔形、笔顺、修饰笔形、根顺以及字形的规范,码元、键元和键盘设置的尽可能规范,以及其它需要规范的方面。
④.单笔和零散部件的适当处理,能体现汉字部件化思想,方便操作。
⑤.有一个尽可能大的编码信息单位容量;部件的字母化在多结构字里要全部实施,这是实现部件全息码方针之所必需;尽量运用汉字全部有效的信息手段;用于编码所需的背景知识具有普及性,是广大用户所熟悉或易于掌握的。
⑥.恰当的智能处理,智能化处理跟反映汉字客观实际的编码思想方法相结合。
⑦.可以快速盲打、想打、听打。
⑧.音码的优点是最接近人们的思唯习惯,作为线性化类文字可能唯一体现的部件全息音形码,应当在自己的编码中尽量溶进这一优点。
⑨.音、形规范下的低重码;减轻脑力劳动下的短码长;普及基础上的高速度;普及型与专业型的统一-在方块汉字的客观可能下取得最好的综合效益。
⑩.有一套比较完整坚实的编码理论;编码方案具有尽可能大的通用性、系统性、普及性;能用于简、繁汉字和日、韩汉字的编码;编码思想符合汉字的发展方向;有助于多文种的开发。
7.“部首查字法改革方案”-《新部首查字法规则》(适用于大中小型字、词典)(1).依据字形定部,分汉字为有旁字和“无旁字”两类,有旁字按部首查字,“无旁字”按起笔查字。每字只有一个查法。查旁、查字均按起笔结合笔划数扫描进行。
(2).有旁字的查法统一规定如下①.根据字旁所在位置,按先上后下、先左后右的次序查字。规定如下念(人)育(亠)罕(冖)空(穴)左() (勹)*-取上盅(皿)整(止)咒(几)惑(心)黎(水)眉(目)-取下则(贝)鸿(氵)刘(文)攻(工)咫(尸)修(亻)-取左毅(殳)卿(卩)尅(寸) (刀)励(力)题(页)-取右②.凡占据整个方块结构、上下左右都顶头的部件称为主件,按主件取旁。主件的位置或在外部,或贯穿内部问(门)巨(匚)巫(工)乘(禾)栽(戈)武(弋)头(大)③.无旁可取时,左上角部位,其次结构相同的右、下部位也算查字部位a.能(厶)疆(弓) (白)弑(乂)*b.够(夕)蠢(虫)夥(夕)皕(白)④.查字时,在字形上注意一点同一部位上有多笔、少笔的旁相叠合时,取多笔的旁。如“章”有“ 、立”,查“立”;“磨”有“广、麻”,查“麻”。在结构上注意一点凡交叉结构一律不拆开取旁,如“内、臾、必、本”。在笔划上注意一点凡属一个笔画的不分割取旁,如“果、电、由、求、甫”。
(3).本来无旁或没有规定的旁以及字旁所在位置不合规定的,统归“无旁字”类。
查法见附件《转变观念,尊重实际……》一文8页5款“第三层次”说明。
8.关于电报码电报码共7080字,按与GB1、2级汉字库完全相同的构思和编码方法进行编码,共有重码257对,531个重码字。每字四码,遇重码加识别码后,尚余重码73对。电报码要求完全避免重码,办法是重码字按笔划数多少来区分,笔划数少的为1,较多的依次为2;另有约10对重码笔划数相同,则以高、低频相区分,高频为1,低频为2。用以上办法全部离散重码。73对重码字在码本附表备查。
部首部件定音表部首 部件A:木凵匚冂( )冖 B:八(丷)冫卜( )贝鼻疒宀勹 匕 C:厂()寸车(車)虫齿 巛巜屮 镸歺朿 D:刀()大歹刂氵灬 勹东 癶 E:耳儿阝彐 F:方父风缶扌 幽 G:工戈骨革广弓鬼 H:禾火户( )黑虍禾 I:讠(言)J:巾见斤角几( )钅(金) 丩 己已巳 K:口L:耒立力鹿耂 M:目米门麻毛马皿毌 N:女鸟牛(牜) 禸 丶 O:月(冃) P:片丬(爿)卩( )亠彡丬卪疋丿 Q:犬犭豸气欠 主R:彳亻人(入)日(曰曰)S:石十山罒舌矢手()鼠尸殳 豖 少 巿丨亅饣(食)礻(示)
T:土(士)田 乇U:纟(糸)厶 厶V:艹(廾) 戊戍戌戉 W:王瓦文攵夂囗 旡 X:小()心穴西( )辛夕(夕) 乂 忄()髟Y:雨( )页酉弋鱼羊()衣 肀 尢亦 衤羽又Z:走足()隹爪(爫)舟子(孑) 疋 乛乚 辶廴记码方法:
1.形似:
木=A,树冠形: =L,竹连根月=O,园形艹=V,小草: =曲=Q =册=C =勿=W 夂=攵=W =巴=B纟(糸)厶=U 扌=F 讠=I2.字头:
=F,发字头 =N,农字头 =J,脊字头亠=P,旁字头 髟=X,鬚字头 勹=B,包字头
权利要求
1.一种《部首-三分-两类-音形通用码》汉字输入系统,简称《部首码》。该码是在一个“部首查字法改革方案”基础上建立的。“部首查字法改革方案”分汉字为有旁字和无旁字两类,分别查字。《部首码》根据编码的特点,相应地将汉字分为多结构字和一结构字两类,多结构字首先确定部首并按“三分”的序性原则拆分取码;一结构字取两个坐标码+末笔码。第一码均为整字音码。
2.如权利要求1所说的,“部首查字法改革方案”在理论上的特征为汉字不存在象拼音文字凡单字都由字母组成那样高度的统一性或同一性,因而不存在统一的查字规则。把汉字分为按部首检索的有旁字和不能按部首检索的无旁字两类,就可以分别制定出统一的规则,使每个汉字都只有一个固定的查字方法,并把传统的部首+单笔部首+难检字的公式改为有旁字+无旁字的公式。
3.如权利要求1、2所说的,“部首查字法改革方案”的主要内容包括在《新部首查字法规则》理。其查字方法的特征为有旁字按旁的起笔结合笔划数扫描查旁,无旁字按字的起笔结合笔划数扫描查字。
4.如权利要求1-3所说的,“部首查字法改革方案”在查字部位上规定上、下、左、右、主件为一级查字部位,左上角为二级查字部位。一级查字部位有两个部首时,按“先上后下,先左后右”的次序取部。一级查字部位没有部首时,按二级查字部位取部。
5.如权利要求1-4所说的,“部首查字法改革方案”在查字部位上的一个特征是“主件”的创制。它配合上、下、左、右、左上角五个查字部位,提高了按部首检索的准确性和规范性,从而方便了有旁字的定部,并为在理论上把芜杂的交叉结构字都归入无旁字类提供了一个依据。
6.如权利要求1-5所说的,“部首查字法改革方案”在汉字拆分取部上的规则只有一条交叉结构一律不拆分、不分割。这符合汉字按部件划分的自然趋向,避免了汉字在拆分中的随意性和零散性。
7.如权利要求1所说的,《部首码》在编码设计上的特征为将汉字分为多结构字和一结构字两类,多结构字首先按规定的部位确定部首,并按“三分”的序性原则,发挥部首的调控作用进行拆分,取1、2末三个部件组码,二结构字追加第二结构起末笔坐标码;一结构字取1、2笔和3、4笔坐标码+末笔笔形称谓码。
8.如权利要求1、7所说的,《部首码》设计了一个查询字音很方便的智能方法用“V”代替整字音码,其余取码方法相同。
9.如权利要求1、7所说的,《部首码》在汉字拆分和取码上的特征表现在“三分”的序性原则上根据交叉结构一律不拆分的规定,按3、4、5、6、7、2结构的序性进行拆分。它有两个方面的意义一是把按部件取码的数量限定在3的数目上,提高了拆分的规范性和简明性;二是限定了应当如何对多结构字按“三分”的序性原则、结合有关规定准确唯一地进行拆分。
10.如权利要求1、9所说的,《部首码》在部首提取上的特征在于凡部首一律不拆分,不在部首位置上时,作部件处理。确立以部首为主脑去调控、限定部件拆分的方针,为拆分的唯一性提供重要的条件和保证。
11.如权利要求7、9所说的,《部首码》在部件提取上的特征为拆分中发生二义性时,先取小部件,后取大部件。整字的拆分公式为部首-小部件-大部件(部首有时在后面,部件先小后大的序性不变。)
12.如权利要求7、9、11所说的,《部首码》在部首设置上的特征在于严格依形定部,多结构字都有一个固定的部首;少数字在规定的取部位置没有部首时,拆分后以第一部件代作部首;个别情况部首在规定的大体位置上但不规范的,不算部首,仍以第一部件代作部首。
13.如权利要求7、11所说的,《部首码》在部首、部件定音上的特征表现在《部首-部件定音表》上成字部首均按本音定音(只有月、木二字依形定音);非成字部件主要向形近字、形声字挂靠来定音,化非成字部件为准成字部件,实行归类理解记忆。非成字部件定音后不再拆分,视为特定的部件。
14.如权利要求7、13所说的,《部首码》在非成字部件定音上的一个特征为有意设置几个无音部件不给定音,从而相关的结构也不能拆分和定音,以便达到一批成字整体表达的目的,化非成字部件为成字部件。
15.如权利要求7、13、14所说的,《部首码》在非成字部件定音上的另一个特征为取用少数几个常用部首,说明它们不能拆分的理由,然后将其扩大到一批形近的非成字部件,以便把它们转化成为准成字部件,并避免了拆分的零散性。
16.如权利要求7、9所说的,《部首码》在单笔处理上的特征在于将几个单笔纳入部件化思路的轨道上去处理,这也是实现多结构字部件全息码方针的需要。凡单笔必须首先跟前或后的一个部件试着结合成一个新部件,左右两个对称的单笔也要合并成一个新部件,不能作到才作为一个独立的部件组码,这跟自然形态上的单笔概念就不同了。
17.如权利要求1、7所说的,《部首码》用“/”键作为词简码的结束键。二字词简码为首字音+二字音+/;一键+/作为最常用的词、词组、短语或句子等的简码,由用户自己定义。
18.如权利要求1、7所说的,《部首码》在字、词识别码设计上的特征表现为字取首结构起笔和末结构末笔坐标码;词取首字结构起笔和末字末结构末笔坐标码。这种均衡提取信息的方式,使某些词码在组词上“一头沉”的现象得以改善,更好地起到了离散重码的作用。
全文摘要
本码由一个《部首查字法改革方案》支撑,该方案分汉字为有旁字和无旁字两类,查字唯一。本码为部件全息码,多结构字按“三分”的序性原则取1、2、末三个码,并以部首为主脑去调控部件的拆分,有二义性时先小后大。少数一结构字取两个坐标码加末笔码。字、词首码均为整音,取码方法符合思维习惯。本码思路独特,音形规范,拆分唯一,成字部件取本音,非成字部件实行理解记忆。并为实现汉字线性化类文字目标提出了优化音形码应具备的10条要求。
文档编号G06F3/023GK1100821SQ94108809
公开日1995年3月29日 申请日期1994年8月2日 优先权日1994年8月2日
发明者肖长杰 申请人:肖长杰