专利名称:汉字拼书编码法及其输入键盘的制作方法
技术领域:
本发明涉及将零散的汉字信息项目转换成代码的编码方法及其键盘,特别是一种用拼书码编码输入汉字的汉字拼书编码法及其输入键盘。
为解决汉字的计算机输入问题,现已推出了数百种汉字编码法及其键盘。这些编码方法可以分为四类,即字音码、字形码、形音码和数字码,较为流行的是字形码和字音码两类。
字形码的代表首推“优化的五笔字型编码法及其键盘”,它是一种对汉字进行纯形编码的方法,具有编码较为科学,字根体系的设计规律性强,可以直接采用英文键盘输入汉字的优点,在解决专业人员在计算机上输入汉字方面取得较大成效。但不足的是使用这种编码方法在计算机上输入汉字的人必须经过专门的培训和学习,对操作者的文化素质有一定要求,普及存在一定困难。
音形码是较为实用普及面最广的方案,最近有一种名称为“拼音加偏旁部首代码汉字输入法”(中国专利公报,G06F3/023,申请号9010847.4)的汉字编码输入方法。这种方法的主要构思是用人们在小学时就会的汉语拼音中的声母和韵母作代码来表示汉字的读音音节,用表示汉字的意符的部首作代码对汉字中同音不同义的单字进行区别,将所述的声母代码、韵母代码和部首代码分别定义在计算机的输入键盘上,利用这个键盘上的键位直接用声母、韵母和部首代码编码输入汉字。这种汉字编码输入法的优点一是在一定程度上克服了现有拼音码存在的重码太多,找字困难的普遍问题,二是对操作者的文化素质要求较低,可以不经过专门培训即可上机操作。但是该方法将表示汉字形旁的部首生硬地划分为21个大类,不仅未能起到汉字形旁的作用,而且学习时必须死记硬背,给使用者造成困难;三是将表示汉字读音音节的A、O、E、I、U这五个韵母省去,给输入带有这几个韵母的汉字时造成诸多不便。
本发明之目的,在于针对现有技术的上述不足而提供一种普及性强,可以适用于不同文化背景的人使用,简单易学且输入效率高的汉字编码法及配用这种编码法的输入键盘,该编码法属汉字的音形编码法,为和其它音形编码法相区别,将其命名为汉字拼书编码法及其输入键盘。
汉字的特点是字数多,音节少,存在大量同音字,据康熙字典载,汉字的字数五万多,加之我国人口众多,方言繁杂,读不准音的人多,不认识的字更多,要将如此众多的汉字用计算机上的有限个键位编码输入,而且要使文化背景较差的人也能较快掌握,的确存在较大的困难。
本发明根据我国汉语教学的习惯,选择表示汉字读音这个人们自幼就学习、就使用的汉语拼音为基础,以表示汉字意符的部首为支柱,运用“六书”造字法则,溶合计算机技术,系统工程学和工程心理学等方面的知识,优化筛选,编出不受方言限制,文化水平要求不高,易学易掌握,速度又很高的音形输入的拼书码和设计出用该码输入的拼书键盘。该技术方案的主体构思是将汉字视为是由构成其读音音节的声母、韵母、调号和表示其意符的部首这四类音形信息项目构成的整体,将这四类音形信息项目分别用24个字母代码表示,将一个不少于24个键位的汉字输入键盘定义为声母,部首、声调和韵母四个区,将所述分别包括24个字母代码的声母、部首、声调和韵母归入对应的区中,形成的一种在汉字输入键盘上按构成汉字的四类音形信息代码组字、组词输入的汉字拼书编码法及其输入键盘。
采用这种主体构思方案,在汉字输入键盘上形成的代码组合量可达244个信息组合,即331776个,用来表示所输入的汉字不仅容量绰绰有余,而且由于各类代码数量整齐划一,特别有益于配置所需的汉字输入键盘。
这种主体构思方案的四类代码是这样确定的声母代码采用“汉音拼音方案中的21个声母字母,加上作为零声母的字母Y和W,考虑到无声母的汉字音节拼读编码时的需要,特增设一个声母代码V,在拼读编码时读为“威”,总计24个。为了便于在键盘上标定和记忆,采用
、<、
三个字符作代码字母分别代替汉语拼音方案中Zh,Ch和sh三个声母,具体参见
图1。
韵母代码为24个,而汉语拼音方案中的韵母为39个,本发明利用声母和韵母在相拼时互不干涉原则将汉语拼音方案中的39个韵母归并为24个,也即是说,有部分韵母代码可以同时表示两个汉语拼音方案中的韵母。如A,它可以分别表示汉语拼音方案中的韵母a和ia。为了便于在键盘的键位上标定和便于记忆,除A、E、I、O和U这三个韵母采用和汉语拼音方案中韵母字母一致的字符作代码外,另新造19个字符作代码,各韵母的字母代码和它们分别表示的汉语拼音方案中的字母的表征一样参见图2。
部首代码为24个,分别用于表示分为24个大类的汉字部首信息,将汉字部首分为24个大类的主要原则是“从意”,即将一定范围内,含意近似的汉字部首归为一类,如代码b,部首代码中它用于表示头部,它包括页(头)、目、见、耳、鼻、面、髟、首计八个汉字部首。又如部首代码W,它用于表示巫病部,它包括疒、鬼、卜爻、歹五个部首,均与巫和病有关。采用这种归并办法,部首真正起到了汉字形旁的作用,利用这种部首代码进行编码时,让人容易理解,容易记忆,容易联想。但汉字的形旁多达1900个之多,光新字典收集的部首就有189个,要把这么多个部首形旁归并为24个大类并用代码表示难度较大,本发明大胆假借“世界语”的工具类部首拓扩为部首代码的工部,用字母G表示,将与工作、加工有关的事和物统统归入工部;另外增加一个部首,叫“颇”(杂)部,用代码P表示,它包括23个部首以外的字,如独体字、虚词、量词等。本发明将汉字部首归并为24个部首代码的这种方法,使一般人只要记熟224个部首的代码和大意,就能做到不查字典也能正确确定表示汉字形旁的部首代码。为了便于在计算机的键盘上标定部首代码,所述的24个部首代码全部借用前述声母代码的字符。(见图1)声调代码为24个,它们的主要作用是区别用部首代码不易区分的同音字。汉语拼音方案中将汉字读音的调号分为阴平、阳平、上声、去声、轻声五类,本发明在此基础上增设多调和备用两类,用于解决汉字同字不同调和其它特殊情形。这里,阳平代码为B、P、M、F、G;阴平代码为DTNLK;上声代码为
H;去声代码为ZCSYJ;轻声代码为Q;多调代码为X;备用代码为vW。所述的24个声调代码均用和声母代码相同的字母表示。
由于本发明可以用所述的24个声母代码,24个韵母代码,24个声调代码和24个部首代码在键盘上用拼写方式编码输入汉字,特将这种代码称为拼书码。
本发明用拼书码表示汉字的编码形式可以分为四种第一种,由“声母代码+部首代码+声调代码+韵母代码”组成,如“鼓”字,其拼书码编码为“LDST”;
第二种,实际上,用拼书码编码表示汉字,大约有5000个左右的汉字只需用声母+部首+韵母三种代码组合就可以表示,这种编码比第一种更为简单,如“醋”字,只需用代码组合“CDU”就可以表示;
第三种,用拼书码表示汉字,约有600个左右的汉字可以用声母和韵母两种代码组合即可表示,如“粗”字,只需用拼书代码组合“CU”编码即可;
第四种,考虑到在汉字输入键盘上输入汉字的特殊性,拼书码规定用韵母代码作为拼书码编码中汉字输入的结束符,这种规定不仅和世界上所有的拼音文字相同,而且有利于计算机软件的设计,有利于采用如第二和第三种编码形式高速输入汉字。借用这个规定,可以将24个高频字直接用韵母代码表示,从而形成一种在计算机上直打直入输入汉字的代码,这就是拼书码的第四种形式。这也是拼书码在对汉字编码时不采用流行的声母、韵母、部首这种顺序的原因之一。
将上述四种形式顺序排列,得到汉字用拼书码编码的二种码形,即(1)全码;(2)由三字母码、二字母码和一字母码构成的简码。值得指出的是可以用简码表示的单字均可以用全码表示。
如前所述,拼书码中的声母、韵母、声调和部首四类代码的数量均为24个,由于其整齐划一,特别有利于键盘的配置。在实践中,可以将常见的英文键盘中24个键位的键位区重复定义为声母、部首、声调和韵母四个区,将所述的声母代码、部首代码、声调代码和韵母代码直接标定在这四个区中的键位上,也即是说,位于所述的键位区中的某一个键位可以按输入的顺序依次表示声母代码、部首代码、声调代码和韵母代码的四种信息(具体参见图3)。对于各类代码信息的识别工作由计算机软件自行完成。这样设置的键盘谓之24键拼书键盘。
拼书码的四类代码还可以直接定义在一个具有48个键位的专用键盘上,以实现用拼书码编码输入汉字。具体的处理是将一个具有48个键位的键盘分为两个分别具有24个键位的区,将其中一个键区用来重复表示所述的声母代码、部首代码和声调代码,由于这三类代码用的是同一种字母,可以直接标定在这个区的各个键位上,而剩下的一个区则用于专门标定韵母代码。这样设置的键盘谓之48键拼书键盘(见图4)。
所述两种具体键盘(参见图3、图4)都是101标准键盘为依据,由于这种键盘在世界流行,人们指法统一,易于普及。文中没有具体标定各字母的键位是证明拼书码只要有哪种软件就能设置哪种键盘,反之,用户需要哪种键盘都可以得以满足,只要从新制作软件即可使用。
本发明考虑人们的使用习惯与生产厂家的利益,还设置了一种用26位字母键的拼书码汉字输入键盘,具体的办法是以101标准键盘为依据,将代码P、O、V、E、I直接设在对应的英文字母键位上;另外将28个代码按声、韵母两种代码序号相同则共键原则,将它们分别设置在14个与声母代码字母相同的英文字母键位上,另外再将
组,分别设置在英文字母A、F、J、Q、V、W、X计7个键位上。同时将17个数字和符号键赋于一些高频字和汉字数字信息(见图5)。这里,汉字数字用ctrl+数字键,同时按下输入。英文数字在大写状态下输入。
这种键盘人们无须改变指法,中、英文通用,生产厂家只须作较少改动而不必从新设计制作键盘和改变生产方式,还利于在世界范围销售。对于现已购置电脑的人们,可在已有的键盘键帽上,用白胶布按图5(可按帮助键将图形提出)写上标定的内容,再在上面贴一层透明胶纸加以保护。然后剪成小块按图5贴上就可在拷有拼书码的软件支持下,用拼书码输入汉字。
所述三种键盘除配用的计算机软件略有不同外,用拼书码输入汉字的编码完全一样,实际上,拼书码可用具有不少于24个键位的各种键盘进行定义。
在定义了拼书码的键盘上,用拼书码输入汉字的方法为(1)四码四键输入法,即全码输入法;(2)由三码三键输入,二码二键输入和一码一键输入构成的简码输入法。
在定义了拼书码的键盘上,用拼书码编码输入汉字的方法和前述用拼书码表示汉字的全码和简码两种码形对应。即(1)全码输入法,也叫四码四键输入法;(2)简码输入法,它包括三码三键输入法,二码二键输入法和一码一键输入法。即只需在键盘上按汉字的音形信息选择所需输入汉字的拼书编码,然后直接用该汉字的拼书编码依次键入即可,极为方便快速。如前述的汉字单字“鼓”,若采用全码输入法,只需顺序键入<、D、
和I即可完成该汉字的输入。对于简码中的三字母码、二字母码和一字母码,可分别采用简码输入法中的三码三键输入,二码二键输入,一码一键输入即可。
为帮助初学者尽快掌握拼书码的编码输入方法,本发明在用拼书码输入汉字时采用了一种特殊的屏提示提示分为上、下两行,上行提示10字,分别含一字母码,二字母码和四字母码;下行提供12字,均为三字母码,下行12字按音位置放。如“粹”字,键入CD,提示是
键韵母键
,则“粹”字输入。
如果是由于操作者的发音造成误键<D,则提示为
查无要输入的“粹”字时,只需按翻页键,提示则自动翻出上面的CD页,再键韵母
则可完成“粹”字的输入。如果采用的是声韵母共键的键盘,击空格键后认定为韵母。此时,要输入“粗”字,击2即输入。
这种提示的特点是(1)有字有码,见字知码,记码神速;(2)不必担心读不准音,只要是声母+部首的同字根的各种字同页提示,给使用者提供极大方便。
又由24个声韵母相拼还有很多空位,而一些高频字按严格的编码规则将码编码增长,降低输入效率。由于提示自教自帮的作用,我们可以在“合乎情理”能被人们接受的前提下,利用空位增设不规则码缩短编码,减少击键次数,提高输入速度。
拼书码的组词编码方法分为两种1、对于两字词,用第一字的声母代码+第二字的拼书编码作为其编码,如“报酬”其拼书码的编码为B<PT,“豆豉”的拼书编码为D<D
I。只需在键盘上按码键入就能实现其输入。2、对于多字词,则用前两字的声母代码+末位字的拼书编码,如“保宁醋”其拼书编码为BNCDU,又如“中国人民解放军”代码为ZGJK,只需在键盘上按码键入即可。
特别要说明的一点是词组的输入不需换档和作其他处理。
拼书码为了自身形成一个汉字输入系统,除借用现有的单字输入,后缀联想词汇功能外,还增设一种小学一年级学生都掌握使用的查字典式的输入方法。该方法是拼书部首代码+字典输入符(逗号,)+原字典部首提示号+笔画数代码+声母+声调+韵母。例如“燔”,代码为H,01JYJ
;“猫”,码为L,1LMXⅡ;“哄”,码为K,1THXΛ。输入时,只需按上述代码击键即可输入上述对应的汉字,笔画数代码的顺序号就是汉字的笔画数。
该方法只是为了完善拼书码汉字输入系统而增设的附加功能,方法非常简单,人人都会使用,但速度极慢,好在使用机会极少,不会影响整个输入速度,对于小学生可尝试计算机的汉字输入,而对于字库量大而广的印刷社,输入生僻字(多为不认识的字)时却十分方便。一般人有时也会遇上不认识的字,用此法就很容易实现输入。字都不认识,声调、韵母当然不知道,这时可通过提示选字母键入。由于末三位是声母、声调、韵母,它间接地起到了字典查读音的功能。
所述的各种拼书码都是以韵母结束,写在纸上音节清楚,同时给电脑识别一个字词的输入程序终止有一个明确的命令,给软件制作带来方便。
本发明适用于一切大、中、小型汉字信息电脑处理系统,照排系统、中文电传机、中文电脑打字机、汉字终端机,及汉字电脑通讯设备、电脑自动翻译机、档案管理、目录索引、查询、中、小学计算机教育等方面获得广泛应用,拼书码还可作为电报明码使用。
综上所述,本发明和现有技术相比,具有以下优点1、本发明克服了现有字形码难普及难掌握和字音码输入效率低的不足,熔其两种码的优点,具有简便、易学、高速、易普及的特点,不论专职或非专职人员都只需几分钟消化拼书码操作说明即可上机应用,是一种理想的音形码。
2、本发明不受方言和发音不准的限制,近音声母Z,Zh;C、Ch、S、Sh;n、L四种可翻提示查找,近音韵母en、eng;in、ing、un等都同屏提示,不怕分不清。
3、本发明组字能力强,全组合为244,即331776字,可以作到绝无重码。
4、本发明部首表意能力强,容易掌握和确定。且所述的部首基本依照康熙字典繁体字归并,少量字借用简化字部首,所以拼书码对于简、繁体汉字都适用。
5、本发明组字、组词法则简单,掌握、记忆都快。
6、这一发明有少量的不规则码,加快了输入速度。同时,心理学认为出现少量的不规则事物会使人精力更加集中,不易疲劳,它和高速度公路不能修筑成一条直道是一样的道理。
7、拼书码采用特殊的提示方法,操作时只需看提示上行左侧,用逆淘汰法即可快速查字输入。
8、国标一、二级字库大量汉字的拼书码都集中在三位码中,操作员只要能记住600一、二级简码就能只看文稿和编辑屏输入汉字,使实现“盲打”的进程大大加快。
9、不认识的字也能用查字典式的方法输入。
10、码即是形声字,一字一形一码一音,由于码文短,平均一个汉字只用1.8个字母,而且韵母始终处于结尾,音节十分清楚,可以用码来记笔记,近于速写,字义不乱。这样给人们提供了机外练码的广阔天地。学生用来作笔记可减轻笔记紧张的压力,还不会因赶速度而乱写乱画汉字,乱了汉字书法手法。又给以后参加工作使用计算机奠定了雄厚基础,一举多得。
11、拼书码的掌握与输入速度都很高,多数人使用半个月后就能比拼音码快两倍以上,半年即可过100字/分钟关。经过指法训练的操作员可每分钟输入230个以上的汉字。所述26字母键盘输入单字码长不足两键,48字母键盘输入单字码长=1.85键,加之词组、联想约1.5键。
综上所述,本发明的技术方案完全达到本发明之目的。
本发明有如下附图图1,拼书码的声母、声调和部首代码的字母和部首代码所表示的汉字部首表。
图2,拼书码的韵母代码表及其分别表示的汉语拼音方案中的韵母字母。
图3、用英文键盘中24个字母键作为拼书码编码输入汉字时的键盘,也是本发明的实例1。
图4、具有48个字母键的且可用拼书码编码法输入汉字的专用键盘,也是本发明的实例2。
图5、具有26个字母键的且可用拼书码编码法输入汉字的键盘,也是本发明实例3。
图1说明如下图中的声母代码、声调代码、部首代码均用相同的字母表示。为便于使用,专门排出了各类代码的小写字母。
图2说明如下图中除韵母代码外,也列出了各韵母代码的小写字母。
图3中实例说明如下(参见图1、图2)图中键盘的字母键位上,标有韵母代码分别包括的汉语拼音方案中的韵母,在英文字母键E和I上,由于未定义拼书码代码,特分别标有高频字“的”和“是”;为了提高该键盘的利用率,在数字键和符号键上也分别标有高频单字;它们可以按键面上标定的汉字直接按键输入。
图4和图5中实例和图3中实例雷同,这里从略。
由于实例1、2、3的使用前面已叙及,这里也不再介绍。
权利要求
1.一种堆积密度大于550克/升并由多种独立的颗粒组分组成的粒状洗涤剂组合物,其特征在于,其中至少一种颗粒组分包括(a)5%至60%重量的表面活性剂体系组分,它实质上包括(ⅰ)选自以下的初级阴离子或非离子表面活性剂(1)C14-C20烷基硫酸盐;(2)脂族C12-C20烷基磺酸盐;(3)C12-C20烷基甲酯磺酸盐;(4)分子式为
的多羟基脂肪酸酰胺,其中,R5是H、C1-C4烃基、2羟乙基、2羟丙基或其混合物,R6是C11-C31烃基,Z是具有直烃链的聚羟烃基及其它们的混合物,至少三个羟基官能团直接速到该烃链上或者一个烷基化衍生物上。(ⅱ)平均每摩尔含有1至7个乙氧基团的水溶性C11-C18烷基乙氧基硫酸盐;所说的初级阴离子或非离子表面活性剂或其混合物与所说的水溶性C11-C18烷基乙氧基硫酸盐充分地混合,初级阴离子或非离子表面活性剂或其混合物相对于烷基乙氧基硫酸盐的重量比是2∶1至19∶1,烷基乙氧基硫酸盐的用量是该组分重量个声调代码的字母对应相同,它们的序号,字母代码,字母代码所表示的汉语拼音方案中的声母,字母代码作为声母代码时的名称,字母代码作为声调代码时所表示的调号,字母代码作为部首代码时的部首名称及其分别包括的汉字部首是1 B b b 玻 阳平 头部 页,目(四),见,耳,鼻,面,首髟2 P p p 坡 阳平 颇杂部 含23部以外的字,单体字,虚,量词等3 M m m 摸 阳平 木部 木,片.4 F f f 佛 阳平 纺织部 纟,糸,巾,方,衣,衤,黹,网(四)5 D d d 得 阴平 稻禾部 禾,食,饣,酉,瓜,米,麦,豆,黍,甘.6 T t t 特 阴平 土部 土,田,阝(阜邑)囗冖凵(宀穴皿缶瓦)7 N n n 讷 阴平 女部 女,母,子,示,礻,部分姓氏.8 L l l 勒 阴平 林兽部 犭,犬,虍,豸鹿马牛羊豕鼠爪角毛韦9 G g g 哥 阳平 工部 工,车,舟,门,匚,户,宀,穴,皿,缶臼瓦,戈矛,耒,矢,鼓,鼎,鬲,龠.10 K k k 科 阴平 口部 口,曰,言,文,讠,舌牙齿音欠.11 H h h 喝 上声 火部 火,灬,风,气香日月夕色赤青黄黑白12 J j j 基 去声 金部 金,钅,刀,刂,斤,贝,13 Q q q 欺 轻声 躯干部 月,肉,血,身,骨,皮,尸.14 X x x 希 多调 心部 心,忄,.(言,文,攵,攴).15 > > zh 知 上声 竹部 竹,弓,殳,爿.16 < < ch 蚩 上声 虫鸟部 虫,鸟,羽,佳,飞,卵.17 sh 诗 上声 水部 水,氵,巛,冫,雨,18 R r 日 上声 人部 亻,人,王,臣,士,男,父老生辛.(矢)19 Z z z 资 去声 足部 足,,廴,辶,,疋,,彳走立,20 C c c 雌 去声 草部 艹,韭,麻.21 S s s 思 去声 手部 扌,手,肀,攵(攴)西,卩,22 Y y y 衣 去声 鱼部 鱼,龙,黾.23 W w w 乌 备用 巫病部 疒,鬼,卜,爻,歹.24 V v 无 威 备用 山石部 山,石,玉,厂,广,卤,谷.
5.按权利要求1~3所述的汉字拼书编码法及其输入键盘,其特征是被定义在键盘上的24个韵母代码及其分别包括的汉语拼音方案中的韵母字母是1 a:a;ia. 9 :ang. 17 Ξ ツ:iang;uang2 o:uo;o. 10 口:ao, 18 Я я:iu.3 Σ :an. 11 Ц ц:ai, 19 Э э:in.4 u:u;er. 12 :en;ue, 20 :ie.5 e:e;e 13 Θ θ:uan. 21 Ω :ing.6 :eng. 14 :un;(n)ue. 22 :iao;uai.7 П π:ei. 15 Δ :ui;u. 23 ン:ian;ua.8 Г г:ou. 16^:ong;iong. 24 i:i.
6.按权利要求1~5所述的汉字拼书编码法及其输入键盘,其特征是在键盘上用拼书编码法输入汉字单字的方法为四码四键输入法,也称全码输入法,即直接按所需输入汉字单字的四类音形信息项目依次键入一个声母代码、一个部首代码、一个声调代码和一个韵母代码即可完成输入。
7.按权利要求1~4所述的汉字拼书编码法及其输入键盘,其特征是在键盘上用拼书编码法输入词组的方法是两字词的输入用第一个单字的声母代码和第二个单字的拼书编码组合键入;多字词的输用入用第一、第二两个单字的声母代码和末位字的单字的拼书编码组合键入。
8.按权利要求1~5所述的汉字拼书编码法及其输入键盘,其特征是在键盘上用拼书编码法输入汉字单字的简码输入方法为(1)对于可以用一个声母代码、一个部首代码和一个韵母代码组合表示的单字,直接用这三个代码编码依次键入;(2)对于可以用一个声母代码和一个韵母代码组合表示的单字,直接用这两个代码编码依次键入;(3)对于可用韵母代码表示的单字,直接用韵母代码键入。
9.按照权利要求1~8的经所述的汉字拼书编码法及其输入键盘,其特征是对汉字单字和词组进行输入的方法,可用于一切大、中、小型汉字信息电脑处理系统,照排系统、中文电传机、中文电脑打字机、汉字终端机及汉字电脑通讯设备,电脑翻译机、目录索引、查询、档案管理。
全文摘要
一种汉字拼书编码法及其输入键盘,它融合了计算机技术、系统工程学和工程心理学等方面的知识,将汉字的声母,表示汉字形旁的部首,汉字的声调和韵母四类信息项目名用24个字母代码表示,提出一种在计算机键盘上用这四类字母代码依次键入以组字、组词输入汉字的编码方法。由于所述四类代码数量整齐划一,可以用不少于24个键位的键盘进行设置,可以借用流行的英文键盘进行输入。具有代码和键盘设计科学,编码输入容易,对操作者文化背景要求不高,无重码,输入速度快等优点。
文档编号G06F3/023GK1077551SQ9311082
公开日1993年10月20日 申请日期1993年1月5日 优先权日1993年1月5日
发明者刘诗梁 申请人:刘诗梁