专利名称:嵌套字素编码法及其输入键盘的制作方法
本发明称之为“嵌套字素编码法”,它是以满足用户需要和计算机要求为出发点的新颖的汉字字形编码法且是一种准确而快速的检字法。以往的编码法中有的每字击键次数少,但键数多达三、四百;有的只用八键但击键次数达6至8次,有二义性;有的键数不足32个,但每个键上符号个数不均且击键四次和需联想;有的击键次数只三次,但键数多于32个和键上符号多于四个且不均,符号总数多于170个。这些编码方案对初学击键者来说经一月训练,其编码速率(指单位时间里正确无误地进行编码的平均字数)也不足50字/分,且大都无一套完整的编码理论,不能直接形成最短的汉字代码(16位)。
本编码法的目的是克服现有绝大多数方案中存在的缺乏理论根据、有二义性、编码速率低、代码长、唯一性差、需联想、繁体简体不共用键盘表、每字击键次数多于三次、不易盲打等缺点,尽量保持书写汉字的传统习惯,建立一套科学的汉字编码理论,推出一个简捷而易于掌握的编码方法。
汉字由含位置信息的有序的字素集合而成,其结构特点是嵌套式的。字素是经对字的结构进行统计分析后优选出来的能据以完整地组配出所有汉字的必不可少的元素。本编码法以字素为编码单位,把汉字分为单块字(如“只”)和多块字(如“叭”)。单块字就是从书写汉字的起笔开始,以字素及其集合为单位,沿字的水平方向往前,自上向下看,不能左右自然分开的字;能自然分开的字就是多块字。其最左边的一个叫首块;紧接着的叫次块,最右边的为末块。在每块内,以字素及其集合为单位,沿垂直方向往下看(自左向右或从右往左),凡是能无阻碍地上下自然分开的部分称为字层,最上边的叫首层,紧接着是次层,最下边为末层。在每层内,以字素及其集合为单位,沿水平方向往前从上向下看,能左右自然分开的笔形结构称为字片,最左者为首片,右边紧挨着的为次片。首字素通常是首块中头一字素,它位于汉字左边、顶上方或左上角。凡以传统的“部首”为首字素的字,大都为单块字、而以“偏旁”为首字素的字,几乎全为多块字。显然,这种一环套一环的汉字结构便是嵌套结构。
本编码法对字进行编码的基本规则是从汉字书写的起笔开始,利用嵌套字素输入键盘图1,以形状相同笔划最多的字素为编码单位去替换汉字的首字素,然后不重复地按块、层、片首优先顺序原则去选取中间字素,最后以尾字素来结束整个汉字的编码。尾字素系指书写汉字时包含末笔在内的笔划最多的字素,它通常位于字的右边,下边或右下部。即,其规则简写成汉字代码=首→中→尾 (1)其首、中、尾之间彼此不应重迭使用。
在以词为主时,汉字代码=首→中→字键→尾 (2)(一)当汉字至少由三字素组成时甲、当汉字为单块字时①若该字只二字层,且次层只一字素,则中间字素选首层中次片首(头一字素),即次片首优先于首片其余字素。如“壑、避、戆、熟”的“中”分别选“又、立、夂、九”。②若首层后有多个字素,则中间字素选次层首,即层首优先于片首。如“毊、嚣、攀”的“中”分别选“禾、页、大”乙、当汉字为多块字时①若首块后只一字素,则“中”选首块中次层首,即,在首块中“层首”优先于“片首”,如“剿、鹦、颚、氍”的“中”分别选“果、女、二、隹”。②若首块后不止一字素,则“中”选次块首,即,“块”优先于“层首”,例如“碾、翰、
、耘、
、”的“中”分别选“尸、人、女、二、曰”。
(二)、汉字只由二字素组成时,通常无中间字素为了使代码等长为16bit,应把“尾”作“中”,和添加一位置键代码作“尾”,目的是减少重码。位置键代码是“尾”所在键上位置所对应的代码。但当此两字素彼此镶嵌或其“首”为“九、口、日”的单块字时,其“尾”分别选用镶嵌键和“层”代码。
(三)、汉字只由一字素组成时,此时无“中”和“尾”,为了使其代码等长,“中”用该字素所在键上位置所对应的代码,“尾”用一固定键代码。由于字素本身是嵌套的,从而,可直接看键打字和使键上字素减到最少。
(四)、占全部汉字使用频度五分之一的常用字和标点符号的编码=它们所在键代码→SP (3) 这样做的目的是提高编码速率。
(五)、以字词方式提供词汇码,目的是便于输入和提高编码速率。其编码规则为令 词汇=X1X2……Xn,其中Xi(i=1,2,…,n)为第i个汉字,令 X1首、X1中分别表示第1个字的“首”和“中”,Xn首表示第n个字之“首”。
X中=X1中+Xn首(X1仅一字素时)X尾=Xn首+SP(X1仅一字素时)甲、以字为主时,词汇代码=X1首→X中→词汇键→X尾 (4)如小心=小→心→词汇键→SP计算机=言→十→词汇键→木少壮不努力,老大徒伤悲=小→丿→词汇键→非乙、以词为主时,只把上例中词汇键去掉即可词汇代码=X1首→X中→X尾 (5)其输入键盘至少含有32个键,这里只使用其中32个键,字素的键位安排是按其使用频度高低进行的,高频字素放在键盘中央键位上,每键上最多四个字素,它可用任何技术措施表示在键上,以利于看键打字;整个键盘上字素安排是以减少重码率为基准的;编码中小指使用频度在10%以下。
编码键数N与每字击键次数X,代码长度L(bit)间满足X=关系式。当最短汉字代码16bit时,其最佳关系为 N=8 16 32允许每字平均击键次数 X=5 4 3
图1中只有近30个异于辞书上偏旁部首的字素是为更多更好地解决计算机输入编码问题所创设的。
本编码法跟其它同类方案相比较,其特点是有一套符合语言文字学、文献检索学、计算机科学的编码理论作指导,在最佳信息键 N=32时,出现重码率<0.1%,易盲打;以字为主时每字通常击三次键,能直接形成最短的汉字代码(16位),而词须加击一词汇键;在以词为主时则反之;使用频度高的标点符号及汉字只击二次键;将一百廿来个字素均匀地置于31键上,另一键供词汇或字、少数民族文字、外文字、科技符号及其它符号使用;编码规则简明严谨而完备,不用联想;兼容性好,扩充性强,已考虑了二万二千个汉字的编码;其编码表适用于繁、简体和日本汉字;为机器识别汉字创造了条件;其代码蕴含了大量构字信息,使得能产生出尺寸最小的汉字发生器。采用字词方式进行编码,便于学习和提高键入速率。它可用于计算机、具有图形功能的终端、打印机、绘图仪及电子式打字机、通讯系统、办公室自动化和印刷自动化中。
申请号 86104174 申请日 1986年6月28日发明创造名称 嵌套字素编码法及其输入键盘
权利要求
1.嵌套字素编码法及其输入键盘,其特征是采用嵌套字素编码表进行编码。它以字素为编码单位,在以字为主时,按编码规则“首→中→尾”的顺序对字进行编码,能直接形成16bit汉字代码,并按“X1首→X中→词汇键→X尾”规则对词汇进行编码;在以词为主时则反之。整个输入键盘上字素安排以减小重码率为基准,而字素的键位安排按使用频度高低进行,中央键位安放高频字素。
2.按照权利要求
1.的嵌套字素编码法,其特征是字素是嵌套的,有近30个异于辞书上偏旁部首的字素,将一百廿来个字素均匀地分配在31个信息键上;每键安排有四个字素,另一个键为词汇或字、少数民族文字、外文字、科技符号及其它符号设置的。
3.按照权利要求
1.的嵌套字素编码表,其特征是繁、简体及日本汉字共用,且该表可通过任何技术措施表示在键盘上,可看键打字。
4.按照权利要求
1.的嵌套字素编码法,其特征是利用它可得到一种准确而快速的汉字检字法。
5.按照权利要求
1.的嵌套字素编码法的编码规则,其特征是每字通常击三次键,而词加击一词汇键;或每词击三次键而字加击一字键。“首”是严格地按书写汉字起笔开始的笔划最多的字素;“尾”是包含书写汉字末笔在内的笔划最多的字素;“中”是按块、层、片首优先顺序选取的字素。
6.按照权利要求
1.的嵌套字素编码法的编码规则,其特征是占汉字使用频度五分之一的标点符号及汉字各只击二次键。
7.按照权利要求
1.的嵌套字素编码法,其特征是编码规则中使用了位置键代码和嵌套键及“层”键代码,且同一键上字素位置是固定的。
专利摘要
本发明属于中文信息科学领域。其特征是采用嵌套字素编码,将一百二十来个字素均匀地置于输入键盘的31个键上。以字词或词字方式按“首→中→尾”规则对汉字编码,能直接形成16bit汉字代码;最常用标点和汉字(共31个)只击二次键(空格键在内),出现重码率<0.1%,易看键打字或盲打。字素安排以减少重码率为基准,字素使用频度高低决定了它在键盘上的位置。它可用在计算机、有图形功能的终端、打印机、绘图仪及电子式打字机中。
文档编号G06F3/023GK86104174SQ86104174
公开日1988年1月13日 申请日期1986年6月28日
发明者萧忠义, 余锦凤 申请人:余锦凤, 萧忠义导出引文BiBTeX, EndNote, RefMan