专利名称:汉字编码方法及键盘的制作方法
本发明涉及一种汉字字形编码方法及键盘。
现有多种汉字字形编码方法,通过对汉字笔划、构件、笔顺等的剖析制定出一套规则,进行编码,采用26键至51键的键盘输入,存在有规律性不强,记忆量大,二义性较多,重码率较高等问题,例如钱氏“汉字宏观字形编码方案”,重码率4.1%。其中一级汉字重码情况顾多,使用时需进行同码字的选择,并且由51键盘输入,操作不方便,难以实际盲打。
本发明的任务是提供一种规则简明,好学易记,所配键盘操作方便的汉字字形编码方法及键盘。
本发明综合利用了汉字总体布局、笔划、构件、边角等的自身规律性制定了一套规律性简明的规则进行编码,采用标准三行式地26键英文键盘输入,均可完成了上述任务。
本发明用第一列10个数码(即1、2、3、4、5、6、7、8、9、0)分别表示汉字10个基本笔划(即一、丨、丶、丶、十、
、口、
、八、小、一);10个数码分别与键盘上第一行10个键位(即Q、W、E、R、T、Y、U、I、O、P)一一对应。对于相近于基本笔划的笔划(以下称变形笔划)则用另外两列数码(可以看成立第一列数码的变异)对应地予以表示;第一列9个数码(即
、
)表示变形笔划,并分别与键盘上第二行9个键位(即A、S、D、F、C、H、J、K、L)一一对应。第三列7个数码(即
、
)表示变形笔划,并分别与键盘上第三行7个键位(即Z、X、C、V、B、N、M)一一对应,但其中7码(对应的键)不表示变形笔划,而仅表示笔划的组合,即构件。三列数码中,数字相同的三个数码,如1、
构成一个数码组,其所对应的键,即Q、A、Z构成一个键岗组,构件按对该构件取码(此时假设该构件为一个字)时最先取到的一个数码所在的数距组中的一个数码表示,由对应的键位输入。
3列数码与3行键位所表示的笔划,构件见附表一。26键位分布情况,如附图所示。为减少重码率,将数码9、
定为特殊码,所对应的键O、G、B称为特特键。对某些构件按前述方法编码,列入附表一相应位置后,加上括号,表示此构件的实际编码改为该列特殊码,输入时,由该行特殊键输入,在
码后列有构件“口”,表示除“口日用”之外的“口”形,如“恩”字第一码为
,由N键输入。在9码后列有构件“
”表示被其他构件或笔划叉到,如“巾”,先取“冂”再取“丨”。
本发明对GB2312-80《信息交换用汉字编码字符集基本集》中所列的全部一、二级常用汉字,均以方块间隔的方式,从右上角开始,从上到下,从右到左地按照其构件或笔划编码。
一个构件或笔划与另一个构件或笔划相连时,以其交接点为断笔处,如“产”字断成“立丿”,“东”字断成“、木”。但两个相同或相的同码构件相连时,可在非交接点处断笔,使之分成两个构件,取相同的两个码,如“勿”字,接“、×、×”取码为744。曲笔与其他笔划或构件相连或相叉时,按其所在位置所形成的笔划,可以断开取码,如“毛”字断成“/、
、凵”取码,成为
。取码的顺序是先构件,后复笔,最后单笔。这里,单笔指单笔笔划,复笔指两笔及两笔以上的笔划。
本发明对每个汉字,按照其整字或其主体部分由纵向不可分割、或可分割成两部分、或可分割成三部分的三种区别,将该字一次性地区分为单
体字或双体字或三体字。对单体字最多取三码,限取右边;对双体、三体字最多取四码,从右边开始,可转向左边。(1、2、3、4表示取码顺序)
单体字类
「意」字,如附图一所示间隔方块成为「立、日、心」,顺序取码为「
」,其键位为「LHC」。
「字」字,如附图二所示间隔方块成为「宀、
」,
顺序取码为「
」,其键位是「DJV」。
「类」字,如附图三所示间隔方块成为「
、个、
」,
顺序取码为「998」,其键位是「OOI」。
双体、三体字类
「漫」字,如附图四所示间隔方块成为「日罒又氵」,
顺序取码为「
」,其键位是「HNJC」。
「肄」字,如附图五所示间隔方块成为「聿匕
」,
顺序取码为「
」,其键位是「BWKF」。
「紫」字,如附图六所示间隔方块成为「匕厶小丨」,
顺序取码为「
」,其键位是「WCOX」。
「迸」字,如附图七所示间隔方块成为「
十辶」,
顺序取码为「
」。
「街」字,如附图八所示间隔方块成为「一土
丿」,
顺序取码为「
」,其键位是「QGFS」。
「渐」字,如附图九所示间隔方块成为「
扌氵」,
顺序取码为「245
」,其键位是「WRTC」。
「痢」字,如附图十所示间隔方块成为「疒亅丿木」,
顺序取码为「
」,其键位是「PXSV」。
对于仅取两码结束的双体字,应从该字右下角补取一码,如“硕”字,取“页、石”之后,应补上“人”,编码为
,即键AAI。
对于与附表一所列笔划或构件完全相同的汉字,凡可拆成若干笔划者,按拆后笔划编码,例如“户”字,按“丶、、一”编成371,即键EUQ;凡无法拆成若干笔划者,则将该“字”在附表一中所对应的数码列为第一码,并追加两个该码所在列的特殊码,成为三码,例如“十”字,编成499,即键ROO。
为提高输入速度,对《综合汉字频度表》中最高使用频度的26个汉字,仅保留第一码,以其对应键输入。在附表一中,26个汉字分别列在26个数码与键位之后;此外,还列入71个次高使用频度汉字。对这71字,编码时仅保留第一码,第二码则改按该字在附表一中的位置号确定1号同第一码,2、3、4号分别为1、
,每字编两码,以其对应的两键输入。同时,这71字也可以按正常码输入,以双码表示的71个汉字及其对应键。
本发明所提供的编码方法,规则简明严谨,规律性强,编码二义性极少,便于记忆,易于掌握。以一至四码不等长码位取码,其中1码字26个,2码字234个,3码字2559个,大部分属于高频字范围,6763个汉字按《综合汉字频度表》测定,加权平均码长为2.9码。重码率仅为1.9%,并且其中多数为二级字之间或二级字与一级字之间重码,一级字之间极少重码。本发明以26键输入,可以和标准英文26键键盘同步使用,配置合理,操作方便,可以实现盲打。
权利要求
1、一种按字形编码的汉字编码方法,其特征在于采用了1、2、3、4、5、6、7、8、9、0这10个阿拉伯数字及其变异来表示汉字笔划、构件,依一定顺序,以方块间隔的方式,对汉字进行编码。
2、按权利要求
1的汉字编码方法,其特征在于对每个汉字一律从右上角开始,从上到下,以间隔方块、取码。
3、按权利要求
1的汉字编码方法,其特征在于取码按照构件、复笔、单笔的顺序进行。
4、按权利要求
1的汉字编码方法,其特征在于按照汉字整字或其主体部分由纵向不可分割、或可分割成两部分、或可分割成三部分,将汉字区分为单体字、双体字与三体字,对单体字最多取三码并限取在右边,对双体字与三体字,最多取四码,可转向左边。
5、按权利要求
1的汉字编码方法,其特征在于采用第一列10个数码(即1、2、3、4、5、6、7、8、9、0)表示10个基本笔划(即一、丨、丶、十、
、口、、八、小、亠)。
(横、竖、点、叉、串、方、角、八、小、头)
6、按权利要求
1的汉字编码方法,其特征在于采用第二列9个数码(即
)及第三列7个数码(即
)表示变形笔划,数字相同的两个或三个数码构成一个数码组,表示一个基本笔划及与其相近的若干个变形笔划,但其中数码7仅表示笔划的组合,即构件,而不表示变形笔划。
7、按权利要求
1的汉字编码方法,其特征在于对汉字构件,采用对该构件取码(此时假设该构件为一个字)时最先取到一个码所在的数码组中的一个数码表示。
8、按权利要求
1的汉字编码方法,其特征在于将数码9、
定为特殊码,对某些构件改按与原码同列的特殊码表示。
9、按权利要求
1至4的汉字编码方法,其特征在于对仅取两码结束的双体字,需从该字的右下角补取一码,编为第三码。
10、按权利要求
1至4的汉字编码方法,其特征在于对《综合汉字频度表》中最高使用频度的一批汉字,仅保留其第一码,其余码舍去不用。
11、按权利要求
1至4的汉字编码方法,其特征在于对《综合汉字频度表》中次高使用频度的另一批汉字,可以按正常码编码,也可以缩编为两码保留第一码,第二码改按该字在附表一中的位置号确定,1号同第一码,2、3、4号分别为1、
。
12、按权利要求
3的汉字编码方法,其特征在于一个构件或笔划与另一个构件或笔划相连时,以其交接点为断笔处,但两个相同或相似的同码构件相连时,可在非交接点处断笔,使之分成两个构件、取相同的两个码,曲笔与其他笔划或构件相连或相叉时,按其所在位置所形成的笔划,可以断开取码。
13、按权利要求
10的汉字编码方法,其特征在于下列26个汉字以单码表示
要1 工2 这3 在4 中5 和6 的7 人8 不9 主0
14、按权利要求
11的汉字编码方法,其特征在于下列71个汉字可以由缩编的两码表示
15、按权利要求
6至8的汉字编码方法,其特征在于三列共26个数码所表示的笔划与构件如附表一所列。
16、按权利要求
6至8的汉字编码方法,其特征在于对于与附表一所列笔划或构件完全相同的汉字,凡可拆成若干笔划者,按拆后笔划编码。
17、按权利要求
6至8的汉字编码方法,其特征在于对于与附表一所列笔划或构件完全相同的汉字,凡不可拆成若干笔划者,将该“字”在附表一中所对应的数码列为第一码,并追加两个该码所在列的特殊码,成为三码制。
18、按权利要求
1的汉字编码方法设计的一种汉字键盘,其特征在于键位数为26个。
19、按权利要求
18的汉字键盘,其特征在于采用标准三行式26键英文键盘。
20、按权利要求
18的汉字键盘,其特征在于分别由26个键位(即Q、W、E、R、T、Y、U、I、O、P、A、S、D、F、G、H、J、K、L、Z、X、C、V、B、N、M)输入26个数码(即1、2、3、4、5、6、7、8、9、0、1、2、3、4、5、6、7、8、9、1、2、3、4、5、6、7)。
21、按权利要求
18与19的汉字键盘,其特征在于26个键位,分三行排列,第一行10个键位,第二行9个键位,第三行7个键位,分别与三列数码对应。
专利摘要
本发明提供了一种汉字字形编码方法及键盘。其特点是以方块间隔的方式,对GB2312—80中所列一、二级常用6763个汉字,均从右上角开始,从上到下、从右到左地按照汉字构件、笔划编码。采用标准26键英文键盘输入,具有规则简明、规律性强、好学易记、码位短、输入操作方便等优点。
文档编号G06F3/023GK86102058SQ86102058
公开日1987年8月12日 申请日期1986年10月16日
发明者郑伟 申请人:闽东电机七厂导出引文BiBTeX, EndNote, RefMan