背景技术:
现有汉字编码键盘输入,主要分为音码、形码两类。
音码以汉字的拼音为编码,以拼音字母或其特定组合映射键盘字母键或数字键等,通过击键输入汉字的拼音编码完成汉字输入,它要求目标汉字有音且使用者掌握其读音,否则无法输入。
形码以按特定序列提取被赋予代码的特定特征获得相应汉字编码,其涉及汉字特征基本都是部件、笔画分类、笔顺等较复杂的汉字专有知识,它要求使用者具备相应的汉字教育背景,否则难以学习掌握。
本发明的目的是提供一个基于本质为几何线段的汉字笔画构成的简单几何构形特征建立的一种数字化分类管理汉字并可运用于键盘输入的方法、方案,其作用包括但不限于可以作为任何其它汉字输入方案的辅助配套方案,以进一步提高原方案的输入精确度、效率,其特点还在于涉及的笔画构形特征为无需汉字知识也能识别的简单几何特征,不具备汉字教育背景者也能掌握使用本发明所涉及的方法、方案。
技术实现要素:
从视觉特征来说,汉字本质是数量不等的几何线段(笔画)构成的二维平面图案。构成汉字的不同笔画组构出框形、围形、交叉、“八”形、倒“八”形、侧“八”形、“人”形等多种几何构形。
本发明所称汉字中笔画构形指的是由汉字笔画(线段)组构而成、不需要汉字知识也能识别的几何构图或几何构形,主要包括但不限于以下构形:
1、框构形,汉字构图中所有多个笔画组成的封闭构形:
单框:结构只有一个封闭框形,例字:“口、国、户、巨、共、又、文、凹、凸、及”等;
组框:单框被分割成多个框或不同结构多个框连为一体,例字:“日、中、且、毋、那、再、要”等:
2、“人”构形,此合指“八”、“人”、“乂”三个左撇(左弯钩)右捺(右弯钩)组合构形:
“八”形:左撇右捺分离呼应构型及扩展构形,例字:“八、六、灬、糹、小、亦、忝、心、州”等:
“人”形:左撇右捺相连或呼应构型及扩展构形,例字:“人、内、春、塞、木、兼、入、走”等;
“乂”形:对斜交叉构形,例字:“交、又、丸、戈、史、女、廴、犭”等。
约定特定笔画构形为有效特征,根据每个汉字所包含有效特征的不同情况,按特定规则可以将汉字分为可用数字0~9代表的十类,实现数字化分类管理汉字。
约定框构形为有效特征(可以约定当整个汉字只有一个框构型时,组框按包含单框数计算特征数),框构形对汉字的覆盖率只有约六成,可以增加其它笔画构形为有效特征,如增加“人”构形为有效特征(“乂”形与框构形冲突只计框形)。按以下步骤获得汉字分类数字代码:
1、计算目标汉字包含的有效特征数量,数量为零至三个则用相应数字0~3代表,数量超过三个,一律算四,从而使得所有汉字分别获得0~4五个不同代码之一;
2、看目标汉字是否有表露到底部的露锋竖笔画(如“十”的竖笔)、或底部表露的任一端露锋横笔画(该横笔画不被其它笔画交叉及向下的方向不被其它笔画连接,如“上”的底部横笔),如有,则上一步获得的汉字数字代码加上5,相应得到一个6~9的数字代码;否则保持原代码。
步骤2可以改为根据其它特征如目标汉字是否包含表露到底部的钩笔画或各面首、末笔画特征等决定步骤1获得的数字是否加5得到相应分类代码。
由此,每个汉字都将获得一个0~9的数字代码。换而言之,全部汉字或特定汉字集中所有汉字,都可以通过本方法,分类为代码分别为0~9的十类。
例:中——代码为6——(一特征加锋笔:1+5=6);
华——代码为5——(零特征加锋笔:0+5=5);
汉——代码为1——(一特征无锋笔:1);
字——代码为0——(零特征无锋笔:0)。
本分类输入方法作为其他输入法的辅助方法时,可以显著提高其效率。例如作为全拼输入法的辅助输入,则基本集多达111字的yi拼音同码字,经过本方法进一步分类,得到如下分类结果,显然大大分化了同码字,将有效提高实际输入效率:
0:翊衣疙弋铱艺迤屹乙已钇
1:亦矣射苡蛇疫诒饴逸以义诣议易埸毅圯呓酏
2:熠翳夷痍奕食意癔遗荑旖薏镱嶷舣蚁蛾邑蜴挹黟眙贻疑
3:翼姨猗懿漪胰咦噫臆
5:羿翌衤沂依仡一亿抑
6:驿宜弈瘗壹移谊佚轶仪泄刈医异伊役译殪绎忆峄
7:咿颐裔倚益肄溢镒劓佾缢怡揖怿
8:彝椅嗌悒
同理,输入法词库越大,同码词大量增加,引入本发明方案作为补码同样能大大提高实际输入效率。
具体实施方式 以上述方法建立汉字集分类数字代码表,如作为其它输入法汉字编码的辅助码,则将分类数字代码附加在原汉字编码后,通过系统建立数字代码与物理键盘中约定键的映射关系,将汉字代码1、2、3、4、5、6、7、8、9、0分别映射到标准英文键盘a、s、d、f、g、h、j、k、l、m键或q、w、e、r、t、y、u、i、o、p键,或其它约定字母键序列,或数字键盘相应的数字键,从而通过键盘相应键位输入目标汉字数字代码,通过系统转换输出代码相应汉字,如果相应汉字不止一个,再通过翻页查找及序号键选,最终完成目标汉字输入。