专利名称:认字码编码方法及其输入键盘的制作方法
技术领域:
本发明涉及一种汉字输入法,特别是一种拼形组字、拼形组词的汉字编码方法及其输入键盘。
随着计算机的应用技术渗入到各行各业,中文汉字输入技术也应运而生,从难到易、从繁到简,正日趋完善,目前常用的汉字编码法主要有形码与音码两大类,音码地优点在于无需专门培训,只要熟悉汉语拼音即可编码输入汉字,但其缺点是重码率高,且南方人常读不准音,这都给音码输入带来困难。形码的优点是重码少,输入速度快,其缺点是键盘记忆量大,需进行专门培训才能使用,为此许多科技工作者在如何简化编码、优化输入键盘方面进行了不懈的探索。1985年4月,王永民发明的“优化五笔字型编码极其键盘”(其申请号为85100837,审定号为CN1003326B)一经问世,便受到人们的青睐,发明者综合语言文字学、计算机科学、信息科学、工程心理学等多学科的知识,提出了“五笔四型”和“字词兼容技术”等一系列新的字形编码原理,其字根体系的规律性强、码长短、重码少、直观易学,键盘设计符合人机工程学原理,便于盲打,输入效率高,其使用者已风行国内。但由于其字根是自己造的,且大部分是大家所不熟悉的,量大,故不便记忆,其拆字规则有二义性,故给学习带来困难,而且输入不符合文字教学规范,现教委规定在中小学生中不能推广使用这种方法。
为了克服上述不足,本发明的目的是提供一种改进的形码编码及其输入键盘,特别是一种拼形组字、拼形组词的汉字编码方法及其输入键盘,使其拆字规则完全符合文字教学规范,大部分部件都是大家熟悉的部首,且部件少,其编码规则无二义性,好学易记,大大提高了汉字的输入速度,便于在中小学生、机关干部、管理人员中广泛推广使用这种方法。
本发明的目的是由下述方案来实现的。
本发明是一种拼形组字、拼形组词的汉字编码法及其输入键盘,它是在现有技术基础上进行改进的一种编码方法及其输入键盘,以达到好学易记,提高汉字输入速度的目的。本发明的编码方法是1)按汉字的形体结构将汉字分为(1)独体字形、(2)上下字形、(3)上中下字形、(4)左右字形、(5)左中右字形、(6)半包围结构字形;2)根据汉字的形体结构依一定原则对汉字按区划分取码,其码长最多为四码;3)若一个汉字的码长不足四码时,则补上一个字型笔画识别码;4)若还不足四码,击一下空格键以示结束。
其输入键盘设计为利用计算机键盘上A~Z26个键,根据与字母A~Z音关联或形关联将各部件归入对应的字母键中,以形成的拼形组字、拼形组词的汉字编码及其输入键盘。
本发明具有下列优点1)编码规则简单、明确。键盘部件量少,且大部分是大家所熟悉的部首,好学易记;2)编码容量大,包括全部字库汉字及词组,易于扩充;3)编码唯一,重码率低,并且有简便的区分重码的方法;4)编码规则无二义性,同一个汉字只有一个确定的编码;5)直观形象,输入和写字笔顺完全一致,符合文字教学规范;6)输入速度快。
以下将通过具体实施例对本发明做进一步的详细描述。
图1为汉字形体结构图。
图2为字型笔画识别码与键盘对应表。
图3为含插(キ)部件不足四码汉字编码图。
图4为输入键盘设计图。
如图1所示,汉字按其形体结构可分为独体字型、上下字型、左右字型、左中右字型及半包围字型,其中,1)上下字型是指(1)上下部以“部首”或“字”划分,上部最少由二个基本笔画组成,(2)上部或下部再分成左右部分,以明显空间分隔为准,属于该字型的,可将汉字分为二部分、或三部分、或四部分,如忠、想、霜、晶;2)上中下字型是指上下部以“部首”或“字”划分,“字”能分不合,上部或下部是“字”或“部首”归一部分,其余归中间部分,中间是“字”或“部首”归一部分,属于该字型的,可将汉字分为三部分,如意、戴、虎;3)左右字型是指(1)左右部分以明显空间分隔为标志,(2)左边或右边再分上、下部分,以“字”划分,上部字“小”优先,下部字“大”优先,上部是字其余归下部,下部是字,其余归上部,上、下都有“字”其余中间归上部,属于该字型的,可将汉字分为二部分、或三部分、或四部分,如配、趾、错、韶;4)左中右字型是指(1)以明显空间分割三部分,(2)中间部分再分上下部与左右字型,再分上下部方法相同,属于该字型的,可将汉字分为三部分或四部分,如谢、微。对独体字型及半包围字型的规定与现有字型相同,属于独体字型的,可将汉字分为一部分,属于半包围字型的可将汉字分为一部分或两部分。
在分清汉字的形体结构且将汉字分为几部分后,依一定原则对汉字的各部分取码,其取码原则是1)对于只可分一部分的汉字,如独体字,则按笔顺取码,末码必须是末笔画组成的最大部件代码,如“国”,可取冂、王、丶、一;2)对于可分二部分的汉字,如上下字型、左右字型,则第一部分最多取三码(不足三码,有多少取多少),余下第二部分取,取完为止,如“躬”,可取丿、丨、
、弓,“赤”,可取土、丿、丨、、ハ;3)对于可分三部分的汉字,如上下字型,上中下字型、左右字型、左中右字型,则第一部分取二码(只一码就取一码),前面部分没取完,后部分补,每部分最少一码,如“敞”可取v、丨、、ㄨ,“编”可取纟、丶、尸、艹;4)对于可分四部分的汉字,如上下字型、左右字型、左中右字型,则每部分各取一码,如“歌”可取一、一、ク、人。此外,对部件应取大优先,而以基本部件为单位,按笔画连续能写成最大部件优先选用,且笔画相交应全取,即除键盘部件外,凡遇到笔画相交,不管什么形状,多少笔画,相交部分整体提取,分别用叉(ナ)或插
部件代替,所谓叉(ナ)部件是指两笔画交叉的部件,如“皮”、“巾”等。所谓插
部件是指一笔画与两笔画或两笔画以上交叉,有两个或两个以上交叉的部件,例“丰”。
若一个汉字的码长不足四码时,则补上一个末笔字型识别码,此识别码是由汉字结构类型及末笔画代码组成的,汉字结构类型可分为三大类1)上下结构字型(包含上中下字型)和独体字型,2)半包围字型,3)左右结构字型(包含左中右字型);末笔画使用六种基本笔画横(一)、竖(丨)、撇(丿)、捺(丶)、折()(即完全向左包围,如、
、、フ、
)、弯(ㄥ)(即只要其中有向右方向包围,如
ㄥ、ㄅ、z)、末笔画代号取自输入键盘中字母键A~Z的一部分,如图2所示,将末笔画横(一)、竖(丨)、撇(丿)、捺(丶)、折()、弯()按顺序从右向左安排在键盘的中间位置,即分别与字母键J、H、G、F、D、S对应,1)属于半包围字型的,按中间一排笔画与末笔画对应,取本身所在键字母代替,如“闯”字,末笔画是横(一),则识别码取J码;2)属于上下字型及独体字的,按中间一排笔画与该字末笔画对应,取该笔画上一排对应字母代替,如“穷”字,其末笔画是撇(丿),则识别码取T码;3)属于左右字型的,按中间一排笔画与该字末笔画对应,取该笔画下一排对应字母代码,如“机”字,末笔画是ㄥ,则识别码取X码。此外,(1)若左右字型部件“耳”、“阝”在字首时,不补识别码;(2)若编码中有插
部件不足四码则不补识别码,将插
部件按笔顺以键盘上最大部件分解,进行补码、补码最后一码必须是插
部件末笔画组成最大部件,如果一个汉字有两个插
部件,只分解后一个插(
)部件,如图3所示,“电”字其部件为丨、
,插
部件分解为彐、L。
输入键盘设计为利用计算机键盘上A~Z26个键,根据与字母A~Z音关联或形关联将各部件归入对应的字母键A~Z中,如图4所示,各部件所对应的字母键代码是
G 夕犭丿彡冖宀
F 广立辛丶亠
D 大马巴由
マ
S 耳阝礻衤L厶
巛
A 车西央夫羊
H 上止门目丨
J 王田雨一
K 子孑九石厂ナ
L 火米灬古辶廴
M 山贝几冂
N 皿罒方三讠圭
B 二禾彳夂
V 未末中疒冫丬丷
C 力七匕弓西纟幺乡
X 女文又ㄨ彐
Z 已乙尸习心忄卩己
Y 水氺氵小
U 工艹廾
刀
I 木
戈
O 口
P 土士
T 手扌寸十
R 人八
亻
E 儿斤
豕化瓜
W 月
爫
Q 日白虫
リ
例如对于汉字“繁”,其部件为
小,编码为BABY。
权利要求
1.一种认字码编码方法,它是一种拼形组字、拼形组词的汉字编码法,其特征是其编码方法是1)按汉字的形体结构将汉字分为(1)独体字型、(2)上下字型、(3)上中下字型、(4)左右字型、(5)左中右字型、(6)半包围字形;2)根据汉字的形体结构依一定原则对汉字按区划分取码,其码长最长为四码;3)若一个汉字的码长不足四码时,则补上一个字型笔画识别码;4)若还不足四码,击一下空格键以示结束。
2.根据权利要求1所述的认字码编码方法,其特征是1)上下字型是指(1)上下部以“部首”或“字”划分,上部最少由二个基本笔画组成,(2)上部或下部再分成左右部分,以明显空间分隔为准,属于该字型的,可将汉字分为二部分、或三部分、或四部分;2)上中下字型是指上下部以“部首”或“字”划分,“字”能分不合,上部或下部是“字”或“部首”归一部分,其余归中间部分,中间是“字”或“部首”归一部分,属于该字型的,可将汉字分为三部分;3)左右字型是指(1)左右部分以明显空间分隔为标志,(2)左边或右边再分上、下部分,以“字”划分,上部字“小”优先,下部字“大”优先,上部是字其余归下部,下部是字,其余归上部,上、下都有“字”其余中间归上部,属于该字型的,可将汉字分为二部分、或三部分、或四部分;4)左中右字型是指(1)以明显空间分割三部分,(2)中间部分再分上下部与左右字型,再分上下部方法相同,属于该字型的,可将汉字分为三部分或四部分。
3.根据权利要求1所述的认字码编码方法,其特征是对汉字按区划分取码原则是1)对于只可分一部分的汉字,则按笔顺取码,末码必须是末笔画组成的最大部件代码;2)对于可分二部分的汉字,则第一部分最多取三码(不足三码,有多少取多少),余下第二部分取,取完为止;3)对于可分三部分的汉字,则第一部分取二码(只一码就取一码),前面部分没取完,后部分补,每部分最少一码;4)对于可分四部分的汉字,如上下字型、左右字型、左中右字型,则每部分各取一码。
4.根据权利要求3所述的认字码编码方法,其特征是对部件应取大优先,即以基本部件为单位,按笔顺连续能写成最大部件优先选用。
5.根据权利要求3所述的认字码编码方法,其特征是笔画相交应全取,而除键盘部件外,凡遇到笔画相交,不管什么形状,多少笔画,相交部分整体提取,且分别用叉(ナ)或插
部件代替。
6.根据权利要求5所述的认字码编码方法,其特征是叉(ナ)部件是指两笔画交叉的部件。
7.根据权利要求5所述的认字码编码方法,其特征是插
部件是指一笔画与两笔画以上交叉,有两个或两个以上交叉的部件。
8.根据权利要求1所述的认字码编码方法,其特征是其字型笔画识别是汉字结构类型及末笔画代码组成的,汉字结构类型可分为三大类1)上下结构字型(包含上中下字型)和独体字型,2)半包围字型,3)左右结构字型(包含左中右字型);末笔画使用六种基本笔画横(一)、竖(丨)、撇(丿)、捺(丶)、折()、弯()、末笔画代号取自输入键盘中字母键A~Z的一部分,将末笔画横(一)、竖(丨)、撇(丿)、捺(丶)、折()、弯()按顺序从右向左安排在键盘的中间位置,即分别与字母键J、H、G、F、D、S对应,1)属于半包围字型的,按中间一排笔画与末笔画对应,取本身所在键字母代替,末笔画是横(一),则识别码取J码;2)属于上下字型及独体字的,按中间一排笔画与该字末笔画对应,取该笔画上一排对应字母代替,其末笔画是撇(丿),则识别码取T码;3)属于左右字型的,按中间一排笔画与该字末笔画对应,取该笔画下一排对应字母代码。
9.根据权利要求8所述的认字码编码方法,其特征是若左右字型部件“耳”、“阝”在字首时,不补识别码。
10.根据权利要求8所述的认字码编码方法,其特征是若编码中有插
部件不足四码则不补识别码,将插
部件按笔顺以键盘上最大部件分解,进行补码、补码最后一码必须是插
部件末笔画组成最大部件,如果一个汉字有两个插
部件,只分解后一个插
部件。
11.一种认字码的输入键盘,它包含计算机用的输入键盘,其特征是利用计算机键盘上A~Z26个字母键根据与字母A~Z音关联或形关联将各部件归入对应的字母键A~Z中,其各部件所对应的字母键代码是
G
犭丿彡冖宀
F 广立辛丶亠
D 大马巴由
S 耳阝礻衤L厶
A 车西央夫羊
H 上止门目丨
J 王田雨一
K 子孑九石厂ナ
L 火米灬古辶廴
M 山贝几冂
N 皿罒方三讠圭
B 二禾彳夂
V 未末中疒冫丬丷
C 力七匕弓西纟幺乡
X 女文又ㄨ彐
Z 已乙尸习心忄卩
Y 水氺氵小
U 工艹廾
刀
I 木
戈
O 口
P 土士
T 手扌寸十
R 人八
亻
E 儿斤
钅 豕化瓜
W 月
爫
Q 日白虫
リ
全文摘要
本发明提供一种认字码编码方法及其输入键盘,其编码方法是按汉字的形体结构将汉字分为6种字型,然后根据一定原则对汉字取码,其码长最长为四码,若不足四码时,则补上一个识别码,若还不足四码,击空格键以示结束,其输入键盘设计为:利用与字母音或形关联将各部件归入对应的字母键中,形成拼形组字、拼形组词的汉字编码法及其输入键盘,本发明具有编码规则简单,键盘部件量少,好学易记,编码规则无二义性,输入速度快,易于推广使用。
文档编号G06F3/023GK1193763SQ9610164
公开日1998年9月23日 申请日期1996年1月27日 优先权日1996年1月27日
发明者陈茂淦, 高水英 申请人:陈茂淦, 高水英