专利名称:基于字形结构的汉字输入方法
技术领域:
本发明涉及计算机汉字输入编码方法,更具体地说,涉及一种利用字、词的结构笔画特征实现计算机汉字输入的编码方法。
在已有的汉字输入法中,以全拼、双拼为代表的“音码”输入,其特点是记忆量少,比较好学,但重码率高、输入速度慢,不能实现盲打。而以五笔字型为代表的“形码”输入法由于选择字根的因素,重码率相对降低,速度提高,但记忆量很大,难学易忘。
本发明的目的在于提供一种新的基于字词结构笔画特征的汉字输入方法,这种输入方法利用汉字的结构和笔划特征进行编码,所有汉字只需要对其型有一定了解便可输入。
本发明的目的是这样实现的,构造一种基于字形结构的汉字输入方法,用于将至少包括二级国标汉字在内的较大汉字集合中的每一个汉字及常用词组,通过一定步骤转换成可以输入到计算机并为其所识别的汉字编码,所述汉字编码集合包含英文26个字母,所述一定步骤包括将欲输入汉字的字或词的结构及笔划特征形进行分析并从中抽取出几个汉字部件的步骤、将取出的几个汉字部件中的每一个分别映射到一个汉字编码集合中的一个的步骤、逐个输入得到的汉字编码到计算机的步骤,其特征在于所述将欲输入汉字的字或词的结构和笔划特征进行分析并抽取出几个汉字部件的步骤中用到的汉字部件包括26个笔画部件和26个部首部件,所述26个笔画部件及部首部件与编码字母的对应关系包括
按照本发明提供的基于字形结构的汉字输入方法,其特征在于,在对独体结构汉字编码时,所述欲输入汉字包含除横、竖、撇、点以外的笔划时,选取首笔划、所有的横、竖、撇、点以外的笔划以及末笔划,所述欲输入汉字仅包含横、竖、撇、点笔划时,则按笔画顺序选取其第一笔划、第二笔划和末笔划。
按照本发明提供的基于字形结构的汉字输入方法,其特征在于,所述欲输入汉字为上下、左右或包围双结构时,对其中的上部或左部或包围部,先选取横、竖、撇、点以外的一个笔划,如没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划;对剩下的下部或右部或被包围部,如果包含除横、竖、撇、点以外的笔划时,选取首笔划、所有的横、竖、撇、点以外的笔划以及末笔划,否则,则按笔画顺序选取其第一笔划、第二笔划和末笔划。
按照本发明提供的基于字形结构的汉字输入方法,其特征在于,所述欲输入汉字为上中下、左中右结构时,对其中的上部或中部或下部或左部或中部或右部,每个部分的笔划选取是这样的优先选取横、竖、撇、点以外的一个笔划,如没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
按照本发明提供的基于字形结构的汉字输入方法,其特征在于,在输入2-4字的词组时,对组成词组的每一个汉字的各个结构部分选取一个笔划进行编码,其选取是这样进行的优先选取该部分中横、竖、撇、点以外的一个笔划,如该部分没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
按照本发明提供的基于字形结构的汉字输入方法,其特征在于,在输入由5个或5个以上的字组成的词组时,对组成词组的每一个汉字选取一个笔划进行编码,其选取是这样进行的优先选取该部分中横、竖、撇、点以外的一个笔划,如该字没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
按照本发明提供的基于字形结构的汉字输入方法,其特征在于,在输入编码时,利用键盘上空格键来表示字词输入的结束。
实施本发明的基于字形结构的汉字输入方法,特点是最容易学,几乎不学就可以掌握,并且学会后不会忘记,不产生人为的字形部件,无须对人为的字形部件及其编码进行记忆,记忆量少;虽然码长不定,但在对二级字库的6791个汉字的编码结果显示在,平码长为3.66,有重码408个,重码率为6%,词的输入也为输字同规则,特别适合于非专职非专业人员使用。
结合实施例,进一步说明本发明的特点。
本发明提供的基于字形结构的汉字输入方法仅仅利用汉字结构笔划特征来实现其编码输入,它不同于表形码,表形码是利用汉字笔画组成特征元-字根作为原始件;也不同于″大众音形码″这种既要用音又要用形的混合编码方案。1.笔划编码本发明的基于字形结构的编码依据是组成汉字的最基本部件即笔画及常用部首。笔划及部首部件的编码规则如下
2.独体字输入有两种情况第一种情况,该汉字包含除横、竖、撇、点以外的笔划时,则选取首笔划、所有的横、竖、撇、点以外的笔划以及末笔划,例如输入汉字″乘″,选取首笔划″撇″、所有的横、竖、撇、点以外的笔划″提″、″竖弯勾″、以及末笔划″捺″,即
相应编码为″RIBU″。
第二种情况,该汉字仅包含横、竖、撇、点笔划时,则按笔画顺序选取其第一笔划、第二笔划和末笔划。例如输入汉字″主″,选取其第一笔划″点″、第二笔划″横″和末笔划″横″,即被泵码的笔划串为
相应编码为″GYY″。3.上下、左右或包围双结构汉字的输入先选取第一部分的笔划,再选取第二部分的笔划。对其中第一部分的上部或左部或包围部,先选取横、竖、撇、点以外的一个笔划,如没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划;对剩下的第二部分的下部或右部或被包围部,如果包含除横、竖、撇、点以外的笔划时,选取首笔划、所有的横、竖、撇、点以外的笔划以及末笔划,否则,则按笔画顺序选取其第一笔划、第二笔划和末笔划。例如输入汉字″伟″,左部选
右部选
将″
″进行编码的结果为″SYFT″。
又例,输入汉字″昔″,上部选
下部选
合起来的笔划为
编码为″YJJJ″。
又例,输入汉字″进″,包围部选
被包围部选
合起来的笔划顺序
相应的编码为″KYYT″。4.上中下、左中右三重结构汉字的输入对其中的上部或中部或左部或左部或中部或右部,每个部分的笔划选取是这样的;优先选取横、竖、撇、点以外的一个笔划,如没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
例如,输入汉字″例″,左部选
中部选一笔划
右部也选一笔划
合起来就是对
的编码″SDE″。5.词组输入编码分两种情况第一种情况,词组由2-3字组成,对组成词组的每一个汉字的各个结构部分选取一个笔划进行编码,其选取是这样进行的优先选取该部分中横、竖、撇、点以外的一个笔划,如该部分没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
例,输入词组″计算机″,各字分别有二部分、三部分和二部分,对其各个部分选取笔划规则为优先选取该部分中横、竖、撇、点以外的一个笔划,如该部分没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划,其结果为″计″选取
和
″算″选取
和
″机″选取
和
合起来的
的编码为″COWKYTX″。
第二种情况,词组由4个或4个以上的字组成,对组成词组的每一个汉字选取一个笔划进行编码,其选取是这样进行的优先选取该部分中横、竖、撇、点以外的一个笔划,如该字没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。例如,输入词组″深圳经济特区″,分别选取的各字的笔划为
编码为″OINUIM″。
权利要求
1.一种基于字形结构的汉字输入方法,用于将至少包括二级国标汉字在内的较大汉字集合中的每一个汉字及常用词组,通过一定步骤转换成可以输入到计算机并为其所识别的汉字编码,所述汉字编码集合包含英文26个字母,所述一定步骤包括将欲输入汉字的字或词的结构及笔划特征形进行分析并从中抽取出几个汉字部件的步骤、将取出的几个汉字部件中的每一个分别映射到一个汉字编码集合中的一个的步骤、逐个输入得到的汉字编码到计算机的步骤,其特征在于所述将欲输入汉字的字或词的结构和笔划特征进行分析并抽取出几个汉字部件的步骤中用到的汉字部件包括26个笔画部件和部首部件,所述26个笔画部件及部首部件与编码字母的对应关系包括
2.根据权利要求1所述的汉字输入方法,其特征在于,在对独体结构汉字编码时,所述欲输入汉字包含除横、竖、撇、点以外的笔划时,选取首笔划、所有的横、竖、撇、点以外的笔划以及末笔划,所述欲输入汉字仅包含横、竖、撇、点笔划时,则按笔画顺序选取其第一笔划、第二笔划和末笔划。
3.根据权利要求2所述的汉字输入方法,其特征在于,所述欲输入汉字为上下、左右或包围双结构时,对其中的上部或左部或包围部,先选取横、竖、撇、点以外的一个笔划,如没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划;对剩下的下部或右部或被包围部,如果包含除横、竖、撇、点以外的笔划时,选取首笔划、所有的横、竖、撇、点以外的笔划以及末笔划,否则,则按笔画顺序选取其第一笔划、第二笔划和末笔划。
4.根据权利要求1所述的汉字输入方法,其特征在于,所述欲输入汉字为上中下、左中右结构时,对其中的上部或中部或下部或左部或中部或右部,每个部分的笔划选取是这样的优先选取横、竖、撇、点以外的一个笔划,如没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
5.根据权利要求1所述的汉字输入方法,其特征在于,在输入2-3字的词组时,对组成词组的每一个汉字的各个结构部分选取一个笔划进行编码,其选取是这样进行的优先选取该部分中横、竖、撇、点以外的一个笔划,如该部分没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
6.根据权利要求1所述的汉字输入方法,其特征在于,在输入的词组由4个或4个以上的字组成时,对组成词组的每一个汉字选取一个笔划进行编码,其选取是这样进行的优先选取该部分中横、竖、撇、点以外的一个笔划,如该字没有横、竖、撇、点以外的笔划,则选取按笔划顺序取在先的横、竖、撇、点中的一个笔划。
7.根据权利要求1-6所述的汉字输入方法,其特征在于,在输入编码时,利用键盘上空格键来表示字词输入的结束。
全文摘要
本发明公开了一种利用汉字笔画结构来实现其编码输入的方法,这种输入方法根据汉字的结构选取相应部分进行笔划选取及编码,其特点是优先选取一些笔划,进行直接编码,从而使有效编码增加且缩短码长。这种汉字输入方法,特别是容易学,几乎不学就可以掌握,无须对人为的字形部件及其编码进行记忆,记忆量少;平均码长为3.66,词的输入也为输字同规则,特别适合于非专职非专业人员使用。
文档编号G06F3/023GK1205469SQ9710898
公开日1999年1月20日 申请日期1997年7月14日 优先权日1997年7月14日
发明者陈伟昉 申请人:陈伟昉