汉字简易码输入方法

文档序号:6342883阅读:455来源:国知局
专利名称:汉字简易码输入方法
技术领域
本发明涉及一种用于将要处理的中文信息转变成为计算机等能够处理的编码形式的手动输入方法,具体地说,是指一种汉字简易码输入方法。
背景技术
对中国人而言,学习汉字输入法是使用计算机的必备条件。上世纪八十年代初,“五笔字型”输入法的研究成功,标志着汉字无法输入电脑的时代结束。其后国内汉字输入技术的研究开发仍在不断进行。目前国内最流行的汉字输入法,主要有形码和拼音两大类。以“五笔字型”为代表的形码方案的优点是一是重码率极低,输入速度极高,二是不认识的字也能打出来;但其缺点是编码规则较复杂,记忆量大,尽管专门打字员由于打字速度的要求都是学习“五笔”,但对于打字速度要求不高的非专业人员,常常将学习“五笔”视为畏途。拼音码是目前实际使用人数最多的汉字输入方法。它的最大优点是容易学习掌握,学会后不易忘记,操作简便,但其缺点也是明显的一是重码率极高,仅在国标一、二级常用6000多汉字中,拼音“JI”的重码字就有93个,模糊音组拼音“Z(H)I”的重码字更高达110个,在重码太多时,就必须通过多次翻页才能找到所需汉字,这就大大影响了汉字的录入速度;二是不会发音的汉字无法输入。目前一些新开发的拼音输入法,增加了智能处理和词语输入的功能,提高了输入速度,但仍不能根本消除重码多的困扰,也无法解决不会读音的汉字的输入问题。总之,时至今日,汉字输入法的“好学与好用”这对基本矛盾并没有能根本解决,现实的需要推动着众多的研究者投入新的汉字输入法的研究。
实际上,汉字输入法编码方案除了上述的“音码方案”和“形码方案”,还有一类“音形码”方案。它是根据汉字的字形和拼音的综合特性来进行编码,其易学性、重码率和输入速度一般来说是介于音码和形码之间,对于广大的对输入速度要求不是很高的非专业人士应该是最有前途的方案。但目前公布的“音形码”方案虽多,却几乎没有一种进入输入法的主流中。原因仍是编码规则过于复杂,输入速度既不能与“全形码”竞争,又因规则过繁难以吸引目前使用“拼音码”的用户,便只能游离在主流之外了。

发明内容
为了解决现有汉字输入法编码规则过繁难学或重码率过高、输入速度过慢的问题,本发明的目的,乃是提供一种编码规则简单而易学易记、重码率低、输入速度快的汉字简易码输入方法。
本发明采用的技术方案如下(1)采用部分省略韵母字母以及将模糊音统一编码的方法对现有全拼编码进行简化,具体说来是(i)汉语拼音一般由声母+韵母组成,将原有全拼编码中的声母保留,韵母则只保留一个,拼音以-n或-ng结尾的汉字则另加n为编码,零声母汉字则取其前两位拼音码,如只有一位拼音码,则取一位;(ii)对“模糊音”进行统一编码,即C,CH→C;S,SH→S;Z,ZH→Z;N,NG→N;ü,U→U;L,N→L;H,F→F;(iii)简化的拼音码后加1-2位形码作为重码字的检索码;(2)采用以拼音首母为字根编码的方法并大量使用联想字根编码法。该法采用26个英文字母作为编码元件,以字母V做为万能学习键,其余25个字母都用作拼音码,编码方法同一般的全拼码,唯一的区别是韵母ü采用u键,而非V键;使用除V字母键以外的其它25个字母键的全部或部分作为字根编码,具体编码方法是(i)成字字根直接采用该字拼音声母为编码;(ii)非成字字根主要采用其组成或形似的常用字拼音声母或部首命名字拼音声母为编码;(iii)笔划采用其读音或命名汉字声母为编码(iV)个别部首字根采用与其形似的字母为编码;(V)同组的联想字根取用基本字根编码。
本发明通过采用部分省略韵母以及将模糊音统一编码的方法对现有全拼编码进行简化后,使得本方法“音形码”编码的拼音部份只有2-3码,再加上一个形码为检索码,本方法单字的总编码数不大于4个,小于全拼编码的最多6个(实例见后文表1);由于引入形码检索,本法“音形码”的重码率远低于一般的拼音码,输入速度更快。与其它汉字输入法相比,本方法大量采用了形似字根同组统一编码的方法(本法称之为同码联想字根),大大减小了全形码或形音码中字根拆分的难度,减少了记忆量。
本发明的有益效果是方法简单但又多功能,易学易记,可以利用音形码对汉字及常用词语进行直接输入,重码率远低于一般的拼音码,对常用汉字都勿须翻页查找。对于不知读音的非常用字或对重码率、输入速度要求较高的专业人员,可以选择本方法全形码(或形音码)进行高速盲打输入。本方法可在软件中同时备有拼音字库,对于字型、检索码都记不清的汉字又可以全拼音输入。本方法还在软件中备有强大的“词(语)库”,可进行词汇(短语及句子)的直接输入。利用先进的汉字输入方法平台,本方法还可以进行语句的自动记忆与输出。本发明方法特别适合目前采用传统全拼输入法的电脑操作者或有一定拼音基础的新学者使用,并可广泛用于电脑(掌上电脑)、手机、智能电话等设备输入汉字。
具体实施例方式
按照前述本发明的技术方案,全拼码简化后并加检索码的汉字编码实例见后表1。完整的汉字简易音形码,由表1中的简化拼音码+检索码组成,如“唱”字由CANK组成。本发明字根(检索码)编码方法举例见表2,该表说明,除了个别字根是按照与其形似的字母取码外,绝大多数字根都是采取字根汉字或相关汉字的拼音声母作为编码。正因为这样,对于有一定拼音基础或过去就是使用拼音输入法的使用者来说,非常容易记忆,也不必强行记忆编码在键盘上的位置,见字就知音,知音就知字母,知字母就知键位。无论是电脑的标准键盘,或是手机的少键键盘,都可以按照键盘上标注的字母,顺利输入汉字编码,如同一般的拼音法一样。
按照前述本发明的技术方案,使用除V字母键以外的其它25个字母键的全部或部分作为字根编码,而后述表3则是采用B、C、D、E、F、G、H、I、J、K、L、M、P、Q、R、S、T、W、X、Y、Z这21个字母键作为字根编码的实施例。该简易码字根编码汇总表3共有213个基本字根和330个同码联想字根。字根数目虽多,但由于基本上是按照相关汉字声母取码,并联想扩大,实际上很易记忆,一般有一定拼音基础的人看一遍就能大部掌握,剩余的也不一定要死记硬背。由于本方法的软件中采用逐渐提示的方法,只要掌握了拼音简码,对少数字(词),即使不熟悉检索码,也可查到该字及其检索码,在使用中逐步积累学习。为了进一步说明这一点,后述简易码字根编码表4还就表3中键盘字母B、C、D所包含的字根编码方法,同码联想字根及汉字实例进行了举例说明。这里还需补充说明的是,对于部分高频使用的字根,也可使用上述21个字母键实施例中未使用的字母键A、N、O、U来进行替换编码,以降低重码率,与此相关的编码实施例见自定义字根编码表5。但由于部分突破了以汉字拼音声母编码的规则,故加大了使用者的强制记忆量。
本发明在前述技术方案的基础上,还可在全形码和形音码的编码方式中,突破传统编码方法中字根一般不进行二次拆分的惯例(有的只利用字根的部分笔划作为识别码),允许对字根二次拆分(不仅是拆为笔划),这样就不必制定复杂的“识别码”规则,用于成字字根及字根数少于4个的汉字编码。其具体规定是(1)成字字根编码=字根码+该字根二次拆分首码+二次拆分尾码(二级简码字则尾码省略);(2)可拆分字根数少于4个的汉字,必要时取其末位字根的二次拆分尾码为补充码;(3)少数不便拆分的字根重复取字根码为拆分首码或尾码。对字根进行二次拆分的实施例见后面的字根拆分编码实施例表6。
本发明在前述技术方案的基础上,还可多方案编码,同字库混用,操作者可以根据自己的操作习惯和工作性质灵活选用。采用上述的简化拼音编码和字根编码,本发明提供了多方案的编码字库,包括简化全拼码(标准全拼仅进行模糊音统一简化编码);简化全拼+检索码;音形码(简化拼音+检索码);三键形码(仅用于拼音及音形码使用中少量不知读音的难字检索);形音码(汉字声母+三键形码)及全形码(最多四码)。其中前四种方案的字库混编于一个字库中,操作者不需按切换键,就可以根据自己的操作习惯、熟练程度和工作性质灵活选用。部分汉字的多方案编码举例见汉字多方案编码实例表7。
表1 汉字简易码编码实例

表2 字根(检索码)编码方法示例表

表3 简易码字根编码总表

表4 “简易码”字根编码表

表5 自定义字根编码表

表6 字根拆分编码实例表

表7 汉字多方案编码实例表

权利要求
1.一种汉字简易码输入方法,其特征在于(1)采用部分省略韵母字母以及将模糊音统一编码方法对现有全拼编码进行简化,具体说来是(i)汉语拼音一般由声母+韵母组成,即对原有全拼编码中的声母保留,韵母则只保留一个,拼音以-n或-ng结尾的汉字则另加n为编码,零声母汉字则取其前两位拼音码,如只有一位拼音码,则取一位;(ii)对“模糊音”进行统一编码,即C,CH→C;S,SH→S;Z,ZH→Z,N,NG→N;U,ü→U;L,N→L;H,F→F;(iii)简化的拼音码后加1-2位形码作为重码字的检索码;(2)采用以拼音首母为字根编码的方法并大量使用联想字根编码法,该法采用26个英文它母作为编码元件,以字母V做为万能学习键,其余25个字母都用作拼音码,编码方法同一般的全拼码,唯一的区别是韵母ü采用u键,而非V键;使用除V字母键以外的其它25个字母键的全部或部分作为字根编码,具体编码方法是(i)成字字根直接采用该字拼音声母为编码;(ii)非成字字根主要采用其组成或形似的常用字拼音声母或部首命名字拼音声母为编码;(iii)笔划采用其读音或命名汉字声母为编码(iV)个别部首字根采用与其形似的字母为编码;(V)同组的联想字根取用基本字根编码。
2.根据权利要求1所述的汉字简易码输入方法,其特征在于,在其全形码和形音码的编码方式中,允许对字根进行二次拆分,其具体规定是(1)成字字根编码=字根码+该字根二次拆分首码+二次拆分尾码;(2)可拆分字根数少于4个的汉字,必要时取其末位字根的二次拆分尾码为补充码;(3)少数不便拆分的字根重复取字根码为拆分首码或尾码。
全文摘要
本发明为一种汉字简易码输入方法。其特点是拼音部分采用部分省略韵母以及将模糊音统一编码的方法进行简化,简化的拼音码后加1-2位形码作为重码字的检索码;采用以拼音首母为字根编码的方法,并大量使用联想字根编码法,采用26个英文字母作为编码元件,以字母V作为万能学习键,其余25个字母都用作拼音码;使用除V字母键以外的其它25个字母键的全部或部分作为字根编码;在其全形码和形音码编码方式中,允许对字根进行二次拆分.本发明方法编码规则简单,易学易记,便于使用者学习掌握;与原有全拼输入法相比,其码长缩短,重码率低,输入速度快,功能全面,可广泛应用于电脑(掌上电脑)、手机、智能电话等设备的汉字输入。
文档编号G06F3/023GK1700149SQ200410023230
公开日2005年11月23日 申请日期2004年5月21日 优先权日2004年5月21日
发明者周良才 申请人:周良才
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1