专利名称:音形统一黄金分割码汉字输入方法
技术领域:
本发明涉及一种汉字输入方法,特别是一种音形统一黄金分割码的汉字输入方法。
将中文信息迅速、高效地输入计算机,是发展中文信息系统的“瓶颈”技术,它制约着整个系统的工作效率。现有的计算机汉字输入方案基本分为以拼音为主和以字型为主两大类,前者要求使用者对每个汉字的发音都很准确,对于很多发音不够准确的使用者,例如大多数南方人很难区别平舌音与卷舌音、前鼻韵母与后鼻韵母,使用拼音输入时常常感到困难;大多数字型输入法又完全脱离了汉字的读音,使用者需要掌握很多笔型的编码(例如“五笔字型输入法”需要记忆180多个音型脱离的字根),还会遇到拆分困难的问题,不仅难于掌握,而且容易忘记一位能熟练掌握五笔字型输入法的专业打字员,脱离打字工作一段时间后,就需要重新记忆和训练。对于非专业人员,就更难掌握。同时,这些输入法中,用单码输入的“常见字”数量很少,大多数的字需要用四个甚至五个键输入,打字效率较低。据统计,汉语中双音词汇的数量为常用字数量的十倍以上,而现有的大多数汉字输入法没有特别重视双音词汇的简化输入问题。另外,大多数输入方法采用阿拉伯数字作为识别码,来区分重码字,而阿拉伯数字键在键盘的上方,使用时手指移动距离较远,影响输入速度。随着大陆与港、澳、台以及海外华人交往的增多,繁体字的使用越来越频繁,现在各种汉字输入方法,都是将简体字与繁体字分别设置在不同的字库里,无法在同一种输入方法中同时输入这两种汉字,十分不便。
针对现有汉字输入法的上述不足,本发明的任务是提供一种新的汉字输入方法,该方案能够实现字型与发音的和谐统一,同时大幅度提高单码及双码输入汉字的数量,使输入速度得到提高。本方案的使用者不需要记忆大量字根或部首的编码,而是利用人们读写汉字的原有习惯对汉字进行一次或二次分割,达到降低重码率的效果,同时避免因为发音不准或字型拆分困难带来的困扰。本方案还兼顾到字与词(特别是双音词)输入的便利,以及简体字、繁体字通用等问题。本发明还要提供一种解决重码字的新方法,以避免由键盘上方的阿拉伯数字作识别码所带来的问题。本方法还将繁体字与简体字统一进行编码,使用者可以随心所欲地选用两种字体,十分方便。由于重码率极低,本发明除作为汉字输入方法外,还作为字典检索或通讯电码使用。
完成上述发明任务的方案是音形统一黄金分割码汉字输入方法,按照使用频率,将所有汉字分为最最常用字、最常用字、一般常用字、不常用字以及词组,分别按以下步骤编码1、最最常用字一律用该字汉语拼音的第一个字母编成单码字,例如“的”、“大”、“地”、“动”、“多”、“得”、“当”等字均用D作为编码,组成D字库。对于这些重码字,采用距离手指位置很近的标点符号和其他符号代替阿拉伯数字作为识别码,可以提高输入速度。本输入法的识别码为,./;’[]等共七个。例如在D字库中,只输入D为“的”;输入“D,”为“大”;输入“D.”为“地”;输入“D;”为“动”;输入“D’”为“多”;输入“D[”为“得”;输入“D]”为“当”。用同样原理组成其他字库。见附表5。表中繁体字与简体字通用,而且字体越复杂,拆分与编码越容易。
2、最常用字编成双码字。编码的规则是将字分割成两部分(以下称为“字元”),用这两个字元名称的汉语拼音的第一个字母作为该字的编码。例如“张”分割成“弓”与“长”,编码为GC。吴分割成“口”与“天”,编码为KT。其余类推。
以上单码字180个,双码字1200个。基本涵盖了所有的最常用字。
3、一般常用字编成三码字。即按照双码字的分割方法将一个字分割成两个字元,得到前两个编码以后,对其中的一个字元,进行再次分割,用二次分割后得到的两个小字元中第一个字元名称的汉语拼音的第一个字母作为该字的第三个编码。例如“统”分割成“纟”与“充”,将“充”再分割成“云”与“儿”,其编码即为GCY(E),“封”分割成“圭”与“寸”,再分割成“土”与“土”,其编码即为GCT。余类推。
4、不常用字编为四码字与上述三码字的分割方法相同,但将二次分割后两个小字元的名称字母均用作编码,即得到四个字母的编码。例如“蛩”分割成“巩”与“虫”,再分割出“工”与“凡”,编码为GCGF。“缫”两次分割,先后得到“纟”、“巢”与“巛”、“果”,编码为GCCG。余类推。
字体分割的原则是(1)、尽量分割出两个有读音的字元,否则分割出一个有读音的字元和另一个没有读音的字元(称为“盲音”),用V作为盲音编码,无法分割出有音字元时,就分割成两个盲音字元。见附表1与附表3。
(2)、第二次分割的原则是一次分割出的两字元性质相同时,分割后一字元;两字元性质不同时,则按以下先后顺序选择其一分割①盲音字元,如 等;见附表3。
②赋音复合字元(也可称为近似字元),对于某些盲音字元,人为地赋予它读音,即用形态相近似字的读音来读该字元,如 等均为复合字元,编为F。又如 读为“奉”。见附表4③有音字身字元,如害、生等;见附表2。
④辅助部首字元,如ナ、メ等,均为交叉笔型,编为J,见附表1。
⑤部首字元,如大、力等。部首中的辶、廴均读为“走”。对其中最常用的七个部首字元,给予专用的编码其中艹(含 )定为A讠与言定为I月定为O水与氵定为U手与扌定为V木定为F纟定为G。
⑥部尾字元,位于字体下方或右方,并且使用频率较高的八个字元,定义为“部尾”如刂(读“刀”)、心等;⑦基本字元,即横、竖、撇、捺等不可再分的字元。例如“必”,分割成“心丿”其中的“丿”即为基本字元。
⑧对于某些字很明显能够分割成两个常用字元,但是在其中还多余了个别的笔画,则舍去这些多余的笔画。例如“候”分割成“亻 舍去中间的小竖。“学”分割成 子”,舍去其中的冖。
5、对于一笔成字的特例,则加DTZ(独体字),其中的常用字可只输DT,省略Z。例如“乙”编码为“GDT-Z”(-号表示其后的字母可省略)。两笔成字的特例,则分割得到两个编码后,常用字加该字读音的第一个拼音字母作为第三个码,例如“乃”编码为“GPN”。不常用字再加“字型码”为第四码。字型码规定如下交叉型为“J”;左右型为“Z”;上下型为“S”;外包型为“W”;半包型为“B”。例如“刂”编码为“SGDZ”。
以上各条的实例如“夯”分割成“大力”再将“力”分割成“ 丿”。编码为DLGP。“仁”两次分割成“亻二一-一”(其中的“一”读为“横”),编码为REHH。如“替”分割成“ 日夫夫”,编码为VRFF。见附表4。
5、双字词的标准编码是把词中的每个字都作为上述第2条“最常用字”的双码,组成四码作为词条的编码。对于其中部分常用的双字词,可以编为简化码,即双码(三字词为三码)取每个字汉语拼音的第一个字母作为编码,用符号键作为消除重码的识别码。其中“.”定为人名码,包括人的称谓,人身体上的部分等与人有关的词组;“;”定为动物码;“’”定为静物码;“/”定为常用字(或词)识别码。“[”定为天文、地理类词组以及地名码;“]”定为外来语及科技名词的识别码。
例如“实践”,分割成“宀头 ”编码为BTZJ。“真理”分割成“十具王里”,编码为SJWL。对于重码,可使用识别码,简化码的实例如“因为”是常用词,其编码为“YW/”;“所以”的编码为“SY/”。“朱德”是人名,编码为“ZD.”。“老虎”编码为“LH;”。“沉积岩”编码为“CJY]”。标准码加用识别码的实例如如“津贴”与“汉字”的四码UYBZ相同,“津贴”后可加“,”。“作家”与“住家”四码RZBS相同,其中“作家”为人的称谓,加识别码“.”。
7、其他多音词编码与现有编码相同。
本发明提供的汉字输入方法,能.够实现字型与发音的和谐统一,符合人们学习汉字时的思维习惯,所以易学好记,使用者不需要记忆大量字根或部首的编码,而是利用人们读写汉字的原有习惯对汉字进行一次或二次分割,达到降低重码率的效果。同时本方法只采用汉语拼音的第一个字母,输入时SH与S;CH与C;ZH与Z均不用输入H,避免了因为发音不准或字型拆分困难带来的困扰。本方法大幅度地提高了单码及双码输入汉字的数量,使输入速度得到提高。本方案还兼顾到字与词(特别是双音词)输入的便利,以及简体字、繁体字通用等问题。本发明提供了解决重码字的新方法,用标点符号作为识别码,手指运动距离小,输入速度可加快,避免了由键盘上方的阿拉伯数字作识别码所带来的问题。由于重码率极低,本方法输入速度很高,同时除作为汉字输入方法外,还作为字典检索或通讯电码使用。
实施例1单码字“的”、“大”、“地”、“动”、“多”、“得”、“当”等字均用D作为编码,组成D字库。只输入D为“的”;输入“D,”为“大”;输入“D.”为“地”;输入“D;”为“动”;输入“D””为“多”;输入“D[”为“得”;输入“D]”为“当”。
实施例2双码字。编码的规则是将字分割成两个字元,用这两个字元名称的汉语拼音的第一个字母作为该字的编码。例如“张”分割成“弓”与“长”,编码为GC。吴分割成“口”与“天”,编码为KT。
实施例3三码字。用二次分割后得到的三个字元中第一个字元名称汉语拼音的第一个字母作为该字的三个编码。例如“统”分割成“纟”与“充”,将“充”再分割成“云”与“儿”,其编码即为GCY(E),“封”分割成“圭”与“寸”,再分割成“土”与“土”,其编码即为GCT。
实施例4四码字二次分割后四个小字元的名称字母均用作编码。例如“蛩”分割成“巩”与“虫”,再分割出“工”与“凡”,编码为GCGF。“缫”两次分割,先后得到“纟”、“巢”与“巛”、“果”,编码为GCCG。
实施例5赋音复合字元,对于盲音字元,人为地赋予它读音,即用形态相近似字的读音来读该字元,如 等均为复合字元,编为F。又如 读为“奉”。
本发明的实施例还可参见附表中的各字。表1、黄金码部首字元分库表 注1、因复合赋音字元具有辅助部首字元的作用,故一并列入本表。
2、字元后的两个英文字母代表该字元一分为二后的两个小字元的汉语拼音的第一个字母。
3、(J)凡相交的两个笔画都J作为代码。
4、(L)凡相邻的两个笔画都以L作为代码。
5、(Q)任何缺口都以Q作为代码。
6、单笔画基本字元为横一H,竖| S,撇丿 P,捺(含点、)N,和提T,均为不可分字元。表2黄金码有音字元表(字身字元) 注“ →V”表明该字元有读音,但为不常用字,因此可以盲音化,也可以用“V”作为编码。表3黄金码盲音字元表(以V作代码) 表4黄金码近似字元表 表5黄金码单码字表(简繁体字同码通用) 注字后码为该字成为字元时的一分为二编码。表6黄金码编码模式的输入汇总表
权利要求
1.一种音形统一黄金分割码汉字输入方法,其步骤如下将所有汉字分为最最常用字、最常用字、一般常用字、不常用字以及词组,分别按以下步骤编码最最常用字一律用该字汉语拼音的第一个字母编成单码字,对于重码字,采用,./;’[]七个识别码,最常用字编成双码字,规则是将字分割成两部分“字元”,用两个字元名称的汉语拼音的第一个字母作为该字的编码,一般常用字编成三码字按照双码字的分割方法将一个字分割成两个字元,得到前两个编码以后,对其中的一个字元,进行再次分割,用二次分割后得到的两个小字元中第一个字元名称的汉语拼音的第一个字母作为该字的第三个编码,不常用字编为四码字与上述三码字的分割方法相同,但将二次分割后两个小字元的名称字母均用作编码,即得到四个字母的编码,字体分割的原则是(1)、尽量分割出两个有读音的字元,否则分割出一个有读音的字元和另一个没有读音的“盲音”字元,用V作为盲音编码,无法分割出有音字元时,就分割成两个盲音字元,(2)、第二次分割的原则是一次分割出的两字元性质相同时,分割后一字元,两字元性质不同时,则按以下先后顺序选择其一分割①盲音字元,②赋音复合字元,对于某些盲音字元,人为地赋予它读音,即用形态相近似字的读音来读该字元,③有音字身字元,④辅助部首字元,⑤部首字元,⑥部尾字元,⑦基本字元,双字词编码方法把词中的每个字都作为上述“最常用字”的双码,组成四码作为词条的编码,其中常用的双字词简化为双码,三字词为三码取每个字汉语拼音的第一个字母作为编码。
2.按照权利要求1所述的音形统一黄金分割码汉字输入方法,其特征是部首字元中最常用的七个部首字元,给予专用的编码其中艹(含 )定为A讠与言定为I月定为O水与氵定为U手与扌定为V木定为F纟定为G。
3.按照权利要求1或2所述的音形统一黄金分割码汉字输入方法,其特征是,还有设有如下步骤用符号键作为词组的识别码,其中“.”定为人名码,“;”定为动物码,“’”定为静物码,“/”定为常用字或词识别码,“[”定为地名码,“]”定为外来语及科技名词的识别码。
4.按照权利要求1或2所述的音形统一黄金分割码汉字输入方法,其特征是在分割规则中,对于某些字很明显能够分割成两个常用字元,但是在其中还多余了个别的笔画,规定舍去这些多余的笔画。
全文摘要
音形统一黄金分割码汉字输入方法,最最常用字用拼音第一个字母编成单码字,最常用字编成双码字,规则是:将字分割成两个字元,用字元名称拼音第一个字母作为编码。其他字为三码或四码:即二次分割得到第三、第四编码。重码字,采用符号作识别码。词组按上述方法编为两码或四码。本发明字型与发音的和谐统一,不需要记忆大量字根或部首,而且降低了重码率,还避免了因为发音不准或字型拆分困难带来的困扰。
文档编号G06F3/023GK1314629SQ0111359
公开日2001年9月26日 申请日期2001年5月8日 优先权日2001年5月8日
发明者郭子中, 刘玉 申请人:郭子中