组合式汉字输入法的制作方法

文档序号:6414199阅读:442来源:国知局
专利名称:组合式汉字输入法的制作方法
技术领域
本发明是一种计算机汉字输入方法。
目前在我国计算机应用方面,利用键盘输入汉字是应用最广泛的输入方式。汉字编码的实质是用事先约定的计算机能够接收的字母、数字、符号等形式,给每个汉字的存储写明地址,以便计算机查找调用。汉字编码方案是利用汉字的音、形、义三者所包涵的信息来实现的,编码规则不外乎流水码、音码、形码、音形码四种形式,并且必须符合单义性、方便性、高速性、大众性等几项基本原则。
目前已有1000多种编码方案。但真正完成上机验证的却只有二十几种,具有实用价值的就更少。即使当前比较流行的几种汉字编码方案,也存在许多缺陷,不能真正适应中国人学习应用计算机知识的需要。例如形码中的优秀代表五笔字型,它是按照汉字字型结构和书写顺序实施的汉字编码文字。虽然它以其输入速度快,效率高、容易实现盲打诸多优点得到广大计算机操作人员的喜爱。但在其字根选取和拆分规则上仍然存在许多不合理的地方。例如五笔字型规定基本字根为130个,但实际应用达到199个,字根的变形非常不规范,并在基本拆分过程中也并不完全按照规则进行,容易使人产生岐义。五笔字型的字根记忆虽然有规律可循,但相对记忆量较大。同时键名汉字,成字字根及识别码等人为规定更增加了学习难度,这也正是它只适用于专业人员使用的主要原因。
随着计算机在我国的应用普及,汉字信息处理量大大增加。考虑到广大用户不同的知识层次、年龄结构以及计算机知识在中小学生中的普及应用,社会迫切需要一种更为先进合理,简便易学高效的汉字编码方案。本发明正是基于这种社会背景下开发实现的。
本发明的任务是利用计算机普通键盘,采用新的编码规则,发明一种组合式汉字输入法,达到简便易学,提高工作效率。
本发明任务解决的方法是组合式汉字输入法是一种利用计算机普通键盘,采用汉字读音、字型结构、书写顺序以及人们的识字习惯,汉字中部件与部件的组合来实施编码方案,全部汉字均为四键全码,单字编码等于整字声母加第一部分声母加第二部分声母加最后部分声母,其编码中,第一部分为按汉字字型结构和书写顺序分离出来的最大认知部分,包括字与字的组合;第二部分按同样方式对剩余部分进行拆分取码;最后部分为整个汉字按字型结构和书写顺序相对分离的最后认知部分,也可以是第二部分的组成部件。
一、汉字的信息源(一)汉字的读音国家教育部所颁布实施的标准汉语拼音方案,是中小学进行识字教学的主要手段之一。在全社会得到广泛普及,是人们基础知识比较扎实的构成部分,是不同知识层次,不同年龄结构的人们学习汉字最为熟悉、最容易掌握的方式。这也正是组合式汉字输入法把汉字读音作为编码信息主要组成的主要原因。
(二)汉字的字型结构众多的汉字编码方案认为汉字是由一定数量不可再分解的基本元件——字根组成的,不同的字根组合或字根相同而相对位置不同就构成不同汉字。所以拆分汉字的唯一方式就是把汉字拆分成一些基本字根或偏旁、笔画,按构成汉字的字根或偏旁、笔画及架形式来进行编码。组合式汉字输入法从汉字主要由形声字构成入手,创建性地提出了汉字是由字和字构成的,汉字的笔画、偏旁是汉字长期演化的结果,我们通常认识学习汉字,也正是循这一基本规律的。我们常说立早一章,弓长一张,同样我们可以认为“演”字是由三点水和寅字构成。但关键问题在于几乎没有人肯把“寅”字做为字根之一。本发明正是把“寅”这类汉字所具有的信息作为汉字编码的一个重要信息来源。
总上所言,组合式汉字输入法所采用的字形信息是根据人们已有的识字基础,有广泛性。
二、键盘布局。
1、组合式汉字输入法使用普通键盘的26个英文字母进行编码。由于汉字读音声母在数量上分布的不平衡性,同时为降低重码率,减轻操作人者的劳动负担,本输入法对各字母所代表的汉语拼音声母和韵母有所调整。主要变化如下AzhOchIshUyu yun yue Vwei2、组合式汉字输入法把常用偏旁按人们习惯、名称,归类并分别对应在相应的键位上,并附带由这些偏旁变形而产生的少数部件以及几个非常用字(见附图
)。
汉字的六种基本笔画,横、竖、撇、捺、点、折分别对应H、I、P、N、D、V,除竖弯钩及竖折以外的所有带转折的笔画都归在V键上。
本输入法所采用的成字部件,大都是我们所熟悉的常用汉字、偏旁及笔画。所以我们能够正确读出并把它们很快地归到相应的键位上,所以记忆量是非常小的,并且一旦识记就可保持相当长的时期,不容易被遗忘。
三、拆分规则和顺序1、取大优先在拆分过程中,尽可能使每次拆分的汉字最大不受汉字偏旁、字型结构等因素的限制。以下是拆分实例频——步、页、贝彻——彳、切、刀简——、间、日根据规定“频”拆成止、小、贝,“简”拆成、门、日,“彻”拆成彳、七、刀都是错误的。
2、兼顾直观,遵从习惯。
在拆分过程中,为了遵从人们识字习惯,不过分强调取大字原则,兼顾直观取字。例如,“章”字如果拆分成章——音、十,不如拆分成章——立、早更符合人们识字习惯。
3、拆分顺序按照汉字的书写顺序结合汉字的间架结构形式汉字拆分应遵循以下顺序先横后竖,先撇后捺,从上到下,从左到右,从外到内(或从内到外),先中间后两边。对于全包围结构,如“国”字,应遵循兼顾直观原则,将
看作一个整体,按先外后内顺序拆分。四、编码规则组合式汉字输入法采用四键码长,全部汉字均为四键全码。
1、单字编码单字编码=整字声母+第一部分声母+第二部分声母+最后部分声母。
汉字读音没有声母的,按其韵母首字母处理,以下为拆分实例彻=彻+彳+切+刀=ORQD解=解+角+刀+牛=JJDN根据规定,“彻”字拆分成彳、七、刀。“解”字拆分成ク、用、牛是错误的。
关于四码即未尾的特殊规定(1)未码若与第三码相同,则按书写的相反顺序取最大成字部分可以是笔画。例频=频+步+页+贝。
(2)如汉字构成笔画较少,可以重复其未笔画以补全四码。例如一二YHHH。
(3)未码遇到九、刀、七等汉字,其未笔画一律视为折。
(4)下含辶、偏旁的半包围结构汉字,其未码为所包围部分的未码。如“远、逞”等字。
2、词组编码组合式汉字输入法为提高汉字输入效率,采用词混编方式,无须任何换档及其它操作。该输入法配备了20000多条词组,并首次引入常用短语(如经济实惠、安装使用等),并把它们作为词组看待。在实际操作过程中,见字打字,见词打词使输入速度大大提高。
(1)双字词组=字前两码+第二字前两码例如词组=词+讠+组+纟=CXZS另外,该输入法为方便词组输入,对双字词采用另一种编码形式,以供使用者选择。即双字词组=第一、二字前两码+第一、二字第二码,例如词组=词+组+讠+纟=CZXS。
(2)三字词组=第一字首码+第二字首码+第三字首码例如计算机=计+算+机+木=JSJM(3)四字词组=依次取每字首码例如国际主义=GJAY(4)多字词组=前三字首码+未字首码例如中华人民共和国=AHRG3、简码字词一级简码按照1975年国家出版总局所做的字频统计,组合式汉字输入法挑选了78个高频汉字作为一级简码,能够达到一般文章使用汉字的33%以上。使用者可以通过空格键或数字键选择所需要的汉字,为了提高汉字输入速度,应当熟记这些一级简码。
A这、中、主 B不、本、部 C才、从、此D的、大、地 E而、二、尔 F发、方、分
G个、工、国 H和、会、后 I上、是、时J级、就、经 K可、开、看 L了、来、力M民、们、面 N年、能、农 O产、成、出P批、平、品 Q起、求、去 R人、日、如S所、三、四 T他、同、体 U于、与、月V为、位、委 W我、无、王 X下、学、行Y一、有、用 Z在、作、子二级简码组合式汉字输入法选择2000多个常用字作为二级简码,使简码达到一般文章要求的97.97%以上。同样二级简码和一级简码采用三字同行方式,如果遇到比较拆分的独体汉字,就可以通过提示行的提示,选择相应的数字键来选取所需要的汉字。这就方便了汉字输入人员,大大降低了拆分难度,提高了输入效率。由于二级简码汉字比较多,本说明不在一一列出。
三级简码组合式汉字输入法把所有没有重复的四级全码全部作为三级简码,并且充分利用编码的剩余空间把一些常用词组作为三级简码,总数达5000多个,更加方便了使用者。
五、重码字由于汉字结构的特殊性,汉字编码难免会出现重复。重码率的高低是衡量一个汉字编码方案是否优秀的重要标准。在这一方面,组合式汉字输入法是相当成功的。根据对国标GB2312-80所规定的一、二级6763个汉字偏码所做的统计,组合式汉字输入法共有210对重码,低于绝大部分汉字编码方案。通过技术处理,可使一级汉字区重码降低至64对,重码率为0.94%。实际操作,重码率低于万分之五。
六、容错编码和一字多码由于拆分难免会出现岐义,组合式汉字输入法,规定了部分汉字具有容错编码。同时由于汉字大量存在同形异音,所以本输入法规定同形异音字具有多重编码。
例行=XRHD=HRHD=HREV七、万能查询组合式汉字输入法规定“?”为万能查询键,初学者可利用该键替代难以确定的编码部分以查阅该汉字的全码。
附图为本发明的常用字根与键盘对应表。
实施例单字编码=整字声母+第一部分声母+第二部分声母+最后部分声母,其编码中第一部分为按汉字字型结构和书写顺序分离出来的最大认知部分,包括字与字的组合;第二部分按同样方式对剩余部分进行拆分取码;最后部分为整个汉字按字型结构和书写顺序相对分离的最后认知部分,也可以是第二部分的组成部件。
单字解=解+角+刀+牛=JJDN词组编码采用词混编式,见字打字,见词打词,三字词组=第一字首码+第二字首码+第三字首码,如计算机=计+算+机+木=JSJM。
本发明与原有的汉字编码方案相比,规则简单,简便易学。拆分更具规范性,更加符合小学识字教学规律。同时,它所采用的独特编码方式以及全部简码均采用高频先见和字词混编形式,均在一定程度上降低了汉字拆分难度,提高了输入速度。与原有汉字编码方案相比,学习难度小,训练期短,保持期长。
权利要求
1.组合式汉字输入法,是利用计算机普通键盘,采用汉字读音和字型结构、书写顺序以及人们的识字习惯,汉字中部件与部件的组合进行编码方案,全部汉字均为四键全码,单字编码等于整字声母加第二部分声母加最后部分声母,其特征在于利用汉字中部件与部件的组合进行编码输入。
2.根据权利要求1所述的组合式汉输入法,其特征在于运用单字编码规则。
3.根据权利要求1所述的组合式汉字输入法,其特征在于汉字常用部件的键盘布局。
全文摘要
组合式汉字输入法,是一种利用计算机普通键盘,采用汉字读音、字型结构、书写顺序以及人们的识字习惯来实施编码方案,全部汉字均为四键全码,单字编码等于整字声加第一部分声母加第二部分声母加最后部分声母,主要特征是利用汉字中部件与部件的组合进行编码输入。本发明与原有汉字编码方案相比,规则简单,简便易学,训练期短,提高工作效率。
文档编号G06F3/023GK1243980SQ98110378
公开日2000年2月9日 申请日期1998年7月31日 优先权日1998年7月31日
发明者许风申 申请人:许风申
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1