专利名称:一种规范音形汉字输入法的制作方法
技术领域:
本发明涉及汉字输入方法,具体涉及一种规范音形汉字输入法。
背景技术:
现有的汉字输入方法虽然各具有其相应的优点,但是在考虑输入法与国家有关语言文字的标准规范相结合方面均存在一定欠缺,特别是在与中小学识字教学和信息技术教学结合方面有较大的差距。因此,研究出一种完全符合规范、紧密与中小学识字教学和信息技术教学结合、简单易学易用的汉字输入方法是非常必要的。
发明内容
本发明的目的在于提供一种规范音形汉字输入法,该方法完全符合国家有关语言文字和中文信息处理的标准规范,与中小学识字教学和信息技术教学紧密结合。在汉字拆分、编码码元选取、键位安排和取码规则等方面有许多创新。该输入方法充分利用国民基础教育的背景知识,降低了使用人员的学习要求,既适合中小学生学习,又适合其它文化程度的人群使用。具有简单、易学、易用和使用广泛的特点。
本发明的设计原则如下 1.依据国家语言文字和中文信息处理等相关规范,满足中小学识字教学和信息技术教学要求。
2.运用汉语拼音、汉字结构、部首、笔画、书写规则等语文基础知识编码,实现与识字教学的紧密结合,解决中小学生“提笔忘字”等汉字应用问题。
3.综合采用数据库、信息检索和中文信息处理等多种技术手段,实现“打字、查字和识字、写字”的有机结合。
4.本发明应简单、易学和易用,具有友好的人机界面,适合学生学习和将来走向社会后的高效中文信息处理的要求。
为达到以上目的,本发明采取的技术方案是 一种规范音形汉字输入法,其特征在于 (1)编码码元和键位安排 编码码元包括基础码元和普通码元,其中,键位映射表中的码元为基础码元,基础码元全部取自《GF0011-2009汉字部首表》中的部首;普通码元取汉语拼音首字母,与计算机通用键盘中的A~Z的键位相对应;所说的键位映射表如下
(2)汉字拆分 ①《GF0013-2009现代常用独体字规范》中的独体字、《GF3001-1997信息处理用GB13000.1字符集汉字部件规范》中的基础部件、《GF0014-2009现代常用字部件及部件名称规范》中的部件和键位映射表中的部首按笔顺拆分成笔画, ②合体字按汉字自然结构和层次依次拆分成字或基础部件或部件,所说的字为《GB2312-80信息交换用汉字编码字符集·基本集》或《现代汉语通用字表》中的字,所说的基础部件为《GF3001-1997信息处理用GB13000.1字符集汉字部件规范》中的基础部件,所说的部件为《GF0014-2009现代常用字部件及部件名称规范》中的部件;所说的基础部件包括成字部件和非成字部件; 当拆分成《GB2312-80信息交换用汉字编码字符集·基本集》或1988年国家公布的《现代汉语通用字表》中的字时按成字取大优先处理,即如出现少笔画字与多笔画字重叠的拆分结果时,优先取多笔画字; (3)取码规则 每个汉字最多取四码,依次取前三码和最末一码,不足四码,取完为止, ①独体字取该独体字汉语拼音的首字母为第一码,余码依次取一、二、末笔画相应的键位编码; ②键位映射表中的部首取其相应的键位为第一码,余码依次取一、二、末笔画相应的键位编码; ③合体字取该合体字的汉语拼音首字母为第一码,余码依次取拆分后的一、二、末部分相应的键位编码; 所说的余码依次取一、二、末部分相应的键位编码是 A.字或成字部件按其汉语拼音的首字母取码;或, B.键位映射表中的部首按相应键位取码;或, C.非成字部件按所取笔画的相应键位编码,或用“替代符”来代替,所说的“替代符”为v键或u键或i键或o键;或, D.《GF-0014-2009现代常用字部件及部件名称规范》中的部件按其名称规范的读音首字母取码,或用“替代符”来代替,所说的“替代符”为v键或u键或i键或o键。
本发明的进一步特征在于对拆分成两部分且后一部分为独体字时,对后一部分可以依次取其汉语拼音首字母和末笔画的相应键位编码,或,后一部分为非成字部件取首末笔画的相应键位编码。
按照本发明所述的拆分和取码规则,对同一个合体字有多种符合规范的拆分方法,对每一种规范拆分方法均进行了编码,提供了二至三种输入码。
在上述方案的基础上,本发明对不认识的字输入时,使用“替代符”替代该字汉语拼音首字母,计算机在处理后,将该汉字及其正确的拼音显示在屏幕上。
在上述方案的基础上,本发明输入汉字时,对独体字拆成部件、不按笔顺取码和基础部件再拆分均在屏幕上有上述错误提示,并提供正确编码。
在上述方案的基础上,本发明对多音字的第一码按照该字的常用读音或其它不同读音的汉语拼音首字母取码,拆分后的成字部件为多音字时按照《GB2312-80信息交换用汉字编码字符集·基本集》中的拼音索引表规定的读音取码。
与现有的输入方法相比本发明具有以下优点 1.汉字拆分、编码码元选取、键位安排和取码规则完全符合国家语言文字及中文信息处理相关规范,紧密与中小学识字教学和信息技术教学相结合,适于引入基础教育的识字教学和信息技术教学。
2.对汉字拆分采取按结构和层次依次拆分方法,在拆分过程中,贯彻成字取大优先的原则。降低了汉字的拆分难度,提高了方案的实用性。
3.基础码元的选取、键位安排完全取自《汉字部首表》中的部首,与国民基础教育背景知识同步,记忆量小,增加了易学性,还能很好地帮助中小学生巩固汉字学习的成果。
4.同一个合体字可能有多种规范拆分并对其进行编码,本发明采用此特点,对同一个合体字提供了2到3种输入码。使用者知道其中任何一种编码即可,降低了使用人员的学习要求,增加了通用性。
5.本发明对因笔顺、拆分理解错误造成的编码输入不规范,规范音形汉字输入法方法能给出正确的汉字,同时提示规范的编码,并指出编码输入错误的原因。
6.本发明对不认识的字输入时,使用“替代符”替代该字汉语拼音首字母,计算机在处理后,将该汉字及其正确的拼音显示在屏幕上。
7.本发明简单、易学、易用,具有使用的广泛性。
具体实施例方式 以下对本发明作进一步详细说明。
一、编码码元选择和键位安排 1.编码码元 本方案,用基础码元和普通码元作为编码码元。其中,《键位映射表》中的码元为基础码元,全部取自《GF 0011-2009汉字部首表》中的部首;普通码元取汉字的汉语拼音首字母及《GF 0014-2009现代常用字部件及部件名称规范》中的部件读音首字母。
2.键位安排 基础码元键位安排主部首按其汉语拼音首字母安排键位,附形部首键位跟随主部首,例如附形部首“刂”跟随主部首“刀”均安排在键位“D”;附形部首“灬”跟随主部首“火”均安排在键位“H”;某些部首匚、凵、冂
卩()、彳、夂、攵、覀按习惯用法和便于记忆安排在相应键位上,具体见《键位映射表》。
普通码元键位安排均按字的汉语拼音首字母或《现代常用字部件及部件名称规范》中部件读音首字母的键位安排,即与计算机通用键盘中的A~Z的键位相对应。
本发明选取没有对应基础码元的键,例如v键或u键或i键或o键作为“替代符”,用于替代一些非成字部件和不认识字的汉语拼音首字母,使得输入更加方便、灵活。
二、汉字拆分 1.《GF0013-2009现代常用独体字规范》中的独体字、《GF3001-1997信息处理用GB13000.1字符集汉字部件规范》中的基础部件和《键位映射表》中的部首拆分成笔画。
如电→丨、乛、一、一、乛(独体字)。
戋→一、一、乛、丿、丶(基础部件)。
犬→一、丿、丶、丶(部首)。
2.合体字 ①遵循GF3001-1997《信息处理用GB13000.1字符集汉字部件规范》中的“交重不拆,相离、相接可拆”的原则。
申→交重不拆; 旦→相离可拆为日、一; 敢→相接可拆为乛、耳、攵。
②合体字按汉字自然结构和层次依次拆分成含有《GB2312-80信息交换用汉字编码字符集·基本集》和《现代汉语通用字表》中的字、《GF3001-1997信息处理用GB13000.1字符集汉字部件规范》中的基础部件或《GF-0014-2009现代常用字部件及部件名称规范》中的部件;所说的基础部件包括成字部件和非成字部件; 当拆分成《GB2312-80信息交换用汉字编码字符集·基本集》和《现代汉语通用字表》中的字时按成字取大优先处理,即如出现少笔画字与多笔画字重叠,优先取多笔画字; 如“赣”字拆分为“章”、“久”、“贡”(“章”、“贡”均为成字取大优先处理)。
三、取码规则。
1.字的取码 每个汉字最多取四码,依次取前三码和最末一码,不足四码,取完为止。
①独体字取该独体字汉语拼音的首字母为第一码,余码依次取一、二、末笔画相应的键位编码; 例如“电”字的取码D、S、Z、Z,其中D为“电”汉语拼音首字母,S为第一笔画“竖”(丨),Z为第二笔画“折”(乛),Z为末笔画“折”(乛)。
②键位映射表中的部首取其相应的键位为第一码,余码依次取一、二、末笔画相应的键位编码; 例如部首“犬”的取码Q、H、P、D,其中Q为部首“犬”相应的键位(Q),H为第一笔画(一),P为第二笔画(丿),D为末笔画(丶) ③合体字取该合体字的汉语拼音首字母为第一码,余码依次取拆分后的一、二、末部分相应的键位编码; 所说的余码依次取一、二、末部分相应的键位编码是 A.字或成字部件按其汉语拼音的首字母取码; 例如“赣”字的取码为G、Z、W、G。其中G为“赣”的汉语拼音首字母,Z为拆分后成字部件“章”的汉语拼音首字母,G为成字部件“贡”的汉语拼音首字母。
B.键位映射表中的部首按相应键位取码; 例如“赣”字的取码为G、Z、W、G。其中W为部首“攵”相应的键位(W)。
C.非成字部件按所取笔画的相应键位编码,或用“替代符”来代替,所说的“替代符”为v键或u键或i键或o键; 例如“单”字可拆分为“丷”和非字部件两部分,取码为D、B、S、S,其中D为“单”字汉语拼音首字母,B为“丷”的编码,S为非字部件的首笔画(丨)编码,S为非字部件的末笔画(丨)编码。
又如“单”字的取码也可以为D、B、V,其中用“替代符”V代替了“单”字后部分的非字部件的编码。
D.《GF0014-2009现代常用字部件及部件名称规范》中的部件按其名称规范的读音首字母取码,或用“替代符”来代替,所说的“替代符”为v键或u键或i键或o键。
例如“昔”字可拆分为“”和“日”两部分,取码为X、X、R,其中第二个X是非字部件按《现代常用字部件及部件名称规范》的名称取其读音首字母的编码。
“昔”字取码也可为X、V、R,其中V是“”的替代符。
本发明选取没有对应基础码元的键,例如v键或u键或i键或o键作为“替代符”,使得输入更加易学易用、方便、灵活。
④为降低重码,提高输入效率,对拆分后只有两部分的字且余部为独体字时,对余部可取其汉语拼音首字母和末笔画两个编码。
如“闲”的编码为X、M、M、D,因为“闲”字拆分后只有两个部分,余部“木”为独体字,可取“木”的拼音首字母(M)和末笔画(D)。
⑤按照上述拆分和取码规则,对同一个合体字可能有多种符合规范的拆分方法,本发明对合体字的每一种规范拆分方法均进行了编码,所以本发明对每个合体字均提供了2-3种输入码。
如“章”可拆分为音、十,也可能被拆分为立、早。按音、十拆分,“章”的编码是Z、Y、S,其中Z为“章”字的汉语拼音首字母,Y为拆分后部件“音”的编码,S为“十”的编码。按立、早拆分,“章”的编码是Z、L、Z,其中Z为“章”字的汉语拼音首字母,L为“立”的编码,Z为“早”的编码。还可以拆成立、日、十,“章”的编码是Z、L、R、S,其中Z为“章”字的汉语拼音首字母,L为“立”的编码,R为“日”的编码,S为“十”的编码。此处,给“章”提供了三种输入码。
又如“奥”可拆分为奥字头和“大”两部分,也可拆分为丿、ㄇ、米、大四部分,按照上述不同的拆分方法,给出了两种输入码。
⑥对因笔顺、拆分理解错误造成的编码输入不规范(例如笔顺错、拆分错、取码错、笔形错等),本发明能给出正确的汉字,同时提示规范的编码,并指出编码输入错误的原因。
如“万”字的正确取码为W、H、Z、P,对笔顺的理解错误可能输入错误编码W、H、P、Z,对该输入错误,软件可以显示出“万”字,但同时指出“笔顺错误!”并提示正确编码W、H、Z、P。
如“示”字只能拆成笔画,“示”的正确取码为S、H、H、D。若对拆分的理解错误,可能输入错误编码S、E、X,其中S为“示”拼音首字母,E为“二”的拼音首字母,X为“小”的拼音首字母,对该输入错误,软件可以显示出“示”字,同时指出“独体字和键位部首不拆!”并提供正确编码S、H、H、D。
⑦对不认识的字,可以使用替代符作为第一码。
如“郄”拆分为“乂”、“ナ”、“厶”和“阝”,如不认识“郄”字,取码为V、A、Z、E,其中,“V”为“郄”字的拼音首字母“替代符”。
⑧多音字的第一码可按照该字的不同读音取码,均能够输入正确的汉字;拆分后的成字部件按照《GB2312-80信息处理用汉字编码字符集·基本集》规定的读音取码。
例如,多音字“重”第一码可以取C(chóng),也可以取Z(zhóng)。但当“重”字作为部件使用时,均按照规定读音(chóng)的首字母“C”取码,如“董”取码为DCC。
2.词语取码 词语均取四码, ①两字词依次取每个字的前两个编码。
例如“国家”的编码为GWJB,其中,GW为“国”字编码(GWY)的前两个编码,JB为“家”(JBS)字编码的前两个编码。
②三字词依次取每个字的首码和第三个字的第二码。
例如“共和国”的编码为GHGW,其中,G、H、G分别为“共和国”每个字的首码,W为“国”字的第二个编码。
③四字及四字以上词语依次取前三个字的首码和末尾字的首码。
如“一知半解”的编码为YZBJ,其中,Y、Z、B、J分别为“一知半解”每个字的首码。“中华人民共和国”的编码为Z、H、R、G,其中,Z、H、R、G分别为“中”、“华”、“人”、“国”四个字的编码。
权利要求
1.一种规范音形汉字输入法,其特征在于
(1)编码码元和键位安排
编码码元包括基础码元和普通码元,其中,键位映射表中的码元为基础码元,基础码元全部取自《GF0011-2009汉字部首表》中的部首;普通码元取汉语拼音首字母,与计算机通用键盘中的A~Z的键位相对应;所说的键位映射表如下
(2)汉字拆分
①《GF0013-2009现代常用独体字规范》中的独体字、《GF3001-1997信息处理用GB13000.1字符集汉字部件规范》中的基础部件、《GF0014-2009现代常用字部件及部件名称规范》中的部件和键位映射表中的部首按笔顺拆分成笔画,
②合体字按汉字自然结构和层次依次拆分成字或基础部件或部件,所说的字为《GB2312-80信息交换用汉字编码字符集·基本集》或《现代汉语通用字表》中的字,所说的基础部件为《GF3001-1997信息处理用GB13000.1字符集汉字部件规范》中的基础部件,所说的部件为《GF0014-2009现代常用字部件及部件名称规范》中的部件;所说的基础部件包括成字部件和非成字部件;
当拆分成《GB2312-80信息交换用汉字编码字符集·基本集》或1988年国家公布的《现代汉语通用字表》中的字时按成字取大优先处理,即如出现少笔画字与多笔画字重叠的拆分结果时,优先取多笔画字;
(3)取码规则
每个汉字最多取四码,依次取前三码和最末一码,不足四码,取完为止,
①独体字取该独体字汉语拼音的首字母为第一码,余码依次取一、二、末笔画相应的键位编码;
②键位映射表中的部首取其相应的键位为第一码,余码依次取一、二、末笔画相应的键位编码;
③合体字取该合体字的汉语拼音首字母为第一码,余码依次取拆分后的一、二、末部分相应的键位编码;
所说的余码依次取一、二、末部分相应的键位编码是
A.字或成字部件按其汉语拼音的首字母取码;或,
B.键位映射表中的部首按相应键位取码;或,
C.非成字部件按所取笔画的相应键位编码,或用“替代符”来代替,所说的“替代符”为v键或u键或i键或o键;或,
D.《GF-0014-2009现代常用字部件及部件名称规范》中的部件按其名称规范的读音首字母取码,或用“替代符”来代替,所说的“替代符”为v键或u键或i键或o键。
2.如权利要求1所述的规范音形汉字输入法,其特征在于对拆分成两部分且后一部分为独体字时,对后一部分可以依次取其汉语拼音首字母和末笔画的相应键位编码,或,后一部分为非成字部件取首末笔画的相应键位编码。
3.如权利要求1或2所述的规范音形汉字输入法,其特征在于按照本发明所述的拆分和取码规则,对同一个合体字有多种符合规范的拆分方法,对每一种规范拆分方法均进行了编码,提供了二至三种输入码。
4.如权利要求1或2所述的规范音形汉字输入法,其特征在于对不认识的字输入时,使用“替代符”替代该字汉语拼音首字母,计算机在处理后,将该汉字及其正确的拼音显示在屏幕上。
5.如权利要求3所述的规范音形汉字输入法,其特征在于对不认识的字输入时,使用“替代符”替代该字汉语拼音首字母,计算机在处理后,将该汉字及其正确的拼音显示在屏幕上。
6.如权利要求1或2所述的规范音形汉字输入法,其特征在于输入汉字时,对独体字拆成部件、不按笔顺取码和基础部件再拆分均在屏幕上有上述错误提示,并提供正确编码。
7.如权利要求1或2所述的规范音形汉字输入法,其特征在于多音字的第一码按照该字的常用读音或其它不同读音的汉语拼音首字母取码,拆分后的成字部件为多音字时按照《GB2312-80信息交换用汉字编码字符集·基本集》中的拼音索引表规定的读音取码。
8.如权利要求3所述的规范音形汉字输入法,其特征在于多音字的第一码按照该字的常用读音或其它不同读音的汉语拼音首字母取码,拆分后的成字部件为多音字时按照《GB2312-80信息交换用汉字编码字符集·基本集》中的拼音索引表规定的读音取码。
9.如权利要求4所述的规范音形汉字输入法,其特征在于多音字的第一码按照该字的常用读音或其它不同读音的汉语拼音首字母取码,拆分后的成字部件为多音字时按照《GB2312-80信息交换用汉字编码字符集·基本集》中的拼音索引表规定的读音取码。
10.如权利要求6所述的规范音形汉字输入法,其特征在于多音字的第一码按照该字的常用读音或其它不同读音的汉语拼音首字母取码,拆分后的成字部件为多音字时按照《GB2312-80信息交换用汉字编码字符集·基本集》中的拼音索引表规定的读音取码。
全文摘要
一种规范音形汉字输入法,其基础码元全部取自《GF0011-2009汉字部首表》中的部首;普通码元取汉语拼音首字母,与计算机通用键盘中的A~Z的键位相对应;对独体字、基础部件和键位映射表中的部首按笔顺拆分成笔画,合体字拆分成字或基础部件或部件;每个汉字最多取四码,独体字、合体字取其汉语拼音首字母为第一码,余码依次取一、二、末笔画相应的键位编码。本发明汉字拆分、编码码元选取、键位安排和取码规则完全符合国家语言文字及中文信息处理相关规范,紧密与中小学汉语汉字教学和信息技术教学相结合,适于引入基础教育语文教学和信息技术教学;本发明降低了使用人员的学习要求,记忆量小,简单、易学、易用。
文档编号G06F3/023GK101604210SQ200910157419
公开日2009年12月16日 申请日期2009年7月28日 优先权日2009年7月28日
发明者健 闫 申请人:健 闫