专利名称:一种使用国标规范部件和笔画在计算机上输入汉字的方法
技术领域:
本发明属汉字信息处理技术领域。 技术背聚本发明是一种使用国家规范标准部件,即国家语言委员会颁布的《信息处理用 GB13000.1字符集汉字部件规范》和国家规范标准笔画,即《现代汉语通用字笔顺规范》在 计算机大键盘上输入汉字的方法。在汉字信息处理技术领域,现有的使用部件(有的叫字根)和笔画的汉字输入技术,一 个最大的问题是部件和笔画拆分不规范,发明人的个人随意性极大,已形成行内所称的"编 码污染"。即使如社会上广泛流行使用的《五笔字型》,其字根(即部件)的拆分也不符合国 家规范。比如"出"字,规范拆分应该为"屮"和"U",但《五笔字型》拆分为两个"山" 字,人为地将竖(I )笔画断为两截;再如,"我、黑、鬼、象、东、非"等字已是规范的 基础部件,不能再拆分了,但仍被各种输入法拆分得一个方法一个样,十分混乱。这种情况 不利于汉字输入法的规范建设和健康发展;不但有损于汉字的纯洁性,且有很大的破坏性, 亟待修正。本发明以国家规范部件和笔画为准,将汉字拆分成标准的部件和笔画进行编码,既保持 了汉字部件拆分组合的合理性,又易学好用。发明内容本发明是一种使用国家规范标准部件,和国家规范标准笔画,在计算机大键盘上输入汉 字的方法。由于现行使用汉字部件(或称字根)和笔画输入汉字方法的不规范性,已致使汉字输入 方法处于比较混乱的境况。如汉字的笔画被任意肢解、汉字被任意拆分、汉字部件被任意组 合,每个发明人对汉字部件的处置都带有极大的随意性,国家关于汉字部件、笔画的规范已 得不到基本保证,已形成很严重的汉字输入法的"编码污染"现象。本发明本着严格遵循国家部件规范和笔画规范的规则,编制了一套部件笔画编码汉字输 入方法,可以根本避免"编码污染"现象且方法简单,重码率与《五笔字型》持平。本发明的几个基本概念关于笔画指横(一)竖(I )撇(J )点(、)折(乙)等五类。其中,捺(V)属 于点类。本发明将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔 画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类。笔画编码是横l,竖2,撇3,点4,折5,叉横9,叉竖8,叉撇7,叉点6,叉折0; 另外,首笔为竖的部件,有方框特征的为"方竖",方竖归入叉竖 撇,有其他笔画与撇的中部相连特征的为"中撇",中撇归入叉撇; 点和捺,与上下左右的横或竖相邻的,为"直点、直捺",直点、直捺归入叉点叉捺 关于部件指《信息处理用GB13000.1字符集汉字部件规范》中所列,由笔画组成的 具有组配汉字功能的构字单位。部件分为成字部件和非成字部件两种,成字部件中的成字以 《国标GB—2310 (抑)》中的常用字为限超出常用字部分的成字归入非成字部件部分;本发明所使用的部件均为不可再拆分的基 础部件关于部首指《现代汉语词典》中所列部首;本发明使用计算机大键盘上30个键位上10个键位为成字部件键位,下10个键位为 非成字部件键位,中10个键位为笔画键位;部分非成字部件和成字部件相通的,合并归入成字部件键;每个键位设一个键名字(键盘图示见附图
);编码方法本发明为字、词混合编码, 一个部件或一个笔画为一码,每个字、词最多四码部件或 笔画不足的,以识别码补足;三部件的字补一个识别码;两部件的字补两个识别码,汉字是 成字部件,但笔画不足的,也以识别码补足。识别码由部件的末笔画和字型结构合成字型结构分三种,一种是左右结构; 一种是上 下结构一种是杂合结构左右结构为l,上下结构为2,杂合结构为3;识别码的笔画取部件的末笔画取两个笔画时,部件的选择依次Jj:非成字部件、成字 部件、成字部首、键名字,前一个部件笔画不足的,取后一个部件的笔画;同是非成字部件、 成字部件、成字部首、键名字的,两个部件各取一码,先取末部件,后取首部件只取一个 识别码笔画的,也依非成字部件、成字部件、成字部首、键名字的顺序取码使用过的笔画 不重复使用;键名字该字所在键连击四键;成字部件汉字第一码为该字所在键,二、三、四码为二、三、末笔画二部件汉字两个部件各取一码,补两个识别码;三部件汉字三个部件各取一码,补一个识别码;四部件汉字四个部件各取一码,*五部件以上汉字一、二、三、末部件各取一码两字词每字取两码;三字词一、二字各取一码,第三字取两码四字词每字各取一码五字以上词一、二、三、末字各取一码,附面说明附图是计箅机键盘30个键位所示内容计算机键盘字母键位置,如"A、 B、 C"等; 键位编号,如"11、 12、 83"等;上10个键位所列为成字部件,如"又、木、田、我、 更"等;下IO个键位所列为非成字部件,如"广、口、耒、iL"等;中IO个键位所列为 "横、竖、撇、点、折、叉横、叉竖、叉撇、叉点、叉折"10个笔画键其中叉笔等叉笔 画的虚线与主笔画的实线相对示意,如叉横(十),主笔画为横,是实线,与横交叉的笔画 为虚线,表示有其他笔画与横交叉,其余同;30个键位上的黑体字为键名字,如"大、中、 日"等。
具体实施方式
关于笔画指横(一)竖(I )撇(J )点(、)折(乙)等五类,其中,捺(、)属 于点类。本发明将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔 画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类。如"王"的第一笔为横,第二笔为 叉横,第三笔为叉竖。其余类推。笔画的编码是横l,竖2,撇3,点4,折5,叉横9,叉竖8,叉撇7,叉点6,叉折0;横与叉横l、 9相对,竖与叉竖2、 8相对,等等,便于记忆,其余同另外,首笔为竖的部件,有方框特征的为"方竖",如"口、中、黑、申"等,方竖归 入叉竖;撇,有其他笔画与撇的中部相连特征的为"中撇",如M 、勺、牛"等,中撇归入叉撇;点和捺,与上下左右的横或竖相邻的,为"直点、直捺",如'""中的点,"卜"中的 点,"其"中的点,"水"中的捺等,直点、直捺归入叉点叉捺;关于部件指《信息处理用GB13000.1字符集汉字部件规范》中所列,由笔画组成的 具有组配汉字功能的构字单位,部件分为成字部件和非成字部件两种,成字部件中的成字以 《国标GB-2310 (抑)》中的常用字为限,201个成字部件如下口一八木日曰人入土士月金十田文贝七又大止女言虫火山王玉心小立禾衣竹目几石寸车厂 四广白工力皿米示门巾刀刁巳已己尸爪子耳卜羊儿牛习戈雨夕夫方食酉水二川干西斤臼丰 见弓戊丁犬户革由长舟歹册而臣业未末自非毛巴且矛千中甫氏束里母手龙乙世皮黑亡瓦也 丸不内父果上鬼亚身乃柬九电气万冉央曲兆乍必甘屯巨牙瓜了弗我重尹丘五民丫申于下东 乡及更予甲片为丑求垂尺韦乎丹夷久之井禹熏本肉串永象才两斥州乐曳三飞专丈年史事凹 吏秉个书凸承超出常用字部分的成字归入非成字部件部分,如"匕、伍、聿、廿、臾、艮、耒、秀、 爿、弋"等;本发明所使用的部件均为不可再拆分的基础部件。关于部首指《现代汉语词典》中所列部首;部首是合成部件的,均拆分成基础部件使 用,如"麻"拆分为"广、木、木""豆"拆分为"一、口、 乂"等本发明使用计箅机大键盘上30个键位上10个键位为成字部件键位,下10个键位为 非成字部件键位,中10个键位为笔画键位;首笔为"横竖撇点折"的部件和笔画在键盘的 右方,依次由中部向右顺次排列,首笔为"叉横叉竖叉撇叉点叉折"的部件和笔画在键盘的 左方,依次由中部向左顺次排列部分非成字部件和成字部件相通的,合并归入成字部件键,如"才"从"手",">("从 "人","韦"从"金","t "从"食","i "从"言","4 "从"示","卑"从"衣","夂 夂"从"文","* 从"牛","茧^"从"羊"等;每个键位设一个键名字,成字部件键位在该部件中选择一个汉字,如11键的键名字为 "工";非成字部件键位和笔画键位从所属成字部件的成字中选择一个汉字,如12键的键名 字为"石",13键的键名字为"王";个别键位设了两个键名字,一个成字,一个非成字, 如32键的"人4 "、 33键的"金,"、42键的"心? "、 62键的"言i "、 72键的"手," (键盘图示见附图);编码方法本发明为字、词混合编码,一个部件或一个笔画为一码,每个字、词最多四码部件或 笔画不足的,以识别码补足三部件的字补一个识别码两部件的字补两个识别码,汉字是 成字部件,但笔画不足的,也以识别码补足。识别码由部件的末笔画和字型结构合成;字型结构分三种, 一种是左右结构,如"好、 骑、短,树"等; 一种是上下结构,如"尖、轰、型、著"等;一种是杂合结构,如"围、 连、氛、病"等左右结构为1,上下结构为2,杂合结构为3;如笔画为横的识别码分别 为11、 12、 13;识别码的笔画取部件的末笔画需要取两个识别码时,笔画所属部i牛的选择依次为非 成字部件、成字部件、成字部首、键名字,如"制"的第一个识别码笔画为"鬼"的末笔画叉竖,识别码为81,第二个识别码笔画为"帝"的叉折,识别码为01:前一个部件笔画 不足的,取后一个部件的笔画,如"仍"的第一个识别码笔画为"乃"的末笔画撇,识别 码为31,第二个识别码为'M "的末笔画竖,识别码为21;两个部件同是非成字部件、成 字部件、成字部首、键名字的,每个部件各取一码,先取末部件,后取首部件,如"叨"的 第一个识别码笔画为"刀"的撇,第二个识别码笔画为"口"的横只取一个识别码笔画的, 也依非成字部件、成字部件、成字部首、键名字的顺序取码;使用过的笔画不重复使用键名字该字所在键连击四键,如木=92 (木)92 (木)92 (木)92 (木)土=93 (土) 93 (土) 93 (土) 93 (土);心=42 (心)42 (心)42 (心)42 (心)成字部件汉字第一码为该字所在键,二、三、四码为二、三、末笔画 如重=71 (重)92 (+) 22 ( I ) 12 (—) =71922212: 久=71 (久)52 (乙)42 ( 、 ) 43 (、杂合形识别)=71524243; 二部件汉字两个部件各取一码,补两个识别码,如件=31 (4 ) 71 (牛)81 (十为"牛"的末笔画;左右识别)91 (十为"牛"的倒 二笔画;左右识别'M "是键名字,"牛"是成字,取后者)=31718191;只=82 (口) 31 (八)62 (A'上下识别)12 (—上下识别;"八"的笔画用完,故用"口" 的末笔画)=823162112;尖=21 (小)91 (大)62 ("小"的末笔画A';上下识别)32 ("小"的倒二笔画J ;上 下识别,)=21916232;仁=32 (>f ) 11 (二) 11 (—左右识别)21 ( I左右识别;"二"笔画用完,故用M " 的末笔画)=32111121:三部件汉字三个部件各取一码,补一个识别码, 如推=92 ) 31 (>( ) 63 (圭)11 (—左右识别);棋=92 (木)93 (苴)31 (八)11 (—左右识别;"苴"是非成字部件,取之)=92933111: 四部件汉字四个部件各取一码,如撕=92 ) 93 (苴)31 (八)31 (斤)=92933131: 辟=51 (尸)82 (口) 61 (立)9(十)=51826191: 五部件以上汉字一、二、三、末部件各取一码, 如劈=51 (尸)82 (口) 61 (立)52 (刀)=51826152; 廉=61 (亡)82 (口) 7(月)42 ( 、 ) =61827142: 颤=63 (山)83 (口) 82 (口) 23 (贝〉=63838223: 两字词每字取两码,如国家=83 (口) 11 (玉)43 (a) 13 (豕)=83114313; 文字=63 (文)42 ( 、 ) 43 (" 51 (子)=63424351; 三字词一、二宇取两码,第三字取前两码, 如计算机=62 ) 73 (w) 92 (木)31 (几)=62739231; 四字词每字各取一码,如前仆后继=63 (乂) 32 " ) 33 (厂)52 (纟)=€3323352;五字词以上一、二、三、末字各取一码,如中华人民共和国=81 (中)32 (4 ) 32 (人)83 (口) =81323283,
权利要求
1、一种使用国家标准规范部件和笔画在计算机上输入汉字的方法,属汉字信息处理技术领域,它涉及汉字部件的拆分和组合规则,其特征是严格遵循国家部件规范和笔画规范的规则,拆分汉字和部件组合;将笔画的横竖撇点折等五类笔画依据其有无其他笔画叉过,一分为二为无叉笔和有叉笔的十类笔画;将规范的成字部件、非成字部件和十类笔画分别规则地分布在计算机的大键盘上,其编码方法和输入方法如下关于笔画指横(一)竖(丨)撇(丿)点(丶)折(乙)等五类;其中,捺()属于点类;本发明将这五类笔画依据其有无其他笔画叉过,一分为二,又分出有叉笔的五类笔画,即叉横、叉竖、叉撇、叉点(叉捺)、叉折等五类;笔画的编码是横1,竖2,撇3,点4,折5,叉横9,叉竖8,叉撇7,叉点6,叉折0;另外,首笔为竖的部件,有方框特征的为“方竖”,;撇,有其他笔画与撇的中部相连特征的为“中撇”;点和捺,与上下左右的横或竖相邻的,为“直点、直捺”,直点、直捺归入叉点叉捺;关于部件指《信息处理用GB13000.1字符集汉字部件规范》中所列,由笔画组成的具有组配汉字功能的构字单位;部件分为成字部件和非成字部件两种,成字部件中的成字以《国标GB-2310(80)》中的常用字为限,201个成字部件如下口一八木日曰人入土士月金十田文贝七又大止女言虫火山王玉心小立禾衣竹目几石寸车厂四广白工力皿米示门巾刀刁巳已己尸爪子耳卜羊儿牛习戈雨夕夫方食酉水二川干西斤臼丰见弓戊丁犬户革由长舟歹册而臣业未末自非毛巴且矛千中甫氏束里母手龙乙世皮黑亡瓦也丸不内父果上鬼亚身乃柬九电气万冉央曲兆乍必甘屯巨牙瓜了弗我重尹丘五民丫中于下东乡及更予甲片为丑求垂尺韦乎丹夷久之井禹熏本肉串永象才两斥州乐曳三飞专丈年史事凹吏秉个书凸承超出常用字部分的成字归入非成字部件部分;本发明所使用的部件均为不可再拆分的基础部件;关于部首指《现代汉语词典》中所列部首;部首是合成部件的,均拆分成基础部件使用;本发明使用计算机大键盘上30个键位;上10个键位为成字部件键位,下10个键位为非成字部件键位,中10个键位为笔画键位;首笔为“横竖撇点折”的部件和笔画在键盘的右方,依次由中部向右顺次排列,首笔为“叉横叉竖叉撇叉点叉折”的部件和笔画在键盘的左方,依次由中部向左顺次排列;部分非成字部件和成字部件相通的,合并归入成字部件键;每个键位设一个键名字,成字部件键位在该部件中选择一个汉字;非成字部件键位和笔画键位从所属成字部件的成字中选择一个汉字;个别键位设了两个键名字,一个成字,一个非成字;编码方法本发明为字、词混合编码,一个部件或一个笔画为一码,每个字、词最多四码;部件或笔画不足的,以识别码补足;三部件的字补一个识别码;两部件的字补两个识别码,汉字是成字部件,但笔画不足的,也以识别码补足;识别码由部件的末笔画和字型结构合成;字型结构分三种,一种是左右结构;一种是上下结构;一种是杂合结构;左右结构为1,上下结构为2,杂合结构为3;识别码的笔画取部件的末笔画;需要取两个识别码时,笔画所属部件的选择依次为非成字部件、成字部件、成字部首、键名字;前一个部件笔画不足的,取后一个部件的笔画;两个部件同是非成字部件、成字部件、成字部首、键名字的,每个部件各取一码,先取末部件,后取首部件;只取一个识别码笔画的,也依非成字部件、成字部件、成字部首、键名字的顺序取码;使用过的笔画不重复使用;键名字该字所在键连击四键;成字部件汉字第一码为该字所在键,二、三、四码为二、三、末笔画;二部件汉字两个部件各取一码,补两个识别码;三部件汉字三个部件各取一码,补一个识别码;四部件汉字四个部件各取一码;五部件以上汉字一、二、三、末部件各取一码;两字词每字取两码;三字词一、二字取两码,第三字取前两码;四字词每字各取一码;五字词以上一、二、三、末字各取一码。
全文摘要
一种使用国家标准规范部件和笔画在计算机上输入汉字的方法,属汉字信息处理技术领域,它涉及汉字部件的拆分和组合规则,其特征是严格遵循国家部件规范和笔画规范的规则,拆分汉字和部件组合;将笔画的横竖撇点折等五类笔画依据其有无其他笔画叉过,一分为二为无叉笔和有叉笔的十类笔画;将规范的成字部件、非成字部件和十类笔画分别规则地分布在计算机的大键盘上,无需强行记忆;字、词混编,每字、词四码,学习容易。
文档编号G06F3/023GK101236464SQ200810083269
公开日2008年8月6日 申请日期2008年2月27日 优先权日2008年2月27日
发明者平 李 申请人:平 李