专利名称:原生态形码汉字输入法的制作方法
技术领域:
本发明涉及一种中文输入法,具体涉及一种按照汉字的原始形态进行分部取笔形编码的原生态形码汉字输入法。
背景技术:
纵观现有汉字众多输入法,为什么难于普及于大众,其中一个重要的因素,就是忽视了汉字发展的历史和地域因素,单纯从计算机输入的需要去改变汉字几千年来的知识结构,迫使学习者重新学习汉字,其难度可想而知,既难学又易忘,如最常见的五笔字形输入法等。而拼音输入法、五笔字形输入法等,这些输入法都需要键盘上的26个字母键才能完成,限制了其使用。另外拼音输入法的重码率高而且因方言而难于普及。而五笔画输入法,则虽然简单好记,但输入速度慢。
发明内容
本发明的目的是提供一种利用汉字的原生形态结构,根据汉字形体进行分类、分部取笔形编码的,简单易学,输入速度快的原生态形码汉字输入法。
本发明输入法的技术方案包括将汉字笔划划分为10种笔形,并分别用代码表示;将汉字根据其形体结构划分为基本字、包括若干个级别的级别字、以及包括一般复杂字和特殊复杂字的复杂字三种类型;并对相应的分类汉字进行分部,再用所述笔形代码对汉字进行编码。
所述基本字由笔形构成;所述级别字包括一级、二级、三级、四级及以上级别的级别字,所述的一级字为由一个以上的基本字、或者由至少一个基本字加上至少一个笔划集合第一次生成的新字,所述二级、三级、四级及以上的各级级别字分别为由一个较该级别的级别字低一级的级别字加上至少一个基本字或笔划集合第一次生成的新字;所述复杂字包括一般复杂字和特殊复杂字,所述一般复杂字由二个级别字或者由二个级别字加上基本字或笔划集合构成,所述特殊复杂字由一般复杂字加上基本字或笔划集合构成;所述笔划集合为相互衔接交叉或相互依附关联的若干个笔形的组合。
所述对相应的分类汉字进行分部包括级别字、复杂字的分部,所述级别字、复杂字的分部是分别以基本字、笔划集合、相应的级别字、一般复杂字为基本单元,一个基本单元分为一部,按构成该级别字或复杂字的基本单元数分,由几个基本单元构成就分成几部;当级别字作为基本单元时,取其最高级别作为一个基本单元。
所述笔形包括单笔形以及分别与所述相应的单笔形同代码的同码组合笔形;所述10种笔形分别对应用0-9十个数字作为其代码。
所述对汉字进行编码为对于基本字直接以笔形进行取笔编码,对于分部汉字则对所划分的每个部以笔形进行取笔编码。
本发明的输入法操作简单,完全按照汉字的原始形态进行分类分部取笔编码,使汉字的计算机输入变得象书写汉字一样,简单快捷,易于掌握,克服了汉字计算机应用的瓶颈。它只用10个数字键,单手操作,很短时间就可以熟练掌握,既可应用于电脑,也可应用于手机。既具有五笔画输入法的简单易学易掌握,又有比五笔输入法更快的输入速度。既适宜简体,也适宜繁体,涵盖一切汉字,可以在使用华语的任何地域,任何人群中推广使用。
图1为本发明结构分类示意图。图2为本发明笔形与代码关系对照图。
具体实施例方式
根据语言学家的研究,汉字中形声字最多,而且随着时间的推移逐渐增多,甲骨文中占百分之二十左右,《(说文解字)》中占百分之八十以上,现代汉字中已占百分之九十以上。主要由以下几种情况发展而来第一,因一个字的用途多了,为了表意明确,加形符另造字。如由“其”加形符“”造新字“箕”。第二,由一个字的引申义,加形符造新字,如古人在黄昏时举行婚礼,于是“昏”加形符“女”造新字“婚”。第三,由假借义造新字。如“乳”字有浓厚的意义,借农为乳,于是农声字如“浓、脓、秾、 ”等多有浓厚的意义。这样一来汉字发展成为一个形声化的文字体系,非形声字,大多也属于形声字的组成部分。按照汉字的这一历史发展轨迹,撇开汉字的声义单从汉字的形态结构入手,进行深入研究,发现看似纷繁无序的成千成万的汉字形体中存在着内在规律,遵循这一规律概括出汉字笔形结构新学说,运用这一学说创立了本发明输入法。
下面结合本实施例对本发明作具体说明一、笔形划分及代码笔划是组成汉字的唯一元素。根据书写汉字时的运笔规律,将所有汉字的笔划概括为横、竖、点、撇、捺、左钩、右钩、上钩、下钩、方匡10种单笔形,并用0-9十个数字作为其代码,由0-9十个数字键输入。为了使汉字编码的分布更趋合理,减少重码,同时引入同码组合笔形的划分,同码组合笔形的代码分别归属于相应的单笔形。
其笔形划分和代码关系为单笔形横和提“一、 ”的代码为数字键1,单笔形竖“丨”和同码组合笔形“木、木”的代码为2,单笔形点“ 、 丶”和同码组合笔形“冫、氵、灬、亠、丷、 ”的笔形代码为3,单笔形撇“丿、丿”的代码为4,单笔形捺“、 ”和同码组合笔形“钅、艹”的代码为5,单笔形左钩“亅、 、ㄅ、ㄋ、 ”和同码组合笔形“十、ナ、×”的代码为6,单笔形右钩“ ㄥ、ㄑ、”和同码组合笔形“讠”的代码为7,单笔形上钩“乚、 乙、 ”和同码组合笔形“亻、人、、 ”的代码为8,单笔形下钩“乛、”和同码组合笔形“扌”的代码为9,单笔形方匡“口”的代码为0。其中由于单笔形方匡“口”在书写时需三笔,但从形态上我们把它看成单笔形,如“0”。
具体笔形与代码关系对照如图2所示。
关于笔形划分的几点说明1、提“ ”划规为横“一”。
2、不管一笔前面有多少弯折,只要最后以左钩收笔的都算左钩;以右钩,右拐,右弯,右折,右点收笔的都算右钩;以向上、斜向上收笔的都算上钩;以下钩,下折,左下折,左下撇收笔的都算下钩。
3、四周全封闭,中间笔划可串插,如日,目,申,由等其中的方匡取“口”笔形,只要有一边突破如耳,巨,母等其中的方匡不取“口”笔形。
4、同码组合笔形“艹、十、ナ、×”中,横竖斜杠都要无钩无转折,只能衔接其他笔不能穿越其他笔。如“土、廿”的上部取“十、艹”笔形,“米”中间取“十”笔形,但“表、井”上部不能取“十、艹”笔形。又如千下部取“十”笔形,但羊下部不能取“十”笔形。“×”有撇或捺的不能取“×”笔形,如“义、又”下部不能取“×”笔形。
5、“”上笔取“人”笔形,“火,欠,亥”下笔取“人”笔形。
6、组合笔形在字体结构中看成一笔,与单笔形同等看待。
笔形代码通过如下口诀助记横1点3竖木2撇4捺5含钅(金)艹(草)左钩加叉6右钩讠(言)属7上钩人字8
下钩提手9,口诀要记清,还有方匡0。
二、汉字结构及分类1、基本字和笔划集合的构成(1)基本字;在一个字的字体结构中,没有任何笔形组合能生成别的字,这种字称它为基本字。
一个笔形是完整的,既不能割断,也不能移位。如“夫、必”是基本字,因为在它的字体结构中,没有任何笔形组合能生成别的字。“夫”不能生成“土”和“人”字,因割断了笔划“丿”,也不能生成“二”和“人”,因移动了“二”。“必”不能生成“心”,因移动了“丿”。但“国”中的“玉”单独成字,它不需要割断或移动“国”字中的任何笔形。“主、宜”字中的“王、且”单独成字,它不需要割断或移动“主、宜”中的任何笔形,所以“国、主、宜”都不是我们所定义的基本字。
“一、乙、口、人、十、木”6个笔形本已单独成字,但它们已作为同码组合笔形列人取码笔形,所以不再视为基本字,在汉字结构中把它们看成非字笔形。
(2)笔划集合;笔划之间有一定的衔接交叉或虽有某些笔划没有衔接交叉但在构成汉字时存在某种依附关联,前一种情况如“冖、匚、冂、 、廴、卩、阝、 宀、夂、犭、饣、疒、 ”等等;后一种情况如“忄、彡、 、火、巛”等等称为笔划集合。规定这样的笔划集合,只要它们在字体结构中的位置相同就把它们归拼为一个笔划集合。如“毫”,基本字“毛”上边的所有笔划归为一个笔划集合。又如“办”,两点“ 、”在基本字“力”的左右两边,位置不同,所以我们把两点“ 、、”视为两个笔划集合(为叙述方便,单独一笔我们也称为笔划集合)。
2、级别字的构成(1)一级字一级字分两种情况;A,一个或几个基本字加上一个或几个笔划集合第一次生成的新字。B,两个或两个以上基本字第一次生成的新字。前者如“字”是基本字“子”加笔划集合“宀”构成的一级字。“鱼”是由基本字“田”两个笔划集合“ 、一”构成的一级字。“潦”是由两个基本字“日、小”加两个笔划集合“氵、 ”构成的一级字。后者如“明”是由两个基本字“日、月”构成的一级字。“忘”是由两个基本字“亡、心”构成的一级字。“磊”是由三个相同的基本字“石”构成的一级字。但“森”不是一级字,虽然它也是由三个相同的笔划集合“木”(注意;“木”已作为取码笔形,在汉字结构中不作基本字看待)构成,因它不是“木”第一次构成的新字,“木”第一次构成的新字是“林”,所以“林”才是一级字。“森”是一级字“林”加笔划集合“木”构成的二级字。
(2)二级字分两种情况;A,一个一级字加上一个或几个笔划集合第一次生成的新字。B,一个一级字加上一个或几个基本字第一次生成的新字。如一级字“旦”加上笔划集合“亻”构成“但”,“但”就是二级字。由一级字“早”加上基本字“立”构成“章”,“章”就是二级字。一级字“旦”加上基本字“里”构成“量”,“量”也是二级字。
三级字、四级字及以上级别的级别字构成以此类推。
3、复杂字的构成复杂字分为一般复杂字和特殊复杂字。
一般复杂字分两种情况;A,由两个级别字构成。如“鲢”由一级字“鱼”和一级字“连”构成。B,由两个级别字再加上基本字或笔划集合构成。如“赣”由二级字“章”和一级字“贡”加上笔划集合“攵”构成。
特殊复杂字由一般复杂字加上基本字或笔划集合构成。如“戆”由一般复杂字“赣”加上基本字“心”构成。又如“腑”由一般复杂字“府”加上基本字“月”构成。
级别字里至少有一个基本字或一个较低级别的级别字。复杂字里至少有两个级别字。汉字结构分类如图1所示。
三、汉字分部方法基本字不分部,级别字和复杂字分部。
1、级别字分部方法(1)一级字一级字的分部是以每个构成该一级字的基本字、笔划集合为基本单元,有几个基本单元就分成几部。如“旦”只有一个基本字“日”和一个笔划集合“一”,所以分成两部“日、一”。“鱼”有一个基本字“田”,两个笔划集合“ 一”所以分成三部“田、 、一”。“明”有两个基本字“日、月”没有笔划集合,所以分成两部“日、月”。“复”有两个基本字“日、又”,两个笔划集合“、丿”所以分成四部“日、又、、丿”。
(2)、二级字二级字的分部是以每个构成该二级字的基本字、笔划集合、一级字为基本单元,有几个基本单元就分成几部。如“但”分成一级字“旦”和笔划集合“亻”两部,不能分成“亻、日、一”三部,因为“日”与“一”已生成一级字“旦”,在二级字里一级字不能再拆分,这点特别重要,它和“鱼”不同,“鱼”虽然有两个笔划集合,但其中任何一个与基本字“田”都不能生成新字,所以“鱼”本身是一级字。
(3)、三级、四级及以上级别的级别字三级字的分部是以每个构成该三级字的基本字、笔划集合、二级字为基本单元,有几个单元就分成几部。如“骤”,由基本字“马”与二级字“聚”构成,分成“马”和“聚”两部。“聚”不能再拆分成一级字“取”和笔划集合“ ”,在“骤”的分部中应取其最高级别“聚”。四级字及四级以上的级别字的分部以此类推。
2、复杂字的分部方法一般复杂字的分部是以每个构成该一般复杂字的基本字、级别字、笔划集合为基本单元有几个基本单元就分成几部。其中当级别字为基本单元时,取最高级别作为一个基本单元。如“鲢”,由两个一级字“鱼、连”构成,分成“鱼”、“连’’两部。又如“赣”,由二级字“章”、一级字“贡”,笔划集合“攵”组成。分成“章”、“贡”、“攵”三部。
特殊复杂字的分部是以每个构成该特殊复杂字的基本字、笔划集合、一般复杂字为基本单元,有几个基本单元就分成几部。如“戆”,由一般复杂字“赣”,和基本字“心”组成,分成“赣”、“心”两部。
不管是级别字还是复杂字,每部的排序,按每部首笔书写顺序而定,首笔在前的排前,依次为第一部、第二部......。如“但”,第一部为“亻”,第二为“旦”,“赣”第一部为“章”,第二为部“攵”,第三部为“贡”。“梁”第一部为“ ”第二部为“刀”,第三部为“丶”,第四部为“木”。
3、在汉字结构中,如果一个基本字或级别字加左边的部分生成新字,加右边的部分也生成新字,这时规定加右边的部分生成新字。如“倒”,一级字“至”加左边的“亻”生成“侄”,加右边的“刂”生成“到”,按规定加右边的“刂”生成“到”,分部时,分成“亻”、“到”两部,而不能分成“侄”、“刂”两部。
如果一个基本字或级别字加上边的部分生成新字,加下边的部分也生成新字,这时规定加下边的部分生成新字,如“章”字,基本字“日”加上边的“立”生成“音”,加下边的“十”生成“早”,按规定加下边的“十”生成“早”,分部时分成“立”、“早”两部。同理,“彭”分成“十、豆、彡”三部,而不能分成“士、 彡”三部。
四、取笔形编码的步骤和方法1、取笔形编码的步骤(1)、辨别汉字类别即辨别是基本字还是级别字或复杂字,对于基本字的辨别,不能看笔划多少,大多数基本字笔划简单,但也有少数基本字笔划复杂,要根据基本字的定义判断。
(2)对汉字分部基本字无需分部,对于级别字、复杂字的分部,关键是注意字与非字的区别。在一级字里,首先要找出基本字,每个基本字一定自成一部。在二级字里,首先找出一级字,每个一级字一定自成一部。在三级字里,首先找出二级字,每个二级字一定自成一部。在复杂字里,首先找出级别字(按最高级别),每个级别字一定自成一部。因此熟悉汉字中常见的级别字、基本字对提高取笔编码的准确性和速度很有帮助。
(3)编码输入以笔形取笔编码输入。
2、取笔编码方法以笔形取笔编码依次取首笔、次笔、第三笔到第四笔分别对应用第1个至第4个代码表示。不管什么类型的字,编码最多不超过四码。
1)、基本字基本字取4笔。首笔取最高笔,若最高笔有一笔以上时,取最左边的一笔,次笔取最低笔,若最低笔有一笔以上时,取最右边的一笔,若最低笔已在前面取笔时用过,即最高、最低为同一笔形时,不能再重取。第三、四笔按书写顺序取,不足四笔的取完为止。
例农,最高笔“丿”,最低笔“”,第三笔“ ”,第四笔“乛”,编码4739。丫,最高笔“丶”,最低笔“丨”,第三笔“ ”,编码323。事,最高、最低笔同笔“亅”,第三笔“一”,第四笔“口”,编码为610。
2)、级别字、复杂字级别字、复杂字对所划分的各部以笔形取笔,级别字,复杂字各部分最高、最低笔的取笔方法与基本字最高、最低笔取笔方法相同。
(1)、由两部组成的字,每部取最高、最低笔。若第一部只有一笔,(最高、最低同笔的还算两笔),第二部取最高、最低笔后,按书写顺序取第三笔。
例皑,第一部“白”最高笔“ ”,最低笔“口”,第二部最高笔“丨”最低笔“乚”,编码4028。
悲,第一部“非”,最高笔“丨”,最低笔“丨”,第二部“心”最高笔“丶”,最低笔“ ”,编码2238。
源,第一部只有一笔“氵”(组合笔形在取笔时只算一笔),第二部“原”最高笔“一”,最低笔“亅”,按书写顺序再取第三笔“丿”,编码为3164。
情,第一部“忄”最高、最低笔同笔“丨”,(取笔时仍算两笔,所以在第二部不再取第三笔),第二部“青”最高笔“丨”最低笔“”,编码为2226。
(2)、由三部组成的字,第一部取最高、最低两笔,第二部取最高笔,第三部取最低笔。
若第一部只有一笔时,第二部取最高最低两笔,若第二部也只有一笔时,第三部取最高最低两笔,若第一、二、三部都只有一笔时,就只取3笔。
例鞴,分三部“革、 ”,第一部取最高笔“艹”,最低笔“丨”,第二部取最高笔“艹”,第三部取最低笔“”编码为5256。
报,分“扌、卩、又”,三部,第一部只有一笔“扌”,(组合笔形只算一笔),第二部最高笔为“”,最低笔为“丨”,第三部最低笔为“”,编码为9625。
谧,分“讠、必、皿”三部,第一部只有一笔“讠”(组合笔形只算一笔),第二部最高笔为“丶”,最低笔为“丿”,第三部最低笔为“一”,编码为7341。
(3)、由三部以上组成的字,第一、二、三部每部取最高笔,最后一部取最低笔。
例篡,分“、目、大、厶”四部,第一部最高笔“”,第二部最高笔“口”,第三部最高笔 ,第四部最低笔“丶”,编码为8043。
徵,分“彳、山、一、王、攵”五部,第一部最高笔 ,第二部最高笔“丨”第三部只有一笔“一”,最后一部最低笔“”,编码为4215。
赢,分“亡、口、月、贝、凡”五部,前三部最高笔分别是“亠、口、”,最后一部最低笔为“丿”,编码为3064。
3)、最高、最低笔不好确定的字体的取笔提示(1)、且、见、贝、巴、已,等类似字体最高笔取“ ”(2)、用、周、丹,最高笔取“”,最低笔取“丿”。
(3)、同、冃、月、 最高、最低笔同笔取“”。
(4)、凡、风、几,最高笔取“ ”,最低笔取“丿”。
(5)、山、缶、出、凶,最低笔取“ ”(6)、末、未、朱、本,最高、最低笔同笔取“丨”。
(7)、佳,最高笔取“亻”,最低笔取“一”。
(8)、冖,最高笔取“乛”,最低笔取“ ”(9)、女,最高笔取“ㄑ”,最低笔取“丿”。
(10)、阝、卩,最高笔取“ㄋ、”。
(11)、犭,最高笔取“ ”,最低笔取“ ”(12)、刀,最低笔取“丿”。力,最低笔取“”。
(13)、币,最低笔“丨”。
(14)、门,最高笔取“丶”,最低笔取“”。
(15)、虫、会、去,最低笔取“丶”。
(16)、心,最高笔取“丶”。氐,最低笔取“丶”。
(17)、必,最高笔取“丶”,最低笔取“丿”。
(18)、衣、长、良、展、衰、派、瓜等类似字体,最低笔取“”。
(19)、臼 ,等类似字体最低笔取“一”。
(20)、巨、臣、匡等类似字体最低笔取“”。
4)、几种疑难汉字的分部圆,分“囗、员”两部。
阔,分“门、活”两部。
奥,分“ 、米、大”三部。
粤,分“ 、米、 “三部。
函,分“了、 凵”四部。
幽,分“幺、幺、山”三部。
虚,分“ 七、业”三部。
亟,分“了、口、又、一”四部。
成,分“戊、”两部。
臧,分“戈、爿、臣”三部。
裁,分“ 衣”两部。
畿,分“幺、幺、戈、田”四部。
寡,分“ 刀”两部。
敖,分“ 、万、攵”三部。
葭,分“艹、 、コ、又”四部。
疏,分“乛、止、亠、厶、 ”五部。
继,分“ 、米”两部。
侵,分“亻、 、又”三部。
探、绛、侃、修、蓼、鬟为基本字,不分部。
对于取笔形编码,开始要严格按步骤进行训练,等熟记了编码口诀和编码方法后,就一目了然,过目即可报出编码。
本发明输入法中的笔形、笔顺、结构都是以汉字正楷为标准的,遵循先横后竖,先撇后捺,从上到下,从左到右,从外到内,先里头后封口,先中间后两边的笔顺规则。
本发明输入法是以识字为其知识基础,这将反过来促进汉字教学的规范,丰富汉字教学的趣味,加深对汉字的认识,将对汉字的发展应用和走向世界产生深远影响。
权利要求
1.一种原生态形码汉字输入法,其特征是将汉字笔划划分为10种笔形,并分别用代码表示;将汉字根据其形体结构划分为基本字、包括若干个级别的级别字、以及包括一般复杂字和特殊复杂字的复杂字三种类型;并对相应的分类汉字进行分部,再用所述笔形代码对汉字进行编码。
2.由权利要求1所述原生态形码汉字输入法,其特征是所述基本字由笔形构成;所述级别字包括一级、二级、三级、四级及以上级别的级别字,所述的一级字为由一个以上的基本字、或者由至少一个基本字加上至少一个笔划集合第一次生成的新字,所述二级、三级、四级及以上的各级级别字分别为由一个较该级别的级别字低一级的级别字加上至少一个基本字或笔划集合第一次生成的新字;所述复杂字包括一般复杂字和特殊复杂字,所述一般复杂字由二个级别字或者由二个级别字加上基本字或笔划集合构成,所述特殊复杂字由一般复杂字加上基本字或笔划集合构成;所述笔划集合为相互衔接交叉或相互依附关联的若干个笔形的组合。
3.由权利要求1所述原生态形码汉字输入法,其特征是所述对相应的分类汉字进行分部包括级别字、复杂字的分部,所述级别字、复杂字的分部是分别以基本字、笔划集合、相应的级别字、一般复杂字为基本单元,一个基本单元分为一部,按构成该级别字或复杂字的基本单元数分,由几个基本单元构成就分成几部;当级别字作为基本单元时,取其最高级别作为一个基本单元。
4.由权利要求1所述原生态形码汉字输入法,其特征是所述笔形包括单笔形以及分别与所述相应的单笔形同代码的同码组合笔形;所述10种笔形分别对应用0-9十个数字作为其代码。
5.由权利要求1所述原生态形码汉字输入法,其特征是所述对汉字进行编码为对于基本字直接以笔形进行取笔编码,对于分部汉字则对所划分的每个部以笔形进行取笔编码。
全文摘要
本发明公开了一种输入简单快捷,易于掌握,既可应用于电脑也可应用于手机的原生态形码汉字输入法。本发明将汉字笔划划分为10种笔形,并分别对应用0-9十个数字键作为其代码;将汉字按其结构形态划分为分别用该笔形构成的笔划集合和基本字,由基本字和笔划集合构成的级别字,以及由级别字和基本字或笔划集合构成的复杂字三种类型;对相应的分类汉字进行分部,再以该笔形代码对汉字取笔编码。
文档编号H04M1/23GK101017405SQ20071003447
公开日2007年8月15日 申请日期2007年2月15日 优先权日2007年2月15日
发明者严志德 申请人:严志德