固定字根数码汉字输入法的制作方法

文档序号:6563757阅读:207来源:国知局

专利名称::固定字根数码汉字输入法的制作方法
技术领域
:本发明属于数码汉字输入的方法。
背景技术
:现在的汉字输入法,不论是以标准键盘A-2的26个字母作输入,还是用0-9十个数字键盘作输入,不外有下面三种情况一是以笔画和成字部首作输入码,或以拼音字母加笔画加成字部首作输入码,由于码元杂、成字部首多,学、用都有相当的难度;二是以5-6个基本笔画作输入码,方法虽简单,但因编码空间太少,重码字多,二次选码烦,效率低;三是汉字拼音输入法,以26个英文字母作输入,编码空间极大,电脑输入非常简易便捷,这也是英美文字能够成为当今国际通用语言文字的重要原因,但是汉字是图形文字,形、音是分离的,现今在用的字有近2万字,而拼音的音节非常有限(只410多个),因此产生的同音字很多,差错率高,质量难保证;同时不会读音或读音不准的也无法用好汉字拼音。这些不足和缺陷,都是现今汉字输入法的难题,亟待研究解决。
发明内容本发明的目的是为了解决现今汉字输入法存在的难题,提出一种新的以26个基本笔画笔形和基本组合笔画笔形为固定字根,按字的行、层编码的数码汉字输入法。所使用的字根笔形既单纯、简明,又统一固定、有规律性,易学、好记、使用简便;26个字根编码空间极大,按字的行、层次编码,码元频率调度极佳,重码字的消除已经达到了极限。根据8000汉字(内含7000通用字)测试,每200-300字中只有l或2对重码字。具体实施例方式本发明将26个字根笔形分为10部类,并用两个笔形区别符号键"""-",分别与O-9十个数字键相对应,按字的行、层编码,单字取l-4码,不足4码的,加一止码符号键"。";组词取4-6码,前加组词符号键""。各数字键和字根笔形及笔形区别符号键"""-"的对应关系是<table>tableseeoriginaldocumentpage7</column></row><table>7<table>tableseeoriginaldocumentpage8</column></row><table>(、)、点笔。折笔,有竖折笔(L、二),横折笔("、7),复折笔(了、l、h、?、7、"、乙)。钩作折,因此短钩(L、J、、、7)应作竖折笔,长钩(L、)、V、")应作横折笔。十字笔,有短十字笔(+),长十字笔(十),双十字笔(*)。相连接的短竖双十字笔(丰),应作长十字笔,如茉,取码卄丰U(5&i);间接的短竖双十字笔,应取短十字笔,如苯,取码为廿+"(&30,不能取卄"、(^3b。相连的长竖双十字笔(丰),取了长十字(十)后,余下的横笔也要自取笔码,如末,取码十-/、(&3b,未,取码十一'、(Si3J),不能取码丰卩l^")。连笔,是两个基本笔画(单笔)相连接的笔形,有平连笔,即平笔(横、撇、提、捺)相互连接的笔形(—、T、人、入、<■、广);点连笔,即点与平笔(横、撇、提)相互连接的笔形(工、人、^、>);钩连笔,即钩与平笔(横、撇)相互连接的笔形(匕、丄、h)。点与钩的连笔(^)则取点('),钩与点的连笔(7)则取钩(^)。折笔(竖折、横折、复折)和任何单笔相连接的笔形都取折笔,如刀、乃、厶、〕、二、义等,均取折笔"7、3、二、7各码。任何单笔与折笔相连接的笔形,都以其单笔取码,如几、勺、夕等均取撇的长短笔,5、r等均取横的长短笔。这些连接的笔只能取其起笔一码,不能取两码,只有在末笔时才能取其末笔码或两笔同时取码,如垮,取码为+户-b(681^);沟,取码为'"二、(^54)。竖笔(长竖、短竖)与任何单笔相互连接的笔形,均取竖笔码,如4、卜、K丁、《、T等均取长短竖笔。横、竖、撇、折相连接的三笔画及三笔画以上的字或"部件",都不可拆分为连笔,应按单笔各自取码,如下,取码一l、(^4。);尸,取码^一j(^^);耳,取码一l-十('12^)。交笔,是两个基本笔画相交插的笔形,有平交笔,即平笔(横、撇,提、捺)相互交插的笔形(大、乂、义);钩交笔,即钩笔与平笔(横、竖、撇)相交插的笔形(十、七、3、弋、i");折交笔,即横折、复折与平笔(横、竖、撇、捺)相交插的笔形(又、力、斗、十、九)。钩作折,因此,竖折与平笔(横、撇)相交插的笔形(亡、尹、t)应作钩交笔;双交笔(宇、戈、卄、,、丈、也、开、卡),应作折交笔。折笔两端的交笔,不能作双交笔,应分别取交笔码,如女,应取码t夕(88),车,应取码亡半(8§)。散笔,是两三个分散的笔画相并列的笔形,有两散笔(、、、、"J、A、"、儿、《);三散笔(?、、7、乡、〈〈〈、;、、、);重迭笔(字)"a"、,,),",,"为两个相同字的代码,如林、羽、目目、關、月月、炎、圭……。字根笔形相重迭,不取重迭码,应取字根码,如aa(00),从(f7)。折笔(竖折、横折、复折)和竖笔(短竖、长竖)与任何单笔相分散并列的笔形,都不作散笔,均以折笔、竖笔取码,如i、气取复折t、飞,;取横折7;)1、、1'、小、)'l均取竖笔|。围笔,是两三个笔画相接组成包围框或半包围框的笔形,有空围笔,即里面没有字的口(口、凸、凹);实围笔,即里面有字的口(日、曰、a);半围笔(n、nj、n、匚、lj、d、门、厂、i_)。"E"为里面有字的口的代码(如国、圆、里、目、四、酉、等字中的口)。②长笔、短笔的界定长横笔、长横撇笔,必须是一横笔直到字的左右两边的尽头,两边不得有竖笔相连挡住,长竖笔、长竖撇笔、长钩笔、长十字,必须是一竖笔直到字的上下两边的尽头,两边不得有横笔相连挡住。否则,就是短横、短竖、短撇、短十字。但是,允许一边有挡笔或两头有接笔。如正,第一笔、末笔均为长横(一),第二笔的竖因为上下两边都与横笔相连挡住,故为短竖笔(,),取码为一卜一(i2ii);斤,第一、二两笔横撇和竖撇是笔尾和笔头相接,故均为长撇,第三笔的横只有左边的竖撇相挡,故为长横一,取码为7卩一》(Sl2);巳,第二笔的横,左边有钩笔挡住,右边是接笔(算半挡),故为短横-,第三笔的钩只上面一接笔,故为长钩L,取码为"7-L(^g。)。③依惯例,提(/)作横,竖提(L)、竖钩(J)做竖U),但提、竖提、竖钩与其他笔画相交时,其原性质不变,仍然为交笔。如于为钩交笔,不能为十字笔(十),净为双交笔,不能为竖双十笔(丰)。三、编码方法①汉字的结构分为左右结构和上下结构(包括整体结构和包孕结构),左右结构的字分行次编码,上下结构的字分层次编码,以行、层为单位取码,行里的层以行计,层里的行以层计,每字前取3码,后取末笔一码,不足4码的,加一止码符号键"。"。行、层区分的原则,是以原字明显分隔的行、层为主,其次是以成字为一层划分层次,再次是以笔画结构划分层次和以字根为层次。明显分隔层次〉成字层次〉笔画结构层次>字根层次。大者为先、为准。如美,无明显分隔的层次,按成字层次可分M、大两层,按结构层次可分"、土、大三层,按字根层次可分为"、一、+、一、,、v六层,显然,美,应拆分为至、大两层,取码、/-大、(9isb。又如禽,应以结构层次分为人、忠、内三层,取码人^x、(7'784);事,要以字根层次取码子口斗"&)§1)。汉字的行次是分明的,所以规定行间不管是否有笔画相连靠,行次都认定是明显分隔的,在分行、层次时,行为大,如我,应为两行字;微,应为三行字,不能分为六层字;同样,警、馨、暂、羲应为三行字;赢,应为四行字。行次和明显分隔的层次是决定每字编码的数量和方式的唯一依据。没有明显分隔层次的行叫整行,没有明显分隔的层次的层叫整层。一整行(整层)的字,按字根笔顺取前3码,后末笔一码,如真,取码+曰-'、(65i9);革,取码卄-a4(ii06);离,取码丄XU、()854)。两整行(整层)的字,按字根笔顺第一行(层)取前两码,第二行取前、末笔两码,如锯,取码"一"^(7ik));骨,取码rnn-(5SI)。如第一行(层)只有一码,则第二行须取3码(前2、末l),如播,取码净/"+(§396);筹,取码〃卢一、(5§f4);槿,取码十卄--(^11)。反之亦然,如权,取码斗,、叉(&45);曾,取码"E'S(9^6)。三行(层)的字,第一行(层)取前1码,第二行取前、末两码,第三行取末笔1码,如徽,取码/I,乂(3228),微,取码/l卞义(32S8);徵,取码/l-乂(3218);镪,取码h"^一(7^7');罾,取码日、"曰(6925);鼻,取码/13+1(3&62)。如果第二行(层)只有一码,则第三行(层)须取前、末两码,如浙,取码W'l(^32);槠,取码fitB^^5h如果第二、第三行均为一个笔码,则只取3个笔码就行了,如鲁,取码/—S(3ib;均,取码"V(639);枳,取码ta/i(So9)。四行(层)的字,前三行(层)各取起笔一码,第四行(层)取末笔一码,如滌,取码Jit-(&2'1);縧,取码乙H/、(5229);甸,取码/—o+(3106);亭,取码丄o"(f04^);亮,取码山口^(+0^)。两行三层的字,取码方法同三行字,如措,取码^卄-ig(^、E));鹘,取码nn--(^li);两层三行字;鹭,取码a/o-(0301);暂,取码f/I曰(832))。两行四层的字,取码方法同四行字,如绢,取码二-a-(510i);骰,取码nn;x(^-3§);靛,取码丰n、、(6547)。两层四行字,如蘅,取码卄7/^(53^);赢,取码丄nn、()554);赢上no、(亍504);羸,取码上J7"、()594)。两行五层以上的字,每行均取前、末两笔码,如豌,取码—"L(lk5);榖,取码+、乂又(6435);觳,取码+"义(6^5);懿,取码+^(6*195)。如果第一行为一个笔码,则第二行增加一码,如淳,取码、〉A口J(^ob为增强记忆,将按行、层次编码的方法,用顺口溜的形式归纳于下一行必须是整层,不然,就是按行层数取笔码;二行每行各取两笔码,三行必须中行增一末笔码,四行每行各一码,两行五层以上每行均取前、末两笔码。注意单码行层下行加一码,最后的行层要取末笔码。②围笔(日、口)与单笔相交笔的取码方法日的下边与单笔相交,应以日的起笔竖(')为笔顺,先取日,后取相交的单笔,如甲,取码曰l(&。);里,取码曰+—(&i)。口的上面与其他笔画相交,应以口的末笔横(一)为笔顺,先取其他笔画,再取口为末笔码,如由,取码I曰(&。);西,取码(i350);酉,取码一,L曰(i356)。③实围笔字、包孕笔(含半包围)字的取码方法实围笔(ra)、包孕笔是一个明显分隔的层次,实围笔、包孕笔里的字或部件,应分行、层,统一计数编码,如圊,为三层,取码曰4--(^11);园,分三行,取码0"((52各。);囹,为四层,取码t3A、、(0744);圈,为两层,取码0"^b(&§5)。包孕字,匐,为四层,取码;一a+(3106);武,为两层,取码-大lz(l^i);藏,分三层,取码卄^H(g§32)。实围笔字的口,既是起笔(i),又是末笔(一),取过的码不能再取,所以围笔字都以口内的字的最后一笔为末笔。包孕字的末笔也往往位移于起笔上,因此,也以包孕笔里的字的末笔为末笔。④四笔画以下的字,依笔顺按单笔实取码,如一,取码一(1。);乙,取码乙(S。);人,取码7、(^。);入,取码/、(3乙);又,取码7、("。);刀,取码乂(^。);三,取码---(il'l。);乞,取码J一l(3l5。);口,取码ll一(^i。);中,取码,,—j(2SG);气,取码,--1(311"^);手,取码—一j(3li么);毛,取码卜一Ldii^)。⑤重迭字的编码方法,以重迭笔码为起笔码,然后第一行(层)取次笔码,第二行(层)取末笔码,如林,取码"'乂、(§3匕);朋,取码〃--(Mi);羽,取码""(§99)。如两行字中重迭字一为整行或两层字中重迭字为一整层,重迭字码取了以后要加取它的一起笔码,如栩,取码为十,//7("^);桂,取码十〃/十(^3^);焚,取码"+"人(9697)。⑥组词编码方法组词以字为单位取码,前两字每字取前、末两笔码,两字以上的组词,不论多长,只加取最后一字的前、末两笔码。以6码为限。组词先用组词符号""标明,组词符号""可用/键。两字词例汉字)、义、于(9848)输入i:"人(8g7)数码、/义r一(9871)编码二卄r-(:5^71)多字词例天安门-、、"H(:li48))北京市U》J上,(S^7'2)毛泽东〗t、;+h、(^%89)世纪坛并L么L+、(g555&)知识产权人D》,、+又(:7(^96§)劳动文化宫卄力""力、CI(:冗1§40)百闻不如一见T曰门+n/L(:76to7)先天下之忧而忧比-、'、(351^4).权利要求1、一种固定字根数码汉字输入法,其特征在于,以26个汉字基本笔画笔形和基本组合笔画笔形为固定字根,把26个字根笔形分为10部横(提),竖(竖提、竖钩),撇,点(捺),折(钩),十字笔,连笔,交笔,散笔,围笔,并用两个笔形区别符号“·”“-”,分别与0-9十个数字键相对应,单字分行、分层编码,取1-4码,单字不足4码的,加止码符号键“。”。2、根据权利要求1所述的一种固定字根数码汉字输入法,其特征在于,该发明以26个基本笔画笔形和基本组合笔画笔形为固定字根,这26个固定字根的笔形是①横短横-,长横(提)一;②竖短竖l,长竖(竖提、竖钩)|;③撇短撇乂,长撇j;点正点、,反点(捺)';⑤折竖折(短钩)L,横折(长钩)l,复折3;十字笔短十字+,长十字十,双十字⑦连笔平连笔h,点连笔丄,钩连笔C;⑧交笔平交笔f,钩交笔f,折交笔力;⑨散笔两散笔、/,三散笔、》重迭笔";围笔空闺笔口,实网:I:S,半ll笔n。3、根据权利要求1或2所述的一种固定字根数码汉字输入法,其特征在于,该发明把26个字根笔形分为10部类,并用两个笔形区别符号"""-",分别与0-9十个数字键相对应,其对应关系为<table>tableseeoriginaldocumentpage3</column></row><table>4、根据权利要求3所述的固定字根数码汉字输入法,其特征在于,对其横、竖、撇、钩及十字的长、短笔形定义为凡是一长笔必须是一笔直到字的左右两边的尽头、或上下两边的尽头,而且两边不得有挡笔,否则,就是短笔,但允许一边有挡笔或两头有接笔,接笔是两个笔画的笔头与笔头或笔尾与笔尾、笔头与笔尾相连接的笔形。5、根据权利要求1或2所述的固定字根数码汉字输入法,其特征在于,规定只有平笔(—横、提、撇、捺)与点、钩笔中任何两个笔画相连的笔形才是连笔。折点虽为一笔写成,但直观却是两连笔,故折笔和任何笔画相连都不做连笔,应以其相连笔的起笔取码;折笔和任何笔画相分离并列的笔也不作f^笔,均应以折笔取码;竖笔在字根组笔中利用过多,为了保持竖笔的一定用量,规定竖笔和任何笔画相连的笔和相分散的笔都不作连笔、散笔,均以竖笔取码;规定连写的两短横=、两短竖l/、两短撇"为长横一、长竖|、长撇j;规定横、竖、撇、折4个笔画相连的三笔画及三笔画以上的字或"部件",都不拆分为连笔,均按单笔取码。6、根据权利要求l所述的固定字根数码汉字输入法,其特征在于,述及的功能键有两个字根笔形区别符号"*"(循环点)"-"(短杠),一个不足码字的止码键"。"(句号),一个组词符号键""(冒号);区别符号键"*"可用本码数字键"双击",区别符号键"-"可用本码数字键同左边或右边另一数字键"同击",止码符号"。"可用"*"键,组词符号键""可用"/"键。7、根据权利要求1所述的固定字根数码汉字输入法,其特征在于,把26个字根笔形分为10部,用两个笔形区别符号键"""-",分别与0-9十个数字键相对应。8、根据权利要求1或2所述的固定字根数码汉字输入法,其特征在于,单字的分行、分层编码以行、层为单位取码,每字前取3码,后取末笔一码,不足4码的,加一止码符号键"。"。9、根据权利要求1或2所述的固定字根数码汉字输入法,其特征在于,组词以字为单位编码,取4-6码,组词编码前加组词符号键""。10、根据权利要求9所述的固定字根数码汉字输入法,其特征在于,述及的组词编码方法为以字为单位取码,前两字每字取前、末两码,组词4-6码,组词前用组词符号键""标明。全文摘要本发明根据汉字结构和字根构成及其频度的理论研究,提出了以26个汉字基本笔画笔形和基本组合笔画笔形为固定字根的数码汉字输入法。本发明把26个字根笔形分为10部类横(提),竖(竖提、竖钩),撇,点(捺),折(钩),十字笔,连笔,交笔,散笔,围笔,并用两个笔形区别符号键“·”“-”,分别与0-9十个数字键相对应,分行、分层编码,单字为1-4码,组词4-6码。本发明学、用极其简易便捷,基本无重码,高质、高效,并可广泛应用于大小型电脑、微型手机。文档编号G06F3/023GK101178622SQ20071030126公开日2008年5月14日申请日期2007年12月18日优先权日2007年12月18日发明者刘心洁申请人:刘心洁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1