专利名称:无字根汉字信息输入法的制作方法
技术领域:
本发明涉及一种无字根汉字信息输入法,简称“邓码”或“无根码”,是一种无须编造字根、键盘容易记忆、规则简明易学、使用效率较高、适用一切汉字的汉字信息处理方法。适用于计算机和其它汉字信息处理使用。
传统汉字编码中的音码,由于受到普通话和汉语拼音知识普及程度的限制,使用范围有限。传统汉字编码中的形码,都是在笔画或字根(部件)两个层次上对汉字进行拆分编码,普遍存在着记忆困难、使用不便、仅适用于特定汉字集合等缺点。如果不从汉字编码的基本理论上突破,这种状况难以改变。
汉字的笔画分为“横、竖、撇、点、折”五种,其中折笔在书写过程中转变方向称为“复方向笔画”,其余为“单方向笔画”(参见《汉字键盘输入技术与理论基础》,陈一凡胡宣华著,清华大学出版社1994年6月出版)。
汉字的笔画组合分为以下四类(参见《汉字键盘输入技术与理论基础》,陈一凡胡宣华著,清华大学出版社1994年6月出版)一、离散。例如二、氵、刂、彡、火、巛等;二、连接。例如厂、丁等;三、交叉。例如十、丰、也、车等;四、包围。例如囗、匚等。
本发明的目的在于提供一种无须专门的字根、采用规范的汉字的笔画或笔画组合构成的笔画组合,通过将各种笔画组合定义到标准的计算机键盘或类似的输入装置上完成汉字信息处理的无字根汉字信息编码方法。
本发明的上述目的是通过这样的技术方案实现的,即一种无字根汉字信息编码方法,其特征在于,是一种根据汉字的最基本规范,通过笔画及笔画组合归纳成笔画块,对汉字进行拆分编码,将汉字中可能出现的笔画组合分为“合、聚、交、叉、围、含、孔、口”8类基本笔画块,并根据笔画数或最小包围数进一步细分30个次级笔画块,与横、竖、点、撇、捺5种基本笔画,共35种,与英文字母对应,通过取码规则构成编码方法,对任意汉字、词语进行编码,用这种编码敲击键盘上与码对应的英文字母,将汉字信息输入计算机的方法。
所述笔画组合“合、聚、交、叉、围、含、孔、口”的定义如下合表示完全没有折笔的离散、连接笔画集合;聚表示至少有一折笔的离散、连接笔画集合;交表示完全没有折笔的笔笔相交的笔画集合;叉表示至少有一折笔的笔笔相交的笔画集合;口表示形成四面包围周围没有笔画伸出的笔画集合,分为一般的口和大口;一般的口当中没有笔画或只有一点,大口中有点之外的笔画或多点;孔表示形成四面包围但周围有笔画伸出的笔画集合,分为一般得孔和大孔;一般的孔当中没有笔画或只有一点,大孔中有点之外的笔画或多点;其中孔周围笔画及这些笔画上交叉的笔画不再拆,交叉在周围笔画上的三面包围也不再拆;围表示形成三面包围的笔画集合;含表示形成三面包围中间有竖笔或竖撇与之相交接的笔画集合;其中中间竖笔上交叉的笔画不再拆。
30个次级笔画块为将合、聚、交、叉按块中笔画数分为“二合、三合、四合、五合”,“二聚、三聚、四聚、五聚”,“二交、三交、四交、多交”,“二叉、三叉、四叉、多叉”诸种;将孔、口按笔画块中包含的最小四面包围数量分为“一口、二口、三口、四口、多口、大口”,“一孔、二孔、三孔、四孔、多孔、大孔”诸种;围、含各单独为一种;加上横、竖、点、撇、捺5个基本笔画,按对称易记方式排列,指定在标准键盘上与英文字母对应。
附图
为本发明的键盘的示意。其上的英文字母的键位与标准的英文打字机或计算机键盘相同,每个字母键位上对应至少一个汉字笔画块。
本发明涉及的笔画块是一种比字根更基本的汉字结构,利用它设计的无字根汉字编码法的编码规则为“识围交,分聚合,依笔顺,取编码”。
一、识围交“围”即各种包围,“交”即各种交叉,邓码无字根汉字编码法规定交叉不拆,包围不拆,以交叉和包围划界,将一个字分解为若干部分,即在一个汉字中,设想把各种交叉、包围用不同的颜色描画出来,这个汉字就被拆分成了若干部分;二、分聚合连续书写或去掉交叉或包围笔画块后可以看成连续书写的连接、离散笔画只要不超过五笔就可以在一块中;但必须注意(1)能大则大对连接和离散笔画,尽量取大,如果超过五笔,则在照顾汉字结构的前提下划分为两块或多块;如果结构分析存在歧义,则按照先行取大的原则取码。例如“容”字的第一码应是“五聚(穴)”而不是“三聚(宀)”,“忿”字的第一码应是“四聚(分)”而不是“二合(八)”;(2)不跨结构不破坏汉字的自然结构,可以“合结构”——将两个完整的结构合为一码,不能“跨结构”,即不能将一个结构块中的一部分和其它结构块组合为一码。比如左右结构的“划”字左部取“三叉”之后剩下“一点”,这一点不能与右部的“立刀”结为一块(“三聚”)而只能编码为“三叉、点、二聚”,原因是“划”字的“戈”和“刂”是两个明显的结构块。如果取大时可以将两个或更多结构块组合在一起,则按能大则大原则取码。例如“修”字中按能大则大规则“亻”和“丨”可以组合为“三合”,但不能将“亻”、“丨”和“夂”中之“丿”组合为“四合”,原因就是跨了结构;(3)少笔特例对于总笔画数为五笔及以下的字,如果该字是左右型、上下型或三包围、两包围,则不按照能大则大,而只按照不跨结构。例如“分”字拆分为“二合、二聚、折”对应的键为RUY,而不是“四聚、撇、捺”;“闩”拆分为“三聚、横、横”对应的键为ITT,不是“四聚、点、折”;“忆”字拆分为“三合、折、折”对应的键为EYY;“厄”字拆分为“二合、二聚、折”对应的键为RUY。
三、按笔顺取码顺序按书写笔画顺序,但一个笔画块中如第一笔在前则整个笔画块在前,对应的码亦在前。例如“成”字中的“戈”,其第一笔是全字的第一笔,故“成”字的第一码是“三叉”;四、取编码每字取三码或四码。
1.如果一个字明显划分为左右或上下两部分(或两部分以上)其第一部分有两码或两码以上,则第一部分有两码取两码,超过两码则取首尾两码;其余部分如只有一码则取一码,如有两码则取两码,如超过两码则取首尾两码;例如“教”字,为左右型,其第一部分为左部的“孝”,其编码为“二交、二合、折、二叉”,取首尾二码为“二交、二叉”,其余部分为“攵”,取码为“二合、二交”,因此“教”字的编码为“二交、二叉、二合、二交”对应的键为DJRJ。“壁”字,为上下型,其第一部分为上部“辟”,第二部分为下部“土”,第一部分取码其首码“一孔”和尾码“二交”,第二部分取“二交、横”,故“壁”字的编码为“一孔、二交、二交、横”对应的键为NDDT。
2.如果一个字没有明显的上下或左右两部分,或虽有明显的上下或左右两部分但第一部分只有一码,则依次取码。例如“字”为上下型字,但第一部分只有一码“宀(三聚)”故依次取码为“三聚、折、二叉”对应的键为IYJ;“设”为左右型字,但第一部分只有一码“讠(二聚)”故依次取码为“二聚、二聚、二叉”对应的键为UUJ;“商”字难于明确划分部分,故依次取码为“四合、围、二合、一口”对应的键为WFRV。如一个字只有一码,则补以第一笔和第二笔的笔画码,例如“三”字,取码为“三合、横、横”对应的键为ETT,“鸟”字,取码为“五聚、撇、折”对应的键为PGY;3.如果一个字只有二码,则补以第二码第一笔的笔画码,例如“典”取码为“多口、二合、点”对应的键为BRG;如一个字有三码则依序取一、二、三码,例如“鹏”字的编码为“二孔、二孔、五聚”对应的键为MMP,“通”字的编码为“二聚、四口、三聚”对应的键为UZI;4.如果一个字有四码则依序取一、二、三、四码例如“探”字的编码为“三叉、四聚、二交、二合”对应的键为KODR,“豚”字的编码为“二孔、二孔、五合、一口”对应的键为MMQC;5.如果一个字超过四码,则取一、二、三、末码,例如“操”字的码如取全应为“三交、一口、一口、一口、二交、二合”,按此规则取为“三交、一口、一口、二合”对应的键为KVVR。
6.一个字按上述方法编码之后,如只有三码,可以再加上该字汉语拼音的第一个字母,凑成四码,以减少重码。例如“典”字的编码BRGD,其第四码“D”即为汉语拼音“Dian”的第一个字母;“通”字的编码UZIT,其第四码“T”即为汉语拼音“Tong”的第一个字母。
无字根汉字信息输入法的词语编码规则如下1.二字词取每字的前二码,共四码。例如“建设”中“建”字的前二码为“二孔、二叉”,“设”字的前二码为“二聚、二聚”,故“建设”的编码为“二孔、二叉、二聚、二聚”对应的键为MJUU;2.三字词取第一字的第一码、第二字的第一码和第三字的前二码,共四码。例如“计算机”中“计”字的第一码为“二聚”,“算”的第一码为“三合”,“机”字的前二码为“二交、二合”,故“计算机”的编码为“二聚、三合、二交、二合”对应的键为UEDR;3.四字词取每字的第一码,共四码。例如“知识产权”中“知”字的第一码为“二合”,“识”的第一码为“二-聚”,“产”字的第一码为“四合”,“权”字的第一码为“二交”,故“知识产权”的编码为“二合、二聚、四合、二交”对应的键为RUWD;4.四字以上的词取前三字和最后一字的第一码,共四码。例如“知识产权局”中“知”字的第一码为“二合”,“识”的第一码为“二聚”,“产”字的第一码为“四合”,“局”字的第一码为“一孔”,故“知识产权局”的编码为“二合、二聚、四合、一孔”对应的键为RUWN。
实际使用中如发生重码,包括字与字重码、字与词重码、词与词重码,可利用数字键进行选择。
本发明无字根汉字信息输入法有如下优点
一、思路全新。邓码提供了一种汉字信息处理的全新思路。在过去形码设计的使用基本笔画和人为编制字根之外提出了一种全新思路。过去虽有个别汉字编码方法涉及过类似本发明提出的笔画块中的一部分,但由于没有把它作为编码方法的理论基础,也就没有提出这种全新思路。
二、记忆量小。由于完全没有需要死记硬背的字根,只要会写汉字就能够理解邓码涉及的全部笔画块,在记忆笔画块方面不会产生任何困难。邓码键盘采用对称方法排列,记忆也非常容易。
三、使用简便。邓码无字根汉字编码法的编码规则十分简单,理解、记忆和使用都很容易。包围不拆、交叉不拆,使汉字的拆分大为简化。使用围交划界的方法,不会产生歧义。使得汉字编码的方法变得十分简便。
四、适应面广。可以为任何汉字集编码。由于邓码笔画块包含了全部汉字可能的笔画集合,以此为基础的无字根汉字编码法不但可以处理GB2312-80汉字集,可以处理GB13000的CJK汉字集,也可以处理其它任何汉字集合。
权利要求
1.一种无字根汉字信息输入法,其特征在于,是一种根据汉字的最基本规范,通过笔画及笔画组合归纳成笔画块,对汉字进行拆分编码,将汉字中可能出现的笔画组合分为“合、聚、交、叉、围、含、孔、口”8类基本笔画块,并根据笔画数或最小包围个数进一步细分30个次级笔画块,与横、竖、点、撇、捺5种基本笔画,共35种与英文字母对应,通过取码规则构成编码方法,对任意汉字、词语进行编码,用这种编码敲击键盘上与码对应的英文字母,将汉字信息输入计算机或其它汉字信息处理设备的方法。
2.根据权利要求1所述的无字根汉字信息输入方法,其特征在于编码规则为“识围交,分聚合,依笔顺,取编码”;其中“识围交”中的“围”即各种包围,“交”即各种交叉交叉不拆,包围不拆,以交叉和包围划界,将一个字分解为若干部分;“分聚合”包括“能大则大”、“不跨结构”的取码规则。
全文摘要
无字根汉字信息输入法,是一种根据汉字的最基本规范,通过将笔画及笔画组合归纳成笔画块,对汉字进行拆分编码。将汉字中可能出现的笔画组合分为“合、聚、交、叉、围、含、孔、口”8类基本笔画块,并根据笔画数或最小包围个数进一步细分30个次级笔画块,与横、竖、点、撇、捺5种基本笔画,共35种,与英文字母对应,通过取码规则构成编码方法,对任意汉字、词语进行编码,用这种编码敲击键盘上与码对应的英文字母,将汉字信息输入计算机或其它汉字信息处理设备的方法。
文档编号G06F3/023GK1244672SQ9911508
公开日2000年2月16日 申请日期1999年8月16日 优先权日1999年8月16日
发明者邓新民, 邓颖 申请人:邓新民, 邓颖