汉字实用部首编码法及其键盘的制作方法

文档序号:6408000阅读:399来源:国知局
专利名称:汉字实用部首编码法及其键盘的制作方法
技术领域
本发明涉及一种用于将所要处理的中文信息项目转变成为计算机能够处理的编码形式的手动输入方法及其装置,特别是指一种汉字实用部首编码法及其键盘。
汉字电脑输入的技术获得突破性解决至今已有近十年的时间了。在这段时间里,各种新的汉字编码技术不断涌现,有的已经取得了举世公认的成就,拥有了国内外众多的用户,得到了海内外各界的高度评价。然而当前有一种倾向也不能不引起汉字编码专家们的重视,即现在有些从事汉字编码工作的研究人员一味追求输入速度,把输入速度作为衡量一种方法是优是劣的唯一标准,而忽视了汉字电脑输入作为一个新时代的先进技术还必须具备的实用性和通用性的问题。更具体一点来说,目前已出台的一些汉字输入方案大都存在着规则多而又不严谨、字根难记、取码操作不流畅、学习中使用时精神负担过重等问题,因而很难被广大的一般用户所接受,以致影响其普遍推广应用。即算是当前享誉最高的五笔字型输入法,也仍只是被专业打字员所使用。该输入法从学习到熟练运用,一个具备中等文化的女性青年专职打字员要花近四个月的时间。这对于一个由单位选派培养的专业打字员或中学毕业的待业青年来说,当然有时间和条件去进行这种强化训练。但是对于那些广大的在职人员,特别是对于那些广大的中老年文化和科技工作者来说,则是难以做到的。因此说,当今从事汉字编码的专家和研究人员,应当把主攻方向放到汉字电脑输入技术的进一步实用、通用和普及上来。
有鉴于上述实际的需要,本发明的目的,乃是提供一种易学易记、能较快地为一般用户所掌握而又具有高输入速度的汉字实用部首编码法及其键盘,从而使其具有更大的适用面和更强的实用性与通用性。
本发明的解决方案如下。它以汉字字典为基础精选出可成为汉字部首偏旁(以下简称部首)的若干部首字根和不作为部首而仅起构字作用的纯字根,总共形成部首字根占大多数而纯字根占少数的208个字根代码并简称为字码,其中每个字码代表了一个字根或几个相类似的字根,采用现有计算机标准键盘,将208个字码均等地安排在标准键盘的大键盘的26个英文字母键正面上,使得每个键位包含8个字码,其具体作法是,将每个键位正面均匀地分成9个小区,用数字1至9给9个小区依次编号而形成对应于每个小区的坐标码,每个键位原有的英文字母符号标印在原键位9个小区的中心区,而8个字码的符号则分别标印在英文字母外围的8个小区,从而使得每个小区内的字码或英文字母与所在小区的坐标码之间形成一一对应的关系,将208个字码按照字根的首笔笔画而划分为横起区、竖起区、撇起区、捺起区、折勾区和另外一个特区,同一区的字码被安排在相邻的键位上,相邻区的字码可以共用一个键位,这样便形成了一个将形码(即字码)与数码(即坐标码)相结合且以形码为主而数码为辅的采用字根拼形组字的汉字新型编码法及其输入键盘。
下面结合附图和实施例对本发明加以进一步详细说明。


图1为本发明精选的208个汉字字根代码总表实施例;图2为本发明与图1相适配的非成字字根单体输入及共码字根表;图3为本发明与图1相适配的汉字字码和英文字母共容的大键盘图;图4为图3大键盘上26个键位的坐标码的排列顺序实施例;图5为图1中的字码标示在图4所示键位上时选取最佳位置的说明示意图;图6为本发明采用的计算机标准键盘中小键盘的数字键位图。
参见图1,本发明在拆分汉字时是以字的部首为基础,从新华字典92年版的189个部首中精选出162个,对其中少数部首进行了变形改造,如“青”改为“”、“业”改为 “疋”改为 等,同时为了适应电脑输入的需要,增补了8个部首,如 等,这就形成了170个部首字根;另外还精选了38个不作部首字根而仅起构字作用的纯字根,如“”、 “巴”等,这170个部首字根和38个纯字根就构成了如图1所示的208个字码。
本发明之所以要选择以汉字的部首为拆分的基础,其原因之一是作为有形方块字体的汉字,其大多数部首不但能表明字的属性特征,而且部首作为一种字根,在组成汉字时也起着十分重要的作用。一些部类汉字的部首在其它部类汉字中亦重复频繁出现,虽然它们此时不是作为部首的身份,但却充当着构字的重要角色。可见部首对于汉字的构成来说,其作用是举足轻重的。原因二是“部首”为广大的人们所熟悉,使本发明的输入法易于为大家学习掌握,特别是对于从事非理科类的各级人员更具优越性。原因三是很多字的部首块体大,如“龙”、“骨”、“身”等,有利于笔画繁多的汉字的组合。
按照形码理论的定义,字根是横、竖、撇、捺、折五种基本单笔画以及由若干这些基本单笔画所组成的相对不变的结构,它是拼形组字的基本单元,“一、丨、丿、、乙”五种单笔画是最简字根。本发明所定义的五种基本单笔画与新华字典上定义的基本相同,其中“挑”属于横笔画类,“点”属于捺笔画类。但用“乙”作为折笔画的代表过于笼统,考虑到汉字带折结构的情形多而且丰富,本发明将折笔画类改称为折勾画类且再细分为下列三种情况(结合参见图1与图2),①纯折笔画。包括顺折“”、反折“”,多折 用字码“”代表;②勾笔画。其类型较多,其中横勾、左竖勾、右竖勾分别用字码“乛”、“亅”、 代表;③折带勾笔画。单折勾用字码 “乚”代表,多折勾 “乙”、“ㄋ”用字码“乙”代表。参见图1与图2,本发明将能够作为汉字部首的字根称为部首字根,如“土”、“亻”、“氵”等;不作为部首而仅起构字作用的字根称为纯字根,如 “亅”、“乂”等;其本身就是一个汉字的部首字根或纯字根称为成字字根,如“王”、“女”、“马”、“古”、“九”等;本身不是一个汉字的部首字根或纯字根称为非成字字根,如“廾”、“亻”、“殳”、 “”等;只有那些入选成为本发明的208个字根代码之一的部首字根和纯字根才称为本发明的字根代码并简称为字码,而未入选的其它字根不能称为本发明的字码;字码只代表本身字根的称为单义字码,如“扌”、“刂”、“丁”、 等;字码除代表本身字根外还代表其它字根的称为多义字码,如字码“彐”代表字根“彐”, 和 字码“牛”代表“牛”、 “牜”,字码“”代表字根 “小”,因此字码“彐”“牛”“”均是多义字码;多义字码所代表的除本身字根以外的其它字根,称之为该多义字码的共码字根,如上述 “牜”称为字码“牛”的共码字根, “小”称为字码“”的共码字根等,按照一个汉字中所含字根的多少,本发明将汉字分为独体字、二合字、三合字和多合字四种。独体字只有一个字根,所有的成字字根都是独体字。由两个字根组合而成的汉字称为二合字,由三个字根组合而成的汉字称为三合字,由四个以及四个以上字根组合而成的汉字称为多合字。
字例独体字〔水、土、金、木、火〕
二合字〔江、明、音、字、回〕三合字〔搬、学、唱、合、部〕多合字〔谭、越、兼、蔼、塑〕本发明根据组字时字根相互之间的连接状态将汉字分为“单”、“散”、“连”、“交”四种类型①单即为独体字。
②散字根之间保持一定距离,不相连也不相交,如“地”、“功”、“字”等。
③连一个字根的某个部位的边缘与另外的字根某一部位的边缘相粘连但不重叠,如“天”由字根“一”连字根“大”,“太”由字根“大”连“丶”,“早”由字根“日”连“十”等。
④交,两个或多个字根交叉套迭,如“申”由字根“曰”与“丨”,“里”是由字根“曰”与“土”,夷是由字根“一”、“弓”、“人”套迭而成。
图1所示的按首笔笔画划分的横起区、竖起区、撇起区、折勾区、捺起区以及另外一个特区的总共208个字码,虽然大多数都为人们熟悉,但在编码输入时要迅速地找到每个字码所在的位置却非易事。而找到每个字码所花的时间直接影响输入的速度,为此本发明采取了一种如前述解决方案所述的独特键盘布局方案(同时参见图3)。按照这个方案,我们将横起区具有的48个字码标印在Q、W、E、R、T、Y这6个键位上,将竖起区具有的32个字码标印在U、I、O、P这4个键位上,将撇开区具有的51个字码标印在A、S、O、F、G、H这6个键位及J键位左边的3个小区上,将捺起区具有的33个字码标印在Z、X、C、V这4个键位及8键的左上角小区上,将折勾区具有的36个字码标印在J键与8键这两个键位余下的小区和K、W、N这3个完整的键位上,将特区具有的8个笔画和形状较为特殊的字码标印在L键位上。本发明之所以设置特区键位,是为了方便用户在拆分和组合汉字时,易于记忆和查找这些较为特殊的字码。
具体实施前述本发明总的解决方案,还必须将26个英文字母键位上9个小区对应的坐标码一一对号入座地确定下来。需要特别强调的是,本发明的字母键上9个小区的坐标码,并非象字码和英文字母那样有形可见地标印在字母键上,而是一种隐形不可见的理论性规定,但又是用户在编码输入时必不可少地必需牢记在心的操作依据。本来,9个坐标码在9个小区的位置是可任作规定性安排的,但考虑到坐标码隐形而不直观的特殊性,为方便用户的快速输入,本发明选择了如图4所示的最佳实施方案,即是将数字1至9这9个坐标码在字母键9个小区上排列的顺序与标准键盘中小键盘的数字键位(参见图6)1至9这9个数字键的排列顺序完全相同,这样一来,使得分成小区的字母键上的坐标码就好象是小键盘上数字键缩小了的图形,用户在输入坐标码时也就有了一个近在眼前的有形可依的提示物,从而加快输入速度。
在图3中,各区字码所在的键位区,字码从左至右按笔画的递增以及字形由简到繁呈有序的排列,笔画最少、字形最简单的排在最左边的键位上,笔画最多、字形最繁的排在最右边的键位上,介于两者之间的则排在中间的一些键位上。而在每个键位上的8个字码的排列位置也有原则(结合参见图5与图4)。一些字码如“厂”、“广”、“户”,在组成的汉字中位于字的左上部位置,如“厅”、“庆”、“房”,所以这些字码就被安排在键位的左上角坐标码为“7”的位置。一些字码如“辶”、“廴”、“毛”在组成的汉字中位于字的左下部位置,如“过”、“建”、“毯”,所以它们被安排在键位的左下角坐标码为“1”的位置。一些字码如“艹”、“”、“亠”在汉字中一般位于字的上部,如“草”、“算”、“高”,它们就被安排在键位的上边坐标码为“7”、“8”、“9”中的某一个位置。有些字码如“扌”、“亻”、“氵”在汉字中位于左侧部位,它们被安排在键位左边坐标码为“1”、“4”、“7”中的某一位置、按此原则,“亅”、“殳”、“隹”被安排在键位的右边位置,“廾”、“皿”、“灬”被安排在键位的下部位置等等。而有些字码如“土”在字中可能不完全处于同一位置,如在“地”和“基”字中分别处在字的左部位和下部位,在“幸”字中又处于字的上部位,象这种情况就以“土”在汉字中出现频度较大的位置考虑。显然,“土”在字的左部位和下部位出现的频度较大,所以它被安排在键位的左下坐标码为“1”的位置,其它类似的情况亦按此原则排位。208个字码在26个键位上的排列参见图3。有了上述排列规则,要在键盘上寻找一个字码的位置就较为容易了。例如要找字码“日”,因为“日”属竖起区,所以它的大体位置在第一排字母键的右边部分。其笔画不太多,会在竖起区键位的左边靠中间的键位上。“日”在字中常出现在左边和上部位置如“晒”和“是”,所以它可能安排在键位的左上角。这样,操作者只要把目光在竖起区字码键中靠左边的键位的左上角搜寻,便很快可发现它位于“I”键左上角坐标码为“7”的位置。需要补充说明的是,由于所杜选的208个字码在汉字中位于左边的情况要多一些,从而使少数字码如 “丬”、“方”未能按以上原则安排,但只要对这几个字码加以特别记忆,而绝大部分字码的排列是符合上述原则和规律的。图3所示的208个字码是在字母键上的排列图,除专业打字员外,一般用户不必去进行强记,随着用户使用的时间一长也就自然地记住了。不难看出,每个键面上的字码都是沿键面四周分布,每个键位中心的英文字母的坐标码都是“5”。这样,每个键上的8个字码和一个英文字母就与键面上隐形的9个小区的坐标码以及小键盘上的9个数字键建立了一一对应的关系。键面上的字码和英文字母的标印,可以采用铸印,也可采取一般通用的粘贴不干胶标签的办法。
为了下述所谓“简码”编码的需要,本发明用26个常用高频汉字给26个英文字母键各取一个键名,键名汉字不标印在键面上,而且它们与所在键位的字码也不一定有必然的联系,仅只是一个名字而已。键名汉字及其排列参见图1。从图中可看出,每个键名汉字的读音即为它所在键的英文字母转化为同形汉语拼音字母的读音。若键面转化的汉语拼音字母是韵母,则就是韵母的发音;若键面转化的汉语拼音字母是声母,则为其声母与韵母“i”或“e”的拼音,英文字母“I”、“U”、“V”在汉语拼音字母中没有,它们就按英文字母的读音起名,因此I键的键名是“爱”,U键的键名是“优”,V的键名是“为”,掌握了以上规律,要记住26个键名汉字就较为容易了。
由于本发明是以汉字的部首作为编码时拆分和组合的基础,所以正确地判定一个汉字的部首就成为掌握本发明的首要问题。除了少数一部分“连交”复合结构的字外,人们对绝大多数的汉字传统部首的判定并不困难,但有一点要说明,传统字典中很多汉字具有多层属性,一个汉字同时被编进了不同的几个部首类中。而本发明所制定的部首判定规则的宗旨是,一要尽量做到与字典上部首归类一致,二要消除字典中一字多属的现状,即让一个汉字只有一种部首。这样,每个汉字按部首分类时,其隶属关系便具有唯一性。
本发明将汉字分解为字根组合的拆分原则是,以本发明的208个键面字码代表的字根(包括字码本身字根和其共码字根)为依据对汉字依序进行拆分,并且从拆分得出的字根中选取第一个字根或最末一个字根作为该字的部首,而不能取中间的字根作为该字的部首(即使该中间的字根是属于208个字码之一的部首字根也不能取作该字的部首)。
按上述拆分原则,独体字不存在拆分和部首字根的选取问题。同时在此拆分原则下规定,对于“散”结构、“散连”结构以及单纯的“连”和单纯的“交”结构类型的组合汉字,在选取部首字根时还应按照书写的顺序,采取“取大优先”的原则,在汉字拆分后的第一个或最末一个字根中只有一个是属于208个字码中的部首字根的,则取该部首字根作为该字的部首。例如“世”字是由字根“廿”与“”组成,其中“廿”是部首字根而“”是纯字根,所以“世”字的部首是“廿”。
“具”字是由字根 与“八”组成,其中 是纯字根而“八”是部首字根,所以“具”字的部首是“八”。
“鞍”字拆分第一个字根时,根据键面上的字码有“廿”及“革”,字码“革”比字码“廿”大并且“革”中包含了“廿”,根据“取大优先”的原则,第一个拆分的字根为“革”而不能取“廿”。
对于“连交”杂合结构类型汉字的拆分,以及对于组合字中组成汉字的第一个和最末一个字根都是部首字根时究竟选取哪一个作为该字的部首,本发明在上述总的拆分原则下,还制定了简便易学的“汉字难分字的拆分及部首的判定方法”,以供用户实际操作运用。
键面上的208个字码在未输入电脑之前仅只是一些符号,只有当将它们按照一定的方式输入电脑后才具有实际的意义。如字码“土”是字根“土”和 的代表符号,当对它进行单体输入时,我们就得到汉字“土”,它的发音和意义就是字典中“土”所包括的内涵。如果对字码“土”进行组合输入而与字码“止”组成汉字“址”,这时字码“土”在这里是作为一个部首字根起构字作用,而输入的“址”字有了完全不同于“土”字的意义。另外,多义字码如字码“彐”,它是“彐”、 三个字根的代码,在拆分组合汉字时凡是遇到这些字根都输入字码“彐”。而最后得到的结果究竟是哪一个呢?电脑会根据用户的需要自动而且正确地作出选择,这一功能则是通过编码和软件制作来实现的。为着编码时表述和书写的方便和统一,本发明规定,运用分派在每个字母键上的8个字码及其共码字根进行编码时,采用它们所在字母键的英文字母作为其编码符号,并称该英文字母为它们所对应的键位代码,简称键位代码,如“土”、“十、“工”、“大”等的键位代码为“Q”;同样,每个键的英文字母还用作该键英文字母本身和该键键名汉字的编码符号,同样称作它们所对应的键位代码,如英文字母“W”的键位代码为“W”,键名汉字“而”的键位代码为“E”。
编码时按照汉字的楷书形式的正确书写顺序,从左到右,从上到下,从外到内将所拆分的字根进行编码;取码以208个字码为依据,最多只取四码,对于超过四个字根的汉字,按一、二、三、末字根的顺序取码;当汉字拆分不足四个字根时,必须输入坐标码,如果是三合字,输入该字部首字根的坐标码,如果是二合字则该字的部首字根和另一个字根都要输入坐标码,独体字的编码为其键位代码加坐标码再加空格键,多合字不取坐标码,取坐标码的次序是紧跟在它所隶属的字根后面。对以上所述各举一例示范,汉字 类别 部首 拆分编码摘多合字扌〔扌、 冂、古〕 〔WXLR〕塑多合字土〔丷、一、 月、土〕 〔SQEQ〕部三合字阝〔立、口、阝〕〔V1K4〕码二合字石〔石、马〕〔R1M1〕车独体字车〔车〕〔17u〕键名汉字不需要拆分,输入编码为其键位代码加空格键,如“啊”字的编码是〔Au〕“奇”字的编码是〔Qu〕,“优”字的编码是〔Uu〕等。
26个字母键键面上的123个成字字根在单体输入时就是字码本身所示的汉字,它们的编码为其键位代码加坐标码再加空格键,如“龙”字的编码为〔Y3u〕,“马”字的编码为〔N1u〕。“丨”、“丿”“”等单笔划,有时也需单独使用,它们的编码形式与键面字相同,分别为〔U7u〕、〔A1u〕、〔Z7u〕。
英文字母(汉语拼音字母)的输入编码为其键位代码加坐标码再加空格键,如字母“A”的编码是〔A5u〕,字母“Q”的编码是〔Q5u〕等。
数字的输入编码为其键位代码加空格键。输入时击该数字的数字键再击空格键即可。如数字“0”的编码为〔Qu〕,2的编码为(2u〕。这里所说的数字键是指大键盘中位于英文字母键上方一排的数字键,而非小键盘上的数字键。
对于初学者,在输入坐标码时,将小键盘上的数字键置于数字输入状态,用右手击小键盘上相应的数字键。而对于较熟练的用户和专业打字员,则可用大键盘上的数字键输入坐标码,而此时可将小键盘上的数字键置于编辑工作状态,以充分利用大小键盘设备和功能。
为了提搞汉字的输入速度,本发明的编码方案也设计了简码。26个键名汉字的各自键位代码加上空格键,称之为一级简码,共有26个。将按照一般编码法所得汉字编码中具有的坐标码去掉,并且只保留该字的部首字根键位代码和除该部首字根键位代码之外的第一个字根的键位代码,然后再加上空格键,这样便形成了262=676个二级简码,另外,所有208个键面字码都可构成二级简码,而作为非成字字根如“ナ”、 “亻”、 等在单体输入时为它们所代表的高频汉字(参见图2),这类二级简码的编码为键位代码加坐标码再加空格键,以上两类二级简码合计884个,其中除了“丨”、“丿”、“”三码作为基本笔划输入外,其余881个均为选择的高频常用字。本发明的二级简码数比“五笔字型法”的二级简码数(625)个多出256个,即多40%。将按一般编码法所得汉字编码中具有的坐标码或最后一个字根的键位代码去掉,但保留该字的部首字根键位代码和除该部首字根键位代码之外的前两个字根的键位代码,然后再加上空格键,称之为三级简码。本发明有足够的容量给一万多汉字编入三级简码,因而大大地有利于输入速度的提高。同时,具有简码的汉字的全码输入方式仍然保留。
为了提高输入速度,本发明对一些常用词汇进行了词汇编码。不论其字的多少一律取四码,同时词汇编码作为一种开放式结构,各不同专业的用户可根据需要自己组织词库。词汇编码的方法如下二字词分别取两个字的部首字根和除部首字根后的第一个字根,如,“电脑”〔日、乚、月、文〕〔IJFX〕“世界”〔廿、、田、人〕〔ELJA〕三字词取一、二字的部首字根加第三字的部首字根及除第三字的部首字根后的第一个字根,如“计算机”〔讠、、木、几〕〔ZGRS〕“招待所”〔扌、彳、户、斤〕〔WSCF〕四字词依次分别取各个字的部首字根,如“科学技术”〔禾、子、扌、木〕〔GKWR〕“新华字典”〔斤、十、宀、八〕〔FQCS〕多字词取一、二、三字及最后一个字的部首字根,如“湖南电视台” 〔氵、十、曰、厶〕〔CQIB〕“中华人民共和国”〔丨、十、人、口〕〔WQAL〕
对于汉字中字根组成完全相同仅是字型不同的字如“旭”与“旮”“只”与“叭”,考虑到类似这样的情况只是极少数,所以本编码法不设字型识别码,而将它们作为重码字处理。重码字的编码是将重码中的常用字仍按常规编码,而将不常用的字进行重码编码,重码编码按字的部首分类编排,先取部首码,再取部首的坐标码,然后再取数字“0”键键位代码,如果重码的字只有一个,这时它就会出现在屏幕的提示行上,再击空格键即可将该字输入。例如“旭”字是较常用字,仍按常规编码为|F917|。而“旮”是非常用字,则对其进行重码编码。“旮”字的部首是“日”,它的编码为|I70u|。
若在某一部首类内的重码字不止一个,则按它们使用出现的频度排列并标以序号。在键入〔数字“0”键键位代码〕以后,这些字就会按序号排列次序出现在屏幕提示行中,用户可照拼音输入法那样进行二次选择,击相应的数字键即可获得所要汉字的输入。其它类型重码字亦是按以上原则和方法处理,如“喜”与“嘉”字是重码字,将较常用的“喜”按正常编码为〔FIWI〕,将较不常用字“嘉”按重码编码为〔E90u〕。
对一些难于拆分的汉字或因为用户未能掌握正确的书写顺序,结果会使一个字得出多种拆分结果。对于这种情况,本发明的编码方案对每个汉字都编定了一个标准码。对于不符合标准码的拆分结果,一律称为容错码,并把这些容错码也纳入了编码之中,当用户输入了这些字的容错码时也可获得所需要的汉字。例如“长”字的标准码和容错码如下,“长”〔丿、七、〕〔A1WZ〕—标准码“长”〔七、丿、〕〔W9AZ〕—容错码“长”〔丿、一、 〕〔AQKZ〕—容错码“长”〔一、 丿、〕〔QKAZ〕—容错码当输入容错码时,电脑虽会给出操作者所需要的字,但同时会发出警告声,以提示操作者未掌握该字的正确的编码方法,此时在屏幕提示行中会显示出需要输入的汉字和它的标准编码形式,以利学习改正,电脑的这种功能称之为本发明独有的电脑自动纠偏功能。
对于结构复杂、难于拆分、难于判定其部首的一些汉字如“我”、“垂”、“年”等,本发明设置了难分字查找码,其编码方法是,将难分字按书写顺序首笔及末笔笔画进行分类,共分为“横”、“竖”、“撇”、“捺(点)”、“折”、“勾”、“折带勾”七类,分别对应大键盘“Q”、“U”、“A”、“Z”、“L”、“J”、“B”七个字母键。输入时首先击首笔画所属的字母键,再击末笔笔面所属字母键,再击数字“0”键,这时,属于该类的所有难分字将按其使用的频度每5个一组依次出现在屏幕的提示行中,并且在每个字的前面标以序号以供用户选择。如果第一组的5个汉字中仍没有用户需查找的字,就击“<”键进行翻页,如此直至用户所需的字在提示行中出现,然后击相应的数字键。这时,所需汉字自动跳到屏幕上输入行列位置,同时提示行中其它难分字消失,只留下用户需要输入的那一个难分字。在该字的后面显示出它的标准编码形式和部首字根。所以难分字的查找码亦为四码,其编码形式为,〔首笔笔画所在字母键键位代码〕+〔末笔笔画所在字母键键位代码〕+〔数字“0”键键位代码〕+〔提示行选择序号数字键键位代码〕。
本发明具有如下优点,①科学的键盘字码排列布局,充分利用了人对于形象记忆印象深的特点,对按一定规律安排的字码,用户操作时能很快地找到其所在位置,这就特别有利于中老年文化和科技工作者以及一般用户的学习记忆。②将形码与数码有机地结合,创造了一种全新的编码方案,使编码法兼具形码直观、数码严谨的优点,尤其是坐标码的创立使本发明的实用性大为提高。引入坐标码后,使很多汉字以及基本单笔画的编码输入与“五笔字型”法相比较大为简化,同时也是简便而有效地避免和防止重码的方法。同时本发明取坐标码比“五笔字型”法取“识别码”和“末笔码”在操作上要简便得多。坐标码的优点还在于它使得在不更换功能键的情况下能同时输入中英文(或拼音)字母,从而为用户在输入汉字的同时需要插入少量英文(或拼音)字母提供了方便。并且由于在整个操作过程中无需改变电脑的工作状态,因而有利于保持输入的节奏。此外,坐标码的采用还使本发明的组合容量大为增加,有利于简码的编码。本发明的一、二级简码数量加起来共有907个,它包括了大部分的常用汉字,该数目大大超过了“五笔字型”法一、二级简码总数。所以对于熟练运用本编码输入法的专业打字员,可以达到不亚于“五笔字型”法的输入速度。③具有一套严谨、完善的汉字部首判定规则和汉字拆分规则。使每个汉字的部首具有单一性,而拆分结果具有唯一性,从而为汉字电脑输入走向规范化、标准化和通用化奠定了基础。④标准码与容错码的设立和由此带来的电脑自动纠偏功能,可自动检验操作者掌握输入方法编码的正确程度,有利于用户输入走向规范化和通用化。
权利要求
1.一种汉字实用部首编码法及其键盘,其特征在于,精选出包括部首字根和纯字根在内的208个字根代码并简称为字码,其中每个字码代表了一个字根或几个相类似的字根,采用现有计算机标准键盘将208个字码均等地安排在标准键盘的大键盘的26个英文字母键正面上,使得每个键位包含8个字码,为此将每个键位均匀地分成9个小区,用数字1至9给9个小区依次编号而形成对应于每个小区的坐标码,每个键位原有的英文字母符号标印在原键位9个小区的中心区,而8个字码的符号则分别标印在英文字母外围的8个小区,从而使得每个小区内的字码或英文字母与所在小区的坐标码之间形成一一对应的关系;将208个字码按照字根的首笔笔画而划分为横起区、竖起区、撇起区、捺起区、折勾区和另外一个特区,同一区的字码被安排在相邻的键位上,相邻区的字码可以共用一个键位,这样形成一个将形码与数码相结合且以形码为主而数码为辅的采用字根拼形组字的汉字新型编码法及其输入键盘。
2.如权利要求1所述的编码法及其键盘,其特征在于,将横起区具有的48个字码标印在Q、W、E、R、T、Y这6个键位上,将竖起区具有的32个字码标印在U、I、O、P这4个键位上,将撇起区具有的51个字码标印在A、S、D、F、G、H这6个键位及J键位左边的3个小区上,将捺起区具有的33个字码标印在Z、K、C、V这4个键位及8键的左上角小区上,将折勾区具有的36个字码标印在J键与8键这两个键位余下的小区和K、N、M这3个完整的键位上,将特区具有的8个笔画和形状较为特殊的字码标印在L键位上。
3.如权利要求1、2所述的编码法及其键盘,其特征在于,各区字码所在的键位区,字码从左至右按笔画的递增以及字形由简到繁呈有序的排列,笔画最少、字形最简单的排在最左边的键位上,笔画最多、字形最繁的排在最右边的键位上,介于两者之间的则排在中间的一些键位上。
4.如权利要求1、2所述的编码法及其键盘,其特征在于,将数字1至9这9个坐标码在字母键9个小区上排列的顺序与标准键盘中小键盘的数字键位1至9这9个数字键的排列顺序完全相同。
5.如权利要求1、2所述的编码法及其键盘,其特征在于,以208个键面字码所代表的字根为依据对汉字依序进行拆分,并且从拆分得的字根中选取第一个字根或最末一个字根作为该字的部首。
6.如权利要求5所述的编码法及其键盘,编码时按照汉字楷书形式的正确书写顺序,从左至右,从上到下,从外到内将所拆分的字根进行编码;取码以208个字码为依据,最多只取四码,对于超过四个字根的汉字,按一、二、三、末字根的顺序取码,当汉字拆分不足四个字根时,必须输入坐标码,如果是三合字,输入该字部首字根标的坐标码,如果是二合字则该字的部首字根和另一个字根都要输入坐标码,独体字的编码为其键位代码加坐标码再加空格键,多合字不取坐标码,取坐标码的次序是紧跟在它所隶属的字根后面,输入坐标码既可用大键盘上的数字键,也可以用小键盘上的数字键。
7.如权利要求1、2所述的编码法及其键盘,其特征在于,用26个常用高频汉字给26个英文字母键各取一个键名,键名汉字的读音即为它所在键的英文字母转化为同形汉语拼音字母的读音,英文字母“I”、“U”、“V”在汉语拼音字母中没有,就分别按这叁个英文字母本身的读音起名,键名汉字的输入编码为其键位代码加空格键。
8.如权利要求1、2所述的编码法及其键盘,208个键面字码中的成字字根在单体输入时就是字码本身所示的汉字,非成字字根在单体输入时为它们所代表的高频汉字,它们的编码形式均为键位代码加坐标码再加空格键;英文字母(汉语拼音字母)的输入编码为其键位代码加坐标码再加空格键;数字的输入编码为其键位代码加空格键;输入坐标码既可用大键盘上的数字键,也可用小键盘上的数字键。
9.如权利要求5所述的编码法及其键盘,其特征在于,对词汇编码不论字的多少一律取四码,二字词分别取两个字的部首字根和除部首字根后的第一个字根,三字词取一、二字的部首字根加第三字的部首字根及除第三字的部首字根后的第一个字根,四字词依次分别取各个字的部首字根,多字词取一、二、三字及最后一字的部首字根。
10.如权利要求1、2所述的编码法及其键盘,其特征在于,设置难分字查找码,其编码方法是将难分字按书写顺序首笔及末笔笔画分为“横”、“竖”、“撇”、“捺(点)”、“折”、“勾”、“折带勾”七类,分别对应大键盘上“Q”、“U”、“A”、“Z”、“L”、“J”、“B”七个字母键,难分字的查找码为四码,其编码形式为〔首笔笔画所在字母键键位代码〕+〔末笔笔画所在字母键键位代码〕+〔数字“0”键键位代码〕+〔提示行选择序号数字键键位代码〕。
全文摘要
汉字实用部首编码法及其键盘针对已出台的一些汉字编码方案存在规则多而不严谨、取码不流畅、难记难学而很难被一般用户接受等缺点,提出了一种将形码与数码相结合而以形码为主数码为辅的全新编码方案,它将208个字根代码在26个字母键上科学地排列布局,设置了独特的实用性极强的坐标码,规定了一套严谨完善的汉字部首判定规则和拆分规则,使得改造成的中文键盘形象直观且码长短、重码少、简码多、取码流畅,能在输入汉字时插入英文(或汉语拼间)字母,每分钟可输入100-150个汉字,能较快地被一般用户特别是中老年操作者掌握。
文档编号G06F3/023GK1121596SQ9411311
公开日1996年5月1日 申请日期1994年10月28日 优先权日1994年10月28日
发明者唐显滇 申请人:唐显滇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1