汉字音形快速三位等长编码的制作方法

文档序号:6599398阅读:704来源:国知局
专利名称:汉字音形快速三位等长编码的制作方法
技术领域
本发明涉及汉字的一种编码。
目前汉字编码很多,已在计算机上使用的汉字编码已有100余种,包括常见的拼音码、首尾码、双拼码、五笔字型码等。这些编码都尚未很好地同时解决汉字拆码的简易性、检索或输入汉字的快速性以及编码的易记易学三方面的矛盾。如拼音码,虽简单易学,但重码率高,检索或输入汉字速度都较慢。首尾码、五笔字型码等虽能实现汉字快速输入,但汉字拆码难、记忆规律差。其它各种编码也存在上述这样或那样的缺点。
本发明的目的在于提供一种易学易记并能快速拆码、快速输入或检索的汉字编码。
本发明是这样实现的,将汉字尽可能均衡地拆成三个部件,对每个部件取其汉语拼音的第一个字母或相应的笔形码(即0、1、2、……9和[、]、;,其用法见表1。)作为部件码,由三个部件码构成该汉字的字码。对于无法读音或无相应笔形码的部件,根据其笔画顺序的先后采用H(当有H所对应的指定部件 等时)、[(当有[所对应的基本部件 部件时)、](当有]所对应指定部件辶、廴和]所对应的基本部件 时)和8(当有 结构的部件时)字符中的一个作为其部件码,对于无法使用上述4个码表示的部件,一律以“;”作为部件码。例妞=NHT,嚏=K[P,噼=K]X,廪=G8S,渚=I;E。
对于以拼音字母“Yu”开头的汉字,即于、与、予、聿、余、禺、雨、元、去、匀、允(鱼、玉、禹仍用“Y”作为部件码)等汉字,一律用“U”作为部件码。对于某些部件,规定了其相应的关系汉字,以这些汉字汉语拼音的第一个字母作为这些部件的部件码,见表2。
为了减少重码,作出下列规定(1)为了充分、平均地使用上述39个字符,指定了20个字符作为若干常用部件的部件码,见表3。
(2)下列汉字作为部件使用时,不拆开卑、乏、麻、佳、审、桑、有。和艹也不拆开。“今”尽可能拆成“9H”。
(3)在使用表4中的汉字(部件)时,如果这些汉字(部件)处在字首,则使用空格符加上这些汉字(部件)本身的部件码对其编码。如果这些汉字(部件)处在字尾,则使用这些汉字(部件)本身的部件码加上空格符对其编码。含有上述汉字(部件)的汉字的编码,加上空格符后,仍为三位码。但需要拆成三位码时,上述汉字(部件)不加空格符。
(4)在旃、旆、游、漩等这些汉字中,部件“”不参与编码。
(5)在下列汉字中“ ”、“冂”不参与编码浸、侵、溟、螟、暝、谛、蒂、嫡、濠、瞢、甍、薨等。
(6)由相同的部件(可称为子部件)构成一个新部件时,一律按照子部件的个数分别以“2”、“3”、“4”作为其部件码。如“熠”中的“羽”部件码为2;“澡”中的“品”部件码为3;“照”中的“灬”部件码为4。
(7)部件“辶”一律作为第一部件,并且不拆开。如逞=]KW(8)对少数5笔画以下的汉字,使用其汉语拼音的第一个字母作为第3部件码。如土=01T,士=01S,无=1WW,入=34R。
按照本发明的汉字编码,除极少数一级简码汉字(由一个码元和一个空格符组成)和少数二级简码汉字(由2个码元和一个空格符组成)外,绝大多数汉字均由三个码元组成,这些汉字不论其笔画多少,都要首先拆为三个部件,然后按照上述规则分别取三个部件的部件码,由三个部件码组成汉字的字码。取码时,按照先左后右、先上后下、先外后内的规则。在拆成部件时,以常用汉字偏旁和有通常读音的汉字部件优先,同时按照散、连、交之顺序拆字,并且要尽可能均衡地拆成三个部件。
例(1)先左后右 喇 =KSQ 糨 =MGS(2)先上后下 鼋 =UKD 碧 =WBS(3)先外后内 圄 =85K 酉 =W81(4)汉字部件优先 唤 =KHD 漾 =U;Y(5)按散、连、交顺序 秒 =HX3 庙 =4CY(6)尽可能均稀拆分 灯 =89D 绩 =FQB
本发明的汉字编码与已有的汉字编码相比,具有易记易学、码长短、重码率低、检索或键入汉字速度高、拆码简易等优点,可以实现计算机盲打快速输入。该编码也可扩展用于词组。
本发明的汉字编码主要为计算机汉字输入而设计,已经完成了其在操作系统水平上的软件实现,该编码也可以用于字典检索,并可提高检索速度。


权利要求
1.一种通用的汉字音形三位等长编码,其特征在于用英文大写或小写字母、0-9十个数字以及[、]、;三个字符来表示汉字的部件,每一汉字拆为三个部件,对每个部件取其汉语拼音的第一个字母或相应的笔形码或指定码元作为部件码,由三个部件码组成该汉字的字码。
2.根据权利要求1所述的汉字编码,其特征在于码元与英文字母、数字和[、]、;三个字符间具有表1和表3所列的对应关系(附后)。
3.根据权利要求1所述的汉字编码,其特征在于每个汉字(除极少数一级简码汉字和少数由两个部件码和一个空格符组成的二级简码汉字外)无论笔画多少,都要拆为三个部件,然后对其取码。
4.根据权利要求1所述的汉字编码,其特征在于每个汉字(除极少数一级简码汉字和少数二级简码汉字外)的取码原则为先左后右、先上后下和先外后内,以常用汉字偏旁和有正常读音的汉字部件优先,按散、连、交的顺序尽可能均衡地拆成3个部件。
5.根据权利要求1所述的汉字编码,其特征在于汉字部件若无对应的拼音码或笔形码或指定的码时,则根据其笔划顺序的先后,采用H(当有H所对应的指定部件 等时)、[(当有[所对应的基本部件 部件时)、](当有]所对应的指定部件辶、廴和]所对应的基本部件 )和8(当有口、 结构的部件时)字符中的一个作为其部件码,对于无法使用上述4个码元表示的部件,一律以“;”作为部件码。
全文摘要
一种汉字编码,其特点是用英文大写或小写字母、0—9数字和[、]、;三个特殊字符表示汉字的部件,并构成汉字的音形码码元,以此对汉字取码。本发明的汉字编码具有易记易学、码长短、重码率低、拆码快速简易、汉字输入或检索速度高等优点。
文档编号G06F3/023GK1103179SQ9311504
公开日1995年5月31日 申请日期1993年11月20日 优先权日1993年11月20日
发明者黎涤萍 申请人:黎涤萍
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1