笔形方位码汉字编码法的制作方法

文档序号:6412293阅读:685来源:国知局
专利名称:笔形方位码汉字编码法的制作方法
技术领域
本发明涉及一种汉字编码法,尤其是涉及一种笔形方位码汉字编码法。
众所周知,汉字编码技术是中文信息领域里的一项关键技术,目前已有数百种方案纷纷问世,可谓是万“码”奔腾。但是纵观现有的技术,我们可以发现大多数的方案,在字根的选取和编排上缺乏内在规律性,死记硬背的成份比较多,记忆量大、脑力负担重,学习周期长,适用范围有限,并且有许多方案在编码过程中违背了汉字的规律,造成了严重的汉字污染,影响着汉字的健康发展。
本发明的目的在于提供一种拆分简便、编码规范、字根规律性强,键位设计合理,易学易记易掌握的具有大众化和标准化的笔形方位码汉字编码法。
本发明的技术方案是将汉字的五种基本笔画分成直笔和斜笔两大类,然后进行不同的组合,产生出19种特征笔形和6个独立主偏旁,每种笔形根据其特征对应有若干字根,并规律地分布在除功能键Z外的其它25字母键A-Y上。
本发明将汉字中的左右结构具体地划分为二分左右结构和复合左右结构两种,视二分左右结构为方位结构,进行方位划分,每个方位对应有若干组字信息。
本发明以笔顺为基础,结合方位特征对汉字进行有效地拆分。即在遵照汉字的书写规范,先后的先拆,后写的后拆的大前提下,对方位结构和方位结构部分按方位顺序拆分,对非方位结构和非方位结构部分按笔顺依次拆分,然后取整字拆分的第一、二、三、末码编足四码,不足四码的,补充特征码。
本发明键盘分为两个大区上排键和中排键为笔形区,每个键位对应一个具体的笔形;下排键除Z键外,为主偏旁区,每个键位对应一个独立主偏旁。
本发明在将6个独立主偏旁还原到具体的笔形中去后,可对汉字进行纯数字式编码。这样按照一定的序性,就可对汉字进行有效地排序和检索。
与以往的汉字编码方案相比,本发明具有显著的优点和进步
本发明优选了19种特征笔形和6个独立主偏旁,并以此为分类系统对字根进行了科学地编排和选取,合理地分布在各个键位上。因此它具有字根规律性强,键位设计合理,识记方便速度快,易学易记易掌握的优点。
本发明独创性地将汉字中的二分左右结构独立出来进行方位划分,以提取有效信息进行组字。这样针对不同结构的字,采用不同的拆分方法,有效地克服了以往编码中存在的规则复杂,拆分繁琐,重码率高的缺点。因此它具有拆分简便、编码规范、低重码的优点,同以往的编码方法相比更具灵活性和实用性。
由于本发明能够对汉字进行有效地纯数字式编码,因此它可以很好地使汉字的电脑输入技术和汉字排序检索及字典的编排等技术同步,从而更广泛地适用于中文信息技求的各个领域,让汉字这一古老文化和现代技术的电脑完美地融合在一起。
表1为本发明的字根总表。


图1为本发明的键盘示意图。
以下结合表1和图1对本发明进行详细的说明。
该汉字编码法将汉字的五种基本笔画横、竖、撇、点、折按其线性特征分为两大类一类是呈直线状的直笔如横、竖;一类是呈斜线或曲线状的斜笔,如撇、点、折。如果把直笔和斜笔进行不同的搭配和组合,则会产生出各种形式的笔画搭配,其中具有相同结构特征的笔画搭配形式叫笔形,那些具体的笔画搭配为字根。该汉字编码法共有19种特征笔形和6个使用频率高的独立主偏旁,每种笔形按特征对应有若干字根,其中笔形特征明显的为基本字根也称笔形字根,其他需要变形归类的字根为归类字根。
参见表1的字根总表19种特征笔形的代码、名称、基本特征和对应字根如下1.横从左往右的一直笔字根有一、丁、工、王;2.竖从上往下的一直笔;字根有丨、卜、
、止、山、
、;3.点单独的点;字根有丶、冖、宀、讠;4.加两直笔相交;字根有十、
、土
;5插一直笔纵穿两以上的直笔,字根为
、丰、中、韦、
彐、忄、
;6.散由中心点向周围发散的笔画组合;字根为米、火、
、爪、
;7.框呈直角状或一面开口的方框;字根有、、冂、、凵、
、月、几;8.分呈“八”字样的笔画组合;字根有八、人、夂、从;9.方呈方形或内含一直笔的方形;字根有口、日、
、白、
;00.点横点和横的组合;字根有;亠、
立、辶、广、疒;01.乙呈“丆”的组合或逆时针的弯钩,字根有乙、
、乚、
、丆、儿、厂、尸、石;02.撇从右上往左下的一斜笔;字根为
斤、
彳;03.捺点从左上往右下的斜笔或点的组合;字根为、
、冫、
、灬、丬、、
、心;04.叉直笔和斜笔或斜笔之间的交叉;字根为ナ、、乂、
又、力、女、七、廴;05.斜一斜笔纵穿两笔以上的直笔或斜笔;字根为
夫、
戈、
戊、虫;06.弯顺时针方向的弯钩;字根为
了、
、勹、阝、卩;07.角呈三角状的笔画组合;字根为∠、
纟、
ク、
巛、癶、
;08.大呈“大”字或“”的笔画组合;字根为大、、
钅、攵;09.目四角整齐且内含两笔的四方形;字根为目、罒、四、田、
、甲、

6个独立主偏旁分别为提手旁(扌)、草字头(艹)、三点水旁(氵)、单人旁(亻)、口字旁(口)和木字旁(木)。因为它们在汉字中组字频率高,数量大,所以把它们从具体的笔形中独立出来,作为主偏旁使用。其中提手旁(扌)是从笔形05中独立出来的,同是兼包围结构特征码;草字头(艹)是从笔形5中独立出来的,同时兼左右结构特征码,字根有廿、
耳;三点水旁(氵)是从笔形03中独立出来的,同时兼上下结构的特征码;单人旁(亻)从笔形02中独立出来,同时兼独体结构的特征码;口字旁(口)是从笔形9中独立出来的,木字旁(木)是从笔形6中独立出来的,字根有木、小。
该汉字编码法将汉字分为上下,左右,包围和独体四种基本结构类型,其中左右结构又具体分为二分左右结构和复合左右结构。二分左右结构是指从左到右只存在两个并列的部分,左右关系明显,能简单的一分为二,例如非、构、到、清、解等字,复合左右结构是指从左到右存在着两个以上的并列部分,不能简单的一分为二,例如例、鲫、滩、洲等字,在复合左右结构中最左边的部分为左半部分,其余的为复合右半部分。
为了简便快捷地提取组字特征信息,该汉字偏码法把二分左右结构同其他的结构分离开来,视为方位结构进行方位划分。左半部分为左方位,简称左位;右半部分为右方位;简称右位。当左位的字根为一到两个时,整字的拆分按笔顺依次进行;当左位的字根超过两个时,整字的拆分为跳跃式,即左方位只取首尾两个字根,这样,整字的拆分即迅速快捷,又全面直观。
在本汉字编码中,把本身即为方位结构的字定为方位字,如明、朗、解等字;把含有方位结构的其他类型(上下、复合左右、包围)字定为方位结构字,如盟、撤、廊等字;把不含方位结构的字定为非方位结构字,如天、其、国、摊等字。
笔形方位码汉字编码法的拆分原则为以笔顺为基础,结合方位、取大优先、兼顾直观。
以笔顺为基础是指拆分时必须按照书写规范先写的先拆,后写的后拆。
结合方位是指对方位结构和方位结构部分按照方位顺序进行拆分,而对非方位结构和非方位结构部分按笔顺逐次拆分。
取大优先是指拆分时,尽可能取笔画数大的字根和字根数少的拆法。例如“缶”拆分成
、山,而不拆分成、一、山。
兼顾直观是指对个别复杂或繁琐的细节予以忽略,以直观为主进行拆分。例如
拆分成艹、曰,就比拆分成一、冂、艹、一直观。
编码的原则为取整字拆分后的第一、二、三、末码,依次编足四码,不足四码的补充结构特征码,即独体,上下,左右和包围四种。
下面结合实例具体介绍编码的方法1.字根和字根字的编码方法为本身所属的笔形码+首笔码+次笔码+末笔码,不足四码的补充结构特征码。例如字根“亠”拆分成亠、丶、一、亻;编码为00、3、1、亻;(PDGB)。
字根字“工”拆分成;工,一,丨,一;编码为1、1、2、1(GGFG)。
2.非方位结构字(即独体字和不含方位结构的上下、包围和复合左右结构字)的编码方法为先按笔顺依次拆分,然后取整字分后的第一、二、三、末码,不足四码的补充结构特征码,例如其拆分成艹、一、一、八;编码为艹、1、1、8(CGGK);天拆分成一、大、补充亻、亻,编码为1、08、亻、亻,(G1BB);国拆分成口、王、丶、补充扌,编码为9、1、3、扌,(LGDX)。
3.方位字的编码方法为当左方位为一到两个字根,整字取自然拆分,即按照笔顺依次拆分;当左方位超过两个字根时,整字取跳跃式拆分,即左方位只取首尾两码,右方位自然拆分,然后取整字拆分后的第一、二、三、末码,不足四码的补充结构特征码。
例如倍拆分成亻、立、口、补充艹,编码为亻、00、口、艹,(BPNC)。跪拆分成口、止、ク、乚,编码为口、2、07、01,(NFUT);融拆分线一、丨、虫、补充艹,编码为1、2、05、艹,(GFQC);解拆分成ク、
丨编码为07、5、06、2,(UAYF)。
4.方位结构字的编码方法为方位结构部分按方位顺序拆分,非方位结构部分按自然笔顺拆分,然后取整字拆分后的第一、二、三、末码,编足四码,不足四码的补充结构特征码。例如掣拆分成
、丨、刂、
,编码为08、2、2、5(1FFA)。
5.为了提高效率,减少重码,我们对个别的偏旁或单字,以习惯为主进行拆分,它们主要有①复合字根
(00,3)、令(8,3,3)、甫(1,5)、里(9,4,1)、犭(6,02)、 雨(1.03)。
②诸如象、黝、鲫、魁、题、彪这样的字,我们习惯上将其左半部分或外包围部分拆分成首尾两个字根。
③又、立、王,这三个字根在组字时,如果是作为结束字根的话,那么在不是四码的情况必须补充一笔捺或横作为补充信息以减少重码。如果还不足四码,则再补充结构特征信息。例如仅拆分成亻、又、、艹,编码为亻、04、03、卄,(BWEC);拉拆分成扌、立、一、艹,编码为00、1、艹,(XPGC)。
6.为了简化输入和提高速度,对常用的字在输入时往往可以只取其全码中的一个、两个或三个编码,这就是简码,简码共分三级一级简码,二级简码和三级简码。
7.词组编码方法为①双字词分别取每个字的前两码;②三字词取前两个字的首码和第三个字的前两码;③四字码取每个字的首码。④多字词取第一、二、三、末字的首码。
该汉字编码法的输入键盘参见图1,共分两个大区上排键和中排键为笔形区,每个键位对应一个具体的笔形,下排键除功能键Z键外,为主编旁区,每个键对应一个主偏旁。中排键对应的笔形以直笔为主,又称直笔区;上排键对应的笔形以斜笔为主,又称斜笔区。
上排键从左到右的键位Q、W、E、R、T、Y、U、I、O、P,对应的笔形码依次为05、04、03、02、01、06、07、08、09、00;中排键从左到右的键位A、5、D、F、G、H、J、K、L;对应的笔形码依次为5、4、3、2、1、6、7、8、9;下排键从左到右的键位X、C、V、B、N、M;对应的独立主偏旁分别是扌、艹、氵、亻、口、木。
该汉字编码法在将6个独立主偏旁还原到具体的笔形中去后,可对全部的汉字进纯数字式编码,并能有效地实现汉字的排序和检索,因此它是一种广泛实用的汉字编码方法。
权利要求
1.一种笔形方位码汉字编码法,其特征在于1.1将汉字的五种基本笔画分成直笔和斜笔两大类,然后进行各种组合,产生出19种特征笔形和6个独立主偏旁,每种笔形根据其特征对应有若干字根,这19种笔形和6个独立主偏旁分别对应于除功能键Z外的其它25个字母键A-Y;1.2将汉字中的左右结构具体地划分为二分左右结构和复合左右结构两种,对二分左右结构进行方位划分,每个方位对应有若干组字信息;1.3汉字的拆分原则是以笔顺为基础,结合方位,取大优先,兼顾直观;1.4汉字编码的原则为取整字拆分后的第一、二、三、末码,依次编足四码,不足四码的部分由结构特征码补充。
2.一种如权利要求1所述的笔形方位码汉字编码法,其特征在于将汉字的五种基本笔画横、竖、撇、点、折分成直笔横、竖、和斜笔撇、点、折两大类。
3.一种如权利要求1所述的笔形方位码汉字编码法,其特征在于具有相同结构特征的笔画搭配形式为笔形,那些具体的笔画搭配为字根,以笔形为分类系统,对字根进行编排和选取。
全文摘要
本发明公开了一种笔形方位码汉字编码法,它将汉字的五种基本笔画进行不同的组合,产生出19种特征笔形和6个独立主偏旁,以此为分类系统对字根进行科学地选取和编排,并分别对应于除功能键Z外的其它25个字母键A-Y。该编码法对汉字的结构特点进行了有效的方位划分,具有拆分简便,编码规范,字根规律性强,键盘设计合理,易学易记易掌握的特点,能广泛地适用于汉字键盘输入和汉字的排序检索,是一种普及性强的新型汉字编码法。
文档编号G06F3/023GK1175026SQ9711720
公开日1998年3月4日 申请日期1997年8月11日 优先权日1997年8月11日
发明者翁健华 申请人:翁健华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1