专利名称:横竖笔段数数字检字法和横竖笔段数数字输入法的制作方法
技术领域:
本发明涉及一种汉字横竖笔段数数字检字法和横竖笔段数数字输入法。
背景技术:
世界融合带来的语言文字互渗,使文字与异文化背景者的遭遇成为常态,从而使 无相应文字背景者产生检索或输入该文字的可能需求,比如中国完全不懂英文的街头打字 员遭遇英文单词的录入,美国完全不懂汉字的NBA观众好奇希望检索查询某个球员身上纹 身汉字的含义等。现有汉字检字及输入方法、方案,都想当然预设面对对象为具备汉字教育背景的 汉字使用者,从而建立在没有汉字教育背景基本无法识别的汉字专有知识之上,即使是最 简单的五基本笔画输入法,也涉及甚至具备汉字教育背景者都无法完全把握的笔顺知识, 没受过汉字教育不识汉字者无法掌握使用。
发明内容
本发明的目的是通过汉字中世界通识的简单几何特征建立一种数字编码排序管 理汉字并运用于汉字编排检索及键盘输入的方法、方案,使完全不具备汉字教育背景者也 能掌握使用。本发明实现上述目的的技术方案是横竖笔段数数字检字法和横竖笔段数数字输 入法。本发明提供的横竖笔段数数字检字法和横竖笔段数数字输入法,其特征在于汉 字由各种形态笔画组构而成,笔画本质就是几何线段,如横为水平向直线段、竖为竖直向直 线段,本发明选取易于分辨的横、竖笔段,以每个汉字包含的“横”、“竖”数量数字组成该字 的数字编码,从而使汉字获得有序化数字编码序列,能够运用于汉字检字及键盘输入。本发明设定面向的对象是不一定具备汉字教育背景的任意用户,不同于作为汉字 基本笔画的横、竖概念,本发明中的“横(笔段)”、“竖(笔段)”概念,实质是作为“水平向 直线段”、“竖直向直线段”的几何概念,因而汉字横竖或横撇等组合连写构成的“折”笔,其 中包含的横或竖笔段,仍然包含在本发明的“横、竖”概念中,即一个“折”笔,如同时包含横、 竖笔段,则会同时在横、竖计数中将相应笔段计入。本发明适用于所有现代楷化书写的汉字及其它同源文字,如中文的繁、简、异体汉 字及日、韩、越等国语言文字系统中的所有汉字,也可一定程度移用于其它文字及常用符 号,对某些特定类别文字符号可引入附加措施如加计弧形笔段等,以方便这些文字符号统 一在汉字系统中无差别进行键盘输入。
具体实施例方式分别数出目标汉字的横、竖数量(“提”笔及其它倾斜直笔可约定归入横、竖),两 个得数组合构成运用于汉字检字及键盘输入的该字基本数字编码。
例“王”三横一竖,编码为31 ;“用”三横二竖,编码为32。汉字数量庞大、部分汉字构成复杂,笔画繁多,基本编码实际使用效率较低,具体 实施可以引入一些调整及附加措施,优选措施如下一、部分汉字笔画繁多,一一计数效率较低,一般同类笔画四画以内易于一眼看清 而不必一一细数,约定横或竖超过四画都一律算四画,即多余横竖忽略不计,这样超过四画 通常也能直接判断编码。例“赢”有16个横笔段15个竖笔段,显然一看而知都大大超过4笔,因而不必细 数,编码为44。二、过四算4,则仅0 4共五个有效码元,常规的10数字编码空间利用率较低,约 定1、如该字含“口”形方框,“框”及其内包含的横、竖不单计,整体算5计入,但一个 “框”只用一次,先取优先,计入“横”则不计入“竖”,如含多个“框”,横、竖各取一个,多余的 忽略不计;2、如该字不含“ 口,,形方框,则如横或竖有其中任何一笔或多笔带钩,任取一带钩 笔算5优先计入,不算在限额四笔内,其它钩笔忽略钩,只作为横、竖笔段计数。例“呈”字三加五(框)横一竖,编码为81 ;“用”字三横一加五(钩笔)竖,编码 为36。三、通过以上调整扩充为十个码元,但二位数编码仅100编码空间,实用效率较 低,约定1、再计数该字所含交叉数量,作为补码,交叉超过五个则一律算5,即多余交叉忽 略;2、左右(含左中右)结构字,不计交叉,而分别数左、右部横竖得到“横竖横竖”四数字。例“王”三横一竖一叉,编码为311 ;“用”三横一加五竖二叉,编码362 ;“和”左部 一横一竖,右部五横零竖,编码为1150 ;“待”左部零横一竖,右部三横六竖,编码为0136。以上述方法为对象汉字集建立汉字数字编码表,并通过系统建立物理键盘0 9 键位(或其它键位)与码表编码十个数字码元0 9的对应映射关系,从而通过键盘相应 键位输入目标汉字编码,通过系统转换输出编码表相应汉字,如果相应汉字不止一个,再通 过序号键选,最终完成目标汉字的键盘输入。因非左右结构字编码为三位数,实用中与头三位编码相同的左右结构四码字构成 系统性同码,可采取三位码加按附加键或选字时长按键选键等措施区隔,也可码前加9,因 9部四码字极少,基本不造成系统同码字增加。以输入“故”为例1、数出左部1+5横,击数字键6(或规定的其它映射键位,下同);2、数出左部1竖、右部1横、0竖,再分别击数字键1、1、0 ;3、显示同码字序列“1战2故3敌”,击数字键2完成输入。为对象汉字集建立汉字数字编码表,并使之与对象汉字集在其运用主体如电子 版或平面纸质版字词典等的物理位置信息建立对应关系,构成检字表,以通过读取汉字编 码在编码表中按序检索到该汉字获取其对应的物理位置信息,从而完成目标汉字的检字运用。以查检《新华字典》中“故”为例1、数出左部横、竖及右部横、竖数量分别为6、1、1、0,得到其编码为6110 ;2、在检字表序位6110中找到“故”字,获取其对应物理位置信息“ 161 (页)”;3、翻开字典正文161页,在右列第四位找到“故”字条目完成检索。本发明横竖笔段数数字检字法和横竖笔段数数字输入法特点是1、世界通行涉及的主特征“横、竖”及可能涉及的辅助特征钩、交叉、方框等,均为 简单几何特征,不需要汉字教育背景即可识别,从而掌握整个方法;2、取码便捷横竖过四算4,因而不论多少笔,基本均能一眼判断,不需一一细数, 方便快捷;3、简单实用使用简单,了解即会,实编《新华字典》近11000字,最大同码字组仅 48字,仅3组同码字超过40字,效率远高于拼音,与复杂难学的四角号码检字方案带附码的 五位数字编码检字码分效率相当,而使用效率(读取编码)远高于四角号码检字,作为初级 简易汉字检索、输入手段,完全满足实用要求。本发明适用于汉字有序管理运用各方面,如工具书排检检索,手机、电脑类信息处 理终端的汉字输入等。
权利要求
一种汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其特征在于运用于汉字检索和输入的汉字数字编码,由每个汉字包含的横笔段数、竖笔段数组合构成。
2.权利要求1所述的汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其特征在 于组成数字编码的横或竖笔段数量如果超过四个,只计四个,多余的忽略不计。
3.权利要求1、2所述的汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其特征 在于如果目标汉字结构中含有“ 口,,形方框,则框及其内部所有横、竖不单计入该字横、竖 笔段数,而是整个框算5 —次性计入,只计入一次,横优先,有两个以上框,第二框计入竖, 多余的忽略不计。
4.权利要求1、2、3所述的汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其特 征在于如果目标汉字结构中不含“ 口 ”形方框,则其横或竖笔段有任何一个或多个带钩笔 段,任取其一不作为横或竖直接计数,而是作为限额四笔段之外特别笔段算5计入横笔段 总数或竖笔段总数,多余的带钩笔段忽略钩,仍作为横或竖笔段计数。
5.权利要求1、2、3、4所述的汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其 特征在于汉字横竖笔段数构成的数字编码,增加一个补码,补码为目标汉字结构中包含的 笔画交叉数量。
6.权利要求5所述的汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其特征在 于构成补码的汉字笔画交叉数量,超过5个,只算5个,多余不计。
7.权利要求1、2、3、4、5、6所述的汉字横竖笔段数数字检字法和横竖笔段数数字输入 法,其特征在于如果目标汉字为左右结构汉字,不取笔画交叉数构成的附码,分别计数该 字左右部分的横、竖笔段数量,得到四个数量数,组合构成一个四位数作为该字数字编码。
全文摘要
本发明涉及一种汉字横竖笔段数数字检字法和横竖笔段数数字输入法,其特征在于汉字由各种形态笔画组构而成,笔画本质就是几何线段,如横为水平向线段、竖为竖直向线段,本发明选取横、竖线段,以每个汉字包含的“横”、“竖”数量组成该字的数字编码,从而使汉字获得有序化数字编码序列,能够运用于汉字编排检索及键盘输入。
文档编号G06F17/30GK101901057SQ20091005947
公开日2010年12月1日 申请日期2009年6月1日 优先权日2009年6月1日
发明者江涛 申请人:江涛