一种汉字输入方法及其输入键盘的制作方法

文档序号:1254阅读:467来源:国知局
专利名称:一种汉字输入方法及其输入键盘的制作方法
本发明涉及一种汉字输入方法及其输入键盘,特别是涉及提取汉字信息的二十六个主符号及与主符号有家族关系,容易联想记忆的子符号,令电脑中文化实现字母直观输入技术,按汉字起笔为第一个字母排列,不多于五码,完成汉字输入程序,众所周知,汉字笔划复杂,只提取五个信息量是不够地,产生大量同码字的效果。
因此,电脑中文化,首先要解决的,就是汉字如何简化输入问题,毫无疑问,要在编码方面下功夫,什么算是好编码呢?字母符号少、易学、易记、瞬间界定取码方法、摆脱不确定率、编码长度要短、同码率要低,不改传统规范、符合自然习惯,汉字的编码方法,可分三类,第一类拼音法,凡是用语音输入的,如罗马拼音、国语注音、地方话注音,都受到汉字一字多音和方言读法异音限制,而出现无数同码字,第二类数码法,凡是用数目字代码输入的,如电报码、笔画数码法等,需要多一次用脑、由笔画形状转换为数目字代码,引用交通术语作比喻如“中途转站”而非直航,第三类字母法,凡由汉字笔画、部首、字根、直接提取信息的,如仓颉、唯物、五笔(一百五十个字形)码等,由于拼音法同码率高,拣字要重复用脑,因此不能很好地得到应用。
本中文字母输入系统发明的目的,打破中文没有字母的神话,响应中文信息委员会定出了的六大标准,发明应用于字典、词典检字索引,适应资讯时代,配合电脑,电子打字机,电讯机,高科技之需要。
本发明的另一个目的,是开发一套能读多国语文的双语功能符号,由于科技的高度发展,缩短国际间距离,国与国之间,民族与民族之间,交往频繁,要节省人们无数的精力,时间和物质、国际间有必要建立一种共通语言。
本发明的指标,解决同码率的问题,提供甲“简化字型结构”,乙“介定笔画标准”,丙“规范笔顺程序”三个层次,运作上识别汉字达到减低重码率,消除不定率的功能。
本发明改进简化字形结构,根据GB 2312-80标准汉字6763个,从结构分析十二类型附表

可以看出,大量的字型判别,增加人脑负担,本系统简化字型结构,分为两个模式,第一个模式“分体字”,第二个模式“独体字”。
汉字不论繁、简体。凡可垂切左右分的,称为“分体字”如新、陈、脑、鹏字等……

凡汉字不能左右分的,称为“独体字”如金、道、电、国字等……


根据上述的示意操作方框图,下面将结合实例显示取码操作。
“分体字”垂切左右分为两个字组,取最左字组首尾笔二码,右字组顺序取首次二码,再取尾笔最末一码,合取五码,如左字组,一码取完,则右字组取四码补足,例如“新”、“堤”字……

“独体字”起笔顺序,取首、次、三、四码,再取末笔,最后一码,例如“道”、“国”字……

明显的启示,简化汉字为两个结构,压缩编码,提取信息作出很大贡献,换言之,要拆开十多个结构组合,感觉关卡重重、拾取汉字之讯息、倍感困难。为着明察秋毫、弃繁取简、净化结构是必要的。根据数字纪录、现代汉字、左右结构的,有四千六百五十余个,占新汉字典百分之六十四点二、64.2%比重很大,结论是将汉字只分为两个结构,一种是左右结构「分体字」,一种是「独体字」,非左右结构的、全部列为不能分割的字,这样直观分辨起来便容易得多,纯「形」汉字输入条件已跨进一大步了。「独体字」与「分体字」取码之关系,是堡垒分明的,分析两者之间的笔画走势,「独体字」的笔画是永恒不变的「分体字」则在不同的位置上,产生笔形的变化,原本在「独体字」的笔画,是「一」的,当它变为「分体字」偏傍的位置时,则其笔画就变为「
」了,如下表

诸例子不胜枚举,从上表「独体字」,和「分体字」之间,不难证实、「分体字」在左偏傍位置上,其笔画是变形的,但是「独体字」无论在上下、内外的位置里笔画是固定不变的,因此,根据这种特征,给研究中文资讯传输技术上有莫大的帮助。
界定笔画标准
探讨直观汉字从形输入来说,字正辞严、笔规画距,是重要的一环,相反的,会令操作者无所适从,历代教育家、书法家、教人写字,只重气势,只求美化,只求均衡,强调「永」字八法,铁画银钩,忽视笔画应有的标准,因此汉字之本横「一」竖「丨」撇「丿」捺「
」钩「亅」之笔画没有典法常规。从甲骨、大篆、小篆、隶、草、到楷书,其实汉字,已经定形。「楷」字的含义,是端正模范的意思,风行晋代,而茁长壮大,却朔自南北朝,肯定其为中国文字的指导标准,是理所当然的,我在本文要指出的汉字有几个常用字形,「本」、「禾」、「末」、「耒」、字和「小」、「少」、「省」、「示」、「系等,有些笔画很近似,如竖「丨」、和左竖钩「亅」很容易混淆,那末如何界定「丨」、和「亅」呢?用科学的鉴别法,就是凡和「木」字有关的中间一竖「丨」,肯定是「丨」,例如「木」、「禾」、「未」、「耒」字是没有钩的。又凡和「小」字有关的字形,「小」字在上的,中间一竖「丨」肯定是「丨」也没有钩的,例如「少」、「省」、「尚」字等。假如「小」字在下的,中间一竖「丨」肯定是「亅」,例如「示」、「系」、「东」字等,小字本身亦有钩的。
规范笔顺程序
讨论中国文字的笔画书写次序,过去也不受重视的,书法家只重体裁,所谓颜、柳、欧、苏和诸子百家,有书法学术权威之誉。也同样只重视书法之差别,没有注意程序的重要性,我们分析世界文字书写形式画分为两类,第一种「横列式线性排列」,比较单纯,只有向右移动,字母之间不用加工,第二种「层次式方块组合」在内旋笔画移动之间要通过上、下、左、右、内、外等层次。过去虽然有若干笔顺法则可循,如「自上而下、自左而右、自外而内」。仍然欠健全的制度遵守,致令取舍之间,模棱两可。比如,字形里之「中」、「表」、「存」,字之类,如引用「先上后下」之规律,则「中」字就应先写一竖「丨」后写「口」、「表」字应写一竖「丨」后写横「一」、「存」、字应先写撇「丿」后写横「一」,但传统写法是先写横「一」的。若引用「先左后右」,如「道」、「延」字,则先写「辶」、后写「首」,先写「廴」后写「
」字,但传统的写法,是先写「首」、及「
」字的,又若引用「先外后内」法则如「国」、「因」,则先写「口」再写「玉」、「大」字。但与习惯传统写法是相反的。经过多个书写程序的举例,证实和传统笔顺不符,显示固有法则有修订的必要
由上至下-附则先横后竖、先横后撇、
由左至右-附则先右后艇、
由外至内-附则先「开」后「合」、确立一套完善的文字基本制度后。解除了汉字三千年的桎梏,我归纳创出中文二十六个字母来。打破中国没有字母的神话。不仅如此,同时并发现与国际通用语言的英文字符,具同形同族的关系,即中文的一半是英文,英文的一半是中文的佳话,有双语符号的功能,即是利用英语字母上的某一部分与汉字的某一笔划相似来定义该字符所代表的汉字笔划。如A可代表汉字笔划“人”,“O”代表汉字笔划“口”等。这样使得笔划的位置好记,同时又使得键盘上的标记显得简单而清楚。
图1是本发明一具体实施例中英文字母和中文笔划符号的对照表。
图2是本发明的一实施例,即是应用本发明方法的一个具体的输入键盘的平面图;
图3~图5是本发明的其它实施例,即应用本发明方法而设计的其它类型的输入键盘。
下面结合附图,叙述本发明的实施例。
图1是一具体的英文字母和中文笔划符号的对照表,从表中可看出,中文字母和英文字母形成了如下关系
人第一个字母是「人」字、汉字字汇中「人」、「亻」、「」是一体的、「」多一点引伸成「
」故此「人」字母之下有三个子符「人」在英语字母中是「A」、亦是英语字母中之第一位,和中文字母是同族的,因A之下只一横。
乛第二个字母读作「横钩」,常用在汉字字形之「疋」、「癶」、「
」、「今」字等,在英语字符中是「B」,引用六书象形造字法,取其「B」之右上角形状起笔之义意。

第三个字母叫作「右湾钩」,因其向右湾加钩而命名,常用在「戈」、「心」字之次笔「氏」、「民」字之尾笔,在英语字符中是C,其走势象形有同族之意义。

第四个字母叫「竖右钩」,一竖之后向右加个钩而得名,常用在「比」字之起笔,和「氏」、「民」字之次笔,在上加多一横引伸为「
」作为子符号土字之偏傍,在英语字符里是「D」取其起笔之形状。
曰第五个字母是「日」字与「曰」同,在中文字汇里可独立运用的,英语字符为「E」减去日字右边一竖是「E」,模拟「日」字之同族。

第六个叫「左上角」,是在左角位置上而取名。字形常用于「髟」起笔、本字母有三个子符号、「广」、「
」、「
」常用于「庴」、「虎」字之起笔、「庶」字之首尾笔,为什么两点属子符呢?「
」在英语字符中是「F」,「F」乃英语FIRE火字之字首,而四点乃中文之火字写法,引用六书造字「会意」法模拟同族之关系。
厶名为「钩点」因钩之右加一点而得名,常用在「牟」、「矣」字的起笔,「公」字的尾笔,在英语字符中是「G」模拟象形的关系。
艹叫作「双十」,一般叫「草花头」,在汉字出现频率甚高,用在「花」、「共」字之起笔,和「扁」字之尾笔,「艹」分开一半为「十」常用于「土」、「走」字之起笔,「牛」字之尾笔,与英语字符中之「H」字符模拟像形。
丨名为「竖」用于起、中、尾、笔的很多,如「上」、「用」字等,本字母「丨」两侧加四点「
」为子符号,常用于「雨」字等笔,与英语字符「I」是同族的。
亅称为「左竖钩」,常用于「小」、「水」字之起笔。在上加多一横,引伸为「
」属本字母之子符号。用于「寸」、「才」字之起笔,及「子」字之尾笔。在英语字符中和「J」也是同族的。

名为「曲」顾名思义是弯曲的,和「
」、「
」形状相同,用于起笔的如「邕」、「女」,尾笔的如「衣」、「水」字等。在英语字符里,「K」一半模拟象形。

中文字母称为「左下角」。起笔多用于「疑」、「肄」字,尾笔用于「区」。「
」之尾向上钩「乚」是同类子符号。常用于「也」「
」、「电」字之尾笔。和字语字符「L」是同族的。
丄称为「竖横」或「点横」,因其可作「亠」或「丄」的写法。常用于「言」的起笔,「青」字的「次笔」,和「尾笔」。「丄」字符在印刷体可写作「二」的,故「二」为本字母之子符号,与英语字符的「M」我古文篆书是
写法的像帽的样子也引用象形造字法,模拟同族关系。

中文笔画叫「艇」以其似一艘船的意思。只适用于尾笔,如「之」、「道」、「远」字等,在英语字符中和「N」模拟象形。
口这是「口」字起笔和尾笔都常用,如「吠」、「吴」字的起笔、「高」字的尾笔,是出现频率多数之一,在英语字符中与「O」字也是同族的。

在中文字符中,称为「右上角」,以其起笔于右角而得名,另有二个子符号「」、「
」、用于起笔的,如「叚」、「聿」、字等与英语字符「P」是同族关系。
丶名为「点」,在汉字的用法很广,出现的频率也多,起笔如「之」、「宀」、「氵」等。尾笔如「犬」、「太」、「戈」字等。
「丶」在英语字母里是「Q」,取其最后一点,模撇尾笔象形。

中文名称为「捺」,只用于尾笔之字符。如「爪」、「瓜」、「入」、「建」字等。英语字符为「R」亦取其尾笔,模拟尾笔象形。

名为「弓字钩」,因取弓字的尾部而命名,用于「与」字之起笔,「兮」之「污」,字之尾笔,「
」之上少了一「竖」引伸「」为子符号,用于[刀]、[司]字起笔和「幻」字尾笔等。在英语字符里是「S」,模拟其形状关系。
一名之曰[横],在汉字笔画频率,用法最多。起笔如「雨」、「右」字等。尾笔如「旦」、「画」,在英语字符中为「T」,取其首笔形状相同。
凵称为「冚」,「凵」的倒写是「冂」有四个子符号「
」、「冂」、「
」古文篆书的写法,是三为一体的。均写作「冂」、「几」古文说法原是「冂」字,左加一撇,右加一钩,故此四个都属子符号。有史可稽的、「凵」常用于「山」、「凶」的尾笔。「
」、「冂」、「
」、「几」、字常用于起笔的,如「冗」、「同」、「用」、「风」字午在英语字符中「U」模拟为同族关系。

叫「剔」向上剔之意思。用于「刁」、「打」字等,「
」之上加多一点,引伸成「冫」为子符号,常用之于「冶」、「冰」、「求」字等在英语字符中,象形「√」字模拟同族系。
八是一个「八」字,能单独运用,「八」字倒写变为「丷」,在汉字的起笔是共通的,如「曾」、「酋」字,可写作「
」和「
」字。用于尾笔字如「共」、「典」字等,在英语字符写成「W」,取其中间「八」字形,引用六书象形造字法,模拟同族关系。
×名之为「交叉」以形取名的,用于起笔的,如「凶」、「肴」字。用之于尾笔的,如「父」、「交」字等。「×」在上方加一撇一横,引伸为「攵」成子符号。用之于尾笔,如「变」、「友」字。用于起笔的,如「各」字等。在英语字符中为「X」象形同族关系。
丿名为「撇」在汉字笔画频率上,也是多数之一,起笔如「毛」、「后」、「须」字。尾笔如「少」、「彩」字等。在英语字符中是「Y」,取英文右上角模拟是同族符。
乙中文之「乙」字,是起笔的字符,如「氹」、「虱」、「飞」字等。在英语字符中是「Z」,古文甲骨写作「
」,因此和「Z」模拟形象关系。
输入法概述
有了字符,现在谈到,输入法取码了,本系统是按五键输入的,最少取一个码,最多取五个码,就可显示所有繁简体汉字,没有难字的问题,严格地说,本系统无需刻意学习,取码规则简单,只有十二个字简述,如下
字母顺次取大(即先取复笔后取单笔)
偏傍左分取小(即遇有三个排列的便取最左偏傍)
凡「独体字」顺次序取四码,最后取尾一码。「分体字」是垂直切取左最小「字组」的偏傍首笔及尾笔码。(如一码取完,则向右结构补足取四码)。右字组顺次取两码,最后取尾一码,何谓「字母顺次取大」呢?照正常书写汉字一样,按程序输入字母的时候,字母首选是最大(复笔)的,例如「金」字,首码单笔字母是「丿」第二笔是「
」,根据「丿」和「
」相加是「人」选大「复笔」就取「人」作首码输入了。
何谓「偏傍左分取小」呢?当你要输入「分体字」的时候,向左偏傍取最小之字组,例如「鹏」字,先取「月」字之首尾「
」和「
」两个码。
分体字的取码,举例如下
林 HWHW
码 TOPST
钟 ADOI
程 YWOMM
料 WWQQH
好 KTBJ
读 QZHBA
张 PSIYR
港 QVHTL
独体字的取码,举例如下
虎 FTLU
广 F
道 WTYUN
学 FYUBJ
身 YUMTY
越 HTITQ
武 MITDQ
国 UMMQT
很明显,稍尝涉猎过,英文外语的人士。都知道拼音文字,字母是全写的,字母与字母之间无需加工,而中国文字就没有这种优点,由于笔画组成,过于臃肿,如果一写出来,这欠过长了如
翻 YWHWUHTSVSV
换过五码输入,结果是
翻 YTSVV
衍译证明,只需五个层次,可达致较好的效果,节省大量空间,被称为缩写法,是蛮有意义的。
通过上述多项引证,去支持我之论点,然而还有一项重要的研究,就是重码问题,衡量中文输入法的鉴定标准,「自然习惯」、「重码多寡」、是重要因素之一,要达到全无重码的输入目标。方法只有一个,一字一字打入,否则就是采编码模式了,编码模式有如下三种,一是拼音、二是拼形、三是形音双拼,无论采那种模式,总有「重」字现象,其中更有一个成正比的定率,字母愈少、重字率愈多,字母愈多、重字率愈少,根据统计,本系统中,重字事实上是极少的,只占数字百份之三点一左右。至于重字处理的方法,当重字出现时,位置在「横」轴之左角,便有数字编号,按编号选字后,下一字便可继续进行。
双语字母输入概述
电子学家认为,人工智能的基本概念,只是二进制的数字贮存,电脑是没有生命的,由一连串的「O」和「1」所组成,把字母「A」定为二进数的「0100001」把「B」定为「0100010」推至二十六个「ASCII」标准,当你从键盘输入字母「A」、电脑就贮存数码「01000001」,电脑输出显示时,就会把数码,0100001译回键入过的字母「A」还原,只要输入输出的指示同步,通过三个程序解码=(ENCODING)键入=(TYPING),还原=(RENDERING)在电脑键盘上输入文字时,要有一套共通的文字符号,表达给打字员。这个符号被称为「双语字符」,很明显本「中文字母输入法」与「ASCII」字符是模拟同形的,作为一套迎合世界书写系统的符号。本双语系统,除可输入中国文字之外,同时可输入英、法、德、俄、意大利、希腊、拉丁等语文、日本人有着世界最复杂的文体,如「KANJI」象形文字,和「KANA」拼音文字。遗憾是拼音字母,不能拼出日文汉字的。韩国同是兼用汉字的国家,也有一套二十四个子母音系,若要拼成汉字,和日本人有同样之困难,谋求一项崭新的语言观点,就是打破国家之界限,打破狭隘的民族意识,建立中、日、韩文化之技术系统,事实上,中国文化对日韩关系是非常密切的,所谓中国文化,涵盖的范畴,并不限于中国领域里,今天日韩的文化圈,都是受其光芒照射而形成的。试窥日、韩两国的汉文历史文献,千多年来都是通用汉字的。日本历代用汉文选写的史书,如「日本书记」、「本朝通鉴」、「日本外史」等。韩国的三国史记、东国通鉴、李朝实录等,罄笔难书,可是民族意识作祟,已经限制汉字运用,而自创语文,日本之片假名,韩国之子母音,全是这种意识下产物。经过四百多年演变。能摆脱汉字影响力的。韩国人比日本人较有成就,但离成功之路尚远。有一个无容否认的事实。不论韩文子母音,日文片假名,都是脱胎自汉字笔画蜕变而成的。
讲过一大堆文化关系,接着便需谈谈技术问题,日文片假名包括(浊音、拗音、促音)等七十三个,韩文子母音二十四个,合起来不过九十七个,中国有句名言「泰山不让土壤」,「河海不拒细流」中华字典,再容纳涵盖区区百字,绝对没有问题的,以下是日韩文字母编码举例
日文片假名 中文字母编码
ァ BY
ィ A
ゥ QU

QUF
エ TM
オ JY
カ SY
ガ SYF
キ MC
ギ MCF
ク YB
ゲ YBF
韩文子母音 中文编码


韩文子母音 中文编码

本发明比较现有上机运作的输入法中,字母系统是唯一能作字典、词典检字索引,唯一直观字母对应笔画输入技术,不必拼音,不必部首,不必代数码,不必拆字根,同码率极低,无难字问题,改进不违传统,突出(甲)简化字型结构,(乙)界定笔画标准,(丙)规范笔顺程序,本发明开创二十六个双语字符,能读中、英、日、多国语文。
图3~图5示出了应用本发明方法的其它形式的键盘,即根据本发明方法的其它实施例,本领域的一般技术人员会知本发明也可有其它形式的键盘。
通过以上的叙述,本领域的一般技术人员不难看出,在不超出本发明的范围内,可以对本发明作各种修改和变化。因此,本发明仅受所附的权利要求
的保护,而不受上述具体实例的限制。
权利要求
1、一种汉字编码输入方法,该方法包括挑选一部分笔划作为组成汉字的基本单元,所述每一个基本单元即笔划被赋予一个输入键,每个汉字可由一至五个代表笔划的输入键串组成,本方法其特征在于包括下列步骤
(a)判断所要输入的汉字是属于“分体字”还是“独体字”那一类的,其中这里“分体字”是那些在直觉上可以分成左右结构的汉字,而“独体字”则是指那不能分成左右结构的汉字,
如果是“独体字”则进行(b),否则进行(c);
(b)按书写顺序输入四个代表相应笔划的输入键,然后再输入代表最后笔划的输入键,完成一个汉字输入,返回(a);
(c)将“分体字”垂直切取左偏傍最小结构部分,输入代表其首尾笔划的二个输入键,然后从右边结构顺次输入两个代表相应字符的输入键,最后输入一个代表最后笔划的输入键,完成一个汉字输入,返回(a)。
2、根据权利要求
1所述的汉字编码输入方法,其特征在于利用英语键盘的英语字母的一部分与汉字字符笔划的相似,来定义某一字符所代表的汉字笔划,使得同一字母标记即代表某一英文字母,又代表某一汉字笔划。
3、根据权利要求
1所述的汉字编码输入方法,其特征在于所采用的笔划共有26个,且每一个笔划对应普通英语键盘上的26个英文字母键中的每一个。
4、根据权利要求
2和3所述的汉字编码输入方法,其特征在于所述26个笔划为如下26个笔划,并且和相对应26个英文字母键及所表示的字符有如下关系
5、一种用于实现上述权利要求
1-4所述方法的输入装置,该装置为普通英文键盘,其特征在于在英文字母上标出一部分笔划来表示汉字笔划,这样就可以使每个英语字母键成为一个双语符号,即代表原来所表示的英语字母,又代表汉字笔划,英文字母和汉字笔划的关系如下
专利摘要
电脑中文信息处理技术,应用二十六个字母系统,识别全中文字形图象,舍弃部首、字根、拼音、数码、或形、音相拼方法,依汉字结构分两个模式,第一个相模式“分体字”即左右分间偏傍字体,第二个模式“独体字”不分上上、内外、对角的字体,通过两种字形结构互异的取码方法、和根据书写顺序规律,字母分类过程,使汉字信息码序得到集中和压缩,大大低减重码率功能,增加输入速度,为此目的,本系统包括二十六个双语符号,识别中、英、日多国语文。
文档编号G06F3/00GK87105564SQ87105564
公开日1988年2月24日 申请日期1987年8月10日
发明者区卓煊 申请人:区卓煊导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1