专利名称:“音调形”汉字编码输入方法
技术领域:
本发明属于电脑输入汉字编码键盘类。
目前,我国出现数百种汉字键入方案,大体分为形码(按字形编码)、音码(按汉语拼音编码)、形音码(按字形、字音二素编码)和序列码(按阿拉伯数字序列编码,即电报码)。序列码不属于专利法保护范围,而前三者都不同程度存在难记、重码率高和不适合“听打”“想打”之缺陷。
形码以“五笔字型”为代表,它违反汉语和汉字的使用规律,需额外记忆的成份过多,编码复杂,重码率高,只适合于“看打”。
音码即汉语拼音码,将汉字转换成英文字母的汉语拼音再键入,分简拼、双拼和全拼,没解决声调问题,重码率高,只得边看监视器边键入。
形音码以自然码为代表,字形部分类似于“五笔字型”,字音部分用简拼,编码复杂、难记。
本发明目的是为了克服上述缺点,创建一种既符合汉字读(字音及字调)写(字形)规律,又符合实际应用规律(按使用频率选字,基本沿用汉语拼音规则,保留国际标准键盘习惯)的“音、调、形”码键入方案,便于有汉语知识的人使用,能“盲打”“听打”和“想打”。
本发明提出“音调形码”地电脑输入技术方案。国标GB2312-80的6763个汉字按读(字音及字调)写(字形)规律分成“同音异形字”(包括单音字), “轻声字”(包括感叹字,像声字)和“同形异音字”(包括一形多音字);采用无特殊标记的国际标准化键盘;编码由“音码”和“调码”组成,音码是长码需压缩的汉语拼音,调码的标志符是由汉字书写的横(一)、竖(丨)、撇(丿)、捺(
)、折(
)笔划的列和发音四声阴平(-)、阳平(
)、上声(
)、去声(
)的行组成矩阵的并由标准键盘上除元音a、e、i、o、u、以外的20个英文字母标识的矩阵元,另外,用余下的一个英文字母作特定标志符来取代畸义字的调码,以区别与其重码的汉字音码。矩阵元因具有字调、字形二特征,故称作“调形码”,简称“调码”。这里需要注意二点,一、“点”属于捺范围,二、“折”的含义是除“横、竖、撇、捺”以外的其他基本笔划。调码取自下述调码矩阵。
另外,附加标志符“v”来代替畸义字的调码(详见下文)。
同音异形字按应用频率层次分类取调码。应用频率最高的为一类,依次有二类,三类……按照汉字书写的笔顺不同,调码又分首笔调、尾笔调、二笔调和尾下调以及尾下二笔调,依次类推。首笔调是书写第一笔在矩阵中找到的矩阵元,尾笔调是书写最后一笔在矩阵中找到的矩阵元,二笔调是书写第二笔在矩阵中找到的矩阵元,尾下调是最后一笔相应于该字字调向下高低升降转折的下一声在矩阵中找到的矩阵元,于是有尾下一,尾下二,尾下三等矩阵元。同理,也可得到二下一(二笔下一调)的矩阵元。同音异形字的编码详见下表。
畸义字调码用v代替,以示音码与调码的区别,例如,岂(qin)中的n是调码,而亲(qin)中的n是音码一部分,故畸义字岂编码为qiv。
特殊处理
轻声字(包括感叹字,像声字)加元音a,e,i,o,u(或v)来标识调码。
例如汉字(拼音)编码
呵(a)aa
们(men) meen
唉(ài) aia
嗖(sōu) souu
吗(ma) maa
么(ma) maav
同形异音字(包括,一形多音字),按不同字处理。
例如伯(bó)bokv
伯(bǎi) baihm
背(bēi) beidb
背(bèi) beiL
综上所述,“音调形码”完成GB2312-80国标的6763个汉字的全部编码,只有个别字做了特殊处理,如轻声字(包括感叹字,像声字)和同形异音字(包括一形多音字);而且用“音码+首笔调+尾笔调”的筒码完成了使用频率高达99.9%的3755个一级字中98%的编码。全音6763个汉字的平均码长3.95,总重码率为“0”。参见统计表1。汉字偏傍部首的调码表见表2,长码拼音压缩表见表3 。
本发明具有科学、快速、易学、难忘的明显优点
1、无重码。
2、编码短。
3、所有以辅音+元音开头的汉字,汉字间不必击打空格键,击键动作=码长;少数以元音开头的汉字,击键动作=码长+1。
4、采用国际标准化键盘,键盘上调码矩阵元不必额外标注,有利于汉字及汉字信息走向世界。
5、沿用汉语基本拼音规则和书写笔划常规习惯,不必记忆额外规则。
实施例1
输入的汉字与“音调形码”对照
中 国物 产 丰 富, 比如说
yog go 凵 uy van fegbd fuw, biruwo 鳆鱼 就 很 有 名,父亲 的 fuywz 凵 uukp jiu hen 凵iu mig, fuyv qin de 师傅曾 背 着 官府 们 wid fuyq ceg beiL yeegonj fuxmeen 不知道 背 着 一袋 鳆 bu yig daow beidb yee 凵 i daiyv fuywz 鱼 跑了 uukp paon Le
输入上述37个字,击键动作(包括空格而不包括标点符号)是124次,平均击键动作是3.33次/字,其编码情况如下
实施例2
输入的汉字与“音调形码”对照
呵! 他 积 劳成疾,肌 体 受
aatajivLaop vegjiqjivztihwouy
到伤害
dao wagg hai
以上共12字,击键动作39次(包括空格而不包括标点)平均每字击键动作3.25次。
实施例3
考虑键盘操作手法快,调码放于手指灵活且使用频率高的字符键位上。调码矩阵表如下
Z为特定标志符。调码矩阵元在键盘上对应关系见
图1。
图中调码矩阵用连接线条表示,单线表示矩阵行的一声,双线表示二声,三线表示三声,四线表示四声;左手指停放位GFDS为矩阵列的横(一),左手下移位BVCX为竖(丨),左手上移位TRWO为撇(丿);右手指停放位HJKL为捺(
),右手下移位及上移位Y-NM-P为折(
)。
输入的汉字与“音调形码”对照
中 国物 产 丰 富, 比 如 说鳆
yog go 凵 uq van feggb fuL bi ru wo fuqLy
鱼 就很 有 名 , 父 亲 的 师傅
uurf jiu hen 凵 iumig fuqv qin de wib fuqj
曾 背着 官 府 们 不 知 道
ceg beix yee gonh fuk meen bu yit daoL
背 着一 袋 鳆 鱼 跑 了。
beibg yee 凵 i daiqv fuqLy uurf paoc Le
上述37个字,击键动作124次(包括空格而不包括标点符号)平均击键动作3.33次/字。
从实施例3与实施例1可以看出,编码中的音码都相同,调码因“矩阵元”不同而不同,每个汉字的平均击键动作次数仍为333次/字。
显然本领域技术人员在本发明构思保护范围之内所做的各种变体,不超出本申请案保护范围。
统计表表1
*一形多音字按多个汉字计算
偏傍部首的调码编码表 表2
长码拼音压缩表表3
为了缩短码长,单拼方式的编码简化如下
angag
engeg
ing ig
ongog
iong iog
ng g
uo o
uaioi
iaoio
uanon
ueng og
üuu
üe ue
üanuan
ün iun
uang ug
zh y
ch v
sh w
qiaqa j、q x与“i-”音的
qieqe 某些双元音相拼时,
qioqo 将“i”省略
qiu不能写qu
u,uu(ü)与n、L相拼时为Lù(陆)Luù(绿)
uu(ü)与j、q、x相拼时为ju(居)qu(去)、xu(徐)
以y、w开头的汉字拼音恢复原来字头的元音,并按上述方法进行压缩简化。
其他简化方法与“汉语拼音方案”相同。
权利要求
1、一种“音调形”汉字编码输入方法,其特征在于“音调形码”依据读(字音及字调)写(字形)规律把汉字分成同音异形字(包括单音字)、轻声字(包括感叹字、像声字)和同形异音字(包括一形多音字);编码由“音码”和“调码”组成,音码是长码需压缩的汉语拼音,调码的标志符是由汉字书写的的横(一)、竖(丨)、撇(丿)、捺(
)、折(
)笔划的列和发音四声(阴平(-)、阳平(
)、上声(
)、去声(
))的行组成矩阵的并由键盘上除元音a、e、i、o、u以外的20个英文字母标识的矩阵元,另外,用余下的一个英文字母作特定标志符来取代畸义字的调码,以区别与其重码的汉字音码;采用无特殊标记的国际标准化键盘。
2、根据权利要求1所述的输入方法,其特征在于“点”属于捺范围,折包括除横、竖、撇、捺以外的其他基本笔划。
3、根据权利要求1所述的输入方法,其特征在于调码的标志符分为首笔调,尾笔调,二笔调,尾下调以及二下一(二笔下一调),二下二等,依次类推;首笔调是书写第一笔在矩阵中找到的矩阵元,尾笔调是书写最后一笔在矩阵中找到的矩阵元,二笔调是书写第二笔在矩阵中找到的矩阵元,尾下调是最后一笔相应于该字字调向下高低升降转折的下一声在矩阵中找到的矩阵元,于是有尾下一,尾下二,尾下三等矩阵元。同理,也可得到二下一(二笔下一调)的矩阵元。
4、根据权利要求1所述的输入方法,其特征在于同音异形字按使用频率层次分类,使用频率最高的为一类,依次有二类、三类……
5、根据权利要求1所述的输入方法,其特征在于少数轻声字及同形异音字作特殊处理。
6、根据权利要求1所述的输入方法,其特征在于长音码的汉字的音码采用了压缩技术。
全文摘要
“音调形”汉字编码输入方法属于电脑输入汉字编码键盘类。目的在于创建一种符合汉字读写规律和实际应用规律的汉字键入方案,使有汉语知识的人不必再额外记忆其他东西,即可使用。本发明的汉字编码由音码和调码组成。音码是长码需压缩的汉语拼音,调码的标志符是由汉字书写笔划的横(一)、竖(丨)、撇(丿)、捺(丶)、折(/)的列和汉语发音四声的阴平(-)、阳平(ˇ)、上声(∨)、去声(丶)的行组成矩阵的矩阵元。矩阵元是键盘上的20个英文字母。“音调形”汉字编码无重码,可盲打,听打和想打。
文档编号G06F3/023GK1153340SQ9610078
公开日1997年7月2日 申请日期1996年2月9日 优先权日1996年2月9日
发明者孙先群 申请人:孙先群