汉字双拼意符编码及三十字母键盘的制作方法

文档序号:6405175阅读:614来源:国知局
专利名称:汉字双拼意符编码及三十字母键盘的制作方法
技术领域
本发明属于汉字编码输入电脑的方法和专用键盘装置。
电子计算机问世以来,中文信息处理的汉字编码以及专用键盘装置,成为举世瞩目的科研课题,为解决这一技术难题,国内外已经推出数百个汉字编码方案。主要有字形码,字音码和形音码三种。字形码因汉字笔划复杂,构件太多,导致编码的字元繁杂不易掌握;字音码的重码问题太多;形音码虽兼有两者之长,但还是未能完全解决区分重码和便于普及的问题。
文字是形、音、意的结合体,以往的汉字编码方案主要是从字形和字音的方面去考虑编码,很少从字音和字意的方面去考虑编码。汉字的笔划复杂,汉语的语音却很简单,如能避繁就简,则可创制理想的汉字编码。拼音编码的重码多,有效地区分重码的办法是在“音符”后加上由字母组合成的“意符”,即采用音意码,这种编码也不是完全与字形无关,许多意符都是根据字的偏旁而定的,汉字有百分之八十以上是形声字,所以大部份汉字可以见字即知其意符。在原有的音意编码中,所用的意符太少,如宁宣熙的《拼音文字式汉字编码方案》只用了十个字母作为意符,显然不能区分众多的重码。
反映这方面的资料有
1.《汉字编码方案汇编》中国汉字编码研究会编,科学技术出版社,1980年版。
2.《汉字编码的理论与实践》陈爱文等著,学林出版社,1986年版。
本发明的目的在于彻底解决汉字编码的重码以及不易掌握的问题,并配置三十字母键盘以实现汉字编码的计算机输入。
双拼意符编码采用“音符”和“意符”构成拼音词码,简称音意码。由声韵双拼字母充当音符,用声母组成意符,以元音字母作为标调符号。共用三十个拉丁字母,即在汉语拼音字母的基础上增用几个字母。
声韵双拼方法声母基本按汉语拼音方案不变,只将CH、SH、ZH分别改为

,零声母音节没有W、Y的,在前用“O”表示,只有“ER”这个音节在前不加“O”。
韵母按下表用代字母表示
韵母“ER”不用代字母表示,ü、üan、ün与j、q、x、y相拼时,变成u、uan、un,代字母分别用U、X、Z表示。上表唯一可能产生混淆的是代字母“J”,它同时表示ia和üe,但汉语拼音中用“ia”拼成的字只有几个,可在其后面加一个特定字母来区分用“üe”拼成的字。用声母和韵母代字母相拼,就成为声韵双拼码,即“音符”,可以代替汉语拼音方案的拼音在编码中使用。如
意符组合方法“意符”主要采用两个汉语拼音的声母(这里把W、Y也作声母)来表示。可作为意符前位声母的有B、C、
、D、F、G、H、J、K、L、M、P、Q、S、
、T、W、X、Y、Z、
共21个,可作为意符次位声母的除上述21个外,还有N、R,共23个,这些声母两两组合,可组成483个互不相同的符号,其中可作为音符使用的有三百多个(见附恚T谏偈厥馇榭鱿拢稍诹礁錾傅囊夥笤偌右桓錾咐辞滞灰夥惺被箍墒褂靡桓錾咐闯涞币夥厥馇榭隹捎萌俣喔鲆夥獾牧缴阜爬醋髑址S谜庑┓爬辞种匾舸事胧峭耆挥形侍獾摹 意符是有特定含义的词的符号,有特定含义的词也称“意符词”,将意符词按声母缩写,就成为意符。汉字的许多偏旁都可以作意符词。例如“氵”、“刂”、“
”、“山”的意符词分别是“水流”、“立(利)刀”、“土地”、“山坡”,意符分别是“SL”、“LD”、“TD”、“
P”,当同音词里意义相近的词较多,需要采用同一意符时,则在意符后再加一个声母来区分,如“ sLB”、“ sLC”……、“TDB”、“TDC”……,这种情况为数不多。
意符分类方法汉语中词的含义繁多、复杂,三百多个意符不可能代表完繁杂的词义,但任何词都可以按一定标准来分门别类。首先,词可分成“名词”、“动词”、“形容词”、“代词”、“数量词”(这里把数词和量词并为一类)、“副词”、“介词”、“连词”、“叹词”、“助词”、“象声词”等大类,往下分,“名词”又可分为“众人”、“物类”、“抽象事物”等中类,再往下分“物类”又可分为“地貌”、“植物”、“动物”等小类,最后,“动物”又可分为“飞禽”、“走兽”、“鱼类”等末类。这些构成各种类的词,全都是意符词,末类中的意符词是常用的一些词,在确定一个拼音词码的意符时,首先从末类入手,末类没有恰当的意符词,就用小类的意符词,小类没有恰当的意符词,再用中类的意符词,最后才采用大类的意符词,名词、动词、形容词这三种词类中的末类意符词可以灵活运用,相互替代,比如“飞行”是动词,可以作为名词“飞行物”的意符词,“听闻”是动词,可借代为名词“耳朵”的意符词,有时还可把意符词折开使用,如“计策”可折为“计划”或“策动”来使用,“轻近”可折为“轻的”或“近处”来使用。总之,一个意符词所代表的是与它相关的同义词和近义词的群体,它所包容的含义是很广泛的,比如“致密”这个意符词就代表了“周密”、“稠密”、“浓密”、“细密”、“缜密”、“密实”、“紧密”、“严紧”、“严密”、“紧凑”、“连贯”、“仔细”、“细致”等含义,又如“酒类”这个意符词包含了所有的酒,也代表了同酒一样经过酿造而制成的酱油、醋等。
重码区分方法一个拼音词码适用的意符,是根据该词的含义、所涉及的范围以及其它常用同音词的含义的分布情况来决定,尽量不使用相同的意符,比如“熙”与“熹”字都有“光明”的含义,但“熙”又有“和乐”之意,故“熙”的音符为“Q
”(亲善),“熹”的意符为“ML”(照亮),一般情况下,可以参考汉字的偏旁来确定其意符。不过,“鲸”字不能用“YL”(鱼类)来作意符。
同音的词码中用于姓氏的字,不加意符,没有姓氏的,则最常用的一个字不用意符。代词、数量词、副词、介词、连词、叹词、助词、象声词分别用D、
、F、J、L、T、
、X作为意符,若这些词类还需继续分化,则可取一个其它声母作为区分符,比如它们可分别用B、S、G、K、M、W、Z、Y作为区分符,有的情况可作特殊处理,例如“他”不用意符,“它”、“她”分别用“W”(物)、“C”(雌),作意符,又如“的”、“地”、“得”分别是定语、状语、补语的标志,可分别用“D”、“
”、“B”作为意符,(“的”也可不用意符)。特殊音节“M”、“N”构成的词码用“W”、“Y”、“Z”作为区分符。名词、动词、形容词使用两个或三个声母作为意符,对一些特殊字可用意符以外的两个声母符号作特殊处理。如用于“人名”、“国名”、“地名”、“山名”、“水名”的字可分别用“MR”、“MG”、“MD”、“M
”、“MS”作为区分符。用于区分重码的符号放在音符后面,可区分所有的重码。如“cáo”的同音字有曹、漕、槽、
、嘈、螬、艚,可用意符全部分化曹漕 槽
螬艚CD CD
L CDQJ CDMD CDK
CD
B编码标调方法拼音词码的标调采用元音字母A、E、I、O、U分别表示阴平、阳平、上声、去声、轻声。
汉字编码方法拼音词码以汉语的词为基本单位,其构造成分的位置都是按一定规律排列的。单音节词的第一个字母是声母,第二个字母是韵母代字母,(只有ER、M等特殊字例外)。再后是意符,(有的无意符),最后一个是标调字母。如ZIWZO(字)。两音节词由六个字母组成,第一、三字母是声母,第二、四字母是韵母代字母,最后两个是该词的意符,如WGZIWZ(文字)。三音节词由五个字母组成,前三个字母是该词的三个声母,后两个字母是该词的意符,如XDHBH(现代化),四音节的固定词组由其四个声母组成,如BBWX(白壁无瑕),若有重码,可采用连接符号“-”来区分,如BB-WX(白壁微瑕)。五个音节以上的固定词组可由二个或三个声母缩写而成。如
G(中国共产党)、
RJ(中国人民解放军)。
编码举例音意码是汉字编码的YYMFH
IO HCZIWZ BKMAFH DEU最佳方案ZZFO JJMMA F
OCGF键盘设计双拼意符编码可根据汉语语音特点设计合理的字母键盘,中排字母键安排最常用的字母,上排字母键安排较常用的字母,下排字母键安排不常用的字母。食、中、四、小指所负担的工作量依次降低。拇指专门负责标点符号键和空位键。(见附图
)本发明具有以下显著优点双拼意符编码的专用键盘只用三十个拉丁字母,比常用二十六个字母的键盘只多用四个字母就可解决全部汉字的编码问题,单音节词在最后采用了元音字母标调,而多音节词后面未用元音字母,多音节词中,音节多少不同其词码的字母多少也不同,并且意符可以灵活使用,这样就把所有的词区分开了,无一重码,这是以往任何汉字编码方案无可比拟的。声韵双拼和意符分类具有很强的规律性,简单易学,只要懂得汉语拼音,稍加训练就可掌握编码方法,意符直接与字的偏旁、含义有关,大部份字一见就可知其意符。如果将来我国在此基础上实现了汉字拼音化,掌握编码就更不成问题了。而创制汉语拼音文字,首先可在编码方面进行实验,积累经验,所以,这套编码可为将来在我国推行拼音文字打下基础。此外,该编码的词码短,常用汉字平均码长为三个左右字母,可以实现快速盲打,有利于计算机在中文信息处理方面的普及使用。
权利要求
1.一种用于计算机的汉字编码输入系统,本发明的特征在于采用三十个字母的计算机键盘装置,使这些字母在计算机专用键盘上进行不同的组合,形成任一汉字的计算机编码,即采用“音符”和“意符”构成拼音字码,音符由声母和韵母代字母表示,意符由声母组合而成,标调用元音字母充当,编码方法所用字母与专用键盘上的字母相对应;
2.根据权利要求1所述的汉字编码输入系统,其特征在于专用计算机键盘上的三十字母是A、B、C、
、D、E、F、G、H、I、J、K、L、M、N、O、P、Q、R、S、
、T、U、V、W、X、Y、Z、
;
3.根据权利要求2所述的汉字编码输入系统,其特征在于三十字母在键盘上排列为三排直线行,上排是较常用的字母,从左到右排列顺序为C、M、H、K、J、Y、L、G、B、T,中排是常用字母,从左到右排列的顺序为
、U、E、Q、D、O、I、A、X,下排是不常用字母,从左到右的顺序为V、S、R、F、N、Z、
、P、W、
,字母的下面是一排标号键和空位键,空位键居中,标号键在两旁,字母键上面是十个数字符号;
4.根据权利要求1所述的汉字编码输入系统,其特征在于音符的字母基本按汉语拼音方案不变,只将CH、SH、ZH分别改为

,零声母音节无W、Y的,在前用“O”表示,只有“ER”例外;
5.根据权利要求1所述的汉字编码输入系统,其特征在于音符的韵母用键盘所用的字母(即韵母代字母)代换
6.根据权利要求1所述的汉字编码输入系统,其特征在于意符一般由两个声母组成,有时也用一个或三个声母作为意符,两个声母组成的意符由B、C、
、D、F、G、H、J、K、L、M、P、Q、S、
、T、W、X、Y、Z、
作为前位字母,由上述字母加上“N”、“R”共23个字母作为次位字母,共组成三百多个有特定含义的符号,即“意保袅礁錾傅囊夥剐枨郑蛟谄浜笤偌右桓錾浮S昧礁龌蛉錾缸楹铣傻囊夥ㄓ糜诿省⒍省⑿稳荽省5ド敢夥校篋、
、F、J、L、T、
、X,分别用来表示代词、数量词、副词、介词、连词、叹词、助词、象声词,若这些词类有重码,还需分化,可分别用B、S、G、K、M、W、Z、Y作为区分符;
7.根据权利要求6所述的汉字编码输入系统,其特征在于意符词分为大、中、小、末四类。大类中的意符词是名词、动词、形容词、代词、数量词、副词、介词、连词、叹词、助词、象声词、末类的意符词由一些常用的词构成,选用意符时先考虑末类、次小类、再中类、最后才用大类;
8.根据权利要求1所述的汉字编码输入系统,其特征在于标调采用元音字母A、E、I、O、U分别表示阴平、阳平、上声、去声、轻声。
9.根据权利要求1或4或5或6或7或8所述的汉字编码输入系统,其特征在于单音节词的拼音词码第一个字母是声母,第二个字母是韵母的代字母,其后是意符,最后一个是标调字母;二音节词的拼音词码共有六个字母,第一、三字母为声母,第二、四字母是韵母代字母,最后是该词的意符;三音节词的拼音词码共五个字母,前三个是该词的声母,后两个是该词的意符;四音节的固定词组共有四个字母,用该词组的四个声母表示,五个音节以上的固定词组用其中二个或三个声母缩写而成。
全文摘要
汉字双拼意符编码及三十字母键盘。采用音符和意符构成音意码,由声韵双拼字母充当音符,用声母组合为意符,并将意符分为大、中、小、末四类,用于区分所有的重码,单音节词使用元音字母标调,多音节词使用简码,从而解决了以往任何汉字编码方案未能解决的一系列问题。该编码简单易学、规律性强,字码较短、无一重码,可以盲打,便于普及,并可为我国实现拼音文字创造条件。三十字母的专用键盘设计合理、符合汉语语音及该编码的特点,可实现计算机的汉字编码快速输入。
文档编号G06F3/03GK1033217SQ8710791
公开日1989年5月31日 申请日期1987年11月19日 优先权日1987年11月19日
发明者李一新 申请人:李一新
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1