现代汉语单词拉丁化语音码的制作方法

文档序号:6598252阅读:407来源:国知局
专利名称:现代汉语单词拉丁化语音码的制作方法
技术领域
本发明涉及一种汉语单词编码,特别是关于现代汉语单词拉丁化语音码。
二十世纪四十年代起,计算机的飞跃发展在全球范围内引起了一场以电子计算机为中心的第三次技术革命,它把人类从繁重的脑力劳动中解放出来,开创了人类智力解放的新纪元。众所周知,计算机是通过处理各种符号包括语文符号的方法来进行信息处理的。因此,使用拼音文字的国家能够顺利地进行这次新技术革命,从飞跃发展的生产中获得益处。由于我国记录汉语语言使用的是方块表意文字,这就给计算机的汉语信息处理带来很大困难。为此,众多专家、学者在这方面进行了研究和探索。据报道,各种各样的计算机汉字编码方案不下四百多种。其中具有代表性的编码主要有以下几种1.美国王安电脑公司获专利使用权的“三角编码法”;
2.王永明发明的“五笔字型法”;
3.钱伟长教授发明的“钱码”;
4.上海中学生杜冰蟾发明的“汉字全息码”;
5.河南计算中心邱荷生发明的“拼音文字型编码及键盘”。
以上这些编码可以说相互之间各有千秋,应该承认它们都对汉语计算机信息处理作出了重大贡献。但是,它们都有一个共同的不足之处,即编码都离不开汉字的字形,这样汉语的口授盲打、边思考边盲打均成为不可能,而且大多数编码与汉字之间的转换是不可逆的,汉字可以变成码,而码却很难甚至不可能变成所代表的汉字。即使可变,也必须通过计算机预先储存于价格较贵的汉字库,使计算机成本增加、难于推广。
本发明的目的在于解决上述问题,提供一种全新的根据汉语语音特点用拉丁字母进行编码的现代汉语单词语音码。
汉语是通过语言中最小的有意义的能自由运用的单位-词来进行信息传递的。词由若干个音节组成,不管每一个音节有多复杂,它都是由声、韵、调三个部分组成。本发明采用世界上通用的26个拉丁字母,按照同音同形法则对《汉语拼音方案》中的全部声母、介母、韵母、声调进行编码,并以一定的顺序排列形成汉语每一音节的编码,再按照汉语组词的规律将几个音节连写在一起就完成了对汉语单词的编码,以这些汉语单词为基础就可以传递汉语信息。
由于本发明是根据汉语语音特点,采用26个拉丁字母进行编码,摆脱了过去汉字编码依赖汉字字形的模式,具有简单易学的特点,能广泛应用于汉语、汉字信息处理,为汉语口授机、阅读机、外文翻译机的诞生奠定了基础。同时,由于用26个拉丁字母编码,所以世界上一切处理26个字母的信息处理机都能利用本发明来处理汉语信息。另外,本发明提供了一种研究汉语语法规律的有力工具,借助它能够发现许多新的汉语语法规律。通过在实践中的不断完善,本发明还可以发展成能直接向计算机输入的拼音文字,用来方便地处理汉语信息。
下面结合实施例对本发明作进一步的说明。
本发明例的编码结构采用“声码+介码+韵码+调码”形式,其中,调码兼作隔音节符号。
本发明例的声码符号如下〔注括号内的符号均为汉语拼音符号,不带括号的字母为本发明的语音码。后面叙述均同。〕b(b) p(p) m(m) f(f) d(d) t(t)n(n) l(l) g(g) k(k) h(h) j(zh)(j)q(ch)、(q) x(sh)、(x) r(r) z(z) c(c)s(s) y(y) w(w)
声码除汉语拼音的(zh)、(ch)、(sh)用j、q、x代表外,其它都与原来汉语拼音相一致。因为在汉语音节中除(i)外,能直接与汉语拼音(j)、(q)、(x)相拼的介母、韵母都不能直接与汉语拼音的(zh)、(ch)、(sh)相拼,反之亦然。所以为了缩短拼式,用j、q、x来代表(zh)、(ch)、(sh)就不会产生误拼。另外,若汉语音节无声母,则语音码可省略声码以缩短拼式。
本发明例的介码符号如下i(i) u(u) y(ü)介码除了用拉丁字母y来代表汉语拼音(ü)外,其它介码符号与汉语拼音介母符号相同,这样设计主要是为了方便记忆和将语音码控制在26个字母内。在编码拼写时,要注意把有介母的音节用介码表示出来。另外,若汉语语音无介母,则语音码可省略介码。
本发明例的韵码符号如下a(a) o(o) e(e) i(i) u(u) y(ü)w(ai) z(ei) c(ao) s(ou) x(an) n(en)h(ua) t(uo)p(ang) g(eng) q(ong) d(ing) b(ng)〔无声母韵母〕r(i)〔只与(zh)、(ch)、(sh)相拼〕韵码除单韵母编码与原单韵母符号相同外(用y代表(ü)〕,其余都用一个辅音字母表示以缩短语音码的拼写。为了便于记忆,五个带后鼻音的韵母都用字形带“o”圈的字母p、g、q、d、b来编码。带有介母的韵母除(ua)、(uo)、(ing)用拉丁字母h、t、d编码外,其它都不另行编码。之所以要对(ua)、(uo)、进行辅音字母编码,主要是为了在轻音码省略时不引起误读,因为(ua)、(uo)中的(a)、(o)既代表韵母又代表声调。举例来说,汉语拼音(guo)(轻声),在(uo)不编码情况下(guo)编成guoo,此时,轻音码“o”不能省略,否则guo会被误译为(gu)(轻声)。用t代表(uo),则(guo)(轻声)编成gto,此时可省略轻音码“o”,变成gt,不会产生误拼。(ing)用d来编码是为了缩短编码的拼写。韵码r表示汉语拼音的(zh)、(ch)、(sh)与汉语拼音的(i)相拼时的(i)音,以避免汉语拼音的(j)、(q)、(x)与汉语拼音的(i)相拼时相混淆。即jr、qr、xr分别代表汉语拼音的(zhi)、(chi)、(shi),ji、qi、xi分别代表汉语拼音的(ji)、(qi)、(xi)。
本发明例的调码符号如下a(一)阴平 e(
)阳平 v(
)上声 u(
)去声 o(不标)轻声调码符号除v代表上声(
)外,其余均用元音字母a、e、u、o来表示。不用辅音字母表示是为了避免在前一音节轻音“o”省略情况下引起误拼。辅音v例外,其原因是汉语中没有“v”这个声母,不会引起误拼。另外,为了缩短语音码的码长,在不会引起误拼时可省略轻音符“o”,但当一个音节中用a、o、e、u为韵母时,后面的轻音符“o”一般不能省略。
下面例举一些用本发明例编出的现代汉语单词语音码语音码 汉语拼音 方块汉字gqazuou (gōngzùo) 工作siaxipv (sīxiǎng) 思想qgegqa (chénggong) 成功xrabwu (shībài) 失败jrudqu (zhìdòng) 制动xguliu (shènglì) 胜利
权利要求
1.一种汉语语音码,其特征在于所说的语音码是根据汉语语音特点,用26个拉丁字母拼写的编码。
2.根据权利要求1所述的汉语语音码,其特征在于编码按“声码+介码+韵码+调码”的结构式顺序排列,且当汉语音节无声母、介母时,声码、介码允许省略。
3.根据权利要求1或2所述的汉语语音码,其特征在于声码全部用辅音字母表示。
4.根据权利要求3所述的汉语语音码,其特征在于除了汉语拼音的(zh)、(ch)、(sh)声母用拉丁字母j、q、x表示外,其余的声母均用与之相同符号的拉丁字母表示。
5.根据权利要求1或2所述的汉语语音码,其特征在于汉语拼音介母(ü)用26个拉丁字母中的一个字母表示,例如用y表示汉语拼音介母(ü)。
6.根据权利要求5所述的汉语语音码,其特征在于汉语拼音介母(i)、(u)用拉丁字母的i、u表示。
7.根据权利要求1或2所述的汉语语音码,其特征在于韵码a、o、e、i、u、y分别代表汉语拼音的(a)、(o)、(e)、(i)、(u)、(ü)。
8.根据权利要求1或2所述的汉语语音码,其特征在于除了部分带有介母的复合韵母外,其余的复合韵母的韵码用辅音字母表示,例如用拉丁字母w、z、c、s、x、n、h、t、p、g、q、d、b分别表示汉语拼音的(ai)、(ei)、(ao)、(ou)、(an)、(en)、(ua)、(uo)、(ang)、(eng)、(ong)、(ing)、(ng)。
9.根据权利要求1或2所述的汉语语音码,其特征在于调码用26个拉丁字母中的五个字母表示,例如用拉丁字母a、e、v、u、o分别表示汉语拼音的阴平(一)、阳平(
)、上声(
)、去声(
)和轻声。
全文摘要
本发明涉及一种汉语单词编码,特别是关于现代汉语单词拉丁化语音码,它以汉语语音特点为基础,采用26个拉丁字母进行编码,摆脱了编码依赖汉字字形的模式,具有简单易学的特点。能广泛应用于计算机汉语、汉字信息处理,为汉语口授机、阅读机、外文翻译机的诞生奠定了基础。
文档编号G06F3/023GK1059976SQ90102939
公开日1992年4月1日 申请日期1990年9月20日 优先权日1990年9月20日
发明者苗玉水 申请人:苗玉水
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1