象形文字及声调语言的拉丁化方案及其和汉字的计算机文字输入方法与流程

文档序号:11828049阅读:326来源:国知局
本发明涉及一种汉语和壮语的书写系统及其计算机文字输入方法和汉字的计算机输入方法,即采用拉丁字母拼写的方法,对汉语和壮语制定出一套文字的书面语书写方案,并对这套书写方案配以相应的计算机文字输入方法,以及汉字的计算机输入方法。
背景技术
:以汉字为代表的象形文字能够保存至今并被使用的文字种类非常少见,汉字无疑是一种最为成功的象形文字,但在拼音文字广泛推广的当今世界,汉字的难写和格格不入也是显而易见的,人们一直没有深入探究如何将汉字进行科学地拼音化,近代以来人们纷纷采用各种方法对汉字进行注音,但并没有对汉字转换成拼音化书写,并进而发展出一套汉语的拼音化书写系统,本发明正是创造出一套以拉丁字母拼写的汉语的文字系统。东亚大陆是声调语言高度发展的地区,来源于欧洲和西亚的字母符号在拼写语言文字的时候虽然非常便利,但是在带到像东亚这样的一个声调语言高发区的地区时候会产生不少的麻烦,因为在欧洲和西亚并没有声调语言,也因而没有产生表示声调的字母符号,用拉丁字母拼写的东亚语言,不管是注音符号,还是文字系统,在表示声调的时候很不方便,各个语言采用不同的方法,没有统一的规则,本发明正是创造出所有声调语言都能够采用统一的以字母符号来表示声调,并进而形成完整的拼音化文字的规则。汉语属于声调语言,汉字是象形文字,壮语则与汉语的平上去入各分阴阳的八声调系统严格对应,因而采用汉语和壮语为例,用拉丁字母为书写符号,对象形文字和声调语言进行拼音化书写是最好的例子。目前,尚没有比较成熟的汉语拉丁化文字和比较好的壮语拉丁化文字。1958年全国人民代表大会批准公布的《汉语拼音方案》只是汉语的注音符号,并不是拉丁化文字,而1928年由国民政府大学院公布的国语罗马字虽有拉丁化文字的萌芽,但远未形成一套成熟的文字系统,而且国语罗马字的拼写规则非常繁琐,声母和韵母都很冗长,规则过于破碎繁多,让人很难以掌握,因而难以在人群中广泛推广。1982年由广西壮族自治区人民政府颁布的新壮文也只是一个半成熟的文字系统,它即不能解决壮语中的汉语借词声母合并造成同音字词增多的问题,也不能解决汉语当中本就繁多的同音字词,它的拼写规则也是很不完善的。鉴于现有汉字拉丁化和壮语拉丁化的种种缺点,本发明就要创造出全新的汉语和壮语共有的一套拉丁化文字方案,包括消除同音字词。而目前,在本发明之前,尚未发现有创造出一套将偏旁部首转换成字母符号以达到消除同音字作用的相关报道。本发明同时制定出将汉语和壮语的拉丁化文字输入计算机的方法,以及基于此种拼音化书写方案基础之上的汉字的计算机编码输入,这是有别于以往的汉字输入的一种方法。技术实现要素:本发明所指的汉语不仅仅是作为我国官方语言的普通话,还包括其他的方言和历史的语言,它们是西南汉语、白话、古代汉语,四种形态的汉语分别有四种异形的拉丁字母拼写对应于同一个汉字或者词;这里的壮语不仅与现有的国家规定的标准壮语的拉丁化方案迥异,也不是以武鸣县双桥话为标准音,而是以上林县巷贤话为基础音,兼顾各地壮语方言的特点定制的。本发明的文字拉丁化方案,首先采用声母拼读韵母构成基础音节,然后再经过特定的变化产生带声调的音节。本发明在将基础音节变化的时候,其所用的方法与国语罗马字和新壮文都有类似的地方,即与国语罗马字都采用字母添加和替换的方式区别声调,也与新壮文一样在基础音节后添加某一个辅音作为声调符号。但是本发明与国语罗马字具体的字母添加和替换很不同,首先本发明的声母系统是《汉语拼音方案》系统的,本发明的韵母系统也与《汉语拼音方案》基本一致,而国语罗马字的声母系统和韵母系统都与《汉语拼音方案》相去甚远,从而本发明的字母添加和替换在具体实施时就与国语罗马字的字母添加和替换产生的差别就很大,其次,本发明的字母添加和替换的规则简洁洗练,高度统一,而国语罗马字的字母添加和替换的规则则纷繁复杂,细则太多。本发明所添加的声调符号与新壮文的作法也不一样,首先,本发明的声调符号在这四种形态的汉语当中为1个或者3个,在壮语当中为3个,而新壮文当中的声调符号为5个,其次,本发明的声调符号所用辅音与新壮文的也不尽相同,另外,在入声音节中,本发明所添加塞音声母与新壮文的不尽相同。而本发明将所有的偏旁部首转换成字母符号添加在带声调音节后的作法则为首创,为当前其他的汉语拉丁化方案和壮语拉丁化方案所无。本发明下的普通话声母与《现代汉语拼音方案》的声母几乎完全相同,只是用韵母u代替音节wu。本发明下的普通话韵母与《现代汉语拼音方案》的韵母有一些差别,即:au、eu、ien、ieng、iung、o、u、ung分别代替《汉语拼音方案》的ao、iao、ian、iang、iong、uo、wu、ong,e代替《汉语拼音方案》中jie、qie、xie、jian、qian、xian、yan、jiang、qiang、xiang的ie和ia、a,oe代替《汉语拼音方案》中的üe,o代替《汉语拼音方案》中jue、que、xue、yue的ue,ue代替《汉语拼音方案》中的ü,oh代替《汉语拼音方案》中yo的o,on代替《汉语拼音方案》中部分guan、huan、kuan的uan和其他音节中所有的uan、oi代替《汉语拼音方案》中cuai、chuai、suai、shuai、zhuai、zhuai中的uai,ong代替《汉语拼音方案》中的cuang、chuang、suang、shuang、zuang、zhuang中的uang;el代替《汉语拼音方案》中的儿化韵er,其他的儿化韵由添加l代替《汉语拼音方案》中所添加的r。本发明下的普通话中的轻声没有标识,分别并入阴平和上声。本发明下的普通话韵母及四声变化:阴平阳平上声去声阴平阳平上声去声aaaaravuaioaiuairuayeee,ie(在j、q、x、y后)erev,ye(在j、q、x后)anaenarnanviii,ie(在c、s、z、ch、sh、zh后)iry,iv(在y后)eneen,ien(在j、q、x、y后)ernenv,yen(在j、q、x、后)ooeoruoiniinirninvuueuruvonoenornuoneleelelrelvunuenurnunvoe(实际上不存在的音节)uoeoeroevienianiernyenohoehohruohuanoanuarnwanue(实际上不存在的音节)uueueruevangaengarngankiaeaiaryaengeeng,ieng(在j、q、x、y后)erngenkieieeieryeingiingirnginkuaoauarwaongoengorngonkaiaeairayunguengurngunkeieeieireyiengiangierngienkoiuoioiroyiungiongiurngiunkuiuie,uei(在g,h,k后)uiruyuangoanguarnguankauaoauraweueoeurewiuioiuriwououeourow注:在韵母音节当中,阴平为基础音节,阳平为元音添加或者替换,上声为在元音音节后面添加r,去声为加声调符号,或者辅音替换,或者添加元音。阳平的变化是在音节中重复主要发音的元音,或者ai音节和ia音节的i为e替换,-u开尾韵、u-唇化韵、iung音节的u为o替换,ie-鼻音韵中的e为a替换,与g、h、k相拼的ui为uei替换,与j、q、x、y相拼的e和en前添加i,在音节oe、oi前添加u,在其他音节的元音后添加e。去声为在基础音节后面添加声调符号v;或者-i开尾韵、i音节、ia音节、ien音节的i为y替换,与j、q、x相拼的e和en添加y;o音节、oh音节、on音节的o为uo替换;-u开尾韵、u-唇化韵的u为w替换;uai音节的i为y替换;-ng尾韵中的g为k替换。本发明下的西南汉语音位及字母标识如下表:注:本表中的西南汉语是以柳州音为标准音,并且采用宽式音标来标音。在声母表中,划线部分是柳州音固有音位中不存在的部分,来源于普通话的ch、sh、zh、r,在本发明中,将其设定为存在的音位。在韵母表中,e,en,eng在j、q、x、y后分别为[e:]、[e:n]、[e:,在其他音节中分别为[ə:]、[ən]、[əŋ],o在jo、qo、xo、yo中为[ø:],在其他音节中为[o];on在jon、qon、xon、yon中为[ø:n],在其他音节中为[o:n];u在ju、qu、xu、yu中为[y:],在其他音节中为[u:];un在jun、qun、xun、yun中为[yn],在其他音节中为[u:n];i在ci、zi、si中为[i]或[],在其他音节中一律为[i:];oh只在y后面出现。本发明下的西南汉语韵母及四声变化:iaeaiaryaengeeng,ieng(在j、q、x、y后)erngenkieieeieryeingiingirnginkio(实际上不存在的音节)ieoioriovongoengorngonkuaoauarwaunguengurngunkaiaeairayiengiangierngienkeieeieireyiungiongiurngiunkoiuoioiroyuangoanguarnguankuiuie,uei(在g,h,k后)uiruyauaoauraweueoeurewiuioiuriwououeourow注:在韵母音节当中,阴平为基础音节,阳平为元音添加或者替换,上声为在元音音节后面添加r,去声为加声调符号,或者辅音替换,或者添加元音。阳平的变化是在音节中重复主要发音的元音,或者ai音节和ia音节的i为e替换,-u开尾韵、u-唇化韵、iung音节的u为o替换,ie-鼻音韵中的e为a替换,与g、h、k相拼的ui为uei替换,与j、q、x、y相拼的e和en前添加i,io音节为ieo替换,在音节oe、oi前添加u,在其他音节的元音后添加e。去声为在基础音节后面添加声调符号v;或者-i开尾韵、i音节、ia音节、ien音节的i为y替换,与j、q、x相拼的e和en前添加y;o音节、oh音节、on音节的o为uo替换;-u开尾韵、u-唇化韵的u为w替换;uai音节的i为y替换;-ng尾韵中的g为k替换。本发明下的白话音位及字母标识如下表声母表:b[p],p[ph],m[m],f[f],d[d],t[th],n[n],l[l],g[k],k[kh],ng[ŋ],h[h],gu[kw],ku[khw],w[w],z[ts],c[tsh],s[s],x[],zh[]/[t],ch[h]/[th],sh[]/[],y[j]注:在本表中的国际音标为宽式音标,如:短元音[]、半开元音[]在元音表中分别写作[a]、[o],次闭元音[]存在于[]、[k]中,但均写作u,其他的音位均为宽式音标,主要写成拉丁字母的格式。声母表中划线部分为在当今白话当中并未实际存在的音位,在本发明中设定为存在的音位,分别来自并对应于普通话的zh、ch、sh。唇化生母写成gu、ku,实际上是辅音g、k与元音音节u-相拼,构成一系列的唇化韵。本发明下的白话韵母及四声变化注:在韵母音节当中,阴平为基础音节,阳平为元音添加或者替换,阴上为在元音音节后面添加r,阳上为在基础音节后添加声调符号q,阴去为在基础后添加声调符号j,阳去为在基础音节后添加声调符号v,或者辅音替换,或者元音添加。阳平的变化是在音节中重复主要发音的元音;-u开尾韵、u-唇化韵的u为o替换,ae音节后添加i,ao音节后添加u,在音节oi前添加u,在其他音节的元音后添加e。阳去为在基础音节后面添加声调符号v;或者-i开尾韵、i音节的i为y替换;on音节的o为uo替换;-u开尾韵、u-唇化韵的u为w替换;uai音节的i为y替换;-ng尾韵中的g为k替换。在入声中,阴入为在基础音节后添加送气塞音p,t,k,阳入为在基础音节后添加不送气塞音b,d,g。本发明下的古代汉语音位及字母标识如下表声母表:b[p],p[ph],m[m],f[f],d[d],t[th],n[n],ni[],l[l],g[k],k[kh],ng[ŋ],h[h],gu[kw],ku[khw],[ŋw],w[w],uw[w],z[ts],c[tsh],s[s],x[],zh[],ch[h],sh[],y[j],iy[j]注:在本表中的国际音标为宽式音标,如:短元音[]、半开元音[]在元音表中分别写作[a]、[o],次闭元音[]存在于[]、[k]中,但均写作u,其他的音位均为宽式音标,主要写成拉丁字母的格式。声母表中划线部分为在古代汉语当中并未实际存在的音位,在本发明中设定为存在的音位,分别来自并对应于普通话的zh、ch、sh。唇化生母写成gu、ku,实际上是辅音g、k与元音音节u-相拼,构成一系列的唇化韵。腭化生母写成ni,gi,实际上是辅音n、g与元音音节i-相拼,构成一系列的腭化韵。本发明下的古代汉语韵母及四声变化注:在韵母音节当中,阴平为基础音节,阳平为元音添加或者替换,阴上为在元音音节后面添加r,阳上为在基础音节后添加声调符号q,阴去为在基础后添加声调符号j,阳去为在基础音节后添加声调符号v,或者辅音替换,或者添加元音。阳平的变化是在音节中重复主要发音的元音;或者i-腭化韵的i为e替换,-u开尾韵、u-唇化韵的u为o替换,ae音节后添加i,ao音节后添加u,在音节oi、ong、oeng前添加u,将eh、ew分别替换成ieh和eiw,在其他音节的元音后添加e。阳去为在基础音节后面添加声调符号v;或者-i开尾韵的i为y替换;i音节、i-腭化韵的i替换成y;o音节的o为uo替换;-u开尾韵、u-唇化韵的u为w替换;uai音节的i为y替换;-ng尾韵中的g为k替换。在入声中,阴入为在基础音节后添加送气塞音p,t,k,阳入为在基础音节后添加不送气塞音b,d,g。普通话中的语音与古代汉语对应表,仅列出不同部分和对照部分:白话中的塞尾韵与古代汉语对应表,仅列出不同部分和对照部分:根据权利要求1所述的壮语是以上林县巷贤话为基础音,兼顾其他的壮语方言特点而定制的,其特征是上林县巷贤话所没有的其他辅音音位和上林县巷贤话的固有元音音位,其音位表如下:注:在本表中的国际音标为宽式音标,如:短元音[]、半开元音[]在元音表中分别写作[a]、[o],次闭元音[]存在于[]、[k]中,但均写作u,其他的音位均为宽式音标,主要写成拉丁字母的格式。声母表中划线部分为上林县巷贤话当中并未实际存在,但在其他壮语方言或者普通话中存在的音位,唇化生母大多写成gu、ku,ngu,实际上是辅音g、k、ng与元音音节u-相拼,构成一系列的唇化韵,与we-,wel相拼的,则唇化辅音仍旧写成gw、kw、ngw,即直接在它们前面加g、k、ng。腭化生母写成ni,gi,实际上是辅音n、g与元音音节i-相拼,构成一系列的腭化韵。本发明下的壮语韵母及四声变化注:在韵母音节当中,阴平为基础音节,阳平为元音添加或者替换,阴上为在元音音节后面添加r,阳上为在基础音节后添加声调符号q,阴去为在基础后添加声调符号j,阳去为在基础音节后添加声调符号v,或者辅音替换,或者添加元音。阳平的变化是在音节中重复主要发音的元音;或者i-腭化韵的i为e替换,-u开尾韵、u-唇化韵的u为o替换,ae音节后添加i,ao音节后添加u,在音节oi、ong、oeng前添加u,将ew替换成eiw,在eh、el前添加i,在其他音节的元音后添加e。阳去为在基础音节后面添加声调符号v;或者-i开尾韵的i为y替换;i音节、i-腭化韵的i替换成y;o音节的o为uo替换;-u开尾韵、u-唇化韵的u为w替换;uai音节的i为y替换;-ng尾韵中的g为k替换。在入声中,阴入为在基础音节后添加送气塞音p,t,k,阳入为在基础音节后添加不送气塞音b,d,g。阴入的长元音塞尾韵,还分化出一个更高的调值,在基础音节后添加双写的送气塞音pp,tt,kk,阳入的长元音塞尾韵,还分化出一个更低的调值,在基础音节后添加双写的不送气塞音bb,dd,gg。本发明为汉字的偏旁部首制定出了一套字母符号,这套字母符号为这四种形态的汉语和壮语中的汉语借词共同所有,添加在带声调音节后面,以消除同音字,本发明涉及到的偏旁部首为214个康熙部首,以及在某些版本的词典中存在的其他常见部首,每一个偏旁部首(包括该偏旁部首的变体形式)对应于一个双字母的符号,制定出该符号的方法,是取该偏旁部首读音的声母为第一个字母,第二个字母为另外的声母,包括用于作声调符号的声母,只有少数的偏旁部首例外。本发明的偏旁部首字母如下:214个康熙部首一画一:yt丨:gd丶:zv丿:pt乙:ys亅:kd二画二:rq亠:tw人:rn儿:rl入:rb八:bt冂:gq冖:mc冫:bq几:gj凵:kn刀:df力:lg勹:bf匕:bz匚fk:匸:hl十:sb卜:bk卩:zt厂:hz厶:sx又:yr三画口:kw囗:wr土:tv士:ss夂:zc夊:xp夕:zq大:dh女:nv子:zz宀:mt寸:cn小:xf尢(尣):wq尸:sj屮:ct山:sn巛:zl工:kh已:gr巾:gm干:gz幺:yf广:ym廴:yz廾:kq弋:yg弓:gg彐:gx彡:sm彳:ck四画心:xm戈:gh户:hw手:sw支:zx攴(攵):pk文:wn斗:dw斤:kt方:fg无:wf日:rd曰:rt月:yd木:mk欠:hm止:zs歹:dl殳:sf毋:ww比:bs毛:mw氏:xh气:hj水:sp火:hf爪:zf父:fv爻:yl爿(丬):cz片:pn牙:yh牛:nw犬:hn五画玄:hc玉:yv瓜:kf瓦:wh甘:gb生:sq用:yq田:tn疋:xw疒:nh癶:bd白:bg皮:pj皿:mm目:mg矛:mf矢:st石:sg示:sh禸:rw禾:hh穴:hd立:lb六画竹:zk米:mj糸:ms缶:fw网:wg羊:yk羽:hb老:lf而:rh耒:lr耳:rr聿:wd肉:rg臣:cd自:zj至:zd臼:gw舌:sd舛:cv舟:zw艮:gc色:sl艸:cf虍:hp虫:cm血:ht行:hg衣:yj襾;xj七画見:gn角:kg言:yn谷:kk豆:dp豕:sc豸:zh貝:br赤:cr走:zb足:zg身:sz車:ch辛:xn辰:cx辵:cg邑:yp酉:yw釆:bn里:ls八画金:km長:cl門:mn阜:ff隶:lj隹:zp雨:hv青:cq非:fr九画面:md革:gk韋:wl韭:kb音:yc頁:yb風:fn飛:fl食:sk首:xb香:hs十画馬:mh骨:gt高:gf髟:bw鬥:dv鬯:cb鬲:lq鬼:gv十一画魚:np鳥:nf鹵:lw鹿:lk麥:mq麻:ml更多十二画黃:hq黍:xv黑:hk黹:zr十三画黽:mz鼎:dn鼓:gp鼠:sv十四画鼻:bj齊:cj十五画齒:cs十六画龍:ln十七画龠:nq十八画龜:kv其他词典中出现的12个常见部首yx兀:wt川:cc巳:xs王:wk灬:bv旡:gs业:nb母:mv舍:sr其:kj:cw。本发明为每一个汉字或词和壮语单音节词的拉丁化拼写的原则是:声母+带声调音节+偏旁部首字母符号,其中词的写法为宽式写法和严式写法,宽式写法是可以不标或者标上部分音节的表示偏旁部首的字母符号,而严式写法是不能够省去音节后面的偏旁部首的字母符号,当声调由声调符号表示时,非末位音节的偏旁部首符号要与声调符号互换。如普通话:明:miengrd,验:yenvmh,验明:yenmhvmiengrd为严式写法,yenvmieng则为宽式写法;西南汉语:炸:zhavhf,弹:danvgg,炸弹:zhahfvdanvgg为严式写法,zhavdanv则为宽式写法;白话:链:linvkm,条:tiomk,链条:linkmvtiomk为严式写法,linvtiomk则为宽式写法;古代汉语:焊:hanvhf,接:ziepsw,焊接:hanhfvziepsw为严式写法,hanhfvziep则为宽式写法;壮语中的汉语借词:制:zhijdf,订dinkyn,制订:zhidfjdinkyn为严式写法,zhidfjdink则为宽式写法。在所有的同音字当中,通常是最常用或者最不易找出偏旁部首的简单字,不需要带上表示偏旁部首的字母符号。本发明下的汉语拉丁化方案和壮语拉丁化方案以及汉字输入法在计算机输入上涉及到很多的方法。一、若是输入拼音化文字,则只需将拼音化文字上的字母对应键盘上的字母逐一输入即可。二、若是输入汉字,则涉及到三种编码输入方法,第一种是全拼输入法,即在输入汉字状态下,点选输入法状态栏中的字根拼读输入法(全拼),依次键入汉字、汉字构成的词、词组或者短语所对应的拉丁化文字拼写的字母,若是输入词、词组或者短语,则只需键入第一、第二和最后一个字的声母即可。第二种是双字母输入法,即是将每一汉字拆解为几个字根,在汉字输入状态下,点选输入法状态栏中的字根拼读输入法(双字母输入法),在该状态下汉字的输入规则是:每一个汉字都可以拆解为几个字根部首,每个字根部首由两个拉丁字母表示,对于汉字的输入,只需键入该字的第一、第二和最后一个字根部首的双字母符号即可,对于词、词语和短语的输入,则只需键入第一、第二和最后一个字的首个字根的双字母符号即可。对于不能拆分的只有一个字根的汉字,则可以打出这个字的全拼形式,或者打出这个字的双字母符号,或者是这个字的双字母符号+这个字的全拼形式的头两个字母。第三种是首字母输入法,在汉字输入状态下,点选输入法状态栏中的字根拼读输入法(首字母输入法),对于汉字的输入,只需键入该字的第一、第二、第三和最后一个字根部首的首字母符号即可,对于词、词语和短语的输入,则只需键入第一、第二、第三和最后一个字的首个字根的首字母符号即可。对于只有一个和两个字根的汉字,则可以打出这个字的全拼形式,或者打出这个字的第一和第二个字根的首字母符号+这个字的全拼形式的头两个字母。该文字输入法系统还包括在拉丁化文字和汉字之间进行转换的方法,具体操作是:移动光标,将所要转换的字、词、句子或者段落用鼠标拖动选择,使之背景变为黑色,然后敲击鼠标右键,在弹出的对话框中点选“将拉丁化文字转换为汉字”或者“将汉字转换为拉丁化文字”,也可以在选中所要转换的文字内容后,按住键盘上“shift”和“ctrl”键,这两种方法也都可以利用光标移动键和回车键在弹出的对话框中点选。鉴于本发明下的拉丁化文字有宽式拼写和严式拼写两种方式,该文字输入法系统还包括在宽式拼写和严式拼写当中进行自由转换的方法。其操作如下:将光标移到所要转换的文字内容,用鼠标拖动,使文字的背景为黑色,敲击鼠标,在弹出的对话框中点选“将宽式写法转换为严式写法”或者“将严式写法转换为宽式写法”,“在将严式写法转换为宽式写法”中还有多种选择项,如“将某音节转换为宽式写法”,在自定义选择项中有多中设置方法,设置转换为宽式写法的音节位置,音节的数量,词的位置,和词的数量等,如“将某音节转换为宽式写法”,将“全部音节转换为宽式写法”。对于这两种写法的转换,也可以在选中所要转换的文字内容后,按住键盘上的“alt”键和“ctrl”键,然后弹出对话框,可供操作点选,在弹出的对话框中,也可以利用光标移动键和回车键进行点选。在前述“将汉字转换为拉丁化文字”中仍然有以下的复选项,即“转换为严式写法”和“转换为宽式写法”,在点选“转换为宽式写法”后弹出的对话框与点选“将严式写法转换为宽式写法”相同,往下的点选操作也就一样,这些点选也可以利用光标移动键和回车键来进行操作。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1