汉字双极融合码的计算机输入方法

文档序号:6606011阅读:413来源:国知局
专利名称:汉字双极融合码的计算机输入方法
汉字双极融合码的计算机输入方法,是一种计算机的汉字输入方法。
汉字双极融合码的计算机输入方法,简称双极融合码,是在本人先前申请的″汉字四笔融合码的计算机输入方法″(申请号97106282)的基础上延伸和发展起来的,包括四笔、双拼、形音和音形为一体的综合性汉字输入方法。汉字输入方法所以名目烦多,主要原因有两个1是汉字的形、音变化众多,拆分时各有千秋,2是键盘的代码有几十个,两者建立对应关系千变万化,谁优、谁劣没有另人信服的标准。所以汉字的编码输入方法,如雨后春笋,遍地开花,已经有近千种输入方法,比较流行的方法也有十几种,主要有区位码、首尾码、三键声形码、拼音码、双拼码、五笔字形码、表形码等。这些输入方法大致可以分为下面三种类型;拼音型、形声型、字型结构型;在众多的输入方法中,五笔字形输入方法和汉语拼音输入方法具有一定的代表性,和互补性。利用键盘输入,码长和速度是同一类指标的两个不同的侧面,它们互为因果,都是重要的指标。从根本上来讲,输入速度最能说明问题,码长又是提高速度的关键。理论上讲,码长三键是汉字输入的极限,码长两键是拼音码长(限于416个拼音)的极限。据我所知,还没有听到、看到实现这两个极限的报道。两年前,我所发明的汉字四笔融合码的计算机输入方法,实现了三键无重码输入的历史性突破。它的成功在于,充分地利用了计算机主键盘的字符资源,将形码的码长压缩到三键,并且消灭了重码,这是一项十分喜人的成果,就象是突破了音障一样。
成功的关键在于编码架构的突破,编码设计思想的更新。汉字 是象形文字,首先是作用于人的视觉形象,与之对应的计算机输入文法就是汉字的字形编码方法,如五笔字形输入方法,以及由我本人已经申请专利的四笔融合码输入方法。四笔和五笔的不同点主要在于,一个是码长三键,一个是码长四键,而且是三键无重码,其输入速度就可想而知了。汉语是作用于人的听觉器官的声音,是汉字的读音。形码输入的特点是,只要了解某个字的特定的形体,就能在字库中找到它,并显示在屏幂上。至于发什么音,对于一般的汉字输入者,并不关心、重视。但是,作为等殊情况,也有不少人希望有汉字的拼音显示的功能,即能在需要的时候显示某一个字的拼音,以便能准确地掌握发音。作为一个软件设计者,应该考虑到并实现这一实际需要,增加汉字的拼音显示功能,这是市场经济的必然结果,谁不占领就失去市场,谁占领了就拥有了市场。就具体编制工作而言,这就需要输入每一个汉字的拼音,余下的工作即由电脑程序来完成。要实施汉字的拼音显示,就得建立汉字拼音的字库,再用软件调用,为软件使用者提供优良的服务。就在我们建立汉字的拼音字库的过程中,在进行烦锁的具体工作的时候,当然要接触到拼音,以及自身整天接触到的四笔融合码的编码架构,这就自然引发了″双拼″编码的构想。四笔融合码的发明人是两个人,本人搞编码,另一个搞软件,在申请专利之前我们就已经开发出了只为自己使用的实用软件了。在实用软件的试用中发现,四笔形码虽然实现了三键无重码输入,单字输入只须2.3-2.5键,也不能说十全十美,不少人还是喜欢使用拼音输入方法。可见,作为汉字的另一个重要的特点的发音,也是一个不可忽略的因素。在汉字拼音的输入过程中,声韵双拼引起了我的注意。在编码者的眼里,1个特定的代码和其所替代字符的多少是没有限制的,它们只是一种函数关系,说得通俗一点就是对应关系。声韵双拼是1个很好的主意,打开汉语字典,发现只有416组拼音,而在声韵双拼中存在着不少重码。作为一种输入方法,没有必要一定要按照拼音的规则,才可以输入。根据四笔融合码的编码经验,在汉语拼音的输入过程中,进一步发现四笔融合码的编码架构,也完全适用于拼音编码方法。计算机主键盘的两键编码资源总量在1300以上,而汉语拼音只有416个,这就产生了消灭汉语拼音两键无重码的愿望。由于汉语拼音只是一元的变化,其复杂程度要比汉字低得多,比较轻松地就实现了拼音的两键无重码输入设计。这样,包括四笔融合码在内,也就实现了两个最短极限码长的输入;以这两个输入方法为主体(双极),又能融合形成形音、音形两种输助输入方法;这种集形、音、形音、音形四为一体的综合性输入方法,即″汉字双极融合码的计算机输入方法″也就诞生了。本发明的目的是研究出一种计算机的汉字输入方法,力求单字平均击键次数最少,输入速度最快,而且重码最少,直观易学,为大众所喜闻乐见的计算机汉字键入方法。本发明的汉字输入方法主要分为相互关连的两个基础部分,其一是″四笔″融合码的形码输入部分,这是本输入方法的主体和基础,其二是汉语″双拼″码的音码输入部分,是″四笔″形码输入的延伸和拓展,也是本输入方法的两个重要支柱之一。当前,汉字输入已经从单字输入转向以词码输入为主体的过度。双极融合码的编码架构,正迎合了这种需求,扩大了词码库容,使编码库容高达1千多万条,在提高输入速度方面有了长足的进步和发展。下面分字、词两个方面介绍汉字的编码输入方法。
汉字的编码输入方法四笔融合码的编码特征是,编码资源几乎占据了主键盘的几乎全部字符资源,和其它输入方法相比,资源总量占据了很大的优势,从而给字根的选择和分配创造了宽松的环境。实际选用字根几乎包括了汉语字典中所有的偏旁部首。它的好处是减少了重码,减少了怎样取根、拆分的麻烦解释,适用简体字、繁体字的编码要求;既符合中国人的传统习惯,将汉语字典中的约190个部首都引为字根使用,又根据编码的实际需要,适度扩充了少量自定义字根,将实际字根进行了相似相近的分类,分类字根大约只有160个左右,分别定义在计算机主键盘的26个英文字母和10个数字键上。具体的分配是四笔字根总表
<p>双极″双拼″编码输入方法声韵双拼的优点是按拼音规则进行输入,非常符合人们的汉语常识,同时也是拼音编码的缺点,就编码输入而言,速率是主要矛盾,能不能以最快的速度输入,才是最根本的。而我的思路正在于此,没有把思路局限在声、韵上。我的目的非常明确,就是放在两键无重码上,和″四笔″一样,首先把着眼点放在键盘的可用资源上,这就形成了具有″四笔韵味″的双极″双拼″的输入方法。和″四笔″形码一样,首先着眼于架构设计,即键盘资源的总体配置,并延用了″四笔形码″的架构。其基本点有两条,1是英文字母键和数字键可以作为全方位代码,2是标点符号键不能作为首键代码使用。根据这两个前提条件,实现汉语拼音″双拼″无重码是轻而易举的事。只要在声母的基础上再增加(ji、qi、xi、pi等)代码,在利用了(a、e、o)字母键后,将代码向数字延伸即可。但这是没有必要的,也是不可取的。因为键入操作时,击打数字键毕竟不如击打字母键方便。于是又增加了一条人为的主观限制,就是把双拼的首键只限于字母键,次键可以延伸到符号键。在汉语拼音里,同一个发音有时会有众多的汉字,象″bi″这个发音,就有几十个字,通常用数字键选择输入的功能,必须保留,不能改变。根据上述设想,汉语拼音″双拼″输入的可用资源是,首键可利用26个英文字母,次键在26个英文字母的基础上再加上10个标点符号,共37个。经过努力,问题园满地解决了,次键实际只使用了5个,就消灭了重码,这种架构和四笔输入得到了新的统一,剩余6个符号键,可用于词码和音调选择,″双拼″编码设计也就诞生了。实际编码结果是,首键用26个英文字母,次键另加5个标号键,共31个,具体分配如下
首先来看一下″双拼″ 码的首键的分配。
在汉语拼音的23个声母中有20个和英文字母完全相同,对号入座是当然的,另外3个声母(zh、sh、ch)就近分配在u、i、v字符上,能作首码使用的(a、o、e)也对号入座,由于这三个字母的利用率太低,又占据有利的键入位置,加上可减少符号键的需要,故就近把(ji、qi、xi)分配到(o、e、a)上,以减轻次键和重码的压力。″双拼″次码在键盘上的分配很有规律性,基本上是按照英文字母的自然顺序排列的,共分成了五组,依次是En、eng、e、er、ei,依次分配在Q、W、E、R、T上;ie、iu、I、in、ing、ia、ian、iang、iao、iong,依次分配在Y、U、I、O、P、(;)、(,)、(′)、(。)、(?)10个字符上;a、ai、an、ang、ao,依次分配在A、S、D、F、G上;o、on、ong、ou,依次分配在H、J、K、L上;u、uan、uang、ue、ui、un、uo、ua、uai、ü,依次分配在Z、X、C、V、B、N、M、(,)、(。)、(?) 10个字符上。从列表中可以发现,″双拼″首码以键盘排列为准,″双拼″次码按英文字母的自然顺序排列,除极少数由于重码的原因分配有些特殊外,规律是一目了然的。这就是说″双拼″代码几乎不需要特殊记忆,首键按键盘次序排列,次键的编码规律极强,31个字符代码和双拼编码的对应关系,可以分成5组来记,往往只要记住某一个,就能按键盘上的实际键位,按顺序找到第二个、第三个等等,特别便于记忆。现在,我们以Z行的次键码为例,看看它们的内在联系。Z X C V B N Mu、uan、uang、ue、ui、un、uo字母键Z X C V B N M是键盘上的字母自然顺序,所对应的拼音码完全按英文字母的自然顺序排列。如果知道ue在V上,则马上可以推出,ui在B上、un在N上、uo在M上。从表中可以发现,n和N正好重合,这不是巧合,而是我的有意安排。换句话说,如果记住了这一对应关系,同样可以依据英文字母的自然顺序,推出其它的编码来。好记是毋用置疑的。我想,这样的巧安排是少见的,也是不同于其它拼音码的主要特征之一。双极″双拼″输入消灭了汉字拼音的重码。也就是说,任何一个汉字的拼音,只要击键两次就能显示出来,必将大大提高输入速度。拼音编码方法有它的长处,″双拼″输入同样具备这些特点。尤其是两字词的输入将极为简便,只要按两个字的四个编码输入就行了,对极少数单码字,只要双击输入就行了,相对重码率根低。或者说,双极″双拼″输入最适合用双字、三字″双拼″输入,编码极其简便,输入速度可轻易地提高到200多汉字/分。双极融合码的″双拼″词码输入板块,只设了4个,把两字词、三字词都设定为直接输入了。如果用词码板块输入,输入速度可多达320多汉字/分。在这里需要再强调一下,双极″双拼″不同于声韵双拼,或者说这里的双拼不是以声韵为界限,而是把拼音分成两都分,以便于两键无重码的输入为目的。在拼音的首码中,有(ji)、qi、xi三个编码,其中ji可根据习惯取舍。而在拼音的次码中,有iang、iong uang iao ian等。稍加注意,就会发现这都是为了消灭重码而增加的设定,并不复杂,它们的排列也很有规律,记忆量特少,非常实用。仅仅由于它们的存在,重码不见了。这不能不算是一项重大的突破。在双极″双拼″输入方法中,数字键作重码区别键用,这里所说的重码,是指具有同一发音的同音字,而不是拼音的重码。到目前为止,在主键盘的字符资源中,还有6个没有提到,就是在″四笔″融合码中定义为词码区别键使用的6个键。在双极″双拼″中,只将([丶])两个符号键作为词定义键使用,剩余的(`、-、=、\、)4个标点符号键设定为拼音的音调选择键使用。双极″双拼″的单字输入设有两条路径,1是借助数字键直接选择输入,这是最常用的方法;2是通过音调选择后,再输入,好处是可以邦助校正发音,有利于汉语语音的学习和训练。
双极[形音、音形]码的输入双极″形音、音形″码不是独立的汉字输入方法,是依附于″四笔″和″双拼″的辅助输入方法,没有自己单独的字码库,输入时才自成一体,也都取三键输入。形音码的单字输入取″四笔″的首尾码,加双拼的次码,单根字取单根码,再取双拼码。音形码的单字输入取双拼码,加″四笔″的次码,单根字取单根码。随着″四笔融合码″的延伸和拓展,它的内涵和外延都得到了充分的扩大,形成了双极融合码。想当初在给输入法命名的时候,选用″融合″这两个字是何等的恰当。说是偶然,也是必然,这是″融合″本身自然发展的结果。字母、数字和标号的融合,字码、词码和词组的融合,形码和音码的融合,都是″融合″。形码、音码是输入的两个基本板缺,两个极端,更为突出的是,这两种输入实现了极限″码长″无重码的输入。将这两个输入板块″融合″在一起,两者的强强联合,四为一体,威力无比。构成了集形、音、形音和音形四种计算机的汉字输入方法为一体的综合性输入方法,实现了输入从量变到质变的跳跃,成了输入方法的集大成者。为此,将其命名为″双极融合码″会更加准确,更能反映此项发明的丰富内涵和实用价值。
词的编码输入方法本系统所说的词是指两字词以上的词,单字词视同字进行编码处理。在编码系统中,字词可以混合编码,也可以单独编码。我们选择了后者,即字词的分类编码。它的好处是条块分明,输入者心中有数,互不挤占空间。不仅如此,本系统还将词分成若干个类型,以增加词库容量,减少重码,以提高输入速度。这和增加电话号码的位数,设立地区代码一样,使操作更加可靠,更加心中有数,不走弯路。定义符就是起到了这种不可缺少的作用。″四笔″词码共分 12个板块,为词条输入建立了一个十分庞大的存取空间,从而保证了词的输入成为大家喜欢使用的输入环境,大大地提高了键入速度。在一般情况下,词码总长取3-5键,这是追求速度和充份利用体系资源的折衷选择。在国标三级词库中,共有四万多词条,其中两字词居多,四字词次之,为了贯彻将词条输入成为输入主体的构想,根据库容大的特点,为减少重码,实现快捷输入的目标,把库容的多半配置给两字词,是为了减少两字词的平均单字击键数而采取的必要措施。在″四笔″输入中,单字输入只需约2.3-2.5键,如果两字词的输入用到5键,平均2.5键,那这种词输入就没有存在的必要了。为了把平均击键数压缩到两键以下,才采取了这个不得已的措施。根据两个字字根的具体情况,分别是1根、2根、3根(包括3根以上),共有九种组合,共分为六种类型进行编码,再加上三字词,四字词,多字词,两词词组,多(大)词词组,用户自定义(包括句子、短语的缩写等)等6个,共12个词输入板块。″双拼″词输入分为两种情况,1是两字词、三字词的输入,直接用双拼码输入,取4键符;2是四字词及以上,分4个板块分类输入。-形音、音形码的词输入,与″双拼″词输入极为相似,统见下表。四笔、双拼、形音、音形词输入结构表双极融合码———词码结构一览表
注X(四笔)、x(双拼),1([)、2(])、3(-)、4(=)、5(\)、6(`) 。在″四笔″词输入中,只介绍一下两词词组,其它类型从略。两词词组,是专为提高两字词的输入速度而设立的又一种词输入编码结构。由于四笔输入的单字输入速度大约在2.3-2.5键,而两字词的单字输入速度大约在2键左右,和单字输入速度,相差不算很大,为了进一步提高两字词的键入速度,拟将两字词进行组合编码。即对国标三级词库中的两字词、或三字词,各取首尾汉字的次根码,形成了一个独立的词码输入板块。有了这个板块,象″人民解放军″、″勤劳的人民″、″好好地学习″、″解放军代表队″都可看成是两词词组,但这类词组和多字词的界限交合在一起,很难划分。象″人民解放军″这个多字词,在国标词库中有、″人民″有、″解放军″也有,应该在多字词板块中,两词词组中都可以输入。但词组的内涵要比多字词丰富得多,相差甚远,这是因为两词词组输入的词组,是在国标词库中,两字词、三字词的基础上由计算机软件加工形成的组合词条,而多字词板块是检索国标词库中的多字词并读取的词条,是两个完全不同的概念,有些词条在多字词的词库中不一定存在。两词词组的设立必将有效地提高两字词的输入速度,从而也为提高词的输入速度,字的输入速度,提供了一个行之有效的手段。双极″双拼″词的输入。和″四笔″词的输入不同,″双拼″词的输入比较简单。这是因为,在″四笔″单字输入时,为了追求三键无重码输入,占据了键盘资源,词输入只能让道,而在″双拼″输入中,在拼音的范围内,无法考虑消灭重码问题,只能允许重码存在,当然也就没有完全占据键盘资源,所以在词输入时,正好充分利用了这一有利条件,发挥了双字双拼的优势,比较简单快捷。由于4码资源总量有64.96万-77.45万条,加上三字词的数量也不算太多,故将三字词也纳入直接输入的范畴。这样,双字″双拼″的单字击键数大约为2.0键左右,要比″四笔″的字输入的单字击键数2.3-2.5键,要略低一些,不愧为一种较好的选择。三字词直接输入,首字取双拼码,剩余字取双拼次码,重码也不会多,估计单字击键数约为1.4键。四字词取第1个字的双拼首码,剩余字取次键码,结构是X X[X X,平均击键数约为1.3键。多字词取第1个字的双拼首码,三四末字取次键码,结构是X X]X X,平均击键数约为1.0键。两词词组取两词的首尾字,首字取首码,剩余取次键码,结构是X]X XX,单字击键数约为1.2键。大(自)词词组取两词的首尾字,首字取首码,剩余取次键码,结构是X[X X X,单字击键数估计在0.6键以下。由此可见,″双拼″词输入,除了两、三字词直接输入外,大体上和″四笔″词输入相似,较果略次于″四笔″。双极 [形音、音形]码的词输入,和″双拼″极为相似(参见7页词输入结构表)。输入时只要按取形(大X)、取音(小X)码的规定就行了,或者记住,两字词间断分配,三字词输入1、3分配,板块输入2、2分配,次序同命名次序。
汉字双极融合码的计算机输入方法的基本等点1、汉字双极融合码是在汉字四笔融合码的基础上延伸和发展起来的综合性汉字输入方法。具有广泛的包容性和适应性。本发明完全者眼于计算机主键盘字符键资源的充份利用,力求把汉字输入速度向极限推进,提高到了一个斩新的阶段。根据理论证明,字码输入,三键是极限速度,任何人,只要是利用键盘输入,就不可能超过这个极限。就拼音输入而言,两键也是极限。我的发明正在于实现了这两个极限。要证明这两个极限非常简单。就六千到两万个汉字而言,要用48个字符只击键两次,全部总库容只有48×48=2034,而一级汉字就有3755个,远远地超过了这个数字,必然要出现重码,也就是说,通常最少要三键才能输入一个汉字,所以码长三键是汉字键入的码长极限。同样,汉语拼音共有416个音节,只用一键更不可能,所以两键是极限。经过我的努力,实现了形码三键无重码输入,拼音两键无重码输入的重大突破。
2、全新的编码架构,为实现形码三键无重码,双拼两键无重码的输入方法,奠定了基础。其具体设想是(1)充分利用键盘的可用资源,英文字母键26个,数字键10个,符号键11个,再加空格键,共48个。通常数字键都作为重码区别键使用,如果将数字键改作字根键使用,就象增加电话号码位数一样,必然会增加编码容量,而能减少击键次数的话,那肯定是值得的。″四笔″正是在此基础上实现了三键输入。
(2)符号键的二次利用,为″四笔″、″双拼″无重码输入提供了保证。字根的分类非常重要,五笔字形编码方法中的折笔,其字根重复使用数远远少于其它几类使用数,分布很不均匀,取消这一分类,将其融入其它分类之中,是一个不错的主意。所以以四笔分类。这和实审意见书同时提供的对比文件1(CN1072786A,四笔汉字编码法及键盘,申请号91111317.7),在四笔的想法上,我们是一致的,也就是说,我们都看到了取消折笔的好处;但是,该发明人没有跳出五笔字形编码架构的框框,没有超出26个英文字母键的限制,仍然在26个字母上做文章,实施起来也没有多大价值。我的着眼点跳出了26个英文字母的框框,这是一个不小的进步。
(3)对符号键的巧妙运用是本发明的精华所在,是″四笔″单字三键无重码输入,″双拼″拼音无重码输入成功的可靠保证。
(4)″四笔″输入变单字输入重码的被动消除为主动消除。也是充分利用符号键,作为第二键,第三键使用的新功能。
(5)在″四笔″输入中,用6个符号键作为词码板块定义功能键使用;在″双拼″、形音、音形输入中,根据实际需要只用了两个。
3.″四笔″输入设置了字符的字根显示功能。有了这一功能,只要了解几个主要步骤,就能很快学会使用,无师自通,绝不夸张。
4.汉字的词输入逐渐成为主流,国标词库有四万多个词条,其中两字词最多,四字词次之,如何输入两字词,矛盾比较突出。
(1)在″四笔″输入中,因为两字词字数少,三键编码资源又被单字输入所占用,矛盾更为突出。实际选择了词码的板块结构,它的最大好处是将两字词分成了6个板块,对号入座,以追求最简便、最快捷的输入速度。
(2)在″双拼″输入中,单字输入是以保留重码为代价的,没有占据三键次源,可以直接双字″双拼″输入,词条输入效果最佳。
(3)对于四字词、多字词及词组,矛盾并不突出。″四笔″、″双拼″及其形音、音形输入都有相似的词输入编码结构,输入速度相当。
5.″四笔″和″双拼″输入,作为一个独立的输入方法,有自己的库函数,″形音″和″音形″是辅助输入方法,没有自己的编码库,使用时,只是调用总库或两个主体编码库。
本发明取得了下列积极成果本发明的构思是建立在充分利用键盘资源的高度,力求资源配置趋于合理,资源能得到充分利用的角度,使各项技术指标,如码长、独立字根记忆量、键入速度、词容量等,都处于同类输入方法的领先地位。
1.本发明以″四笔″字形输入为主体,辅助以双极″双拼″码、及其派生出来的形音、音形码,形成了集形、音、形音和音形为一体的综合性汉字输入方法,命名为″汉字双极融合码的计算机输入方法″,简称双极融合码。2.本发明的″四笔″形码输入,实现了三键无重码。而五笔字形输入,一般要用到三到四键,有时要多达五键,比当今盛行的五笔字形输入速度提高了一大步。和对比文件1(CN1072786A)所述的(四笔)更无法相比。
3.″四笔″形码以自然大字根编码为特点,用区别键设定了字根窗口显示、重码提示输入的方法,具有直观、易学、易用,简洁明了的效果。
4.″四笔″和″双拼″字根的设置、分配顺其自然,利用音、形、义等特点,强调联想和编码的规律性,巧妙地解决了,好记重码多和重码少难于记忆的矛盾。例如″廴、辶、了、三″等字根定位在″3″上,″下、雨、羽、水、求、入、″等定位在″8″上,″扌、丰、韦″分别定义在″U、I、O″上,″u、uan、uang、ue、ui、un、uo″分别定义在″Z、X、C、V、B、N、M″上,非常便于记忆。
5.″四笔″编码字根顺其自然,没有刻意地增加或减少字根,分配也非常合理,字根总数约250个,分类字根约160个,记忆字根约有100个;加上设置了字符字根的窗口提示输入,及双根字和部分三根字在窗口的直接显示输入,其记忆量很少,不需要死记硬背烦锁的编码口诀,非常简便。
6.本发明将词条输入作为输入的重点。庞大的词库使输入速度从每字三键以下(约2.3-2.5键)减少到1.5键以下,每分钟能输入300多个汉字。而西文与汉字的译文的比例大于2,约为2.2-2.5;故用本编码输入,其输入速度将会轻松地超越西文,7.″四笔″输入方法特别适用于繁体字的编码输入,可以扩充包括中、日、韩繁体字在内的所有汉字。
8.本输入方法完全可以适应词的大库容需求,完全可以满足GB/T15732-1995中的43540条词语输入的环境要求,是其它输入方法难以相比的。
9.本编码方法中,″双拼″输入实现了拼音两键无重码,″双拼″、″形音″、″音形″三个词输入板块,非常简洁明快。充分体现了音码输入的优点。
10.本发明命名为″双极融合码″,系指实现了″四笔″形码输入的3键码长的极限,和″双拼″音码输入2键码长的极限;并″融合″形成形音、音形为一体的综合性汉字输入方法,可算是汉字编码史上的一次彻底的编码革命。
11.本发明在发展到″双极融合码″阶段之后,已经成了汉字输入方法的集大成者,既直观易学,快捷方便,又能迎合各种人群的爱好和习惯;可以满足各种不同层次,不同群体,各种专业,各种年令结构的各种需要;可以任其所好,各取所需;克服了在输入过程中的卡壳现象,如果在形码输入上出现了障碍,可改用音码,不会发音可借助形码,相互补充,灵活多变,取代了替代键。实施举例输入方法的实施,要依靠软件的支持。编码好比基础,有了软件才能盖起高楼大厦。当然,没有软件的支持,有了基础也没有用,只有两者的有机结合,虽不能做到完美无缺,要实现令人满意并不难。通过五年的努力,我才真正体会到,编码实在是太费时费力了,而且无止无尽。下面主要就″双极融合码″汉字输入的实施,简单地介绍一下正如上面所介绍的,本输入方法共有 4个输入板块,″四笔″和″双拼″是两个基础,即所谓的双极。″四笔″又是双极中的主体。下面主要就″四笔″和″双拼″的实施说明一下。
单字的输入1、用″四笔″输入方法输入一个汉字,首先要看该字的大体结构和繁简,是由几个字根构成。在本编码方法中,不外单根、双根、三根(多根)三种情况。输入单根字,首先要看首笔是点(有点)、横、撇、竖中的哪一类,这也是找字根符的基本步骤。现以金、木、水、火、土为例金起笔是撇,在第三行,读音又与J有联系,是首选目标,代码J,木起笔是横,在第二行,在Y上可以找到,代码Y,水起笔是竖,应该在第四行,但是水通常用作三点水,所以代码是8,火起笔是点,在第一行的″9″上,土起笔是横笔,在第二行的T上。如″事″,虽是独体字,但在字根中找不到这个字根,还是要拆分,可拆为(一口)和(肀)输入。双根字的输入,先找到相应的两个字根符,键入后,根据窗口提示键入相应的提示符输入。如″根″、″旦″、″或″三个双根字,键入双根符后,要分别键入左右、上下、交错区别键才能输入。若要输入″集″字,两个根分别是隹、木,代码是F、Y,依次输入FY(。)即可。三根(及三根以上)字的输入,首先要确定三个字根符(见18页22行),键入两个后,观看窗口,看是否有自己想要键入的字,如有,则键入提示符,若无,则键入该字的第三个根符,就会输入了。例如″譬″字,最突出的字根是″言″,剩余部分取首尾根″尸″、″辛″,编码是(O66),按次序键入字根符就行了。
2、用″双拼″输入单字会有重码,但方法极为简便,一个汉字的双拼代码只有两个,也没有取舍的麻烦,只要按代码输入,再按窗口显示的数字提示键入就行了。双拼码的首码非常简单,主体是23个声母,另加三组a-xi、e-qi、o-ji共29个。关键是有ji、qi、xi的输入。如汉字″集″的拼音是ji,输入编码应拆分成两个(双拼),输入J、I再根据窗口数字提示输入该″集″字;又如″夹″字的拼音是jia,那么双拼编码就是O、A,而不是J、(;),输入O、A后同样依据窗口提示输入。
3、″形音″码的单字输入。单字输入形码的首尾码,再输入双拼的次码。仍以″集″为例,形码取首根隹(F)尾根木(Y),双拼次码是(I),即依次输入FYI即可。
4、″音形″码的单字输入。仍以″集″字为例,双拼码(JI)、形次码(Y),按JIY输入即可。″集″字的四种编码依次是FY(。)、JI(数字)、FYI、JIY,都是三键输入,″四笔″形码不会有重码,双拼单字输入有重码,形音、音形码总库容差不多,略低于形码,重码也不会很多,但它的好处是取码要简单一些,特别是在找不到某一个字的时候,用四种方法之一,不会找不到的。这样就用不着设置万能键了。
词和词组的输入1、″四笔″词条输入。前面已经介绍了″四笔″词码的12个输入板块,除了1个留给用户自定义外,11个由系统提供支持。其中两字词占6个板块,三字词1个,四字词1个,多字词1个,两词词组(实为两字词、三字词)1个,多(大)词词组1个,共12个。两字词的输入分6个板块进行,要根据两个字的字根的多少区别对待。上面已经提到,1、2、3的组合共有9种情况,分成6类
11(1单单) 123(23前单) 223(56) 223(56)231(47后单) 323(89前三)从三字词开始,每字都取1个根,定义为单根取单,非单取次根(便于软件编码),或主根(人工编码,具有主观性和随意性),在下例中,都选用次根。
2、双拼、形音、音形的词条输入要简单得多。
两字词双拼码的输入,直接键入四个双拼代码。
两字词形音码的输入,直接键入两个字的形音代码。
两字词音形码的输入,直接键入两个字的音形代码。三字词双拼码的输入,先键入首字的双拼码,再键入后两个字的双拼次码。三字词形音码的输入,先键入首字的形音码,再键入后两个字的双拼次码。
三字词音形码的输入,先键入首字的音形双码,再键入后两个字的形次码。四字词及以上,按7页的词板块结构输入,列表如下
>从上面的举例和分析可以看出″四笔″单字输入速度大约在2.3-2.5键左右;两字词大约在1.8-2.0键左右;三字词的大约在1.3-1.5左右;四字词的单字输入速度大约在1.3左右多字词及其以下,单字输入速度基本上在1.0键以下;估计词输入速度是很快的,随着词库的扩大,平均单字击键数定会在1.5键以下。如果单字平均击键2.0次,每秒击键8次,则每分钟可输入240个单字。如果录入员比较熟悉词组,以词输入为主,平均单字击键数达到或低于1.5键/秒是不成问题的,那么输入速度将达到320字/秒以上。这个结果绝对是一流的输入速度。″双拼″的单字键入速度大约是3.0键,两字词双字″双拼″输入大约是2.0键,三字词大约1.4键,四字词大约1.3键,多字词大约10键,词组类一般在1.0键以下,平均词输入单字击键数和″四笔″相当,也在1.5键左右。形音、音形码的单字输入速度将略高于″双拼″输入。这是因为窗口提示重码,必然要占据时间,影响击键速度。词输入则和″双拼″差不多,大约在1.5键左右。总之,单字输入以″四笔″输入最快,平均约2.3-2.5键,词输入时,四种输入方法都使用近似的输入板块结构,键入速度也都差不多,大约在1.5键左右,平均单字输入速度可达到320个汉字以上。汉字双极融合码的计算机输入方法绝对是一流的输入方法。
权利要求
1.一种汉字双极融合码的计算机输入方法,是一种计算机的汉字输入方法,其主体部分由四笔融合码和汉语″双拼″码组成,并融合形成形音、音形辅助输入编码;四笔融合码已由本人申请国家专利,申请号是97106282,本″双拼″和声韵″双拼″的共同点,都是对汉语拼音进行″双拼″编码,所不同的是本″双拼″延用了四笔的编码架构体系,和声韵″双拼″在设计思想和编码架构上有本质的不同,形成了双极融合码;其特征是(1)集四笔、双拼、形音和音形为一体化架构的综合性输入方法;(2)″双拼″利用了包括符号键在内的37个字符键;(3)形音、音形直调用四笔、双拼编码库;(4)定义(`、-、=、\、)四个符号键作为″双拼″音调选择键,([、])作为″双拼″、形音和音形共有词区别键。
2.根据权利要求1所述的汉字双极融合码的计算机输入方法,其特征是汉语″双拼″的首码分配在26个字母键上,次码规则地分配在26个字母和5个符号键上,具体的分配是
<claim>3.根据权利要求1所述的汉字双极融合码的计算机输入方法,其特征是形音码单字输入的方法是,取″四笔″形码的首尾码,再取音码的次键码;形码单根取单根码,再取双拼码。
4.根据权利要求1所述的汉字双极融合码的计算机输入方法,其特征是音形码单字输入的方法是,取″双拼″码,再取四笔形码的次码(单根取单根码)。
5.根据权利要求1所述的汉字双极融合码的计算机输入方法,其特征是词、词组输入的一体化架构体系如下双极融合码———词码结构一览表<
>附X代表形码、x代表音码、形码无次码时即用首码;数字与符号的对应关系是(6)`(3)-(4)=(5)\(1)[(2)]。
全文摘要
汉字双极融合码的计算机输入方法,是一种汉字的计算机输入方法。双极是指四笔形码、双拼音码输入,辅助以其融合形成的形音、音形输入,合四为一,具有形声并茂,各有所长,直观易学,无师自通,快捷方便,任其所好的特点;本系统资源共享,码长最短,速度最快,记忆量很少,实现了四笔三键无重码,双拼两键无重码的两个码长极限;单字输入约2.3—2.5键,字、词综合输入速度在1.5键/字以下,绝对是新一代的汉字输入方法。
文档编号G06F3/023GK1253326SQ9911440
公开日2000年5月17日 申请日期1999年8月30日 优先权日1999年8月30日
发明者韩恒瑞 申请人:韩恒瑞
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1