拼音首部数字输入法的制作方法

文档序号:7667157阅读:327来源:国知局
专利名称:拼音首部数字输入法的制作方法
技术领域
本发明属于电脑汉字编码输入方法,也就是计算机中文输入法。 因为它是一种组合手机数码输入法和拼音输入法的计算机输入法,并 且还结合了首部输入技术,因此称为拼音首部数字输入法,经过移植 也可在手机、电话等设备中使用。
背景技术
利用数字对汉字编码由来已久,早期的电报码、区位码就属于数 字编码,具有四位数字等长,无重码,输入速度很快等优点,但因为 其编码毫无规律,只能死记硬背地逐个记住六、七千个汉字的编码, 自然能熟记其编码的人是寥寥无几的,如今,这样的编码连计算机上 都淘汰了,更甭提手机了。四角号码也是数字编码,它算有规律可循, 但不合笔顺规律,包含的同类部件太多,还有些重码,且不适合想打, 效率较低,手机上也没安装这种输入法。将汉字的各种笔画归类为几 种笔画,用几个数字编码,并逐笔输入的输入法,因为象写字一样简 单,几乎人人都能使用,所以在手机上获得广泛应用。可逐笔输入汉 字时,笔画较多的汉字码长较长,输入速度较慢,为此,作了智能化 改进,每输入一笔就出现最有可能的几个字或偏旁供挑选,这样许多 字不必逐笔输完就出现在屏上,明显提高输入速度,成为手机市场上 主流的笔画输入法,可少数汉字仍要击键七、八下甚至更多,选字麻
烦,输入速度欠快。著名的T9输入法好象就属于这类输入法。于是 有人做出改进,将合体字一分为二或一分为三,再选取笔画和部件进 行编码。这类输入法典型的代表是五笔数码,诚如其宣称的那样,既 简单又快速, 一般人十几分钟可学会,输入速度约为西文的二倍。可 这类输入法有个重大缺点,那就是部件选取不当,以五笔数码为例, 它的六键输入法只在五类基本笔画的基础上增加一个"口"部件,选取的部件少了点,它的九键输入法却令人吃惊地选用了 "王""幺"
"心"等组字频率底的汉字部件。另外让人感到麻烦的是五笔数码犯 了一个与四角号码同样的错误,那就是有的基本部件还包含了几个其
他部件,此举一来不利于把部件排到数字键上,因为手机上的数字键 太小,二来增加了部件数,显得烦琐,不利于记忆。市场调研表明, 很多人懒得发抖,不愿学这种十几分钟才能学会的输入法,只有几分 钟就能学会的输入法才有市场。
这样几分钟就能学会的输入法就被推向市场。目前手机市场上在 用的一种输入法是这样的将五种基本笔画和几个汉字部件分别排在 数字键上,合体字的汉字,按笔顺第一部取二码,第二部取一码;独 体字的汉字按笔顺取二码,对汉字作过深入研究的人都知道,有几个 部首"管辖"二百多个汉字,第二部只取一码的话,会造成大量的重 码,这种试图在区区几个数字键上以二、三码输入七千个汉字的做法 必定付出重码高的代价。针对这种情况,本人发明了一种新的汉字输 入法手机数码输入法。该输入法选用的多笔画部件只有五个,分别是 十人净? *,当时还规定部件"八"含"人",后来出于简单易学考 虑,将相对不常用的部件"八"去掉了。经实践证明这五个部件是最 合理的,能以最少的记忆、最少的击键数、较少的重码完成输入。对 于不太熟悉拼音的人来说是最合适不过的输入法。
然而,中国人最常用的输入法不是笔画输入法,而是拼音输入法。 因为拼音输入法输入汉字时无须考虑字形结构,便于想打,因而最为 流行。拼音输入法最初移植到手机上使用时存在着一个输入拼音字母 不便的问题,由于几个字母排在一个数字键上,有的拼音字母要按几 下数字才能出现在屏上,击键次数过多,解决的办法是采用智能拼音, 按拼音字母的次序敲击一下每个字母所在的数字键后,出现几种可能 的拼音组合供选择,这样就大大减少了击键的次数,更便于输入。采用智能拼音后,拼音输入法就开始流行开来,可拼音输入法还存在着 重码率高的缺点,有时不得不从数十个甚至上百个同音字中选择一 个,严重影响输入速度,极为不便。随着手机的全民普及,如何利用 数字键来简便快速地输入汉字仍是目前手机输入法的一个重大技术
难关。

发明内容
这样目前汉字的数字编码输入法要么不合笔顺规范;要么部件选 取不当;要么码长太短或太长;要么重码过高,影响输入速度;要么 不便想打。都没能很好解决简便的不快速,快速的不简便这一技术难 题,输入汉字不甚方便。
本发明的目的是提供一种符合笔顺规范、直观、汉字部件少,简 单易学、输入汉字方便快捷的电脑汉字输入法即拼音首部数字输入 法。
为达到拼音首部数字输入法的目的,本发明将拼音输入法与手机 数码输入法组合,拼音在先,形部编码接后,该形部编码为码长縮短 了的手机数码。形部编码的码长最多为二码,而且规定合体字只取字 首部分,如果字首部分只有一码,就取一码,而不能取剩余部分。这 是不同于手机数码的创新之处。独体字也最多取二码。
本发明将汉字的各种笔画按国家语委的规定归类为横、竖、撇、 点、折五种基本笔画,分别用五个互不相同的数字比如l、 2、 3、 4、 5编码。为降低重码,还优选组字频率或实用频率高的几个笔画结构 即国家语委规定的汉字部件"木"、"净,,、",,、"廿"、"口"、排到 键上,分别用另外五个互不相同的数字如6、 7、 8、 9、 0编码。汉字 部件是由几个笔画组成的具有组配汉字功能的构字单位,汉字部件有 多笔画部件和单笔画部件之分,单笔画部件即五种基本笔画。
形部编码的取码规则是将汉字分为独体字和合体字,合体字又根据整体结构一分为二,先写部分为第一部,简称首部,后写部分为第 二部,简称剩部。合体字的首部按笔顺取前二个部件的相应代码进行 编码,当只有一个部件时,就只取一个部件的相应代码进行编码,而 不必取剩部进行编码,独体字的首部按笔顺取前二个部件的相应代码 进行编码,当只有一个部件时,就只取一个部件的相应代码进行编码。


图1是GSM蜂窝电话的键盘,其中各字母键的排列符合 ITU-TE.161标准。
图2为形部编码数字键盘排列图,图中一、I、 j、、、乙分别 代表横、竖、撇、点、折。
具体实施例方式
下面结合优选的实施例和附图作详细说明。
本人在长期的汉字编码研究中,认识到汉字输入时选用拼音输入 法比较简单,且便于想打,可汉字的同音字较多,必须附加形部编码 来减少同音字。本人研究发现同音同偏旁的汉字很少,即便有,也一 般只有两三对,通常不会超过四对,因此在设计形部编码时只要能区 分偏旁即可,也就是说对合体字只要选用其偏旁即可,而无须考虑其 剩余部分,由于偏旁往往在字首,因此一般的汉字只要选取字首部分, 进行编码即可,但也有的偏旁在字中或字尾,为了符合书写顺序习惯, 便于想打输入,规定也只选用一个字的字首部分,只对字首部分编码。 由于偏旁部首有200多个,组字频率高的偏旁也有近30个,而数字 键却只有10个,因此字首部分只有一码的话是不够的,至少要有二 码,选用三码的话,由于一来字首部分往往笔画较少,二来只有200 多个偏旁,大部分偏旁的组字频率不高,只有30来个偏旁频率较高, 因此似乎多了一点,所以规定最多选用二码是最合适的。
这样本发明的取码规则是编码由两部分组成 一部分为拼音,另一部分为形部编码。为便于输入,规定拼音在先,且最好采用智能拼 目前绝大多数蜂窝移动电话用的都是全拼输入法,其键盘通常符
合ITU-T E.161标准,见附图l。使用全拼输入法输入一个汉字时, 需要输入该汉字的标准汉语拼音中的每个字母。例如,要输入"张" 字,用户必须按键盘上的顺序输入字母"z-h-a-n-g",蜂窝电话用户 要想在其电话上拼出这个"张"字必须在键盘上找5次字母,总共按 10下才能找到该汉字的拼音,这对于蜂窝电话的用户来说是非常麻 烦和费时的。
为减少蜂窝电话的击键次数,目前流行的一种智能拼音输入法在 输入完某个汉字的全部拼音字母后给出了几种可能的组合供挑选,这 样输入"张"字,只要击z、 h、 a、 n、 g这五个拼音字母所再的数字 键,再根据提示行击一次数字键进行选择即可,也就是说只要击键六 次就可输入它的整个拼音。这能明显提高输入速度。在本发明中,拼 音部分建议采用智能拼音。
本发明在编码时对汉字笔画的认识完全科学。笔画是构成楷书汉 字字形的最小连笔单位,是书写汉字时一次连续写成的一个线条。按 国家语委的规定,在只考虑汉字的运笔方向而不计其轻重长短时,即 只考虑其笔形时可分为横、竖、撇、点、折五种基本笔画,其中提并 入横,竖钩并入竖,捺并入点,各种折笔都作折,也就是说其他各种 带转折的笔画都作折。国家语委称五种基本笔画为横、竖、撇、点、 折,而本人倾向于称横、竖、撇、捺、折。因为点的笔画是很短的, 不象其它笔画那样具有一定的长度,且有时运笔方向下垂,几乎与撇 相同。当然国家语委规定称点可能是因为点成字,而且组字频率高于 捺。由于是国家语委的规定,只好遵守,其实国家语委还可规定称捺也允许。汉字部件是由几个笔画组成的具有组配汉字功能的构字单位 汉字部件有多笔画部件和单笔画部件之分,单笔画部件即五种基本笔画。
汉字部件的定义与国家语委的规定相同,它由几个笔画构成的相 对不变的笔画结构,组合后可构成汉字。为便于记忆,本发明规定横、
竖、撇、点、折五种基本笔画分别用1、 2、 3、 4、 5编码,汉字部件 "木"、"矛"、""、"卄"、"口"分别用6、 7、 8、 9、 0编码。记忆
方法是木头手在水草中,"口 "和"0"近形。在手机数码中也将"十"、 "八"等部件删除,只留下这五个部件。
接着将汉字分为独体字和合体字二类。本人在长期的编码研究中
早就认识到一个汉字是否为左右结构是一目了然的,左右结构的汉字
很容易在其产生空隙处将它一分为二,而上下、包围结构的汉字有时
不易一分为二,甚至有时难以分清一个字是独体字还是上下结构或包 围结构。根据一个汉字是否为左右结构进行划分最为简单易学,但这 样不利于降低重码,实际上对于难以划分结构的汉字还可以用容错码 的技术加以解决,即容许对同一个汉字根据不同的划分进行不同编 码,所以还是划分为独体字和合体字为好。这样也与人们的传统思维 一致。需要指出的是将合体汉字一分为二,分成二部分别进行编码的 技术由来已久,并非我独创。
合体字根据整体结构在最初的分界线处将其一分为二,先写的第 一部,后写的为第二部,对左中右结构的汉字将其中间部分、右边部 分划为第二部。对上中下结构的汉字将其中间部分、下面部分划为第 二部。当然也可根据成字优先的原则将中间部分划分到第一部。也可 无条件地规定将中间部分划分到第一部。另外对包围部分按笔顺要分 开书写的汉字如"或"、"载"等字,按该汉字第一笔的先后,规定含 有第一笔的部分为第一部,不含第一笔的部分为第二部。由于包围部分的第一笔往往先写,这条规定实际上是规定包围部分为第一部、被 包围部分为第二部。当然也可将该类汉字归类到独体字中,按独体字 编码。另外镶嵌型的汉字如"乘"等字也可按独体字编码。
又将汉字的各种笔画按国家语委的规定归类为横、竖、撇、点、 折五种基本笔画,分别用五个互不相同的数字比如1、 2、 3、 4、 5编 码。为降低重码,还优选组字频率或实用频率高的几个笔画结构即国 家语委规定的汉字部件排到键上,参与编码。本人在发明双优码中曾 将双笔画参与编码,可后来经过实用操作,发现利用双笔画参与编码 不利于头脑反应,所以只好舍弃双笔画了。汉字部件在选取时数量要 少,且要有利于降低重码,另外汉字部件最好是本身就是偏旁或汉字, 以便于记忆。这样汉字部件"口"、"廿"、"净,,、",,、"木"等部件 就被选出来,从便于记忆的角度出发,将汉字部件"木"、"t "、"?"、
"卄"、"口"分别用6、 7、 8、 9、 0编码。见附图2。记忆方法是 木头手在水草中,"口"和"0"近形。
形部编码的取码规则是合体字的首部按笔顺取前二个部件的相
应代码进行编码,当只有一个部件时,就只取一个部件的相应代码进 行编码,而不必取剩部进行编码,独体字的首部按笔顺取前二个部件 的相应代码进行编码,当只有一个部件时,就只取一个部件的相应代 码进行编码。之所以规定取合体字或独体字的前二个部件进行编码, 而不取合体字或独体字的首尾二个部件是为了便于想打。
编码实例"汉"的编码,在按智能拼音输入han后,即敲击"h"、 "a"、 "n"所在的数字键后,会出现相应的拼音组合供挑选,挑选后 就完成了拼音的智能输入。再敲击"汉"的字首部分"?"的编码代 号8所在的键,就会出现汉、涵、汗、瀚4个字供挑选,根据提示项 利用相应的数字键进行挑选即可完成输入。
"字"的编码,在按智能拼音输入法输入zi后,即敲击"z"、"i"所在的数字键后,会出现相应的拼音组合供挑选,挑选后就完成了拼 音的智能输入。"字"一分为二后,字首部分为"、",字尾部分为"子", 字首部分第一、二笔为点、点,相应的编码代号分别为4、 4,输入
拼音后再敲击编码代号4、 4所在的数字键,提示项就会出现字和窒 2个字供挑选,根据提示项利用相应的数字键进行挑选即可完成输入。 又如"又"字,在按智能拼音输入法输入you后,即敲击"y"、 "o" "u"所在的数字键后,会出现相应的拼音组合供挑选,挑选后 就完成了拼音的智能输入。"又"为独体字,第一、二笔为折、点, 相应的编码代号分别为5、 4,输入拼音后再敲击数字5、 4所在键,
提示项就会出现1个"又"字,这时按确定键就可直接上屏,完成输入。
为提高输入速度,还设置了联想输入法和词组输入法。联想输入 法的原理是输入一个汉字后,会出现几个相关的汉字供挑选。在手机 上输入词组时,不必要再考虑形部编码,跟拼音输入完全相同,只要 按拼音输入法输入即可,在手机上输入拼音时,由于数字键少、屏幕 小,为减少重码,尽量不用简拼输入, 一般只输入每个汉字的完整拼

当然本发明也可移植到配有字母键盘的计算机上使用,这时为便 于输入,还可用十个互不相同的字母代替十个互不相同的数字进行编 码,比如用q、 w、 e、 r、 t、 y、 u、 I、 o、 p分别代替l、 2、 3、 4、 5、 6、 7、 8、 9、 0进行编码。
权利要求
1、一种拼音首部数字输入法,其特征是汉字的各种笔画按国家语委的规定归类为横、竖、撇、点、折五种基本笔画,分别用五个互不相同的数字比如1、2、3、4、5编码,还优选组字频率或实用频率高的几个笔画结构即国家语委规定的汉字部件“木”、“扌”、“氵”、“艹”、“口”排到键上,分别用另外五个互不相同的数字如6、7、8、9、0编码,拼音之后为形部编码,汉字分为合体字和独体字二类,形部编码的取码规则是合体字的首部按笔顺取前二个部件的相应代码进行编码,当只有一个部件时,就只取一个部件的相应代码进行编码,而不取剩部进行编码,独体字的首部按笔顺取前二个部件的相应代码进行编码,当只有一个部件时,就只取一个部件的相应代码编码。
2、 根据权利要求1所述的一种拼音首部数字输入法,其特征是-横、竖、撇、点、折五种基本笔画,分别用五个互不相同的数字比如 1、 2、 3、 4、 5编码"木"、"t "、""、"卄"、"口,,用另外五个 互不相同的数字如6、 7、 8、 9、 0编码。
3、 根据权利要求2所述的一种拼音首部数字输入法,其特征是 可用十个互不相同的字母分别代替十个互不相同的数字进行编码,比 如用q、 w、 e、 r、 t、 y、 u、 I、 o、 p分别代替1、 2、 3、 4、 5、 6、 7、 8、 9、 0进行编码。
4、 根据权利要求1所述的一种拼音首部数字输入法,其特征是:联想输入法的原理是输入一个汉字后,会出现几个相关的汉字供挑选;在手机上输入词组时,跟拼音输入完全相同,只要按拼音输入法 输入即可,在手机上输入拼音时, 一般只输入每个汉字的完整拼音。
全文摘要
本发明属于电脑汉字编码输入方法,也就是计算机中文输入法。因为它是一种组合手机数码输入法和拼音输入法的计算机输入法,并且还结合了首部输入技术,因此称为拼音首部数字输入法,经过移植也可在手机、电话等设备中使用。
文档编号H04M1/23GK101441518SQ200710192849
公开日2009年5月27日 申请日期2007年11月19日 优先权日2007年11月19日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1