形母码汉字输入法_2

文档序号:8922233阅读:来源:国知局
平均码长为 2. 140 键 / 字。
[0085] 对于8, 243字符集的版本,有重码字345个,重码率为4. 185%。
[0086] 对于3, 500字符集的版本,重码字仅59个,重码率为1. 686%。
[0087] 对于27, 719字符集的版本,重码字为5, 458个,重码率为19. 690%。
[0088] 形母码输入法的原版仅包括国标GB2312的6, 763字符集。在这个字符集中,原版 本的重码字为467个,重码率为6. 905%。《龙文基因形母码汉字输入法V8. 1》版本的重码 字为221个,重码率为3. 268%,比原版本降低了一半多。
[0089] 可见,本输入法在平均码长和重码率方面都有较好的效果。
【附图说明】
[0090] 图1为基本形母与按键的对应关系图;
[0091] 图2为普通形母"横"、"竖"、"撇"、"点"、"折"与按键的对应关系图;
[0092] 图3为一级简码字在键盘上的位置图。
【具体实施方式】
[0093] 下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本 发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖 在本发明的保护范围中。
[0094] 一、汉字拆分单元
[0095](一)基本形母
[0096] 本输入法选择26个笔划简单,初学汉语的人较早就接触到并认识的汉字,也是很 有代表性、组字频率高的汉字部件作为组字的码元,在本输入法中称之为"基本形母"。为了 便于记忆,把这26个基本形母编成下面的口诀:
[0097] 日月金木水火土;
[0098] 山犬亡了刀弓止;
[0099] 小贝寸片女可丰;
[0100] 马口人匕目。
[0101] 前三行中,"山"按其形象定义在"V"键上,其它20个按汉语拼音的声母首字母定 键。
[0102] 第四行5个,按韵母首字母定键。
[0103] 基本形母与按键的对应关系如图1所示。
[0104](二)普通形母
[0105] 普通形母是由基本形母根据"形"、"音"、"义"等方面的联想而派生的形母,共有 146个,详见表1。
[0106] 定义普通形母的依据有以下两点:
[0107] 1、单笔画
[0108] 汉字是由笔划组成的。汉字的笔划归纳为五种:"横"、"竖"、"撇"、"点"、"折"。
[0109] 横(一):定在"K"键上。算是一个特殊的规定。
[0110] 竖(丨):与字母"I"形似,定在"I"键上。
[0111] 撇(J):与字母"J"形似,定在"J"键上。
[0112] 点(、):包括"捺",与字母"L"形似,定在"L"键上。
[0113] 折(包括各种形式的折笔,用"乙"来表示):与字母"M"形似,定在"M"键上。
[0114] 本输入法也可以随意改成"笔划输入方式"。这时,这五个键恰好适合右手不须移 位的键盘操作,非常方便。从这个角度来说,用本输入法,几分钟学会打字成为可能。
[0115] 两种方法可以根据自己的习惯任意混合交替使用。这既可以解决初学者遇到不会 拆分的汉字无法输入的问题,又为学习汉字的人提供了练习汉字书写笔顺的环境。
[0116] 2、根据基本形母,或根据所在键名的"形"、"音"、"义"联想记忆,不须死记硬背,很 快就可以掌握。
[0117]例如:
[0118] A键:基本形母是根据韵母首字母定键的"马"。
[0120] 这些汉字部件就都作为普通形母定义在A键上。
[0121] B键:基本形母是根据声母首字母定键的"贝"。
[0123] 这些汉字部件就都作为普通形母定义在B键上。
[0124] C键:基本形母是根据声母首字母定键的"寸"。
[0125] 与"寸"形近音近:廿(卄)(草字头、贲字腰)
[0126] 与"廿"形近:带字头)廿升(弄字底)
[0127] 册牛?(举字底)
[0128] 这些汉字部件就都作为普通形母定义在C键上。
[0129](三)组合形母
[0130] 教育部和国家语言文字工作委员会发布的《现代常用字部件及部件名称规范》 (GF0014-2009)中收入了 514个常用的汉字部件。这么多的部件不可能都用26个字母中的 一个来定义成形母。所以有些部件用2个或2个以上的键来定义。这就是"组合形母"。
[0131] 绝大多数的组合形母不需要记忆,就像对汉字进行拆分那样,可以把它们联想成 是由若干个基本形母或普通形母组合成的。
[0132] 例如:"白",联想成"J"和"日"组成;"本"联想成"木"和"一"组成。这是很容 易的,人们日常生活中也常常这样来描述字的形象。
[0133] 那么为什么还要引出"组合形母"的概念呢?这是要让学习汉字的人懂得:"白"和 "本"都是组成汉字的基础部件,是不可分的。我们根据它们的形象,使用"j"和"日"所在 的键"JR"定义了部件"白";用"木"和"一"所在的键"MK"定义了部件"本"。而不能认为 "白"可以分成"J"和"日";"本"可以分成"木"和"一"。
[0134] 另外,也有少部分的组合形母是需要特殊地学习和记忆一下的。
[0135] 表2~4列出了《组合形母定义表》,共有341个,分为三个部分。
[0136] 第一部分是绝大部分,包括290个。这部分只要简单地看一看就够了。按照书写 的笔划顺序,很容易把它们联想为某些形母的组合。
[0137]例如:
[0139] 第二部分有40个,需要简单地学一下,因为定义这些形母所依据的组成部分,有 些只是形状相似,而并不完全相同。
[0140] 例如:
[0141] "皮":按照书写的笔顺分成"厂"、"丨"、"又",所以定义为"AIX"。而实际上,第一 部分与"厂"形象相似,但并不相同。
[0142] "直":按照书写的笔顺分成"一"、"丨"、"且",所以定义为"KIU"。下面的部分只是 象"且",其实并不是"且"。
[0143] "鸟":按照书写的笔顺分成"j"、"马",所以定义为"JA"。下面的部分只是象"马", 其实并不是"马"。
[0144] 尽管如此,还是很容易记忆的。
[0145] 第三部分有11个,需要认真学一下,并记住。好在数量很少。因为定义这些形母, 不完全按照书写的顺序,有些考虑到"字理",有些为了汉字的拆分和编码的便利做了简化, 有些是依据其突出的特点。
[0146] 例如:
[0147] "言":只按首末两部分,取~,、" 口",定义为"TO"。
[0148] "隹"(锥字边):只按首末两部分,取"彳"、"*",定义为"EF"。
[0149] 敝字旁):象"米"和"门"组合在一起,定义为"XV"。
[0150] "豕"(啄字旁):比"豕"多一点,所以在"豕"的编码后面再加一个"点"的编码, 定义为"KQL"。
[0151] "酉":比"西"多一横,所以在"西"的编码后面再加一个"横"的编码,而省略了"西" 的编码前面的一横,定义为"UK"。
[0152] "朿":CN1054448C中是完全遵循书写顺序把它拆分为"一"、"门"、"小"。而本方法 按照字理分析,"朿"是象形字,由"木刺"的形象演变而来,还是应突出"木"的根本,所以分 成"门"、"木",定义为"VM"。
[0153] "束":CN1054448C中是完全遵循书写顺序把它拆分为"一"、" 口"、"小"。而本方 法按照字理分析,"束"是会意字,由木柴被一根带子捆扎起来的形象演变而来,还是应突出 "木"的根本," 口"代表绳子,所以分成"口"、"木",定义为"0M"。
[0154] 在定义组合形母时,有时会想出多种组合方式。一般情况下,是遵循"尽多"的原 贝1J,就是看哪种方式能首先使尽可能多的笔划集中在一起。
[0155] 下例一些组合形母,可以设想出多种编码方式,但按照"尽多"的原则,可以确定一 种是正确的:
[0156]
[0157] 二、编码规则
[0158](一)单字输入
[0159] 1、基本形母单独成字时,其编码是:基本形母所在键名后加字母V(两键一字)。例 如:
[0161] 2.附加末笔画编码的形母
[0162] "虫"、"已"、"Q(仓字底)"、"心"、"王"、"鸟"这六个形母(前五个是普通形母,最 后的"鸟"是组合形母)组字时,如果是字的最后一个部件,且编码小于四码,则在末尾附加 其末笔画的编码。
[0163]例如:
[0165] 下面各条规则都是在本条规则之外的。
[0166] 3、普通形母单独成字
[0167] 普通形母单独成字,其编码是在普通形母的编码后面附加字的汉语拼音首字母 (两键一字)。这些字的编码是必须附加汉语拼音首字母的,好在不多,只有47个,基本上 都是大多数人熟知的、简单的常用字。
[0168]例如:
[0170
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1