专利名称:拼音、声调、首笔码汉字输入法的制作方法
技术领域:
本发明涉及计算机的汉字输入方法,特别是一种以汉语拼音为基础,以汉字字频进行分级排序编码的汉字输入方法。
在诸多计算机汉字输入法中,有些输入法可达到很高的输入速度。但需经过较长时间的专门学习和训练,因而很难推广普及,其较适于专业打字人员使用。另有一些输入法,如汉语拼音输入法,简单易学,只要懂汉语拼音、无需专门训练即可使用。但重码率太高,输入速度太慢是推广拼音码的最大障碍,其很难作为一种有实用价值的输入法。
事实上,专业打字员只是计算机使用者中的一小部分,对于科技工作者、职员、教师、学生这一大部分计算机使用者而言,所需处理的汉字不是很多,因而他们往往将花费很多时间、精力去训练掌握一种高速盲打的汉字输入法视为畏途。从而制约了计算机的普及应用。
本发明旨在给出一种以汉语拼音码为基础,但重码率低,输入速度快,且简单易学的计算机汉字输入法,以利于计算机的普及应用。
本发明所述的拼音、声调、首笔码(以下称PSS码)汉字输入法、由拼音码、声调码、首笔码构成输入顺序。拼音码为声母码和韵母码,键盘上设置四个键为声调键,分别定义为一至四声,键盘上设置五个首笔键,分别定义为书写汉字的第一笔横一、竖丨、撇丿、捺丶、折 。
按字频分级、排序、编码,随着每输入一键,提示行内根据已输入键所涵盖的所有汉字的使用频度显示三个以下频度最高的字,即规定一、二、三、四级高频字的重码率等于或小于三,非高频字的提示重码率等于或小于三。
将声母相同的所有汉字中频度最高的三个字定义为一级高频字。例如,以H为声母的汉字共145个,其中频度最高的三个字是“和(HE)、会(HUI)、后(HOU)”。这三个字的编码就是H。
将声母+韵母相同的所有汉字中频度最高的三个字定义为二级高频字,例如,与“汉(HAN)”字声、韵母相同的字共14个,其中频度最高的三个字是“含、汉、函”。这三个字的编码就是HAN。
将声母+韵母+声调相同的所有汉字中频度最高的三个字定义为三级高频字。例如,与“玉(yù)”字同拼音码、声调码的汉字共48个,其中频度最高的三个字是“预、玉、域”,这三个字的编码就是YUQ(Q表示声调的第四声)。
将拼字、声调、首笔划相同的所有汉字中频度最高的三个字定义为四级高频字。例如与“遇”字同拼音、声调、首笔码的三个字只有“遇、吁、喻”,这三个字的编码为YUQR(R表示首笔为竖丨)。
凡四级高频字以外的非高频字,用翻页键使其出现在提示行,但仍限制提示重码率等于或小于三。
双声母、多韵母可以采用常规的汉语拼音码简拼方案。如zh、ch、sh分别对应键盘的V、I、U三键,ü、an、ai、ao、ang、eng、ong、ing分别对应V、J、L、K、H、G、S、Y键。
本发明所述的PSS码汉字输入法,以汉语拼音码为基础,利用声调和首笔码区分同音字,以汉字字频分级排序和编码,从而大大降低了重码率。
据PSS码一至四级高频字的定义,将3000个常用汉字进行字频统计,得到如下如果级别 字数 累频一级高频字 78 31.2877%二级高频字1052 50.5649%三级高频字1362 14.4873%四级高频字 3422.0411%非高频字 1660.7690%合计 3000 99.15%(累频——各字频度之和)从统计结果看,一级高频字只有78个,字虽不多但累频很大,占总累频的31%。也就是说用PSS码输入汉字,大约近三分之一的字仅一键即可输入(不计选择键)。二级高频字的累频最高,约占50%。使用二至三键可输入的一、二级高频字的累频之和已占81%。前三级高频字的累频之和约占总数的96%,只有约4%的字还需使用首笔键输入。如果采用简拼法,双声母、多韵母均为一个键,输入一个汉字平均需2.2键(不计选择键)。据统计,PSS码与现行拼音码输入键数比较,平均总击键数可减少约33%。
由于每输入一码,提示行只显示三个(或少于三个)汉字,这种以编码规则限制各级高频字重码率不大于三的输入法较之现行的拼音输入法的重码率低6倍。使用者从三个字中择其一,可一目了然,比拼音法从几十个字中选一个速度快得多。
本发明所述的的PSS码输入法,编码规则简单、统一,没有例外,容易学,能够熟练使用汉字、并懂汉语拼音的人,不必记忆繁杂的编码规则,只要记住拼音、声调首笔的顺序就可以使用。可以不夸张地说,懂汉语拼音的人五分钟就可学会PSS码输入法。计算机初学者亦不必再将学习汉字输入法视为畏途,而利于计算机的普及应用。
图1声调码和首笔码所对应的计算机键位图2PSS码汉字输入法流程图如图1,键盘上T、R、W、Q键依顺序分别定义为一声、二声、三声、四声的声调键(也可将其他四个键定义为声调键)。键盘上T、R、E、W、Q键依顺序分别定义为横一、竖丨、撇丿、捺丶、折 首笔键。(也可将其他五个键定义为首笔键)。按图1的键位定义,T、R、W、Q既是字母键又是声调键还是首笔键,在输入过程中采用顺序识别原则,即第一键是声母、第二键是韵母,第三键是声调,第四键是首笔,如“梯”字的编码TITT,第一个T是声母,第三个T是一声,第四个T是首笔为横。
根据已输入键所涵盖的汉字的使用频度,规定重码率等于或小于三。图2表示了PSS码的输入流程,随着每输入一键,提示行出现的等于或少于三个汉字中,若有所需的字,用数字选择键择其一;如无所需的字再输一键并选择。至四级高频字尚未出现所需的字再按翻页键。
输入词组时,依次输入词组中的每个字的声母码、再输入最后一个字的韵母码、声调码、首笔码,且每输入一码屏幕只显示三个以下重码的词组,再用选择键确定所需的词组。
如YY语言、原有、永远YY1 友谊、予以、优异YY1Q 有益、愿意、意义YY1QW 洋溢
权利要求
1.拼音、声调、首笔码汉字输入法,以拼音码为基础,其特征在于a.由拼音码、声调码、首笔码构成编码,b.键盘上设置四个键为声调键,分别定义为汉语拼音声调的一至四声,c.键盘上设置五个键为首笔键,分别定义为书写汉字的第一笔横一、竖丨、撇丿、捺丶、折 ,d.按字频分级、排序、编码、提示行根据已输入键所涵盖的所有汉字的使用频度显示三个以下频度最高的字,即规定一、二、三、四级高频字重码率等于或小于三,非高频字的提示重码率等于小于三,(1)将声母相同的所有的汉字中频度最高的三个字定义为一级高频字,(2)将声+韵母相同的所有汉字中频度最高三个字定义为二级高频字,(3)将声母+韵母+声调相同的所有汉字中频度最高的三个字定义为三级高频字,(4)将声母+韵母+声调+首笔相同的所有汉字中频度最高的三个字定义为四级高频字,(5)四级高频字以外的所有汉字为非高频字。
2.按权利要求1所述的拼音、声调、首笔码汉字输入法,其特征在于输入词组时,依次输入词组中的每个字的声母码,再输入最后一字的韵母码、声调码、首笔码,且限制词组的提示重码率等于或小于三。
3.按权利要求1所述的拼音、声调、首笔码汉字输入法,其特征在于将键盘上T、R、W、Q键定义为声调键,T、R、E、W、Q键定义为首笔键。
全文摘要
拼音、声调、首笔码汉字输入法,以汉语拼字码为基础,利用声调和首笔码区分同音字,以汉字字频分级、排序、编码,由编码规则限制一、二、三、四级高频字的重码率等于或小于三。本方案重码率低、编码规则简单、统一、容易学、只要记住拼音、声调、首笔的顺序就可使用本方法,非计算机专业人员不必花费精力学习训练就可上机使用本输入方法。
文档编号G06F3/023GK1122469SQ95105648
公开日1996年5月15日 申请日期1995年6月9日 优先权日1995年6月9日
发明者孙时生, 姚振坚 申请人:广州师范学院