一种对输入法候选项进行调频排序的控制方法及控制装置的制造方法_4

文档序号:9374844阅读:来源:国知局
入词的确认信息,则所述输入法编辑器基于用 户选择将所述第2个候选词对应点阵码显示在计算机当前窗口待输入位置上并将所述第2 个候选词对应的编码信息更新至所述候选编码列表,用户发现所述显示信息错误后,则通 过所述计算机普通键盘"退格键"等方式删除所述第2个候选词,所述输入法编辑器接收到 用户所述删除上屏输入词的指令信息后,优选地删除所述候选编码列表中最近更新的所述 第2个候选词对应的候选编码信息。本领域技术人员理解,所述用户指令信息与所述上屏 确认输入信息之间具有连续性,当用户发现上屏输入字词错误后会第一时间对所述操作进 行纠正,则所述输入法编辑器同步对所述候选编码列表中的记录进行更正,确保所述候选 编码列表中记录的字词是用户最近确认输入的字词,且所述确认输入是用户实际希望输入 的字词,排除用户误输入对所述总频率F计算结果的影响。
[0122] 图2示出根据本发明的第二实施例的,在输入法编辑器中调整输入法候选项排序 的控制方法的流程图,所述候选项被显示在输入界面上以待用户选择。具体地,在本实施例 中,首先执行步骤Slll,基于用户输入信息在核心词库中查找对应的N个候选词编码,其中 N多1。更为具体地,所述输入信息包括用户使用输入设备向所述输入法编辑器发送的指令 信息。更进一步地,所述输入设备包括计算机普通键盘、手机键盘、IPAD等触摸式虚拟键盘。 更进一步地,本领域技术人员可以参考上述图1所示实施例中所述步骤S101,在此不予赘 述。在一个优选例中,所述用户输入信息还包括与所述用户输入信息相对应的模糊音信息, 所述输入法编辑器基于汉语拼音规则对所述用户输入信息进行判断,不区分所述用户输入 信息中的平舌和翘舌、前鼻音和后鼻音。本领域技术人员理解,所述输入法编辑器通过对所 述用户输入信息进行模糊音分析,可以在一定程度上避免用户输入信息中的错拼或漏拼现 象,还可以有效避免用户普通话不标准导致无法正确拼写汉语拼音的现象,在扩大所述核 心词库中对应N个候选词编码的搜索范围同时使得所述搜索更精准、更贴合所述用户输入 信息。
[0123] 然后执行步骤S112,通过公式计算每个所述候选编码的总频率F。具体地,所述总 频率F用于表示所述候选词编码基于用户语言习惯在单位时间内出现的次数。更为具体 地,所述输入法编辑器基于如下公式计算所述总频率F :
[0124]
[0125] 其中,x为所述候选词编码被输入的次数,y为语料库中所述候选词编码的频率,k 为所述候选词编码在单位时间内的输入次数。更进一步地,本领域技术人员可以参考上述 图1所示实施例中所述步骤S103,在此不予赘述。
[0126] 接下来进入步骤S113执行,基于所述总频率F确定所述N个候选编码的排列顺 序,从而生成与所述用户输入信息对应的候选项列表。具体地,所述候选项列表包括所述候 选词编码对应的点阵码。更为具体地,所述点阵码存储在所述核心词库中。更进一步地,本 领域技术人员可以参考上述图1所示实施例中所述步骤S104,在此不予赘述。
[0127] 接下来执行步骤S114,基于用户选择判断所述候选项列表中是否有用户希望输入 的词。具体地,所述候选项列表包括N个候选项,其中,所述N个候选项基于所述点阵码显 示。更为具体地,所述候选项的点阵码与所述候选项编码相对应。更进一步地,所述候选项 基于所述总频率F的计算结果由大至小排列。本领域技术人员理解,本发明的技术方案中, 所述核心词库优选地收录所述历史语料中出现频率最高的T个词而非所述历史语料中出 现过的所有词,则所述输入法编辑器从所述核心词库中基于所述用户输入信息查找到的所 述N个候选词编码可能不是用户实际希望输入的词编码,则所述输入法编辑器生成所述候 选项列表后还需根据用户选择确定所述候选项列表中是否有符合用户要求的词。在一个优 选例中,首先基于用户选择判断所述候选项列表中是否有用户希望输入的词,若所述用户 希望输入的词在所述候选项列表中,则所述步骤S114的判断结果是肯定的;否则,则所述 步骤Sl 14的判断结果是否定的。进一步地,若所述步骤Sl 14的判断结果是肯定的,则进入 步骤S115执行;若所述步骤S114的判断结果是否定的,即所述候选项列表中没有用户希望 输入的词,则接下来进入步骤S116执行。
[0128] 具体地,在所述步骤S115中,基于用户本次确定输入的候选编码信息更新候选编 码列表。更为具体地,所述候选编码信息包括所述候选词编码对应的拼音信息、所述候选词 编码对应的点阵码以及本次确定输入的时间戳。更进一步地,本领域技术人员可以参考上 述图1所示实施例中所述步骤S105,在此不予赘述。
[0129] 具体地,在所述步骤S116中,根据用户选择在核心字库中逐字确定新编码。更为 具体地,所述核心字库包括字编码和所述字编码对应的频率。更进一步地,所述字编码基于 所述区位码表示。更进一步地,本领域技术人员可以参考上述图1所示实施例中所述步骤 S106,在此不予赘述。在一个优选例中,若所述用户输入信息对应的拼音由多个字拼音组 成,则所述候选项列表还包括与所述用户输入信息对应的η个候选字编码信息,所述输入 法编辑器在所述核心词库中查找到与所述用户输入信息对应的N个候选词编码后,再基于 所述用户输入信息中每个字拼音在所述核心字库中查找对应的η个候选字编码,并将所述 η个候选字编码基于所述总频率F排序后显示在所述候选项列表中。优选地,所述候选字编 码对应的候选项排在所述N个候选词编码后面。优选地,所述多个字拼音分别对应的η个 候选字编码基于所述多个字拼音在所述用户输入信息中的排列顺序排列,例如,用户输入 "wenhua -词,则所述用户输入信息包括所述字拼音"wen"和所述字拼音"hua",则所述候 选项列表中的候选项按照词拼音"wenhua"在所述核心词库中对应的N个候选词编码、所述 字拼音"wen"在所述核心字库中对应的η个候选字编码以及所述字拼音"hua"在所述核心 字库中对应的η个候选字编码的顺序排列,当用户确定所述候选项列表中所述N个候选词 编码对应的候选项中没有希望输入的词时,则继续浏览所述候选项列表的剩余内容,逐字 确定需要输入的新编码。优选地,所述输入法编辑器同时在所述语料库中获取所述N个候 选词编码和所述η个候选字编码生成候选项列表。在另一个优选例中,所述输入法编辑器 分两个步骤更新所述候选项列表,首先获取所述N个候选词编码生成所述候选项列表,当 用户浏览到所述候选项列表倒数第d页且未选择确定需要输入的候选词时,则获取所述用 户输入信息中每个字拼音分别对应的η个候选字编码,排列在所述候选项列表当前显示页 的后面,供用户逐字确定所述新编码。优选地,所述d为1,例如,用户通过计算机普通键盘 " + "按键将所述候选项列表翻到最后一页时,所述输入法编辑器基于所述用户输入信息每 个字拼音获取对应的η个候选字编码,生成对应的候选项列表。本领域技术人员理解,所述 d还可以为2,则当用户翻页到所述候选项列表倒数第二页时所述输入法编辑器即认为所 述N个候选词编码中没有用户希望输入的词进而生成候选字列表供用户逐字确认新编码, 本领域技术人员还可以根据实际需要变化出更多实施例,这并不影响本发明的技术内容。
[0130] 然后进入所述步骤S117执行,将所述新编码对应的新词显示到所述候选项列表 第一位。具体地,所述新编码与所述新词基于所述点阵码相对应。更为具体地,所述候选项 列表包括基于用户选择确定的所述新编码以及基于用户输入信息的模糊音在所述核心词 库中查找到的对应N个候选词编码对应的候选词。更进一步地,本领域技术人员可以参考 上述图1所示实施例中所述步骤S107,在此不予赘述。
[0131] 最后执行所述步骤S118,将所述新编码对应的编码信息保存至所述候选编码列表 的相应位置。具体地,所述编码信息包括所述新编码对应的区位码、所述新编码对应的点阵 码以及用户本次确定输入的时间戳。更为具体地,所述候选编码列表存储在所述语料库中。 更进一步地,本领域技术人员可以参考上述图1所示实施例中所述步骤S108,在此不予赘 述。
[0132] 本领域技术人员理解,与上述图1所示实施例相比,本实施例在所述步骤Sl 12和 所述步骤S113中生成所述N个候选词编码对应的候选项列表时,即优选地通过不区分用户 输入信息对应拼音中的平翘舌和前后鼻音等汉语拼音规则使得所述候选项列表中包括的N 个候选项范围更广泛,并基于所述总频率F对所述N个候选项进行排序,提高所述候选项列 表尤其是所述候选项列表首页即出现用户希望输入词的命中率,是现有技术中不采用的技 术方案,使得用户输入更方便快捷。
[0133] 在图2所示实施例和上述图1所示实施例的一个共同变化例中,本实施例所述步 骤Sl 12和上述图1所示实施例中所述步骤S103中所述总频率F的计算公式中,所述k可 以被省略。具体地,所述输入法编辑器基于如下公式计算所述总频率F' :
[0134]
[0135] 其中,X为所述候选调編妈被输入的次数,y为语料库中所述候选词编码的频率。
[0136] 本领域技术人员理解,在上述第一实施例和上述第二实施例中所述总频率公式F 中的所述k主要用于提高用户最近M词输入的词语排在本次所述候选项列表前几位的概 率。当所述k与所述F'的数值相近时,所述k对于所述总频率F的计算结果影响较大,则 在同一拼音下所述候选编码列表中记录的用户最近M次确定输入的词相对其他未被记录 在所述候选编码列表中的词语有更大概率排在所述候选项列表的前几位;当所述k与所述 F'的数值相差几个数量级时,所述k对于所述总频率F的计算结果影响较小,则在同一拼音 下所述输入法编辑器优选地基于所述X和所述y参数对所述N个候选词编码进行排序,则 所述k可以被省略。本领域技术人员理解,与现有技术相比,本发明所述输入法编辑器基于 所述总频率F'公式对所述N个候选词编码进行排序,其优选地基于所述X和所述 y的作用 同样能够使得用户最常输入的词语能相对固定地排列在所述候选项列表前几位,所述总频 率F'公式中所述k的省略并不影响本发明的技术内容。
[0137] 图3示出根据本发明的第三实施例的,在输入法编辑器中调整输入法候选项排序 的控制方法的流程图,所述候选项被显示在输入界面上以待用户选择。具体地,在本实施例 中,首先执行步骤S121,基于用户输入信息在核心字库中查找对应的N个候选字编码,其中 N多1。具体地,所述输入法编辑器通过分析一个或多个历史语料库中出现过的汉字符号获 得所述核心字库。更为具体地,所述核心字库包括字编码和所述字编码对应的频率。更进 一步地,所述核心字库中所述字编码对应的频率y的获得方法本领域技术人员可以参考上 述图1所示实施例中所述步骤S101,在此不予赘述。更进一步地,所述字编码表示方法本领 域技术人员可以参考上述图1所示实施例中所述步骤S101,在此不予赘述。优选地,所述 历史语料库包括词库、字库、互联网上全部文章组成的集合中的任一种或任多种。在一个优 选例中,所述输入法编辑器将所述历史语料库中出现频率最高的T个字收录到所述核心字 库中,并将所述核心字库以单独文件形式存储在所述输入法编辑器客户端根目录中,当所 述输入法编辑器被用户激活使用时所述输入法编辑器优选地将包括所述核心字库在内的 所述语料库加载到所述输入法编辑器客户端。优选地,所述核心字库中的所述T个字编码 基于汉语拼音规则排列,相同拼音的多个所述字编码基于所述字编码分别对应的频率由大 至小排列。优选地,所述用户输入信息包括汉语拼音信息。优选地,所述汉语拼音信息包括 全拼和简拼,其中所述简拼包括声母或声母的首字母。优选地,所述汉语拼音信息还包括简 拼和全拼混合输入。优选地,所述T为99999个。本领域技术人员理解,所述核心词库的数 量T可以根据实际需要由本领域技术人员变化出更多实施例,在此不予赘述。优选地,所述 N个候选字编码信息存储在所述输入法编辑器内存中,或云存储装置等存储装置中,这并不 影响本发明的技术内容。
[0138] 然后进入步骤S122执行,判断所述用户输入信息在所述核心字库中是否有对应 候选字编码。具体地,所述核心字库存储在所述输入法编辑器客户端。更为具体地,所述输 入法编辑器基于所述用户输入信息对应的输入码在所述核心词库中查找所述对应候选编 码。更进一步地,本领域技术人员可以参考上述图1所示实施例中所述步骤S102,在此不予 赘述。在一个优选例中,首先判断所述用户输入信息在所述核心字库中是否有对应候选字 编码,若所述用户输入信息在所述核心字库中有对应候选字编码,则所述步骤S122的判断 结果是肯定的;否则,则所述步骤S122的判断结果是否定的。进一步地,若所述步骤S122 的判断结果是肯定的,则进入步骤S123执行;若所述步骤S122的判断结果是否定的,即所 述用户输入信息在所述核心字库中没有对应候选字编码,则接下来进入步骤S126执行。
[0139] 具体地,在所述步骤S123,通过公式计算每个所述候选字编码的总频率F。更为 具体地,所述总频率F用于表示所述候选字编码基于用户语言习惯在单位时间内出现的次 数。更进一步地,本领域技术人员可以参考上述图1所示实施例中所述步骤S103,在此不予 赘述。优选地,所述N个候选字编码和所述N个字编码分别对应的总频率F存储在所述输 入法编辑器内存中。
[0140] 然后进入所述步骤S124执行,基于所述总频率F确定所述N个候选字编码的排列 顺序,从而生成与所述用户输入信息对应的候选项列表。具体地,所述候选项列表包括所述 N个候选字编码分别对应的点阵吗。更为具体地,所述点阵吗存储在所述核心字库中。更进 一步地,本领域技术人员可以参考上述图1所示实
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1