一种信息处理方法及电子设备的制造方法
【技术领域】
[0001]本发明涉及信息检索领域,尤其涉及一种信息处理方法及电子设备。
【背景技术】
[0002]当用户进行信息检索时,通常会在使用输入法时造成输入错误,例如拼音输入法会造成同音、近音错误,手写输入会造成形进错误。这个错误会造成检索不准,从而导致用户体验差。同时,当用户在搜索应用时,通常想找到特定的应用,找到后会下载该应用,因此对于检索词的正确率要求会很高。针对上述的应用场景,现有的对检索词进行纠错的方法,是根据同音、近音、形近等方法来扩展检索词,同时应用多个检索词进行检索,从而扩大了检索范围,帮助用户找到所需的检索结果。但是,这些方法不仅计算量大,且纠错的效果也不是很好。针对这个特点,本发明实现了一种基于检索词纠错的信息处理方法。
【发明内容】
[0003]本发明的实施例提供一种信息处理方法及电子设备,提高了用户进行信息检索的正确率。
[0004]为达到上述目的,本发明的实施例采用如下技术方案:
[0005]第一方面,提供一种信息处理方法,应用于电子设备,包括:
[0006]检测输入操作并获取相应的输入信息;
[0007]比较所述输入信息与纠错关系表中的纠错信息;
[0008]若没有匹配的比较结果,则从所述纠错关系表中获取所述输入操作对应的纠错信息;其中所述纠错关系表是通过分析历史输入信息得到的;
[0009]根据所述纠错信息进行检索,得到输出结果。
[0010]在第一方面的第一种可能的实现方式中,所述方法还包括:
[0011]检测所述历史输入信息,并从所述历史输入信息中提取出至少一个第一信息集合;其中所述第一信息集合为有对应输出信息的输入信息的集合;
[0012]分析所述至少一个第一信息集合中的每个第一信息集合中输入信息与输出信息的相关性,得到所述每个第一信息集合对应的纠错关系;所述纠错关系为输出信息、输入信息与纠错信息之间的映射关系;
[0013]将所述每个第一信息集合对应的纠错关系整合,得到第一纠错关系表;
[0014]将所述第一纠错关系表中同一输出信息对应的纠错关系进行合并,生成纠错关系表。
[0015]结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述分析所述至少一个第一信息集合中的每个第一信息集合中输入信息与输出信息的相关性,得到所述每个第一信息集合对应的纠错关系包括:
[0016]选择任一第一信息集合,计算从所述任一第一信息集合中所有输入信息两两之间的相似度,并输出相似度大于第一阈值的输入信息;
[0017]按照所述相似度大于第一阈值的输入信息对应的输出信息将所述相似度大于第一阈值的输入信息进行分组;其中,一个分组对应一个输出信息,一个输出信息对应至少一个输入信息;
[0018]计算每个分组的输出信息与其对应的输入信息之间的相似度,得到每个分组的第一纠错关系;
[0019]将所述每个分组的第一纠错关系合并,得到所述任一第一信息集合对应的纠错关系;
[0020]其中所述任一第一信息集合为所述至少一个第一信息集合中的一个第一信息集入口 ο
[0021]结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述计算每个分组的输出信息与其对应的输入信息之间的相似度,得到每个分组的第一纠错关系包括:
[0022]选择任一分组,计算所述任一分组的输出信息与所述任一分组中每个输入信息之间的相似度,将相似度最大的输入信息作为所述任一分组中其余输入信息的纠错信息;
[0023]计算其他分组的输出信息与每个输入信息之间的相似度,直到所有分组都计算完为止,得到所述每个分组的第一纠错关系。
[0024]结合第一方面的第一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述将所述第一纠错关系表中同一输出信息对应的纠错关系进行合并,生成纠错关系表之后,还包括:
[0025]从所述历史输入信息中提取第二信息集合;其中所述第二信息集合为没有对应输出信息的输入信息的集合;
[0026]根据所述第二信息集合中各输入信息对所述纠错关系表进行优化,生成第二纠错关系表。
[0027]结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述根据所述第二信息集合中各输入信息对所述纠错关系表进行优化,生成第二纠错关系表包括:
[0028]从所述第二信息集合中选取任一输入信息,并计算所述输入信息与所述纠错关系表中的每个纠错信息之间的相关度;
[0029]若所述任一输入信息的最大相似度大于第二阈值,则将所述最大相似度对应的纠错信息作为所述任一输入信息的纠错信息,并将所述任一输入信息并入所述纠错关系表中;
[0030]计算所述第二信息集合中其他输入信息与所述纠错关系表中的每个纠错信息之间的相关度,直到所述第二信息集合中所有输入信息优化完毕为止。
[0031]在第一方面的第六种可能的实现方式中,所述根据所述纠错信息进行检索,得到输出结果之后,还包括:
[0032]立即或在预设时间后更新所述历史输入信息,并根据所述更新后的历史输入信息更新所述纠错关系表,生成第三纠错关系表。
[0033]第二方面,提供一种电子设备,包括:
[0034]第一信息获取单兀,用于检测输入操作并获取相应的输入信息;
[0035]比较单元,用于比较所述输入信息与纠错关系表中的纠错信息;
[0036]第二信息获取单元,用于若没有匹配的比较结果,则从所述纠错关系表中获取所述输入操作对应的纠错信息;其中所述纠错关系表是通过分析历史输入信息得到的;
[0037]检索单元,用于根据所述纠错信息进行检索,得到输出结果。
[0038]在第二方面的第一种可能的实现方式中,所述电子设备还包括:
[0039]第三信息获取单元,用于检测所述历史输入信息,并从所述历史输入信息中提取出至少一个第一信息集合;其中所述第一信息集合为有对应输出信息的输入信息的集合;
[0040]信息分析单元,用于分析所述至少一个第一信息集合中的每个第一信息集合中输入信息与输出信息的相关性,得到所述每个第一信息集合对应的纠错关系;所述纠错关系为输出信息、输入信息与纠错信息之间的映射关系;
[0041]整合单元,用于将所述每个第一信息集合对应的纠错关系整合,得到第一纠错关系表;
[0042]生成单元,用于将所述第一纠错关系表中同一输出信息对应的纠错关系进行合并,生成纠错关系表。
[0043]结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述信息分析单元包括:
[0044]计算模块,用于选择任一第一信息集合,计算从所述任一第一信息集合中所有输入信息两两之间的相似度,并输出相似度大于第一阈值的输入信息;
[0045]分组模块,用于按照所述相似度大于第一阈值的输入信息对应的输出信息将所述相似度大于第一阈值的输入信息进行分组;其中,一个分组对应一个输出信息,一个输出信息对应至少一个输入信息;
[0046]所述计算单元,还用于计算每个分组的输出信息与其对应的输入信息之间的相似度,得到每个分组的第一纠错关系;
[0047]合并模块,用于将所述每个分组的第一纠错关系合并,得到所述任一第一信息集合对应的纠错关系;
[0048]其中所述任一第一信息集合为所述至少一个第一信息集合中的一个第一信息集入口 ο
[0049]结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,所述计算模块具体用于:选择任一分组,计算所述任一分组的输出信息与所述任一分组中每个输入信息之间的相似度,将相似度最大的输入信息作为所述任一分组中其余输入信息的纠错信息;计算其他分组的输出信息与每个输入信息之间的相似度,直到所有分组都计算完为止,得到所述每个分组的第一纠错关系。
[0050]结合第二方