本发明属于数据库检索领域,具体涉及一种基于词组库的智能精准检索方法。
背景技术:
目前,信息检索(informationretrieval)是用户进行信息查询和获取信息的主要方式。用户可以根据需要,输入一定的搜索词,借助检索工具,从信息集合中找出与所述搜索词对应的搜索结果。例如,在企业搜索领域中,用户根据需要,输入想要搜索的企业的全部或者部分名称,借助企业搜索引擎,获取该企业的详细信息。
然而,现有技术中,经常会出现用户输入错误的搜索词的情况,例如用户想要搜索“北京摩拜”,但是用户输入的是“北京膜拜”,根据“北京膜拜”进行搜索,得不到用户想要的搜索结果,此时用户只能删除搜索词,重新输入正确的搜索词,获取搜索结果,降低了搜索效率,影响用户的搜索体验。
技术实现要素:
本发明提供一种基于词组库的智能精准检索方法,以解决上述问题。
本发明的基础方案为:一种基于词组库的智能精准检索方法,包括以下步骤:
s1,通过输入法选择模块选择合适的输入法,执行s2;
s2,利用输入法向输入模块输入原检词信息,执行s3和s5;
s3,查找模块根据原检词信息从数据库中检索出原目标信息,并执行s4;
s4,显示模块将原目标信息显示出来;
s5,模糊模块根据输入法和原检词信息,得到疑检词信息;
s6,排序模块根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;词组库中存储有检索词和检索次数;执行s7;
s7,显示模块对排序好的备用检词信息进行显示,并执行s8;
s8,查找模块根据备用检词信息,从数据库中检索出备用目标信息,并执行s9;
s9,显示模块将备用目标信息显示出来。
基础方案的有益效果为:本方案中在直接搜索数据库的内容,并将相关内容检索之后,还会对数据库进行模糊搜索,模糊模块模拟用户输入法的错别词条,预估出可能的正确词条,并通过查找模块,对数据库中词条进行搜索。因此本方案中显示模块会显示两种结果,分别是按照用户输入的精准检索结果和模糊输入的检索结果。
进一步,s7中,还包括选择模块选择合适的备用检词信息,执行s9。
本方案中,选择模块对备用检词信息进行筛选,减少后续查找模块的工作量;用户在意识到自己发生笔误的情况下,自行筛选备用检词信息中的正确词条,提高系统运行效率。
进一步,s5中,输入模块还用于输入是否进行模糊检索,若输入值为“是”,则模糊模块根据输入法和原检词信息,得到疑检词信息。
进一步,所述输入法选择模块中供选择的输入法包括拼音输入法和笔画输入法。
进一步,当输入法选择模块所选输入法为拼音输入法时,疑检词信息为原检词信息的同音字;当输入法选择模块所选输入法为笔画输入法时,疑检词信息为与原检词信息的图形相像的字。
进一步,还包括s10,采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块;更新模块对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。
附图说明
图1为本发明一种基于词组库的智能精准检索方法实施例的模块示意图;
图2为本发明一种基于词组库的智能精准检索方法实施例的流程图。
具体实施方式
下面通过具体实施方式进一步详细的说明:
实施例基本如附图1和附图2所示:
本方案中一种词组库的智能精准检索方法是通过词组库的智能精准检索系统来完成的。词组库的智能精准检索系统如图1所示,包括输入法选择模块、输入模块、查找模块、显示模块、采纳模块、选择模块、更新模块、词组库、数据库和模糊模块。
输入法选择模块用于选择输入法,输入法包括拼音输入法和笔画输入法。
输入模块用于输入原检词信息,输入模块还用于输入是否进行模糊检索,输入值为“是”或者“否”。
模糊模块在输入模块的输入值为“是”时,根据输入法和原检词信息,得到疑检词信息。具体为:当输入法选择模块所选输入法为拼音输入法时,疑检词信息为原检词信息的同音字;当输入法选择模块所选输入法为笔画输入法时,疑检词信息为与原检词信息的图形相像的字。
词组库用于存储有检索词和检索次数,检索词和检索次数一一对应。
排序模块用于根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;预设值为后台设定,如预设值为10,那么备用检词信息就是检索次数前10的疑检词信息。
显示模块用于将原目标信息、备用目标信息和备用检词信息显示出来。
选择模块用于在用户通过显示模块查看备用检词信息后,选择自己中意的备用检词信息
查找模块用于根据原检词信息和备用检词信息,在数据库中,检索相关文献资料,得到对应的原目标信息和备用目标信息。
采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块。
更新模块根据采纳模块发送的检索结果对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。如,用户最后的满意的检索结果为“新东方厨师”和对应“新东方厨师”备用目标信息,词库组中“新东方厨师”的检索次数为“20”,那么更新后“新东方厨师”的检索次数为“21”。
一种基于词组库的智能精准检索方法,包括以下步骤:
s1,通过输入法选择模块选择合适的输入法,执行s2;
s2,利用输入法向输入模块输入原检词信息,执行s3和s5;
s3,查找模块根据原检词信息从数据库中检索出原目标信息,并执行s4;
s4,显示模块将原目标信息显示出来;
s5,模糊模块根据输入法和原检词信息,得到疑检词信息;
s6,排序模块根据疑检词信息和词组库,按照检索次数从高到低的方式,对疑检词信息进行排序,并筛选出预设量的疑检词信息,作为备用检词信息;词组库中存储有检索词和检索次数;执行s7;
s7,显示模块对排序好的备用检词信息进行显示,并执行s8;还包括选择模块选择合适的备用检词信息,执行s9。
s8,查找模块根据备用检词信息,从数据库中检索出备用目标信息,并执行s9;
s9,显示模块将备用目标信息显示出来。
s10,采纳模块用于将用户满意的检索结果所对应的原检词信息或备用检词信息发送给更新模块;更新模块对词组库进行更新,将对应检索词的检索次数增加单位次数信息,并更新。
本方案的优点如下:
(1)在直接搜索数据库的内容,并将相关内容检索之后,还会对数据库进行模糊搜索,模糊模块模拟用户输入的当前词条,预估出可能的正确词条,并通过查找模块,对数据库中词条进行搜索。因此本方案中显示模块会显示两种结果,分别是按照用户输入的精准检索结果和模糊输入的检索结果。
(2)用户可以自行选择按照自己原检词信息进行检索,还是采用模糊模块进行模糊检索;提高与用户的互动性,两种检索方式并存的情况下,用户可以根据自己的选择和需要,选择只使用一种检索还是两种检索方式均采用。
(3)词组库根据用户满意的检索词进行实时更新,保证了词组库的准确性。
(4)通过选择模块对备用检词信息进行筛选,减少后续查找模块的工作量;用户在意识到自己发生笔误的情况下,自行筛选备用检词信息中的正确词条,提高系统运行效率。若选择模块不对备用检词信息进行筛选,则所有的备用检词信息均会通过查找模块在数据库中进行检索。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能力,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。