一种搜索方法及装置的制造方法
【技术领域】
[0001]本发明涉及互联网技术领域,特别涉及一种搜索方法及装置。
【背景技术】
[0002]随着科学技术的发展,搜索引擎的出现起到了信息导航的作用,为用户进行信息搜索提供了便利。目前,可以针对待搜索文章中的每个字建立索引,并将每个字与所有包含该字的待搜索文章进行关联,比如,字1被包含在文章1与文章2之中;字2被包含在文章1和文章3之中;此时,如果搜索由字1和字2组成的搜索词,可以搜索到的搜索结果为文章1 ;但是,该方案的不足之处在于,如果字1和字2在文章1中的位置是分离的,也即,在文章1中,字1和字2并未形成一个完整的词时,此次的搜索结果其实是一个无用的搜索结果;但是,该方案中仍会将此次的搜索结果(也即文章1)作为有效的搜索结果呈现给用户,从而给用户提供了无效的搜索结果,使得搜索结果并不精准,降低了用户体验。
【发明内容】
[0003]本发明提供一种搜索方法及装置,用以使搜索结果更符合用户的需求,同时使得搜索结果更为精确,提升了用户体验。根据本发明实施例的第一方面,提供一种搜索方法,包括:
[0004]接收包含搜索词的搜索指令;
[0005]获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
[0006]检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
[0007]在符合预设的连续条件时,将所述待搜索文章作为搜索结果;
[0008]在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。
[0009]在一个实施例中,预设的连续条件至少包括下列条件之一:
[0010]各个字在所述待搜索文章中存在位置连续的至少两个字;
[0011]各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
[0012]各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中。
[0013]在一个实施例中,所述连续条件有多个;不同的连续条件对应不同的分值区间;
[0014]所述方法还包括:
[0015]根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
[0016]在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
[0017]在一个实施例中,所述为所述待搜索文章打分,包括:
[0018]根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
[0019]在一个实施例中,获取所述搜索词中各个字在待搜索文章中的位置,包括:
[0020]根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
[0021]根据本发明实施例的第二方面,还提供一种搜索装置,包括:
[0022]指令接收模块,用于接收包含搜索词的搜索指令;
[0023]获取模块,用于获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;
[0024]检测模块,用于检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;
[0025]搜索结果确认模块,用于在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。
[0026]在一个实施例中,所述搜索结果确认模块包括连续条件设定子模块,所述连续条件设定模块用于将预设的连续条件设定为至少包括下列条件之一:
[0027]各个字在所述待搜索文章中存在位置连续的至少两个字;
[0028]各个字在所述待搜索文章中不存在位置连续,但各个字在所述待搜索文章中至少两个字出现在同一句子中;
[0029]各个字在所述待搜索文章中未出现在同一句子中,但各个字在所述待搜索文章中至少两个字出现在同一段落中。
[0030]在一个实施例中,所述搜索结果确认模块还包括分值区间对应子模块,用于在所述连续条件有多个的情况下,设定不同的连续条件对应不同的分值区间;
[0031]所述装置还包括:
[0032]打分模块,用于根据所述搜索词中各个字在所述待搜索文章中的位置符合的连续条件,为所述待搜索文章打分;其中,打分得到的待搜索文章的分值属于符合的连续条件对应的分值区间;
[0033]排序模块,用于在有多个作为搜索结果的所述待搜索文章时,依据待搜索文章的分值对多个作为搜索结果的所述待搜索文章进行排序。
[0034]在一个实施例中,所述打分模块包括:
[0035]打分子模块,用于根据所述搜索词中各个字在待搜索文章中出现的次数,为所述待搜索文章打分。
[0036]在一个实施例中,所述获取模块还包括:
[0037]位置获取子模块,用于根据所述搜索词中各个字在待搜索文章中的字数序号、用于分隔句子的标点的位置以及段落的分隔符号的位置,获取所述搜索词中各个字在待搜索文章中的位置。
[0038]本发明实施例提供的技术方案可产生以下有益效果:接收包含搜索词的搜索指令;获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置;检测所述搜索词中各个字在所述待搜索文章中的位置是否符合预设的连续条件;在符合预设的连续条件时,将所述待搜索文章作为搜索结果;在不符合预设的连续条件时,将所述待搜索文章排除在搜索结果之外。该方案首先获取所述搜索词中各个字在待搜索文章中的位置,再通过检测搜索词中的各个字在所述待搜索文章中的位置是否符合预设的连续条件,确定所述待搜索文章是否为用户需要的搜索结果,并对该搜索结果进行打分后排序,从而将贴近用户需求的搜索结果排列在搜索结果列表的前端,以方便用户查看;该方案使搜索结果更符合用户的需求,同时使得搜索结果更为精确,提升了用户体验。
[0039]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0040]下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
【附图说明】
[0041]附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0042]在附图中:
[0043]图1为本发明根据一示例性实施例示出的一种搜索方法的流程图;
[0044]图2为本发明根据一示例性实施例示出的另一种搜索方法的流程图;
[0045]图3为本发明根据一示例性实施例示出的一种搜索装置的框图;
[0046]图4为本发明根据一示例性实施例示出的一种搜索装置中的搜索结果确认模块64的框图;
[0047]图5为本发明根据一示例性实施例示出的另一种搜索装置中的搜索结果确认模块64的框图;
[0048]图6为本发明根据一示例性实施例示出的另一种搜索装置的框图;
[0049]图7为本发明根据一示例性实施例示出的一种搜索装置中的打分模块65的框图;
[0050]图8为本发明根据一示例性实施例示出的一种搜索装置中的获取模块66的框图。
【具体实施方式】
[0051]以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0052]本公开实施例提供了一种搜索方法,用于使搜索结果更符合用户的需求,同时使得搜索结果更为精确。如图1所示,该方法包括步骤S10-S40:
[0053]在步骤SlO中,接收包含搜索词的搜索指令;也即,本公开中,当用户输入搜索词时,即代表搜索引擎接收到包含该搜索词的搜索指令,该搜索指令可以由用户根据需要自行选择输入。
[0054]在步骤S20中,获取包括所述搜索词的待搜索文章,以及获取所述搜索词中各个字在待搜索文章中的位置。也即,在步骤SlO中接收到用户输入的搜索词后,获取包括所述搜索词的待搜索文章,也即,只有当所述待搜索文章中包含所述搜索词的所有字,才能被获取;同时,还需要获取所述搜索词中各个字在待搜索文章中的具体的位置,并根据每个字在待搜索文章中的具体位置来确定所述待搜索文章是否为用户需要的搜索结果,并对该搜索结果进行打分后排序,从