用户搜索行为信息的采集方法、处理方法及电子设备的制造方法
【技术领域】
[0001] 本发明涉及搜索技术领域,尤其涉及一种对用户搜索行为信息的采集方法、采集 装置、处理方法、处理装置及电子设备。
【背景技术】
[0002] 终端设备如手机的用户,通常会从应用程序商店中搜索并下载安装自己喜欢的应 用程序(英文缩写:App ;英文全称:Application)。现有的搜索技术,都是以全文本匹配来 进行的。每个App有且只有一个确定的名称,当用户想搜索一款App时,只能通过搜索它的 全文名称才能搜索到它,无法通过搜索它的其它名称如别名来搜索到它。
[0003] 例如,"Facebook"这一款App,很多用户习惯称"Facebook"为"fb"。然而,当这 些用户搜索"fb"时,并不能搜索到"Facebook"。用户只能通过搜索"Facebook"才能搜索 到它。
[0004] 现有的这种以全文本匹配来进行的搜索方式,需要用户输入全文本名称才能搜索 到目标,使得搜索方式固化单一、且搜索效率较低。
【发明内容】
[0005] 有鉴于此,本发明实施例提供一种对用户搜索行为信息的采集方法、采集装置、处 理方法、处理装置及电子设备,能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
[0006] -方面,本发明实施例提供一种用户搜索行为信息的采集方法,包括:接收搜索框 中输入的第一搜索词;根据所述第一搜索词,向用户展示第一搜索结果,并记录所述第一搜 索结果中的结果项是否被进行了点击;接收对所述搜索框中的所述第一搜索词进行清空的 指令,并根据该指令将所述搜索框清空;接收所述搜索框中输入的第二搜索词;根据所述 第二搜索词,向用户展示第二搜索结果,并接收对所述第二搜索结果中的结果项的点击;根 据所述记录,若所述第一搜索结果中的结果项没有被点击,则建立所述第一搜索词与所述 第二搜索结果中被点击的结果项的对应关系。
[0007] 可选地,根据所述用户搜索行为信息的采集方法实施例,所述搜索框为移动终端 设备应用程序商店中的应用程序搜索框;所述第一搜索词为用户在搜索框中输入的目标应 用程序的非全文本匹配名称。
[0008] 另一方面,本发明实施例还提供一种用户搜索行为信息的采集装置,包括:搜索 框,用于接收用户输入的搜索词;展示及记录模块,用于根据所述搜索词,向用户展示与所 述搜索词相对应的搜索结果,并记录所述用户对所述搜索结果中任一结果项是否进行了点 击;清空模块,用于接收用户对所述搜索框中的内容进行清空的指令,并根据该指令将所述 搜索框中的内容清空;判断模块,用于判断在如下过程中,用户对第一搜索结果中任一结果 项是否进行了点击:根据用户在搜索框中输入的第一搜索词展示第一搜索结果,对所述搜 索框中的内容清空后,接收所述搜索框中输入的第二搜索词并展示第二搜索结果,接收用 户对所述第二搜索结果中一个结果项的点击;关系构建模块,用于根据所述判断模块的判 断,若所述用户对所述第一搜索结果中任一结果项没有进行点击,则建立所述第一搜索词 与所述用户在所述第二搜索结果中所点击的结果项的对应关系;上报模块,用于将所述关 系构建模块构建的所述对应关系上报给服务器。
[0009] 可选地,根据所述的用户搜索行为信息的采集装置实施例,所述搜索框为移动终 端设备应用程序商店中的应用程序搜索框;所述第一搜索词为用户在搜索框中输入的目标 应用程序的非全文本匹配名称。
[0010] 再一方面,本发明实施例还提供一种电子设备,其包括前述用户搜索行为信息的 采集装置任一实施例所述的用户搜索行为信息的采集装置。
[0011]与现有技术相比,本发明用户搜索行为信息的采集方法、采集装置及电子设备实 施例,通过建立所述第一搜索词与所述用户在所述第二搜索结果中所点击的结果项的对应 关系,可根据用户的搜索行为,建立搜索词同与搜索词非全文本匹配的搜索结果项之间的 对应关系,这样,即使用户输入的搜索词是与搜索目标非全文本匹配的搜索词,也可以根据 建立的搜索词同与搜索词非全文本匹配的搜索结果项之间的对应关系,将搜索目标展示给 用户,从而能够便于实现更加灵活的搜索方式以及便于提高搜索效率。
[0012] 再一方面,本发明实施例提供一种用户搜索行为信息的处理方法,包括:接收两个 以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜索结果项为与所述 搜索词非全文本匹配的搜索结果项;对从各个客户端接收到的所述对应关系进行噪音处 理,得到有效对应关系;将所述有效对应关系进行保存。
[0013] 可选地,根据所述的用户搜索行为信息的处理方法实施例,所述对从各个客户端 接收到的所述对应关系进行噪音处理,得到有效对应关系,包括:以所述搜索词为基准,在 含有所述搜索词的所有对应关系中,若与所述搜索词相对应的搜索结果项Xi满足如下公 式,则确定所述搜索词与Xi之间的对应关系为第一有效对应关系:
[0015] 其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;i = 1,2···ηι ;m和η均 为自然数;β代表阈值。
[0016] 可选地,根据所述的用户搜索行为信息的处理方法实施例,所述对从各个客户端 接收到的所述对应关系进行噪音处理,得到有效对应关系,还包括:以一搜索结果项Xi为 基准,将含有所述搜索结果项Xi的所有对应关系,按照与所述搜索结果项Xi相对应的搜索 词的数量从大到小进行排列,取排序在前的预定个数的对应关系;取所述排序在前的预定 个数的对应关系与所述第一有效对应关系之间的交集,得到第二有效对应关系。
[0017] 可选地,根据所述的用户搜索行为信息的处理方法实施例,所述的用户搜索行为 信息的处理方法,还包括:接收客户端发送的搜索词;根据接收到的所述搜索词,在保存的 所述有效对应关系中进行匹配查询;将经过所述匹配查询得到的与所述搜索词相对应的搜 索结果项,发送给客户端。
[0018] 可选地,根据所述的用户搜索行为信息的处理方法实施例,所述的用户搜索行为 信息的处理方法,还包括:接收两个以上客户端上报的、用户对与所述搜索词相对应的搜索 结果项是否点击的记录;根据客户端上报的所述记录,统计用户对所述搜索结果项的点击 率;判断用户对所述搜索结果项的点击率是否低于预定阈值,若低于预定阈值,则进行报警 和/或将所述搜索词与相对应的搜索结果项之间的对应关系从所述有效对应关系中自动 删除。
[0019] 可选地,根据所述的用户搜索行为信息的处理方法实施例,所述接收两个以上客 户端上报的搜索词与搜索结果项之间的对应关系,为接收两个以上客户端根据前述用户搜 索行为信息的采集方法任一实施例所述的方法、建立的所述第一搜索词与所述用户在所述 第二搜索结果中所点击的结果项的对应关系。
[0020] 再一方面,本发明实施例提供一种用户搜索行为信息的处理装置,包括:第一接收 模块,用于接收两个以上客户端上报的搜索词与搜索结果项之间的对应关系;其中,所述搜 索结果项为与所述搜索词非全文本匹配的搜索结果项;噪音处理模块,用于对从各个客户 端接收到的所述对应关系进行噪音处理,得到有效对应关系;存储模块,用于将所述有效对 应关系进彳丁保存。
[0021] 可选地,根据所述的用户搜索行为信息的处理装置,所述噪音处理模块,包括:第 一处理子模块,用于以所述搜索词为基准,在含有所述搜索词的所有对应关系中,若与所述 搜索词相对应的搜索结果项Xi满足如下公式,则确定所述搜索词与Xi之间的对应关系为 第一有效对应关系:
[0023] 其中,Xi、Xj分别代表与所述搜索词相对应的搜索结果项;i = 1,2···ηι ;m和η均 为自然数;β代表阈值。
[0024] 可选地,根据所述的用户搜索行为信息的处理装置实施例,所述噪音处理模块,还 包括:第二处理子模块,用于以一搜索结果项Xi为基准,将含有所述搜索结果项Xi的所有 对应