骤302中,基于相关信息确定至少一组可疑用户群体,其中,每组可疑用户群体在相同时间段内点击同一组内容。
[0060]在本实施例中,可以基于上述相关信息确定可疑用户群体,其中,可以有一组或多组可疑用户群体,每组可疑用户群体在相同时间段内点击同一组内容。
[0061]在本实施例的一种实现中,可以采用非参数化的聚类算法确定可疑用户群体,具体来说,首先基于上述相关信息对所有的可疑的点击进行聚类分析,使得每个聚类中心对应的用户群体在相同时间段内点击同一组内容。然后将每个聚类中心对应的用户群体确定为一组可疑用户群体。
[0062]请参考图4,其示出了根据每组可疑用户群体在上述预定时间段内所点击的可疑内容的关键词确定待排除的非作弊用户群体的方法的一个实施例的流程400。
[0063]如图4所示,在步骤401中,获取每组可疑用户群体在上述预定时间段内所点击的可疑内容的关键词。
[0064]在本实施例中,可疑内容为可疑用户群体在上述预定时间段内所点击的预定内容。需要说明的是,可疑用户群体中的用户在上述预定时间段内还可能点击其它不涉及作弊的内容,但这些不涉及作弊的内容与可疑的点击无关,因此,不会被判定为可疑内容。
[0065]在本实施例中,可疑内容的关键词为最能够体现可疑内容各种特征的词。例如,对于一种药品的广告,其关键词可以是广告产品的类别(药品),该药品能够治疗的疾病名称,生产该药品的制药厂的厂名,该药品所含最重要的化学成分的名称等等。
[0066]在本实施例的一种实现中,可以对上述可疑内容进行内容解析,以获取其相关的关键词。在另一种实现中,还可以从对上述可疑内容的名称或者标识信息中获取其相关的关键词。可以理解,还可以有其它的获取可疑内容相关的关键词的方式,本申请对获取可疑内容相关的关键词的方式不限定。
[0067]接着,在步骤402中,基于上述关键词判断上述可疑内容是否为同类内容。
[0068]在本实施例中,可以根据不同可疑内容对应的关键词确定不同可疑内容是否同类。具体来说,首先判断每组可疑用户群体在上述预定时间段内所点击的一组可疑内容的关键词中,同类关键词所占比例是否大于等于预定比例。如果同类关键词所占比例大于等于预定比例,则确定上述可疑内容为同类内容。
[0069]最后,在步骤403中,将上述可疑内容对应的可疑用户群体确定为待排除的非作弊用户群体。
[0070]应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
[0071]进一步参考图5,其示出了根据本申请的用于检测点击作弊的装置的一个实施例的结构示意图。
[0072]如图5所示,本实施例的装置500包括:第一确定单元501,第二确定单元502,第三确定单元503和第四确定单元504。其中,第一确定单元501用于基于预定时间段内预定内容被用户点击的次数确定可疑的点击。第二确定单元502用于根据所述可疑的点击确定至少一组有作弊嫌疑的可疑用户群体。第三确定单元503用于根据每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词确定待排除的非作弊用户群体。第四确定单元504用于排除所述可疑用户群体中非作弊用户群体以确定作弊用户群体。
[0073]在一些可选实施方式中,第一确定单元501包括获取子单元,判断子单元和确定子单元(未示出)。其中,获取子单元用于获取所述预定时间段内每个预定内容被用户点击的次数。判断子单元用于判断所述每个预定内容被点击的次数是否满足预定条件。确定子单元用于将被点击的次数满足预定条件的预定内容所对应的点击确定为可疑的点击。
[0074]在一些可选实施方式中,判断子单元配置用于:判断所述被点击的次数是否大于等于第一预定阈值,且小于等于第二预定阈值。如果是,确定所述被点击的次数满足预定条件。
[0075]在一些可选实施方式中,所述第二确定单元502包括信息获取子单元和用户群体确定子单元(未示出)。其中,信息获取子单元用于获取所述可疑的点击的相关信息。用户群体确定子单元用于基于所述相关信息确定至少一组可疑用户群体,其中,每组可疑用户群体在相同时间段内点击同一组内容。
[0076]在一些可选实施方式中,所述可疑的点击的相关信息包括以下至少一项:可疑的点击所对应的用户的标识信息;可疑的点击所对应的内容的标识信息;以及可疑的点击所对应的时刻。
[0077]在一些可选实施方式中,所述用户群体确定子单元配置用于:基于所述相关信息对所述可疑的点击进行聚类,使得每个聚类中心对应的用户群体在相同时间段内点击同一组内容;将所述每个聚类中心对应的用户群体确定为一组可疑用户群体。
[0078]在一些可选实施方式中,第三确定单元503包括关键词获取子单元,类别判断子单元和待排除群体确定子单元(未示出)。关键词获取子单元用于获取每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词。类别判断子单元用于基于所述关键词判断所述可疑内容是否为同类内容。待排除群体确定子单元用于响应于可疑内容为同类内容,将所述可疑内容对应的可疑用户群体确定为待排除的非作弊用户群体。
[0079]在一些可选实施方式中,所述类别判断子单元配置用于:判断所述关键词中同类关键词所占比例是否大于等于预定比例;如果是,确定所述可疑内容为同类内容。
[0080]应当理解,装置500中记载的诸单元或模块与参考图1-4描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。装置500可以预先设置在服务器中,也可以通过下载等方式而加载到服务器中。装置500中的相应单元可以与服务器中的单元相互配合以实现的用于检测点击作弊的方案。
[0081]下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统600的结构示意图。
[0082]如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM) 602中的程序或者从存储部分608加载到随机访问存储器(RAM) 603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 60KROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
[0083]以下部件连接至I/O接口 605:包括键盘、鼠标等的输入部分606 ;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607 ;包括硬盘等的存储部分608 ;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口 605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
[0084]特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
[0085]附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程