用于检测点击作弊的方法及装置的制造方法
【技术领域】
[0001]本申请涉及网络技术领域,尤其涉及用于检测点击作弊的方法及装置。
【背景技术】
[0002]随着移动互联网众包技术的迅猛发展,一类通过众包网站发布任务,组织网民人工点击特定广告,并给予一定费用的作弊方式开始兴起。这类作弊行为均是由人工真实的触发,具有很强的隐蔽性,很难用传统的方法进行检测。
[0003]目前,现有的对广告众包作弊的检测方法包括:①通过建立描述单个点击者行为特征的规则,来发现可疑点击者,进而判断作弊行为。这种技术的缺陷在于:因为众包作弊来源为真实的用户点击而非来自机器,因此行为有很大的随机性,很难用基于单个用户或广告主建立的规则去判断。②通过观察一个广告主的点击流量来判断是否有针对它的作弊行为。这种技术的缺陷在于:由于众包作弊来自真实用户,当他们感受到作弊被检出后,可以迅速调整自身行为方式,从而使之前的规则失效。③通过寻找点击日志中行为一致的一批点击者,来判断作弊行为。这种技术的缺陷在于:该方法针对人工众包作弊检测实用性不大。
【发明内容】
[0004]为了解决上述问题,本申请提供了一种用于检测点击作弊的方法及装置,解决了现有技术中对作弊点击的检测效率不高,检测精度低的技术问题。
[0005]第一方面,本申请提供了一种用于检测点击作弊的方法,所述方法包括:基于预定时间段内预定内容被用户点击的次数确定可疑的点击;根据所述可疑的点击确定至少一组有作弊嫌疑的可疑用户群体;根据每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词确定待排除的非作弊用户群体;以及排除所述可疑用户群体中非作弊用户群体以确定作弊用户群体。
[0006]在某些实施方式中,所述基于预定时间段内预定内容被用户点击的次数确定可疑的点击,包括:获取所述预定时间段内每个预定内容被用户点击的次数;判断所述每个预定内容被点击的次数是否满足预定条件;将被点击的次数满足预定条件的预定内容所对应的点击确定为可疑的点击。
[0007]在某些实施方式中,判断所述被点击的次数是否满足预定条件,包括:判断所述被点击的次数是否大于等于第一预定阈值,且小于等于第二预定阈值;如果是,确定所述被点击的次数满足预定条件。
[0008]在某些实施方式中,所述根据所述可疑的点击确定至少一组有作弊嫌疑的可疑用户群体,包括:获取所述可疑的点击的相关信息;基于所述相关信息确定至少一组可疑用户群体,其中,每组可疑用户群体在相同时间段内点击同一组内容。
[0009]在某些实施方式中,所述可疑的点击的相关信息包括以下至少一项:可疑的点击所对应的用户的标识信息;可疑的点击所对应的内容的标识信息;以及可疑的点击所对应的时刻。
[0010]在某些实施方式中,所述基于所述相关信息确定至少一组可疑用户群体,包括:基于所述相关信息对所述可疑的点击进行聚类,使得每个聚类中心对应的用户群体在相同时间段内点击同一组内容;将所述每个聚类中心对应的用户群体确定为一组可疑用户群体。
[0011]在某些实施方式中,所述根据每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词确定待排除的非作弊用户群体,包括:获取每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词;基于所述关键词判断所述可疑内容是否为同类内容;如果是,将所述可疑内容对应的可疑用户群体确定为待排除的非作弊用户群体。
[0012]在某些实施方式中,所述基于所述关键词判断所述可疑内容是否为同类内容,包括:判断所述关键词中同类关键词所占比例是否大于等于预定比例;如果是,确定所述可疑内容为同类内容。
[0013]第二方面,本申请提供了一种用于检测点击作弊的装置,所述装置包括:第一确定单元,用于基于预定时间段内预定内容被用户点击的次数确定可疑的点击;第二确定单元,用于根据所述可疑的点击确定至少一组有作弊嫌疑的可疑用户群体;第三确定单元,用于根据每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词确定待排除的非作弊用户群体;以及第四确定单元,用于排除所述可疑用户群体中非作弊用户群体以确定作弊用户群体。
[0014]在某些实施方式中,所述第一确定单元包括:获取子单元,用于获取所述预定时间段内每个预定内容被用户点击的次数;判断子单元,用于判断所述每个预定内容被点击的次数是否满足预定条件;确定子单元,用于将被点击的次数满足预定条件的预定内容所对应的点击确定为可疑的点击。
[0015]在某些实施方式中,所述判断子单元配置用于:判断所述被点击的次数是否大于等于第一预定阈值,且小于等于第二预定阈值;如果是,确定所述被点击的次数满足预定条件。
[0016]在某些实施方式中,所述第二确定单元包括:信息获取子单元,用于获取所述可疑的点击的相关信息;用户群体确定子单元,用于基于所述相关信息确定至少一组可疑用户群体,其中,每组可疑用户群体在相同时间段内点击同一组内容。
[0017]在某些实施方式中,所述可疑的点击的相关信息包括以下至少一项:可疑的点击所对应的用户的标识信息;可疑的点击所对应的内容的标识信息;以及可疑的点击所对应的时刻。
[0018]在某些实施方式中,所述用户群体确定子单元配置用于:基于所述相关信息对所述可疑的点击进行聚类,使得每个聚类中心对应的用户群体在相同时间段内点击同一组内容;将所述每个聚类中心对应的用户群体确定为一组可疑用户群体。
[0019]在某些实施方式中,所述第三确定单元包括:关键词获取子单元,用于获取每组所述可疑用户群体在所述预定时间段内所点击的可疑内容的关键词;类别判断子单元,用于基于所述关键词判断所述可疑内容是否为同类内容;待排除群体确定子单元,用于响应于可疑内容为同类内容,将所述可疑内容对应的可疑用户群体确定为待排除的非作弊用户群体。
[0020]在某些实施方式中,所述类别判断子单元配置用于:判断所述关键词中同类关键词所占比例是否大于等于预定比例;如果是,确定所述可疑内容为同类内容。
[0021]本申请提供的用于检测点击作弊的方法及装置,通过缩小检测范围,确定有作弊嫌疑的可疑用户群体,并根据可疑用户群体所点击的可疑内容的关键词将可疑用户群体中的非作弊用户群体排除,从而实现了对预定内容的点击进行监控,提高了检测作弊点击的效率和检测精度,减少了时间和资源的浪费。
【附图说明】
[0022]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0023]图1是本申请实施例提供的用于检测点击作弊的方法的一个实施例的流程图;
[0024]图2是本申请实施例提供的确定可疑的点击的方法的一个实施例的流程图;
[0025]图3是本申请实施例提供的根据可疑的点击确定至少一组有作弊嫌疑的可疑用户群体的方法的一个实施例的流程图;
[0026]图4是本申请实施例提供的根据每组可疑用户群体在上述预定时间段内所点击的可疑内容的关键词确定待排除的非作弊用户群体的方法的一个实施例的流程图;
[0027]图5是本申请实施例提供的用于检测点击作弊的装置的一个实施例的结构示意图;
[0028]图6适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
【具体实施方式】
[0029]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0030]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0031]请参考图1,其示出了用于检测点击作弊的方法的一个实施例的流程10