一种检测刷量行为的方法、装置、设备和存储介质与流程

文档序号:21363737发布日期:2020-07-04 04:38阅读:394来源:国知局
一种检测刷量行为的方法、装置、设备和存储介质与流程

本发明涉及运营商服务监测领域,尤其是一种检测刷量行为的方法、装置、设备和存储介质。



背景技术:

很多公司在渠道推广app过程中,会通过刷量来伪造用户量、用户访问量的行为,以提高自己app的流量,因此渠道的运营商需要对刷量这种作弊行为进行检测,现有都是通过手机的硬件信息(如imei,mac,定位等)等特征,判断是否正常,由于刷量的手机是有限的,因此如果多个用户集中在某些imei信息的设备上,则可认定是刷量行为,或者根据用户的行为数据生成用户的行为特征,以行为特征值对用户进行分类,分类组用户的行为特征满足预置判定策略时,则认为这是刷量行为。

但是通过硬件信息判断刷量行为可靠性不高,因为目前可以有很多方式伪造imie和mac信息,因此通过这种简单的硬件环境检测判定刷量行为,效果并不佳,其次通过用户分组和分组行为判定策略,这种使用范围不广,复杂性高,不同的app用户的分组和判定策略都是不同的,当用户数量不多的时候,并不能有很好的分组来支持分组判定,而且判定策略很依赖判定策略的用户特征,也依赖大数据的用户数据分析,所需成本也高。

因此开发一种不依赖硬件环境以及app性质的,适用范围广的刷量方法是很有必要的。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的目的是提供一种不依赖硬件环境以及app性质的,适用范围广的刷量方法、装置、设备和存储介质。

本发明所采用的技术方案是:

第一方面,本发明提供一种检测刷量行为的方法,包括步骤:

采集连续时间的app页面访问数据;

对所述页面访问数据进行行为分析;

得到所述行为分析的结果根据预设规则判断是否存在刷量行为。

进一步地,所述采集连续时间的app页面访问数据具体为:定时打包页面访问数据,并保存进数据库中。

进一步地,所述行为分析具体包括步骤:

将所述页面访问数据离散化并进行频谱转化;

计算所述频谱的能量谱,得到能量谱图;

以0.5hz为分界,计算分界左右两端能量值的和,即右边能量值的和sum1和左边能量值的和sum2,比较其大小,将大小比较结果作为行为分析结果。

进一步地,所述预设规则为:当sum1≥sum2时,则判定为有刷量行为,否则判定为没有。

进一步地,所述行为分析还包括进行频谱转化后,识别高频分量,如果频谱中不存在高频分量,则直接判断为无刷量行为,否则,进行下一步分析。

进一步地,所述页面访问数据包括:页面的停留时间和当前存在的页面数。

第二方面,本发明还提供一种检测刷量行为的装置,包括:

采集模块,用于采集连续时间的app页面访问数据;

行为分析模块,用于对所述页面访问数据进行行为分析;

刷量结果分析模块,用于得到所述行为分析的结果根据预设规则判断是否存在刷量行为。

进一步地,还包括数据库,所述采集模块具体为app行为采集代理模块,所述行为分析模块包括分析子模块和数据收集子模块,所述app行为采集代理模块采集数据,发送至行为数据收集子模块,所述行为数据收集子模块将接收到的数据发送至数据库进行保存,所述分析子模块通过读取数据库中连续时间数据,执行如权利要求1至6任一项所述的方法进行刷量行为分析。

第三方面,本发明提供一种检测刷量行为的控制设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面任一项所述的方法。

第四方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面任一项所述的方法。

本发明的有益效果是:

本发明通过采集连续时间的app页面访问数据,并对所述页面访问数据进行行为分析,得到行为分析的结果,并根据预设规则判断是否存在刷量行为,克服了现有技术中,通过硬件信息判断刷量行为可靠性不高,效果不佳,以及通过用户分组和分组行为判定策略,复杂性高,成本高的问题,实现了不依赖硬件环境判定以及app性质,通过采集页面访问数据,对数据进行行为分析来判定是否刷量行为,判断策略高效,使用范围广。

附图说明

图1是本发明一种实施方式的检测刷量行为方法的实现流程图;

图2a~图2b是本发明一种实施方式的离散并频谱转化的过程示意图;

图3a~图3b是本发明一种实施方式的第一组数据离散并频谱转化的过程示意图;

图4是本发明一种实施方式的能量谱示意图;

图5a~图5b本发明一种实施方式的第二组数据的行为分析效果示意图;

图6是本发明一种实施方式的检测刷量行为装置的结构框图;

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

本发明实施例一提供一种检测刷量行为方法,现有刷量方式是通过快速进入界面,然后操作完后快速退出界面,在界面的停留时间不会太长,基于这点,通过一段长时间内的页面停留时间来分析是否刷量行为。

图1为本发明实施例提供的一种检测刷量行为方法的实现流程图,如图1所示,该方法可以包括以下步骤:

s1:采集数据,具体是采集目标app连续时间的页面访问数据;

s2:行为分析,对页面访问数据进行行为分析;

s3:判断是否存在刷量行为,得到行为分析的结果后,根据预设规则判断目标app是否存在刷量行为。

其中,步骤s1中定时打包页面访问数据数据,并保存进数据库中,具体是通过行为采集代理方法采集app界面的进入时间点和退出时间点,获得用户在不同页面的停留时间和当前存在的页面数数据,然后定时将数据通过网络传输送入数据收集数据库中。

例如,当进入页面a的时,采集时间为t1,当前界面数为p1,离开页面a的时,采集时间t2,此时页面a并未关闭,并且当前app界面数为p2,当进入页面b的时候,采集时间为t3,界面数为p3,离开页面b的时间为t4,当前页面数为p4,如此循环采集。将数据表示为[(t1,t2),p1]、[(t2,t3),p2]、[(t3,t4),p3]、[(t4,t5),p4]...,其中[(t1,t2),p1]这样一个数据表示在时间t1到t2期间,页面数为p1,通过连续采集可以得到一串这样的时间上连续的数据。

定时打包数据,并通过网络传入数据库中,这样在数据库中就记录了连续时间范围内的数据。

步骤s2的行为分析具体包括:

1)将页面访问数据离散化并进行频谱转化;

本实施例中的做法是:从数据库中读取在时间ti至tj的数据,把这段时间的连续数据依据采样频率fs(可以设置范围为100ms-500ms)采样成(ti,pi)这样的离散数据,pi指最大值与最小值的平均,经过采样之后得到n个点的离散数据,将得到的离散的n个数据,做快速傅里叶变换(fft)得到n个点的fft结果,即进行了频谱转化过程,就得到了离散频谱,公式如下:

y=fft(p,n)(1)

其中p是页面数量,n是采样数,经过ftt之后,得到的y是离散频谱。

如图2a~图2b所示,为离散并频谱转化的过程示意图,图2a为time/p函数示意图,图2b为转化后的频域图。

如图3a~图3b所示,为本实施例的第一组数据离散并频谱转化的过程实例示意图,例如从数据库中获得数据,以50hz频率,0-40秒区间采样得到如下所示离散数据,(0.0,-0.5)、(0.2,-0.5)、(0.4,0.5)、(0.6,0.5)、(0.8,-0.5)、(1.0,-0.5)、(1.2,-0.5)、(1.4,0.5)、(1.6,0.5)、(1.8,-0.5)、(2.0,-0.5)、…、(38.0,-0.5)、(38.2,-0.5)、(38.4,-0.5)、(38.6,0.5)、(38.8,0.5)、(39.0,-0.5)、(39.2,-0.5)、(39.4,0.5)、(39.6,0.5)、(39.8,-0.5)…图3a为数据效果图,图3b为经过离散并频谱转化操作后的频域图,即实现了将“time/p”的函数图转化为“频率/幅值”的频域图。

2)识别高频分量。

通过滤波器识别出频域中的高频分量,由于频域中的高频分量说明在时域内p的变化量越快,则p变化快的一段时间内的连续频繁界面切换,有可能是刷量行为,则下一步继续判断,如图3b中存在高频分量,则不存在泄露等情况,可以进行下一步分析,如果频谱中不存在高频分量,则直接判断为无刷量行为。

3)计算频谱的能量谱,得到能量谱图;

能量谱针对能量有限的信号,也称为能量谱密度,是指用密度的概念表示信号能量在各频率点的分布情况,即能量谱表明各个频率分量的能量大小,计算能量谱的公式为:

pyy=y.*conj(y)/n(2)

其中conj(y)为复数y的共轭值,y为离散频谱数据。

以频率作为横轴,取pyy的前n/2+1个点,得到能量谱图,该图表示各频率分量的能量大小,通过判断在高频和低频的能量情况,可以判定是否刷量行为。

以0.5hz为分界计算分界左右两端能量值的和,计算小于0.5hz的能量值的和,即右边能量值的和sum1,计算大于0.5hz的能量值的和,即左边能量值的和sum2,比较两个值的大小,将大小比较结果大小作为行为分析结果。

步骤s3中预设规则为:

当sum1≥sum2时,则说明高频的操作比低频多,而且高频操作是在0.5hz内完成,则可以判定是刷量行为,否则判定为没有。

如图4所示,为图3a中数据的能量谱图,可见,以0.5hz为分界,sum1≥sum2,大部分能量是在0.5hz的右侧,判断这段时间内的操作属于刷量行为。

如图5a~图5b所示,为第二组数据的行为分析效果示意图,其中,以50hz频率,0-80秒区间采样,数据如下所示:(0.0,-1)、(0.2,-1)、(0.4,0)、(0.6,0)、(0.8,0)、(1.0,0)、(1.2,0)、(1.4,0)、(1.6,1)、(1.8,1)、(2.0,1)、(2.2,1)、(2.4,1)、(2.6,1)、(2.8,0)、(3.0,0)、(3.2,-1)、(3.4,-1)、(3.6,-1)、(3.8,-1)、(4.0,-1)、…、(78.6,1)、(78.8,0)、(79.0,0)、(79.2,-1)、(79.4,-1)、(79.6,-1)、(79.8,-1)…

其中,图5a为数据效果图,图5b为能量谱图,可见以0.5hz为分界,大部分能量是在0.5hz的左侧,根据预设规则判断,此段时间内的行为不属于刷量行为。

本发明实施例二提供一种检测刷量行为装置,如图6所示,为本发明实施例提供的一种检测刷量行为装置的结构框图,包括:采集模块,用于采集连续时间的app页面访问数据;行为分析模块,用于对页面访问数据进行行为分析;刷量结果分析模块,用于得到行为分析的结果根据预设规则判断是否存在刷量行为。

还包括数据库,所述采集模块具体为app行为采集代理模块,所述行为分析模块包括分析子模块和数据收集子模块,所述app行为采集代理模块采集数据,发送至行为数据收集子模块,所述行为数据收集子模块将接收到的数据发送至数据库进行保存,所述分析子模块通过读取数据库中连续时间数据,执行如实施例一任一项所述的方法进行刷量行为分析,然后将分析结果发送至刷量结果分析模块进行结果分析。

另外,本发明还提供一种检测刷量行为的控制设备,包括:

至少一个处理器;以及,

与至少一个处理器通信连接的存储器;其中,

存储器存储有可被上述至少一个处理器执行的指令,指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行如实施例一所述的方法。

另外,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有计算机可执行指令,其中计算机可执行指令用于使计算机执行如实施例一所述的方法。

本发明通过采集连续时间的app页面访问数据,并对所述页面访问数据进行行为分析,得到行为分析的结果,并根据预设规则判断是否存在刷量行为,克服了现有技术中,通过硬件信息判断刷量行为可靠性不高,效果不佳,以及通过用户分组和分组行为判定策略,复杂性高,成本高的问题,实现了不依赖硬件环境判定以及app性质,通过采集页面访问数据,对数据进行行为分析来判定是否刷量行为,判断策略高效,使用范围广。

在本发明所提供的几个实施例中,应该理解到,所描述的设备和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽咯,或不执行。

以上各实施例仅用以说明本发明的技术方案,而非对其限制,尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1