一种落地页监控方法及系统与流程

文档序号:17663960发布日期:2019-05-15 22:34阅读:509来源:国知局
一种落地页监控方法及系统与流程

本发明实施例涉及网络安全技术领域,尤其涉及一种落地页监控方法及系统。



背景技术:

在互联网广告投放领域,由于投放的广告位的最终跳转落地页容易被广告投放者进行修改,因此流量提供方往往无法对这些跳转页的最终落地页进行有效的控制,导致一些不法分子通过随意修改所发布的信息的落地页,对流量提供方的业务安全造成影响。

现有技术中,常用的对跳转页的控制方法往往是对广告投放的环境中对落地页禁止其二次跳转,然而,现有技术中限制了投放链接的二次跳转,对于部分投放商家来说等于限制了其投放方式,必定会导致部分客户的使用场景受限,另一方面,限制二次跳转只能解决部分使用跳转方式来更换页面内容的篡改者,而很多使用动态ajax请求来控制页面内容变更的篡改方式,是无法限制的。



技术实现要素:

本发明实施例提供一种落地页监控方法及系统,用以解决现有技术中限制了投放链接的二次跳转,对于部分投放商家来说等于限制了其投放方式,必定会导致部分客户的使用场景受限,同时无法对所有的落地页篡改动作进行有效的限制的问题。

第一方面,本发明实施例提供一种落地页监控方法,包括:

当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;

将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;

将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

第二方面,本发明实施提供一种落地页监控系统,包括:

结构信息提取模块,用于当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;

页面特征提取模块,用于将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;

匹配模块,用于将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一方面所提供的落地页监控方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面所提供的落地页监控方法的步骤。

本发明实施例提供的方法提取广告投放者投放广告页的最终落地页的特征信息,与备案的合法落地页的特性信息进行比对,能适应性对多种加载html广告页的载体进行实时监控,且实时的对每次用户的请求做监控,能实现对广告落地页篡改的实时发现、实时报警、实时处理。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一实施例提供的落地页监控方法的流程示意图;

图2为本发明一实施例提供的落地页监控系统的结构示意图;

图3为本发明一实施例提供的电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参考图1,图1为本发明一实施例提供的落地页监控方法的流程示意图,所提供的方法包括:

s1,当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;

s2,将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;

s3,将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

具体的,当平台商加载html广告时,对加载环境强制加载一个监测页面内容的js,通过该js可以对页面的结构进行内容提取,获得落地页的结构信息,随后,进一步的对页面的结构信息做序列转化,序列转化的输出为该落地页结构信息的字符串表示,将该字符串表示作为落地页的页面特征信息,将该页面特征信息与广告投放者备案时的合法落地页特征刻画库中的特征信息进行匹配,若匹配结果为没有相同的匹配信息,则可以表示该广告投放者的落地页被篡改,此时系统发出警报,以便平台商对该广告进行下线处理或以其它方式对广告进行处理。

通过此方法,采用通用性较强的js技术提取广告投放者投放的广告页的最终落地页的特征信息,与备案的合法落地页的特性信息进行比对,能适应性对多种加载html广告页的载体进行实时监控,且实时的对每次用户的请求做监控,能实现对广告落地页篡改的实时发现、实时报警、实时处理。

在上述实施例的基础上,所述落地页加载之前,还包括:对所有合法的落地页的结构进行特征提取并获取所有落地页的页面特征,构建落地页特征刻画库。

其中,所述方法还包括对每一个落地页进行合法性审核,保留合法落地页并清除非法落地页。

具体的,平台方在对投放的广告做审核时,该系统会对确认合法的内容做落地页的读取和确认,并由审核人员确认读取的正确性,落地页可能有多个或者多层跳转,均由审核人员做合法性确认,在获得了具有合法性的落地页后,系统对合法的落地页结构进行内容提取,获得合法落地页的结构信息,进一步的,将每个合法落地页的结构信息进行序列转化,获得合法落地页的字符串表示作为特征信息,将这些特征信息构建落地页特征刻画库。

在上述实施例的基础上,所述对所述落地页的结构进行内容提取,获取所述落地页的结构信息的步骤具体包括:

提取所述落地页中url域名、url结构、页面字节长度、页面html标签数、图片资源数、图片hash、文字数量、文本hash中任意一项或多项的组合,获得所述落地页的结构信息。

具体的,对落地页的结构信息提取的步骤具体包括,对落地页中好办的页面的内容信息例如url域名、url结构、页面字节长度、页面html标签数、图片资源数、图片hash、文字数量、文本hash等内容信息中的一项或多项的组合,构建落地页的结构信息,其中,结构信息包含各类型标签的结构和顺序、图片的hash以及出现顺序等内容。

通过此方法,使用一种简单的特征提取方法,兼顾了html页面的内容信息比对与结构信息比对,能实现准确快速的辨别2个页面直接的相似性。

在上述实施例的基础上,所述将所述页面特征与预设的落地页特征刻画库中的特征进行比对之后的步骤,还包括:若所述页面特征与预设的落地页也特征刻画库中的特征匹配成功,则判定所述落地页为合法页面。

具体的,当落地页的内容匹配成功后,则判定加载的落地页为合法落地页,系统继续执行加载操作。

通过此方法,不会限制广告投放者的投放形式,而是以主动监测形式对广告页进行监控,只有当广告商出现异常时,系统才会对投放者处理。

参考图2,图2为本发明一实施例提供的落地页监控系统的结构示意图,所提供的系统包括:结构信息提取模块21,页面特征提取模块22和匹配模块23。

其中,结构信息提取模块21用于当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;

页面特征提取模块22用于将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;

匹配模块23用于将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

具体的,当平台商加载html广告时,对加载环境强制加载一个监测页面内容的js,通过该js可以对页面的结构进行内容提取,获得落地页的结构信息,随后,进一步的对页面的结构信息做序列转化,序列转化的输出为该落地页结构信息的字符串表示,将该字符串表示作为落地页的页面特征信息,将该页面特征信息与广告投放者备案时的合法落地页特征刻画库中的特征信息进行匹配,若匹配结果为没有相同的匹配信息,则可以表示该广告投放者的落地页被篡改,此时系统发出警报,以便平台商对该广告进行下线处理或以其它方式对广告进行处理。

通过此系统,采用通用性较强的js技术提取广告投放者投放的广告页的最终落地页的特征信息,与备案的合法落地页的特性信息进行比对,能适应性对多种加载html广告页的载体进行实时监控,且实时的对每次用户的请求做监控,能实现对广告落地页篡改的实时发现、实时报警、实时处理。

在上述实施例的基础上,所述系统还包括:特征刻画库构建模块,用于对所有合法的落地页的结构进行特征提取并获取所有落地页的页面特征,构建落地页特征刻画库。

具体的,平台方在对投放的广告做审核时,该系统会对确认合法的内容做落地页的读取和确认,并由审核人员确认读取的正确性,落地页可能有多个或者多层跳转,均由审核人员做合法性确认,在获得了具有合法性的落地页后,系统对合法的落地页结构进行内容提取,获得合法落地页的结构信息,进一步的,将每个合法落地页的结构信息进行序列转化,获得合法落地页的字符串表示作为特征信息,将这些特征信息构建落地页特征刻画库。

图3为本发明实施例的电子设备的结构示意图,如图3所示,电子设备包括:处理器(processor)301、通信接口(communicationsinterface)302、存储器(memory)303和总线304,其中,处理器301,通信接口302,存储器303通过总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行如下方法,例如包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

本发明实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

本实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:当落地页加载完成后,对所述落地页的结构进行内容提取,获取所述落地页的结构信息;将所述结构信息进行序列化转化,获取所述落地页的字符串表示,作为所述落地页的页面特征;将所述页面特征与预设的落地页特征刻画库中的特征进行比对,若没有相同匹配结果,则判定所述落地页为非法页面。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1