一种广告落地页返回作弊检测方法和系统与流程

文档序号:31067708发布日期:2022-08-09 20:39阅读:71来源:国知局
一种广告落地页返回作弊检测方法和系统与流程

1.本发明涉及互联网广告技术领域,具体为一种广告落地页返回作弊检测方法和系统。


背景技术:

2.移动互联时代,广告主在广告平台进行广告投放,用户点击广告位进入广告主落地页,互联网广告,是指通过网站、网页、互联网应用程序等互联网媒介,以文字、图片、音频、视频或者其他形式,直接或者间接地推销商品或者提供服务的商业广告,与传统的四大传播媒体(报纸、杂志、电视、广播)广告及备受垂青的户外广告相比,互联网广告具有得天独厚的优势,是实施现代营销媒体战略的重要一部分。internet是一个全新的广告媒体,速度最快效果很理想,是中小企业扩展壮大的很好途径,对于广泛开展国际业务的公司更是如此。
3.现有的互联网广告当使用者点进入之后发现并不是自己感兴趣的广告,对广告关闭之后,当再次打开同样的页面时,类似的广告又会重新出现,使用者需要再次关闭,浪费时间和流量的同时给使用者带来了较差体验,为此,我们提出一种广告落地页返回作弊检测方法和系统用于解决上述问题。


技术实现要素:

4.本发明的目的在于提供一种广告落地页返回作弊检测方法和系统,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:一种广告落地页返回作弊检测方法,包括以下步骤:s1、用户点击广告位进入广告主落地页;s2、系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址;s3、系统平台上的信息采集模块筛选80%~90%广告主落地页初始检测页面地址和预期返回地址的重要的特征;s4、利用系统平台上的lda模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;s5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征;s6、分类器将信息传输给系统平台上的plc信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;s7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统
平台上的拦截模块直接对广告位进行拦截。
6.进一步优选的,所述s2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除。
7.进一步优选的,所述s4中分类器采用语言模型kl差异度来描述两个相互链接的网页之间的关系。
8.进一步优选的,所述信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升3~5位,最终更加方便互联网用户查找有效信息。
9.进一步优选的,所述s4中lda模型预处理完成以后,对最优特征集合进行3~5轮抽样形成3~5个特征子集,最后将3~5个特征子集集成为一个分类器。
10.本发明还提供了一种广告落地页返回作弊检测系统,所述信息采集模块包括信息获取模块、信息筛分模块,所述信息采集模块与所述数据存储模块连接。
11.进一步优选的,所述信息获取模块与所述信息筛分模块连接,所述信息筛分模块与信息识别模块连接。
12.进一步优选的,所述数据存储模块与所述信息识别模块连接,所述plc信息处理模块与拦截模块连接,所述信息识别模块连接与所述plc信息处理模块连接。
13.与现有技术相比,本发明的有益效果是:本发明用户点击广告位进入广告主落地页,系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址,分类器将信息传输给系统平台上的plc信息处理模块进行信息处理,当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截,使得再次打开同样的页面时,类似的广告不会重新出现,使用者不需要再次关闭,节约时间和流量的同时给使用者带来了较好的体验。
附图说明
14.图1为本发明的步骤流程图;图2为本发明的系统模块图。
具体实施方式
15.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
16.实施例一请参阅图1-2,本发明提供一种技术方案:一种广告落地页返回作弊检测方法,包括以下步骤:s1、用户点击广告位进入广告主落地页;s2、系统平台上的信息采集模块获取85%广告主落地页初始检测页面地址和预期返回地址;
s3、系统平台上的信息采集模块筛选80%广告主落地页初始检测页面地址和预期返回地址的重要的特征;s4、利用系统平台上的lda模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;s5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征;s6、分类器将信息传输给系统平台上的plc信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;s7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截。
17.本实施例中,具体的:s2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除。
18.本实施例中,具体的:s4中分类器采用语言模型kl差异度来描述两个相互链接的网页之间的关系。
19.本实施例中,具体的:信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升3位,最终更加方便互联网用户查找有效信息。
20.本实施例中,具体的:s4中lda模型预处理完成以后,对最优特征集合进行3轮抽样形成3个特征子集,最后将3个特征子集集成为一个分类器。
21.本发明还提供了一种广告落地页返回作弊检测系统,信息采集模块包括信息获取模块、信息筛分模块,信息采集模块与数据存储模块连接。
22.本实施例中,具体的:信息获取模块与信息筛分模块连接,信息筛分模块与信息识别模块连接。
23.本实施例中,具体的:数据存储模块与信息识别模块连接,plc信息处理模块与拦截模块连接,信息识别模块连接与plc信息处理模块连接。
24.实施例二请参阅图1-2,本发明提供一种技术方案:一种广告落地页返回作弊检测方法,包括以下步骤:s1、用户点击广告位进入广告主落地页;s2、系统平台上的信息采集模块获取90%广告主落地页初始检测页面地址和预期返回地址;s3、系统平台上的信息采集模块筛选85%广告主落地页初始检测页面地址和预期返回地址的重要的特征;s4、利用系统平台上的lda模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;s5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类
检测出内容与链接相结合的作弊特征;s6、分类器将信息传输给系统平台上的plc信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;s7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现75%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截。
25.本实施例中,具体的:s2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除。
26.本实施例中,具体的:s4中分类器采用语言模型kl差异度来描述两个相互链接的网页之间的关系。
27.本实施例中,具体的:信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升4位,最终更加方便互联网用户查找有效信息。
28.本实施例中,具体的:s4中lda模型预处理完成以后,对最优特征集合进行4轮抽样形成4个特征子集,最后将4个特征子集集成为一个分类器。
29.本发明还提供了一种广告落地页返回作弊检测系统,信息采集模块包括信息获取模块、信息筛分模块,信息采集模块与数据存储模块连接。
30.本实施例中,具体的:信息获取模块与信息筛分模块连接,信息筛分模块与信息识别模块连接。
31.本实施例中,具体的:数据存储模块与信息识别模块连接,plc信息处理模块与拦截模块连接,信息识别模块连接与plc信息处理模块连接。
32.实施例三请参阅图1-2,本发明提供一种技术方案:一种广告落地页返回作弊检测方法,包括以下步骤:s1、用户点击广告位进入广告主落地页;s2、系统平台上的信息采集模块获取95%广告主落地页初始检测页面地址和预期返回地址;s3、系统平台上的信息采集模块筛选90%广告主落地页初始检测页面地址和预期返回地址的重要的特征;s4、利用系统平台上的lda模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器;s5、通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征;s6、分类器将信息传输给系统平台上的plc信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储;s7、当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现80%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截。
33.本实施例中,具体的:s2中信息采集模块获取的信息发送给信息识别模块,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除。
34.本实施例中,具体的:s4中分类器采用语言模型kl差异度来描述两个相互链接的网页之间的关系。
35.本实施例中,具体的:信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升5位,最终更加方便互联网用户查找有效信息。
36.本实施例中,具体的:s4中lda模型预处理完成以后,对最优特征集合进行5轮抽样形成5个特征子集,最后将5个特征子集集成为一个分类器。
37.本发明还提供了一种广告落地页返回作弊检测系统,信息采集模块包括信息获取模块、信息筛分模块,信息采集模块与数据存储模块连接。
38.本实施例中,具体的:信息获取模块与信息筛分模块连接,信息筛分模块与信息识别模块连接。
39.本实施例中,具体的:数据存储模块与信息识别模块连接,plc信息处理模块与拦截模块连接,信息识别模块连接与plc信息处理模块连接。
40.本发明的工作方式:通过用户点击广告位进入广告主落地页,系统平台上的信息采集模块获取85%~95%广告主落地页初始检测页面地址和预期返回地址,系统平台上的信息采集模块筛选80%~90%广告主落地页初始检测页面地址和预期返回地址的重要的特征,利用系统平台上的lda模型提取作弊网站网页的广告主落地页初始检测页面地址和预期返回地址的主题分布特征,最后将网页的主题分布特征与网页的内容特征相结合来建立分类器,通过分类器将网页的链接特征和网页文本的内容特征结合起来,并分析分类检测出内容与链接相结合的作弊特征,分类器采用语言模型kl差异度来描述两个相互链接的网页之间的关系,信息识别模块根据页面地址及返回地址的重要特征信息将作弊网站识别出,并将其从搜索引擎结果列表中移除,信息识别模块将有用网页的链接在搜索引擎结果列表中排名向前提升3~5位,最终更加方便互联网用户查找有效信息,分类器将信息传输给系统平台上的plc信息处理模块进行信息处理,信息采集模块将检测出内容与链接相结合的作弊方式传输给系统平台上的数据存储模块进行存储,当下一次广告位出现时,系统平台上的信息识别模块将网页的链接特征和网页文本的内容与数据库存储的信息进行对比,当出现70%~80%的内容特征相似时,系统平台上的拦截模块直接对广告位进行拦截。
41.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1