一种基于中文互联网环境程序化投放广告的验证平台和方法

文档序号:10656601阅读:367来源:国知局
一种基于中文互联网环境程序化投放广告的验证平台和方法
【专利摘要】本发明提出了一种基于中文互联网环境程序化投放广告的验证平台,采用虚拟访客技术和像素跟踪技术,在云数据段进行海量页面数据索引和分析,同时在实时客户端具有较高穿透力,保证广告在恰当的时间和地方安全地被投放,防止了广告被不恰当投放时所产生的风险,保护了广告主品牌的安全,包括位于前台的对在线广告进行实时验证的实时客户端和位于后台对广告投放页面进行索引和分类的云服务端;其中,实时客户端包括API接口层、验证服务器和规则数据库,云服务端包括数据爬虫、索引服务器和云端数据库。
【专利说明】
一种基于中文互联网环境程序化投放广告的验证平台和方法
技术领域
[0001]本发明涉及互联网广告技术领域,具体涉及一种基于中文互联网或移动设备等载体程序化投放广告的验证平台和方法。
【背景技术】
[0002]程序化购买,指的是通过数字平台,自动进行互联网广告媒体购买的流程。即广告主接入需求方平台(DSP),通过实时竞价(RTB)对投放入各大广告交易平台(Ad Exchange)的互联网各类广告位资源进行程序化的购买和投放。通过RTB和Ad Exchange等技术,广告主可以根据媒体类型或者受众行为特征进行广告位购买,实现了广告购买和投放的全程自动化,达到互联网广告在效率和精准性上的突破。
[0003]但由于中文互联网环境的复杂性,广告主在程序化购买的过程当中仍然会遇到各种安全隐患,损坏广告主的品牌安全和投放效果。比如广告被投放到三俗内容的页面;旅游局的广告出现在马航事件的内容上;广告出现在一个布局奇怪;6个不同广告并存的奇怪页面;广告被放在了看不见的地方,利用作弊技术欺骗点击量。故而在程序化购买的过程中,需要第三方提供对广告投放的监控和评估,以保障广告主的品牌。
[0004]现有技术当中,美国双重验证有限公司申请的专利号为201080060999.9的发明专利提供了一种实时在线广告的验证系统与方法,包括决策服务器、数据库服务器、网络服务器和查询软件模块。其中查询软件模块提取了存储于网页广告中的标签代码得到了网页信息和相关参数,并传输到决策服务器,决策服务器分析广告活动规则和所提供的参数,并将其决策发送到广告服务器,广告服务器相应地投放广告或者拦截广告。该技术方案虽然能够帮助广告服务器决定投放哪个广告,并允许其根据广告活动的定义,在投放植入(例如网页的网址)的可视性和充分认识的基础上,投放适当的广告,但是缺乏对于中文互联网环境复杂性的考虑,在对投放植入的网页的语义分析、图像识别上、广告作弊监控、网站备案信息查询上,需要进行海量数据的索引和预处理,以满足广告投放的准确性和品牌安全性的要求。

【发明内容】

[0005]为解决现有技术中存在的上述问题,本发明的目的是提供一种能够适应于中文互联网复杂环境,在云数据段进行海量页面数据索引和分析,具有较高网页穿透力达到保护广告主投放效果和品牌的程序化投放广告的验证平台和方法。
[0006]为了达到上述目的,本发明的具体解决方案提供一种基于中文互联网环境程序化投放广告的验证平台,应用于广告主接入的需求方平台(DSP)之上,具有由广告交易平台(Ad Exchange)和其他数据来源提供的广告投放标的网页所组成的数据池,包括位于前台的对在线广告进行实时验证的实时客户端和位于后台对广告投放页面进行索引和分类的云服务端;
[0007]其中,实时客户端包括API接口层、验证服务器和规则数据库,所述API接口层建立广告投放页面与验证服务器的连接,提取网页的URL参数并发送到离线系统,规则数据库存储符合广告主意图的广告活动规则,验证服务器根据离线系统分析得出的网页负向分类和评分数据判断目标网页是否符合广告活动规则;
[0008]云服务端包括数据爬虫、索引服务器和云端数据库,所述数据爬虫提取广告投放页面的文本、媒体和页面数据,并以视觉化方式呈现网页,索引服务器将提取的广告信息和数据进行分析和分类,并建立索引和评分,云端数据库存储经过索引和评分之后的网页负向分类数据。
[0009]进一步的,还包括网站标签,所述网站标签存储于广告投放页面中并由用户的浏览器端执行,所述API接口层根据网站标签来识别广告投放页面,所述网站标签的描述语言包括HTML代码、JAVASCRIPT代码和IFRAME代码。
[0010]更进一步的,其特征在于所述数据爬虫包括像素跟踪程序和虚拟访客程序,所述像素跟踪程序根据网页标签提取广告位置、数量、尺寸、广告链接等数据信息,虚拟访客程序程序,分析HTML结构并呈现页面,针对广告位置对整个页面进行截图。
[0011]更进一步的,其特征在于,所述索引服务器包括语义分析模块、图像分析模块、广告链接分析模块和网站备案分析模块,所述索引服务器根据广告投放页面的备案信息、图像分析结果、非法链接的数量、网页结构、广告数量、作弊历史判断网页的友好程度并进行评分。
[0012]优选的,所述网页负向分类的类别包括酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力。
[0013]另一方面,本发明还提供一种基于中文互联网环境程序化投放广告的方法,所述方法实施于用户竞价广告前或竞价广告之后,包括以下步骤:
[0014]A.用户提供一组广告投放页面网址以进行验证;
[0015]B.数据爬虫抓取广告投放页面的广告信息、文本、媒体和页面数据,并以视觉化方式呈现网页;
[0016]C.建立提取页面的索引,并对提取的广告信息、文本、媒体和页面数据进行分析,根据分析结果建立网页的负向分类和评分;
[0017]D.将页面索引、负向分类和评分存储于云端数据库;
[0018]E.根据页面网址检索到存储于云端数据库的广告投放网页页面的负向分类和评分;
[0019]D.根据负向分类和评分判断广告投放页面是否符合广告活动规则。
[0020]进一步的,本方法还包括在广告投放网页上添加网站标签,所述网站标签的描述语言包括HTML代码、JAVASCRIPT代码和IFRAME代码,用以识别广告投放页面。
[0021]进一步的,所述数据爬虫包括像素跟踪程序和虚拟访客程序,所述像素跟踪程序根据网页标签提取广告位置、数量、尺寸、广告链接等数据信息,虚拟访客程序程序,分析HTML结构并呈现页面,针对广告位置对整个页面进行截图。
[0022]进一步的,对提取的广告信息、文本、媒体和页面数据进行的分析包括,语义分析、图像分析、广告链接分析和网站备案分析。
[0023]进一步的,所述网页负向分类的类别包括酒精、疫情、军事冲突、自然灾害、死亡、
安全事故、色情、交通事故和暴力。
[0024]本发明同现有技术相比,具有以下优点和有益效果:
[0025]1、适应中文互联网复杂的网络环境,保证广告在恰当的时间和地方安全地被投放,不仅向广告主展示了广告的点击率等商业效果,更防止了广告被不恰当投放时所产生的风险,保护了广告主品牌的资产和减少广告投放活动的事后顾虑。
[0026]2、采用虚拟访问者技术,预先访问过了所有广告投放环境中的页面,并在此收集数据的基础上上做了存档,索引,分类,同时根据广告主品牌政策上加上学习点,为广告主,TradingDesk以及广告网络在每一次投放之前做了一张可删选的过滤网。
[0027]3、采用像素跟踪技术,满足广告主对广告投放的可视化要求,采用IFRAME等网络标签,保证了较高的广告验证穿透性。
[0028]4、针对中文互联网,采用语义分析、图像分析、广告链接分析和网站备案分析对广告投放页面进行酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力的分类和评分,分析结果存储于云端服务器,能在用户投放广告是实时调用,并建立广告投放的黑名单。
【附图说明】
[0029]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0030]图1是本发明一种实施例的系统架构图;
[0031 ]图2是本发明另一种实施例的方法流程图。
图3是本发明另一种实施例的方法流程图。
【具体实施方式】
[0032]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全海部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0033]本发明的具体解决方案提供一种基于中文互联网环境程序化投放广告的验证平台,其作用在于对广告投放页面进行监控和保护,防止在同一页面出现上损害广告主品牌形象的网页内容(图片、文字、超链接、视频等)。
[0034]如图1所示,本发明的验证平台应用于广告主接入的需求方平台(DSP)之上,具有由广告交易平台(Ad Exchange)和其他数据来源提供的广告投放标的网页所组成的数据池。广告主通过包括位于前台的对在线广告进行实时验证的实时客户端和位于后台对广告投放页面进行索引和分类的云服务端。
[0035]其中,实时客户端包括API接口层、验证服务器和规则数据库,所述API接口层建立广告投放页面与验证服务器的连接,提取网页的URL参数并发送到离线系统,规则数据库存储符合广告主意图的广告活动规则,验证服务器根据离线系统分析得出的网页负向分类和评分数据判断目标网页是否符合广告活动规则;
[0036]云服务端包括数据爬虫、索引服务器和云端数据库,所述数据爬虫提取广告投放页面的文本、媒体和页面数据,并以视觉化方式呈现网页,索引服务器将提取的广告信息和数据进行分析和分类,并建立索引和评分,云端数据库存储经过索引和评分之后的网页负向分类数据。
[0037]进一步的,还包括网站标签,所述网站标签存储于广告投放页面中并由用户的浏览器端执行,所述API接口层根据网站标签来识别广告投放页面,所述网站标签的描述语言包括HTML代码、JAVASCRIPT代码和IFRAME代码。
[0038]更进一步的,其特征在于所述数据爬虫包括像素跟踪程序和虚拟访客程序,所述像素跟踪程序根据网页标签提取广告位置、数量、尺寸、广告链接等数据信息,虚拟访客程序程序,分析HTML结构并呈现页面,针对广告位置对整个页面进行截图。
[0039]更进一步的,其特征在于,所述索引服务器包括语义分析模块、图像分析模块、广告链接分析模块和网站备案分析模块,所述索引服务器根据广告投放页面的备案信息、图像分析结果、非法链接的数量、网页结构、广告数量、作弊历史判断网页的友好程度并进行评分。
[0040]优选的,所述网页负向分类的类别包括酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力等。
[0041 ]图2是本发明另一个实施例的方法流程图,
[0042]如图所示,本发明还提供一种基于中文互联网环境程序化投放广告的方法,所述方法实施于用户竞价广告前或竞价广告之后,包括以下步骤:
[0043]A.用户提供一组广告投放页面网址以进行验证;
[0044]B.数据爬虫抓取广告投放页面的广告信息、文本、媒体和页面数据,并以视觉化方式呈现网页;
[0045]C.建立提取页面的索引,并对提取的广告信息、文本、媒体和页面数据进行分析,根据分析结果建立网页的负向分类和评分;
[0046]D.将页面索引、负向分类和评分存储于云端数据库;
[0047]E.根据页面网址检索到存储于云端数据库的广告投放网页页面的负向分类和评分;
[0048]D.根据负向分类和评分判断广告投放页面是否符合广告活动规则。
[0049]进一步的,本方法还包括在广告投放网页上添加网站标签,所述网站标签的描述语言包括HTML代码、JAVASCRIPT代码和IFRAME代码,用以识别广告投放页面。
[0050]进一步的,所述数据爬虫包括像素跟踪程序和虚拟访客程序,所述像素跟踪程序根据网页标签提取广告位置、数量、尺寸、广告链接等数据信息,虚拟访客程序程序,分析HTML结构并呈现页面,针对广告位置对整个页面进行截图。
[0051]进一步的,对提取的广告信息、文本、媒体和页面数据进行的分析包括,语义分析、图像分析、广告链接分析和网站备案分析。
[0052]进一步的,所述网页负向分类的类别包括酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力等。
[0053]本发明同现有技术相比,具有以下优点和有益效果:
[0054]1、适应中文互联网复杂的网络环境,保证广告在恰当的时间和地方安全地被投放,不仅向广告主展示了广告的点击率等商业效果,更防止了广告被不恰当投放时所产生的风险,保护了广告主品牌的资产和减少广告投放活动的事后顾虑。
[0055]2、采用虚拟访问者技术,预先访问过了所有广告投放环境中的页面,并在此收集数据的基础上上做了存档,索引,分类,同时根据广告主品牌政策上加上学习点,为广告主,TradingDesk以及广告网络在每一次投放之前做了一张可删选的过滤网。
[0056]3、采用像素跟踪技术,满足广告主对广告投放的可视化要求,采用IFRAME等网络标签,保证了较高的广告验证穿透性。
[0057]4、针对中文互联网,采用语义分析、图像分析、广告链接分析和网站备案分析对广告投放页面进行酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力的分类和评分,分析结果存储于云端服务器,能在用户投放广告是实时调用,并建立广告投放的黑名单。
[0058]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于中文互联网环境程序化投放广告的验证平台,应用于广告主接入的需求方平台(DSP)之上,具有由广告交易平台(Ad Exchange)和其他数据来源提供的广告投放标的网页所组成的数据池,其特征在于,包括位于前台的对在线广告进行实时验证的实时客户端和位于后台对广告投放页面进行索引和分类的云服务端; 其中,实时客户端包括API接口层、验证服务器和规则数据库,所述API接口层建立广告投放页面与验证服务器的连接,提取网页的URL参数并发送到离线系统,规则数据库存储符合广告主意图的广告活动规则,验证服务器根据离线系统分析得出的网页负向分类和评分数据判断目标网页是否符合广告活动规则; 云服务端包括数据爬虫、索引服务器和云端数据库,所述数据爬虫提取广告投放页面的文本、媒体和页面数据,并以视觉化方式呈现网页,索引服务器将提取的广告信息和数据进行分析和分类,并建立索引和评分,云端数据库存储经过索引和评分之后的网页负向分类数据。2.如权利要求1所述的一种基于中文互联网环境程序化投放广告的验证平台,其特征在于,还包括网站标签,所述网站标签存储于广告投放页面中并由用户的浏览器端执行,所述API接口层根据网站标签来识别广告投放页面,所述网站标签的描述语言包括HTML代码、JAVASCRIPT 代码和 IFRAME 代码。3.如权利要求2所述的一种基于中文互联网环境程序化投放广告的验证平台,其特征在于所述数据爬虫包括像素跟踪程序和虚拟访客程序,所述像素跟踪程序根据网页标签提取广告位置、数量、尺寸、广告链接等数据信息,虚拟访客程序程序,分析HTML结构并呈现页面,针对广告位置对整个页面进行截图。4.如权利要求1所述的一种基于中文互联网环境程序化投放广告的验证平台,其特征在于,所述索引服务器包括语义分析模块、图像分析模块、广告链接分析模块和网站备案分析模块,所述索引服务器根据广告投放页面的备案信息、图像分析结果、非法链接的数量、网页结构、广告数量、作弊历史判断网页的友好程度并进行评分。5.如权利要求1所述的一种基于中文互联网环境程序化投放广告的验证平台,其特征在于,所述网页负向分类的类别包括酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力。6.—种基于中文互联网环境程序化投放广告的方法,其特征在于,所述方法实施于用户竞价广告前或竞价广告之后,包括以下步骤: A.用户提供一组广告投放页面网址以进行验证; B.数据爬虫抓取广告投放页面的广告信息、文本、媒体和页面数据,并以视觉化方式呈现网页; C.建立提取页面的索引,并对提取的广告信息、文本、媒体和页面数据进行分析,根据分析结果建立网页的负向分类和评分; D.将页面索引、负向分类和评分存储于云端数据库; E.根据页面网址检索到存储于云端数据库的广告投放网页页面的负向分类和评分; F.根据负向分类和评分判断广告投放页面是否符合广告活动规则。7.如权利要求6所述的一种基于中文互联网环境程序化投放广告的方法,其特征在于,在广告投放网页上添加网站标签,所述网站标签的描述语言包括HTML代码、JAVASCRIPT代码和IFRAME代码,用以识别广告投放页面。8.如权利要求6所述的一种基于中文互联网环境程序化投放广告的方法,其特征在于,所述数据爬虫包括像素跟踪程序和虚拟访客程序,所述像素跟踪程序根据网页标签提取广告位置、数量、尺寸、广告链接等数据信息,虚拟访客程序程序,分析HTML结构并呈现页面,针对广告位置对整个页面进行截图。9.如权利要求6所述的一种基于中文互联网环境程序化投放广告的方法,其特征在于,对提取的广告信息、文本、媒体和页面数据进行的分析包括,语义分析、图像分析、广告链接分析和网站备案分析。10.如权利要求6所述的一种基于中文互联网环境程序化投放广告的方法,其特征在于,所述网页负向分类的类别包括酒精、疫情、军事冲突、自然灾害、死亡、安全事故、色情、交通事故和暴力。
【文档编号】G06Q30/02GK106022843SQ201610396905
【公开日】2016年10月12日
【申请日】2016年6月6日
【发明人】张迪, 丁晓刚, 刘涛, 刘罗军, 尹伟
【申请人】上海荷格信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1