专利名称:广告数据的大规模聚集和报告的制作方法
技术领域:
本说明书总体上涉及在线广告。
背景技术:
在在线广告中, 一些广告主可以在多个网站上做广告,在世界各 地做广告,并且具有许多不同类型的广告(例如文本、视频)。广告 主希望具有提供有用信息的统计报告,使得他们可以调整他们的广告 活动,例如,减少在未产生期望结果的网站上做广告或从未产生期望
结果的区域减少做广告,改变广告("ad")类型等等。为了消除没有 效果的网站,广告主需要具有提供与正在显示他们的广告的位置相关 的位置信息的报告,所述位置信息诸如通用资源定位符(URL) /域信 息。同时,大规模的在线广告可以产生大量原始数据。大规模地收集 这样的数据并且生成报告可能耗费很多时间和计算资源。
发明内容
根据一个方面, 一种方法包括收集关于与广告相关联的一个或
多个参数的统计数据,包括将统计数据过滤到通用资源定位符(URL) 或域的级别;以及将统计数据传送给广告主。本方面的其它实施方式 包括相应的系统、装置、计算机程序产品以及计算机可读介质。
根据另一个方面, 一种方法包括聚集关于与广告相关联的一个 或多个参数的统计数据;评估统计数据,包括向所述统计数据应用过 滤;以及将过滤的统计数据传送给广告主。本方面的其它实施方式包
括相应的系统、装置、计算机程序产品以及计算机可读介质。
根据另一个方面, 一种方法包括接收包括与广告活动中的广告置放相关联的统计数据的报告,所述统计数据被过滤到URL或域的级 另(J;以及根据所述报告修改所述广告活动。本方面的其它实施方式包 括相应的系统、装置、计算机程序产品以及计算机可读介质。
将在附图和以下描述中阐明在说明书中描述的主题的一个或多个 实施例的细节。主题的其它特征、方面以及优点将根据描述、附图和 权利要求而变得清楚。
图l是图示示例在线广告数据聚集和报告系统的框图。 图2是图示用于收集和处理广告数据的示例过程的流程图。 图3是图示用于縮减和报告广告数据的示例过程的流程图。 图4图示了示例广告数据报告。
图5是图示用于在线广告数据聚集和报告系统的示例系统体系结 构的框图。
在各个附图中相同的参考标记和符号指示相同的元件。
具体实施例方式
图l是图示示例在线广告数据聚集和报告系统的框图。在线广告数 据聚集和报告系统100可以聚集广告数据和根据聚集的广告数据生成 报告。
可以由系统100处理的原始广告数据可以包括关于与一个或多个 广告相关联的一个或多个参数的数据。在一些实现中,所述原始数据 包括关于广告闪现(impression)、广告点进(click-through)和/或广 告转化(conversion)的数据。更一般地,原始广告数据可以包括关于 一个或多个广告的表现的统计数据。
在一些实现中,所述系统100包括广告数据过滤器102、广告参考 数据查找引擎104、文件系统106、广告数据聚集器108、数据库110禾口112以及广告数据报告引擎114。 一个或多个广告主118可以通过一个或 多个网络120向广告数据报告引擎114提交报告请求以及从广告数据报 告引擎114接收报告。 一个或多个网络120可以包括例如局域网、广域 网、内联网、有线或无线网络、因特网或以上这些中的一个或多个的 组合。
在一些实现中,所有接收的原始数据被处理。在其它的实现中, 原始数据的样本子集被处理。例如,可以是原始数据的仅一个样本子 集被过滤、被充实(enrich)以及被存储用于聚集的情况。替选地,可 以是所有被接收的原始数据可以被过滤、但是过滤的数据的样本被充 实以及被存储用于聚集的情况。
广告数据过滤器102可以根据一个或多个预定过滤标准过滤原始 广告数据。广告数据过滤器102识别满足预定标准的数据并且从原始数 据集中移除这样的数据。移除的数据可以被保存用于进一步使用或永 久地丢弃。在一些实现中,广告数据过滤器102包括用于将原始数据过 滤到通用资源定位符(URL)或域的级别的标准。也就是说,过滤器 102过滤所述数据使得所述过滤的数据提供以每个广告、每个URL或域 为基础的信息,其中URL或域是其中广告被放置到的URL或域。在一 些其它的实现中,预定标准包括关于垃圾信息(spam)和/或点击欺诈 的标准。也就是说,广告数据过滤器102可以过滤原始广告数据以移除 被确定是潜在的垃圾信息或点击欺诈的数据。
广告参考数据查找引擎104可以可选地充实过滤的广告数据。在一 些实现中,广告数据可以被扩增关于与数据相关联的广告的附加参考 信息。例如,广告数据可以被充实关于广告类型和与和所述数据相关 的广告相关联的其它特征或属性的数据。广告参考数据查找引擎104可 以使用广告标识符从广告信息的数据库110检索与广告相关联的信息。 在一些实现中,广告标识符是分配给广告的唯一标识符。数据库110存 储广告信息。对于广告,存储的信息可以包括但不限于广告类型、关
9键字、区域和/或广告被定向到的人口统计类别等等。
过滤的和充实的广告数据可以被存储在文件系统106或其它数据
储存库以备进一步处理。在一些实现中,文件系统106是Ghemawat等人 右三Proceedings of the 19th ACM Symposium on Operating Systems Principles (2003)的'The Google File System"中描述的Google文件系统,
其内容通过引用合并在此。
广告数据聚集器108从文件系统106检索广告数据并且聚集广告数 据。在数据的聚集期间,可以向数据应用附加的过滤。在一些实现中, 附加的过滤包括一个或多个预定阈值。所述阈值充当针对广告数据而 应用的取舍点(cut-off)。取舍点阈值用来滤出可以被认为是无意义的 数据。移除的数据可以被保持用于再处理或永久地丢弃。例如,可以 对移除的数据执行分析。所述广告数据聚集器108产生縮减的广告数据 集,其可以被存储在数据库112中。
广告数据报告引擎114可以通过一个或多个网络120从广告主118 接收报告请求。广告数据报告引擎114从数据库112检索相关的数据, 根据检索的数据生成报告,并且通过网络120发送报告给广告主118。
在一些实现中,由广告数据报告引擎114生成的报告在URL或域的 级别对广告数据进行报告。也就是说,对于广告,所述报告对用于广 告被放置其中的每个URL或域的广告的表现进行报告。
应该理解,如上所述的系统100仅仅是示例性的。其它实现是可能 的。例如,在一些实现中,广告数据过滤器102在广告参考数据查找引 擎104"之后"出现。也就是说,在广告数据过滤器102过滤广告数据 之前,为广告数据检索参考数据。在一些其它的实现中,数据聚集器 和取舍点阈值引擎代替执行广告数据的聚集和取舍点阈值的应用两者 的广告数据聚集器108。数据聚集器聚集广告数据(可以被连续地执行),并将聚集的数据存储在文件系统106中。取舍点阈值引擎从文件 系统106定期地检索聚集的数据并且将取舍点阈值应用到所述数据。结
果数据可以被存储在数据库112中。
图2是图示用于收集和处理广告数据的示例过程的流程图。
在过程流200中,接收原始广告数据(202)。根据预定标准过滤 所述广告数据(204)。例如,广告数据可以被过滤,使得数据指示在 URL/域的级别的广告的表现。在一些实现中,广告数据可以被过滤 以移除指示潜在的垃圾信息或者点击欺骗的数据,这些数据可能误导 广告主关于他们的广告的表现。
可选地,收集用于广告数据的参考信息(206)。参考信息扩增广 告数据,提供与和广告数据关联的广告相关的附加信息。例如,参考 信息可以包括广告类型(例如视频、文本、横幅等等)。参考信息可 以从广告数据库收集,诸如数据库HO (图l)。过滤的广告数据和参 考信息,如果有的话,被存储在文件系统或其它数据储存库,诸如文 件系统106中(208)。在一些实现中,过滤的数据和参考信息可以被 聚集并且聚集的数据被存储在文件系统中。
在一些实现中,连续地接收广告数据。也就是说,当出现与广告 相关联的事件,诸如闪现、点进和转化,并且提供关于其的数据时, 可以接收原始广告数据。过程流200可以被连续地执行以便处理广告数 据的连续流。
在一些其它的实现中,过滤操作(204)可以在收集用于广告数据 的参考信息之后被执行(206)。
图3是图示用于縮减和报告广告数据的示例过程的流程图。在过程流300中,从文件系统检索数据(302)。在一些实现中, 对特定的时间段检索数据。例如,可以检索过去3天的数据。检索3天 跨度的数据在解决时区变化中可以是有帮助的。在一些其它的实现中, 可以检索昨天的数据。
向检索的数据应用阈值或取舍点标准以产生縮减的数据集(304)。 阈值或取舍点标准移除可以被认为是在统计上对报告的目的无意义的 数据。替选地,取舍点可以由广告主或系统定义以满足用户或系统的 要求。在一些实现中,阈值或取舍点标准可以包括对广告的至少一个 点进或者一个转化的阈值。也就是说,如果在URL/域处的广告置放 在相关的时间段内没有点进或转化,在相关时间段内的用于广告置放 的数据可以被移除。在一些其它的实现中,阈值或取舍点标准可以包 括闪现的最小数目。也就是说,在相关时间段内没有被呈现足够次数 的广告置放的数据可以被移除。縮减的数据集可以存储在数据库中, 诸如数据库112,其中可以对其进行检索以包括在报告中。
接收对报告的请求(306)。请求可以由希望查阅其广告的表现的 广告主提交。从数据库检索与请求的报告有关的数据。从检索的数据 生成报告并且将其发送给请求者(308)。在一些实现中,报告提供在 URL或域的级别上的广告数据信息。广告主可以查阅报告并且相应地 调整他们的广告活动。例如,广告主可以根据报告结束他们的广告在 特定的URL或域上的置放。在一些实现中,广告主可以手工地修改他 们的活动。在一些其它的实现中,广告主可以创建可以根据包括在报 告内的数据被触发的规则。创建的规则可以根据包含在报告中的数据 来自动地修改广告活动。例如,广告主可以创建指定以下内容的规则 如果如报告中所报告的用于在特定URL的置放的闪现的数目低于指定 量,则完全停止该URL的广告的置放,或修改对该URL的广告空间的 出价。
在一些实现中,定期地执行聚集操作(块302-304)。例如,可以每天一次地聚集用于每个广告主的数据。
在一些实现中,根据Dean和Ghemawat的在Sixth Symposium on Operating System Design and Implementation ( 2004年12月)的 "MapReduce: Simplified Data Processing on Large Clusters"中描述的技 术执行广告数据的处理,其公开的内容通过引用合并在此。
在一些实现中,过程流200和300可以被认为是广告数据聚集过程 的两个阶段。在第一阶段中,对应于过程流200,原始广告数据可以被 聚集为URL/域级别广告数据,并且可以移除指示潜在的垃圾信息或点 击欺诈的数据。在第二阶段中,对应于过程流300, URL/域级别广告 数据被进一步聚集以移除统计上无意义的数据。第一阶段可以被连续 地执行,并且第二阶段可以被定期地执行。
图4图示了示例广告数据报告。报告包括与由广告主置放的一个或 多个广告相关联的数据。例如,对于列在报告中的广告,报告可以显 示广告被置放的URL或域,与广告或置放相关联的地理区域,以及触 发广告闪现的查询。报告可以包括对该置放的点进、闪现以及转化的 计数。在一些实现中,在报告中的对点进、闪现以及转化的计数是用 于预定的时间段,例如三天的跨度。报告可以指示报告的数据可应用 到的时间段。
在图4中图示的示例报告中,呈现了用于广告主"Acme Sports, Inc" 的广告数据。示出的数据是用于由广告ID "123"识别的广告向URL "acme.com/equip"的置放。该置放具有300次闪现、IO次点进以及IO 个转化。该置放被定向到州"CA"和区域"North (北部)"。触发广 告闪现的查询包括"acme.sports"。
应该理解,图4所示的示例报告仅仅是示例性的。广告数据报告可 以包括比示出的数据更多或者更少的数据,并且可以使用替选的报告格式。
图5是图示用于在线广告数据聚集和报告系统的示例系统体系结
构的框图。系统体系结构500包括一个或多个处理器502、 一个或多个 网络或通信接口504、数据库504以及510、管理计算机508、存储器512 以及互连这些组件的数据总线514。
管理计算机508可以包括诸如键盘和鼠标的输入装置以及诸如显 示器(未示出)的输出装置。根据管理计算机508,管理计算机可以管 理聚集和报告系统。
数据库504和510可以分别存储广告参考数据和聚集的广告数据。 广告参考数据包括与广告相关联的各种信息,诸如广告类型,广告被 定向到的关键字等等。可以在由系统生成的报告中将聚集的数据呈现
给广告主o
存储器或计算机可读介质512可以存储用于执行系统功能的操作 系统516,用于通过一个或多个网络和其它计算机或装置进行通信的网 络通信模块518,用于过滤广告数据的广告数据过滤器520 (例如,垃 圾信息过滤器),用于从数据库504检索广告参考数据的广告参考数据 查找引擎522,用于聚集广告数据和向广告数据应用取舍点标准的广告 数据聚集器524,用于接收对广告数据报告的请求、生成这种报告和将 这种报告发送给请求者的广告数据报告引擎526,以及用于存储过滤的 广告数据以备进一步处理的文件系统528。
所公开的及其他实施例以及在本说明书中描述的功能操作可以实 现在数字电子电路中,或实现在计算机软件、固件、或硬件中,包括 在本说明书中公开的结构和他们的结构等价物,或者实现在他们中的 一个或多个的组合中。公开的或其他的实施例可以被实现为一个或多 个计算机程序产品,即用于由数据处理设备执行的或控制数据处理设
14备的操作的编码在计算机可读介质上的计算机程序指令的一个或多个 模块。计算机可读介质可以是机器可读的存储装置、机器可读的存储 基片、存储器设备、实现机器可读的传播信号的物质成分或他们中的 一个或多个的组合。术语"数据处理设备"涵盖用于处理数据的所有 装置、设备以及机器,例如包括可编程处理器、计算机或多处理器或 计算机。除硬件之外,所述设备可以包括创建用于正讨论的计算机程 序的执行环境的代码,例如组成处理器固件、协议栈、数据库管理系 统、操作系统或他们中的一个或多个的组合的代码。传播信号是人工 生成的信号,例如,机器生成的电的、光学或电磁的信号,其被生成 以编码用于传送到适当接收器设备的信息。
计算机程序(也称作程序、软件、软件应用、脚本或代码)可以 以任何形式的编程语言编写,包括编译或解释语言,以及它可以以任 何形式部署,包括作为独立程序或模块、组件、子程序或适合在计算 环境中使用的其它单元。计算机程序没有必要对应于文件系统中的文 件。程序可以被存储在保持其它程序或数据的文件(例如,存储在标 记语言文档中的一个或多个脚本)的一部分、专用于正被讨论的程序 的单个文件或者多个协调文件(例如,存储一个或多个模块、子程序 或部分代码的文件)中。计算机程序可以被部署为在一个计算机上或 者在位于一个地点或跨多个地点分布并且由通信网络互连的多个计算 机上执行。
在本说明书中描述的过程和逻辑流可以由执行一个或多个计算机 程序的一个或多个可编程处理器执行以通过操作输入数据和生成输出 来执行功能。过程和逻辑流还可以通过专用的逻辑电路执行,以及装 置还可以被实现为专用的逻辑电路,专用的逻辑电路例如FPGA (场可
编程门阵列)或ASIC (专用集成电路)。
适合于计算机程序的执行的处理器包括例如通用和专用的微处理 器,以及任何类型的数字计算机的任何一个或多个处理器。通常,处
15理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算 机的主要元件是用于执行指令的处理器和用于存储指令和数据的 一 个 或多个存储设备。通常,计算机还包括用于存储数据的一个或多个海 量储存设备,例如磁盘、磁光盘或光盘,或可操作地耦接到所述一个 或多个海量储存设备以从其接收数据或者向其传输数据,或者其两者。 然而,计算机不必具有这样的设备。适合于存储计算机程序指令和数 据的计算机可读介质包括全部形式的非易失性存储器、媒体和存储设
备,例如包括半导体存储器设备,例如EPROM、 EEPROM和闪存设 备;磁盘,例如内部硬盘或活动盘;磁光盘;以及CD-ROM和DVD-ROM 盘。处理器和存储器可以由专用的逻辑电路补充,或并入专用的逻辑 电路。
为了提供与用户的交互,公开的实施例可以在具有以下的计算机 上实现用于向用户显示信息的显示设备,例如,CRT(阴极射线管) 或LCD (液晶显示)监视器,和用户通过其可以提供输入给计算机的 键盘和指示设备,例如,鼠标或轨迹球。也可以使用其他类型的设备 提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感 反馈,例如视觉反馈、听觉反馈或触觉反馈;以及可以以任何形式, 包括声学的、话语或触觉的输入,接收来自用户的输入。
公开的实施例可以在包括例如数据服务器的后端组件、或包括例 如应用服务器的中间件组件或包括例如具有图形用户界面或用户通过 其可以与在此公开的发明的实施方式交互的Web浏览器的客户端计算 机的前端组件、或这样的后端、中间件、或前端组件中的一个或多个 的组合的计算系统中实现。系统的组件可以通过任何形式或介质的数 字数据通信互连,例如通信网络。通信网络的示例包括局域网("LAN") 和广域网("WAN"),例如因特网。
计算系统可以包括客户端和服务器。客户端和服务器通常彼此远 离并且通常通过通信网络进行交互。客户端和服务器的关系依靠在各自的计算机上运行并且彼此具有客户端-服务器关系的计算机程序产^ 。
尽管本说明书包括许多细节,但是这些细节不应该被看作是对权 利要求或者所要求的范围的限定,而应该看作针对特定实施例的特征 的描述。在本说明书中在分立实施例的上下文中描述的某些特征还可 以在分立实施例的组合中实现。相反地,在分立实施例的上下文中描 述的各种特征还可以分立地在多个实施例中实现或者在任何适当的子 组合中实现。此外,虽然特征可能在上面被描述为在某些组合中起作 用,甚至最初要求这样,但是在一些情况下来自所要求的组合的一个 或多个特征可以从组合中删去并且所要求的组合可以指向子组合或者 子组合的变体。
同样地,虽然在附图中以特定的顺序描述了操作,但是不应该理 解为这样的操作以所示的特定顺序被执行或者以连续的顺序被执行、 或者全部图示的操作要被执行以实现所希望的结果。在某些环境中, 多重任务并且并行处理可以是有利的。此外,在如上所述实施例中的 各种系统组件的分离不应该被理解为在全部实施例中都需要这样的分 离,并且应当理解的是描述的程序组件和系统通常可以被集成到一起 成为单个软件产品或封装为多个软件产品。
因此,己经描述了特定的实施例。其它实施例在所附权利要求的 范围内。
权利要求
1.一种计算机实现的方法,包括收集关于与广告相关联的一个或多个参数的统计数据,包括将所述统计数据过滤到通用资源定位符(URL)或域的级别;以及将所述统计数据传送给广告主。
2. 根据权利要求l所述的方法,其中所述一个或多个参数包括点进、闪现或转化中的至少一个。
3. 根据权利要求l所述的方法,其中收集统计数据进一步包括过 滤所述统计数据以移除垃圾信息。
4. 根据权利要求l所述的方法,其中收集统计数据进一步包括用 与所述广告相关联的参考信息充实所述统计数据。
5. —种计算机可读介质,在所述计算机可读介质上存储有指令,所述指令在被处理器执行时,使得所述处理器执行以下操作收集关于与广告相关联的一个或多个参数的统计数据,包括将所述统计数据过滤到通用资源定位符(URL)或域的级别;以及将所述统计数据传送给广告主。
6. —种系统,包括 一个或多个处理器;以及一个或多个指令集,当所述一个或多个指令集被所述一个或多个处理器执行时,使得所述一个或多个处理器执行以下操作收集关于与广告相关联的一个或多个参数的统计数据,包括将所述统计数据过滤到通用资源定位符(URL)或域的级别;以及将所述统计数据传送给广告主。
7. —种系统,包括用于收集关于与广告相关联的一个或多个参数的统计数据的装置,包括用于将所述统计数据过滤到通用资源定位符(URL)或域的 级别的装置;以及用于将所述统计数据传送给广告主的装置。
8. —种计算机实现的方法,包括聚集关于与广告相关联的一个或多个参数的统计数据; 评估所述统计数据,包括向所述统计数据应用过滤;以及 将所过滤的统计数据传送给广告主。
9. 根据权利要求8所述的方法,其中所述一个或多个参数包括点 迸、闪现或转化中的至少一个。
10. 根据权利要求8所述的方法,其中聚集统计数据包括连续地聚 集关于与广告相关联的一个或多个参数的统计数据。
11. 根据权利要求8所述的方法,其中评估所述统计数据包括定期 地评估所述统计数据。
12. 根据权利要求8所述的方法,其中定期地评估所述统计数据包 括以大于与所述聚集相关联的频率的频率定期地评估所述统计数据。
13. 根据权利要求8所述的方法,其中应用所述过滤包括将一个或 多个阈值应用于所述统计数据。
14. 根据权利要求13所述的方法,其中所述一个或多个阈值包括 点进的数目、闪现的数目或转化的数目中的至少一个。
15. 根据权利要求8所述的方法,其中聚集所述统计数据包括聚集原始统计数据的样本子集。
16. 根据权利要求8所述的方法,其中聚集所述统计数据包括将所述统计数据过滤到URL或域的级别。
17. 根据权利要求8所述的方法,其中聚集所述统计数据包括检索 与所述广告相关联的信息以及将所述信息附加到所过滤的统计数据。
18. —种计算机可读介质,在所述计算机可读介质上存储有指令,当所述指令被处理器执行时,使得所述处理器执行以下操作聚集关于与广告相关联的一个或多个参数的统计数据;评估所述统计数据,包括向所述统计数据应用过滤;以及 将所过滤的统计数据传送给广告主。
19. 一种系统,包括 一个或多个处理器;以及一个或多个指令集,当所述一个或多个指令集被所述一个或多个 处理器执行时,使得所述一个或多个处理器执行以下操作聚集关于与广告相关联的一个或多个参数的统计数据; 评估所述统计数据,包括向所述统计数据应用过滤;以及 将所过滤的统计数据传送给广告主。
20. —种系统,包括用于聚集关于与广告相关联的一个或多个参数的统计数据的装置;用于评估所述统计数据的装置,包括用于向所述统计数据应用过 滤的装置;以及用于将所过滤的统计数据传送给广告主的装置。
21. —种计算机实现的方法,包括接收包括与广告活动中的广告置放相关联的统计数据的报告,所 述统计数据被过滤到URL或域的级别;以及 根据所述报告修改所述广告活动。
22. 根据权利要求21所述的方法,进一步包括,在接收所述报告以前,请求所述报告。
23. 根据权利要求21所述的方法,其中修改所述广告活动包括取 消到一个或多个URL或域的广告置放。
24. 根据权利要求21所述的方法,进一步包括提供一个或多个输 入,所述一个或多个输入包括应用到所述统计数据的阈值。
25. 根据权利要求21所述的方法,进一步包括针对所述统计数据 提供URL或域的优选。
26. —种计算机可读介质,在所述计算机可读介质上存储有指令, 当所述指令被处理器执行时,使得所述处理器执行以下操作接收包括与广告活动中的广告置放相关联的统计数据的报告,所 述统计数据被过滤到URL或域的级别;以及根据所述报告修改所述广告活动。
27. —种系统,包括 一个或多个处理器;以及一个或多个指令集,当所述一个或多个指令集被所述一个或多个 处理器执行时,使得所述一个或多个处理器执行以下操作接收包括与广告活动中的广告置放相关联的统计数据的报告,所述统计数据被过滤到URL或域的级别;以及根据所述报告修改所述广告活动。
28. —种系统,包括用于接收包括与广告活动中的广告置放相关联的统计数据的报告 的装置,所述统计数据被过滤到URL或域的级别;以及用于根据所述报告修改所述广告活动的装置。
全文摘要
可以收集关于与广告相关联的一个或多个参数的统计数据。可以将统计数据过滤到通用资源定位符(URL)或域的级别。统计数据可以被聚集和评估,包括向所述统计数据应用过滤。可以将过滤的数据传送给广告主。所述广告主可以在报告中接收所述过滤的数据并且根据所述报告修改他们的广告活动。
文档编号G06Q30/00GK101583964SQ200780049986
公开日2009年11月18日 申请日期2007年11月20日 优先权日2006年11月20日
发明者颜伟鹏 申请人:谷歌公司