本申请是申请日为2009年2月23日、申请号为200980108724.5、申请人为埃克斯凯利博ip有限责任公司、发明名称为“使用用户行为历史来个性化赞助搜索广告布局”的发明专利申请的分案申请。
本发明涉及个性化被显示在搜索引擎的结果页面上的广告的布局。
背景技术:
如何平衡搜索结果页面(srp)的货币化和用户体验是在有机(称为算法的或自然的(native))搜索结果旁边提供赞助列表(基于文本的广告以及潜在的图形广告)的商业搜索引擎中活跃的研究领域。若干主导的商业搜索引擎通常连同有机结果在搜索结果页面的三个位置中的任意位置上显示赞助列表。这三个位置被标为北部、东部和南部,(分别)位于搜索结果页面的上部、右侧和底部。
眼球追踪研究已经将搜索结果页面上的地理区域识别为用户的焦点或“热点”。这些区域是当用户被最初呈现填充了有关搜索内容的html页面时,获得比普通量的视觉关注更多的视觉关注的区域。这些热点之一在页面的上部中心,这是人的眼球往往在处理文档的其余部分之前关注的地方。北部区域通常是广告横幅的位置,并且因此其在什么内容应当放置在那个位置处这一方面博得额外的关注。
北部区域通常是搜索引擎的主要收益源,这主要由赞助列表从用户接收到的额外视觉关注产生,额外视觉关注直接转变为这些广告的额外的鼠标点击。许多搜索销售商业模型基于cpc(点击付费),这样鼠标点击直接转变成收益。
然而,北部区域也可能是负面的用户体验的主要贡献者。北部的赞助列表的数目越高,如果广告被用户视为无关,则用户体验很有可能越负面。负面的用户体验可以通过以下方式来测量:明示地调查用户来测定他们的满意度,或者隐含地使用查询放弃率、首次点击时间、用户返回率以及若干其它代用度量。
目前用于确定广告布局、每个可用位置中的列表数的方法使用基于查询的特征,例如,查询中的字、对查询出价的广告商的数目、查询文本与广告描述之间的匹配量等等。尽管基于查询的方法解决了基本问题,但是它们并没有考虑发起该查询的用户。
技术实现要素:
在一个方面中,本发明的实施例涉及一种向用户呈现个性化搜索结果页面的方法。例如,一种向搜索引擎的用户呈现这样的页面的方法包括以下步骤。首先,基于用户与搜索引擎的交互的时间分布来计算用户的参与指数。然后,如果用户的参与指数满足阈值,则响应于用户的查询,向该用户呈现个性化搜索结果页面。
在另一个方面中,实施例涉及搜索引擎系统。例如,被配置为向搜索引擎的用户呈现个性化搜索结果的系统包括网络搜索客户端和网络搜索服务器。该网络搜索客户端在计算机可读介质中被实现,被配置为从用户接收查询并且将查询传递给网络搜索服务器。该网络搜索服务器在计算机可读介质中被实现,被配置为基于用户的已知的与搜索引擎的交互的时间分布来计算用户的参与指数,并且响应于查询来生成搜索结果页面并且将其传递给网络搜索客户端用于显示,其中,如果用户的参与指数满足阈值,则该搜索结果页面被个性化。
在另一个方面中,本发明的实施例涉及网络搜索服务器。例如,计算机可读介质中所实现的并被配置为个性化搜索引擎的网络搜索结果页面的布局的网络搜索服务器包括个性化模块。个性化模块被配置为接收有关用户与搜索引擎的交互的用户行为数据并且基于用户行为数据的某些来确定用户的参与指数。该模块还被配置为响应于用户的查询来生成具有广告布局的搜索结果页面。其中,该广告布局是以下情形之一:1)当用户的参与指数满足参与阈值时,基于用户行为数据;和2)当用户的参与指数不满足参与阈值时,不基于用户行为数据。
在另一个方面中,本发明的某些实施例涉及个性化在搜索结果页面上出现的广告的布局的计算机实现的方法。例如,一种个性化搜索引擎的结果页面的广告布局的方法包括以下步骤:搜索有关用户与搜索引擎的交互的用户行为数据,基于用户行为数据中的某些来确定用户的参与指数,并且响应于用户的查询来向用户呈现具有广告布局的搜索结果页面。其中,该广告布局是以下情形之一:1)当用户的参与指数满足参与阈值时,基于用户行为数据;和2)当用户的参与指数不满足参与阈值时,不基于用户行为数据。优选地,用户行为数据包括与用户在搜索引擎上或在受搜索引擎提供商控制的其它网络属性上的动作有关的数据。
在另一个方面中,个性化搜索引擎的网络搜索结果的广告布局的计算机实现的方法采用用户兴趣数据。例如,一种方法,包括以下步骤:收集用户兴趣数据;确定用户的参与指数;并且响应于用户的查询来向用户呈现具有广告布局的搜索结果页面。其中,该广告布局是以下情形之一:1)当用户的参与指数满足参与阈值时,基于用户行为数据;和2)当用户的参与指数不满足参与阈值时,不基于用户行为数据。优选地,用户兴趣数据包括与从以下内容获得的用户兴趣有关的数据:1)诸如调查或账户注册表之类的明示源,或2)诸如各种网络属性之间的时间分配的隐含源。
在另一个方面中,一种个性化搜索引擎的网络搜索结果页面的布局的计算机实现的方法采用用户特征数据。例如,一种方法,包括以下步骤:收集用户特征数据;确定用户的参与指数;并且响应于用户的查询来向用户呈现具有广告布局的搜索结果页面。其中,该广告布局是以下情形之一:1)当用户的参与指数满足参与阈值时,基于用户行为数据;和2)当用户的参与指数不满足参与阈值时,不基于用户行为数据。优选地,用户特征数据包括以下类型的数据之一:人口统计学数据和社会数据。优选地,用户特征数据包括与从以下之一得到的用户的特定人口统计学、社会经济学和地理特征:1)明示声明,或2)推断。
附图说明
图1是典型商业搜索引擎的示例性主页,其包括使得用户可以输入搜索查询的搜索文本框。
图2是商业搜索引擎的示例性搜索页面,其包括在页面的不同位置的算术搜索结果和广告。
图3是被分成典型的算术和广告区域的搜索结果页面的示图。
图4是概述包括与本发明一致的个性化引擎的产生搜索结果页面所需要的后端处理步骤的示图。
图5是概述与本发明一致的个性化引擎内采取的处理步骤的示图。
具体实施方式
搜索引擎
用户界面
互联网用户熟悉典型的商业搜索引擎。如图1中所示,商业搜索引擎的典型主页——与搜索引擎的用户交互的起始点,包括文本输入框和查询提交按钮。在图1中,用户在文本输入框中输入了“pizza”(披萨)。查询提交按钮被标记为“search”(搜索)。
图2图示出由商业搜索引擎响应于图1中的查询“pizza”返回的示例性搜索结果页面(srp)。该页面的右列包括广告。该页面的左列包括广告和算法搜索结果(algorithmicsearchresult)。
图3图示出srp的典型布置,其被分成4个区域。这些区域被布置在两列中,反映出图2。左列包含三个区域:最上面的北部区域、中间的算法区域和下部的南部区域。右列包含一个区域,即东部区域。
在由图2和图3示出的典型srp中,与被返回其srp的搜索查询相关联的广告被显示在北部、东部和南部区域中,而查询本身的结果被显示在算法区域中。然而,在目前成功的商业搜索引擎中,不是所有的srp都在北部、南部和东部区域的每一个区域中包括广告。通常,当不在北部区域中示出广告时,算法区域包含北部区域的区域。然而,当不在东部区域中示出广告时,该区域通常留作空白。
后端
图3示出响应于搜索查询生成srp的典型搜索引擎工作流。查询首先被预处理;典型的预处理操作包括过滤、消毒(sanitization)、填充(stemming)、停用词去除和规范格式转换。预处理查询被提供给两个分别的子处理流水线。第一流水线按照与预处理后的查询的关联度的顺序排序通常用万维网上的url或uri参考的所有网络内容。该排序形成针对查询设置的算法搜索结果。第二流水线也按照与预处理后的查询的关联度来排序所有的要么基于文本要么基于图形的广告。响应于查询所递送的srp利用这两个排序:广告的排序和算法结果的排序。通常,srp构建包括合并两个排序并且包括用于确定页面上广告的布局的默认子处理。通常,这些排序确定布局内广告的放置。尽管这样的广告布局算法可以以不同方式用公式表述广告放置,但是它们使用查询和各个广告级特征来确定放置。因此,发起相同查询的每个用户被呈现相同的srp布局。
个性化
搜索引擎用户包括广大范围的点击行为,从主要对算法结果感兴趣并且几乎不点击付费广告的理智的信息搜索者到对赞助列表感兴趣得多的重度网络购物者。在生成srp时反映用户的这种多样性是有益的。
与该目标相一致,图3中描绘的后端系统包括与本发明一致的个性化引擎。如图所示,个性化引擎接收有关历史用户行为的数据。个性化引擎利用用户行为数据来改进针对用户发布的每个查询的srp广告布局。
用户识别
本发明的实施例考虑各种用户识别方案。在某些实施例中,用户经由搜索引擎所提供的基于浏览器的cookie来识别。在某些实施例中,用户利用搜索引擎提供商经由与用户的账户相关联的cookie来识别。在某些实施例中,用户经由与受搜索引擎提供商控制的另一属性相关联的cookie来识别。
参与(engagement)
本发明的实施例包括用于在给定具体用户的(已知的)过去行为的情况下测定该用户利用搜索引擎进行参与的水平的方法。由于浏览器cookie的即时特性以及cookie在浏览器存储器和盘中比较短的寿命的缘故,这样的方法是有益的。因此,实施例计算参与指数,参与指数在计算基于历史用户数据的预测用户行为的置信水平时使用。
本发明的各实施例使用各种度量来计算参与指数。优选地,参与指数基于与搜索引擎的用户交互的时间分布。最优选地,参与指数由至少以下统计数据形成:用户访问搜索引擎网站的频率;用户访问的新近度,例如在最后一次观察到用户访问该网站的时间;搜索引擎网站上的用户行为的强度。以上统计数据可以根据参与指数计算的函数形式以任意合适的单位测量,然而,优选地,频率以每一天测量,新近度以天测量并且强度以页面浏览测量。可以考虑以上统计数据以外的其它统计数据。例如,表示用户访问在时间上的分布的统计数据可以替代频率和新近度统计数据。
某些实施例中所使用的参与指数(ei)的公式如下:ei=频率*强度/新近度。在可替换实施例中,ei公式的变形包括与从其它源收集的用户行为的知识的组合的上述强度、频率和新近度变量中的一个或多个。例如,有关受搜索引擎提供商控制的各种非搜索属性的参与,例如,金融、汽车、运动。
优选地,高ei得分表示(a)将来返回该网页的高可能性,(b)将来在该网站上的高活跃水平或(c)在用于预测点击广告可能性的计算中的高置信水平。相反,低ei得分表示(a)返回该网页的低可能性,(b)将来在该网站上的低活跃水平或(c)在用于预测点击广告的可能性的计算中的低置信水平。
在某些实施例中,ei用来确定可以被有效地执行个性化的用户的子集。优选地,针对所有用户计算ei,并且ei在阈值以上的用户被视为充分参与网站而执行个性化。
在本发明的某些实施例中,如果用户被识别为非个性化候选人,则个性化引擎不会做任何事情并且仅向用户发表在流水线中没有个性化引擎的情况下本应该看到的搜索结果页面。
个性化srp广告布局
个性化操作
个性化引擎为被视为个性化候选人的用户执行个性化操作。存在各种可能的个性化操作。例如,在某些实施例中,布局的个性化包括在增加广告区域之一(例如,北部、南部或东部)中示出的广告数并且减少另一广告区域中示出的广告数的同时在页面上维护许多广告。在某些实施例中,个性化包括在增大一个广告区域中所示出的广告数并且减小另一广告区域中所示出的广告数的同时增大页面上的广告数。
优选地,个性化操作集中于北部广告区域,该区域常常被认为是srp上最有价值的广告区域。例如,集中于北部区域的某些实施例在减少北部区域中所示出的广告数的同时在srp上维护许多广告,而某些实施例增大北部区域中所示出的广告数。增大页面上所示出的广告数的实施例类似地增大或减少北部区域中所示出的广告数。减少页面上所示出的广告数的另一些实施例也可以增大或减少北部区域中所示出的广告数。当然,也可以构想到集中于其它区域的个性化操作。
个性化工作流
图5图示出与某些实施例一致的个性化工作流。首先,针对所有用户计算参与指数(ei)。这些用户之后基于ei被划分到参与用户和非参与用户中。然后,参与用户基于一组分组参数被分到用户群组中。然后,群组连同描述群组的群组元数据和分组参数一起被提供给布局处理。布局处理还接收广告排序集合和算法排序集合,并且之后针对每个群组构建srp。每个srp上的广告布局基于群组元数据。每个布局中的广告和结果包括从两个排序集合中提取的算法结果。
应当注意,针对某些群组生成的个性化的srp可以与针对非参与用户生成的未个性化的srp等同。
个性化
个性化目标
在与本发明实施例一致的个性化方法内如何定义成功的问题是困难的。不是所有的实施例都需要解决该问题。然而,优选地,本发明的实施例包括要么暗示的或要么明确的成功测量。例如,某些实施例包括尝试优化所生成的收益的特征。另一个更难以捉摸的度量是用户体验。某些实施例尝试通过在没有预期收益增加时减小用于广告的区域来改善用户体验。
针对用户群组的个性化
在某些实施例中,基于用户群组的聚合用户行为来针对用户群组执行广告布局的个性化。通过检查在赞助广告列表上的历史点进率(click-throughrate,ctr),候选用户被分类为“重度”、“轻度”或“平均水平”点击者。用户的点进率是用户将在赞助列表上进行的预期点击数,其独立于实际的搜索查询并且独立于赞助列表的特性。以下示出ctr的一个公式。在以下公式中,优选针对充分长的时间(通常为数周)来合计变量:
用户ctr=(点击数)/(至少示出一个广告的搜索数)
对于被识别为“平均水平”点击者的用户,不进行任何广告布局改变。此外,所有非个性化候选人(即,ei得分低于指定阈值的用户)也被有效地视为“平均水平”点击者并且对他们不进行任何广告布局改变。
对于重度点击者和轻度点击者,广告布局优选被如下所述地更改。对于被识别为重度点击者的用户,广告布局被修改使得针对查询子集可以在北部区域(或其它主要位置)中示出不同数目的广告。如果广告布局算法确定应当在北部(或其它主要位置)中示出n个广告,并且如果个性化引擎估计将附加广告移动到北部的预期收益(对于该用户)在某一阈值以上,则其修改该布局使得n+α个广告被显示在北部中,其中,α是正整数。优选地,附加的α个广告在预期收益方面最有价值,它们原本应当不同地在东部(或其它不那么主要的位置)示出。如果广告布局算法已经确定在北部(或其它主要位置)中将示出最大允许数目的广告,则个性化引擎将不会做任何事情。
对于被识别为轻度点击者的用户,广告布局被修改使得针对查的子集可以在在北部区域(或其它主要位置)中示出不同数目的广告。如果广告布局算法确定应当在北部(或其它主要位置)中示出n个广告,并且如果个性化引擎估计将附加广告移出北部的预期收益影响(对于该用户)低于某一阈值,则个性化引擎更改该布局使得在北部中显示n-β个广告,其中,β是正整数。北部中示出的β个广告要么被重新定位于不那么主要的广告位置中要么被从显示中移除。如果广告布局算法已经确定在北部(或其它主要位置)应不示出广告,则个性化引擎将不做任何事情。
对于上述方法,用于将广告移动到北部(或其它主要位置)中的阈值优选用商业约束来确定,商业约束指示用于对任意网站属性进行广告的区域。查询-广告对的独立于用户的预期收益的计算通常可以分解为以下等式:
预期(收益|查询,广告)=费用(广告)*概率(点击广告|查询,广告)
在本发明中没有描述在给定查询-广告对的情况下估计点击广告的概率的问题,因为存在完成计算的若干种方式。广告的费用通常是由搜索引擎和广告商协商的已知值。
在本发明的该实施例中,个性化引擎通过调节以上等式中的“概率(点击广告|查询,广告)”这一项来细化查询-广告对的预期收益估计。该细化可以以若干方式进行。以下是通过修改用户点击广告的概率这一项来反映预期收益计算中的变化的某些示例性方式。
反映更改后的概率的一种方式是增加预定实数值γ。例如,
预期(收益|查询,广告)=费用(广告)*(γ+概率(点击广告|查询,广告))
反映更变后的概率的另一种方式是乘以用户的历史ctr和所有用户的平均ctr的恰当计算的数学函数。一个这样的函数是:δ*(用户的历史ctr)/(所有用户的平均ctr),其中δ是预定常量。保持该公式的精神的该函数的各种其它修改和更改也与本发明一致。
另一些方式包括:开发(使用回归、分类或聚合)预测点击概率的机器学习模型,其使用历史用户ctr率以及优选地从查询和广告级特征得到的独立于用户的点击概率。
点击广告的概率的修改值(以及预期收益)可以用来设置上述方法中概述的阈值。
每个用户的个性化
在本发明的某些实施例中,例如用参与指数确定为个性化目标的用户不是被分到例如“平均水平”、“轻度”或“重度”点击者的群组中。不是例如经由查询和广告级特征计算出并且由个性化引擎如上所述地调节的点击广告的概率,而是预期收益被直接用来确定在主要位置中示出的广告。例如,主要广告地点被给与“定价”,并且只要预期收益在某一最小值以上,广告就可以置于该位置中。优选地,定价阈值被计算出使得可以精确地满足广告位置的商业目标足印(footprint)。这样的足印的一个示例是这样的规则:最多y%的搜索结果页面将在北部区域中具有x个广告。
附加细节和增强
在本发明的某些实施例中,个性化引擎除了可以执行之前描述的方法以外,还可以执行另外的个性化操作。此外,本发明的某些实施例包括附加实现细节。
增强
例如,如果用户点击赞助搜索的概率低,则某些实施例减少在页面上示出的广告的总数。整个页面的广告深度将被减小使得最没什么价值的广告——通常是在最不显眼的广告位置处的最低链接不被显示在搜索结果页面上。所示出(过滤后)的广告数可以使用有关点击广告的个性化概率的阈值来确定。可替换地,如果用户点击广告的概率高,则页面上示出的广告数可以被增大,如果有足够的广告目录和足够的值,例如预期收益的话。
某些实施例基于在给定查询的类别的情况下点击查询的预期概率来修改广告布局。例如,某些用户示出不同的倾向,例如,对分类法中的各种类别(例如,运动、电影、汽车)的广告的历史点进率。如果这样的用户发起被识别为术语分类法上特定节点的查询,则点击广告的概率可以通过使用类别级点进率来更精确地调节。广告布局被修改的方式可以与以上方法中概述的方式完全相同。
在这样的基于类别的方法中,用户对具体类别的广告的兴趣水平不必被限制为用户在搜索引擎页面上的历史行为。这可以从有关网络的其它属性(例如,金融、汽车或其它交通工具)的用户行为中推断。如果通过对某种类别的广告的广告点进率或用在类别网站上花费的时间推断出用户对某些类别的广告有高的兴趣水平,则这可以用来更新有关搜索广告的估计点击概率。例如,如果用户花费比平均时间量更多的时间来浏览房地产网页,则他们更有可能点击有关住房抵押的赞助搜索广告。点击概率中的该变化也可以通过观察历史的用户行为来量化。
此外,某些实施例鉴于间接地点击特定类别的赞助搜索广告的概率来推断用户的兴趣水平。例如,如果用户对汽车示出高的兴趣水平,则他们也有可能对贷款感兴趣。如果他们购买桌面型计算机,则他们也可能对监视器的广告感兴趣。
另外,某些实施例从人口统计学数据来推断用户点击各种广告的概率。年龄、性别和其它度量被用来推断用户有多可能点击某种类别的广告。例如,青少年将更有可能点击音乐相关的产品的赞助搜索广告,或者,男性比女性更有可能点击生发产品的广告。当用户账户已经关联了人口统计学数据,则这样的方法就是可以的。这样的方法可以与以上概述的增强结合。
某些实施例还使用社会网络和用户是某个社团的成员来推断点击各种类型的广告的概率。用户在社会网络中的成员级别以及追随社会网络内所识别的购买模式的概率可以以若干方式测量。例如,如果网络的若干成员购买音乐会门票,则该网络的其余成员在数量上比随机的互联网用户更有可能购买音乐会门票。在某些实施例中,这样的测量也可以用来调节用户将点击某种类型的广告的概率。
另外,某些实施例基于用户的地理位置来修改广告布局。基于地理位置的锁定常常被用来利用本地广告锁定用户。用户点击本地级广告与点击国家级广告有不同的概率,这可以被测量并被用来更新有关搜索广告的估计点击概率。
附加细节
在某些实施例中,参与指数还基于从与非搜索属性的用户交互的分布中推断出的用户兴趣数据。优选地,非搜索属性包括以下内容之一:汽车、金融和运动。
在某些实施例中,预期基于用户行为数据的广告布局相对于未基于用户行为数据的广告布局生成额外的收益。在某些实施例中,基于用户行为数据的广告布局相对于未基于用户行为数据的广告布局,通过减少搜索结果页面中所示出的广告数来改善用户体验。更优选地,本发明的实施例通过基于用户行为模式来向用户提供广告布局来增大平均收益并且同时改善所有用户的平均用户体验。
在某些实施例中,广告布局被修改的方面是搜索结果页面中有可能的广告位置中的每一个广告位置中示出的广告数。在某些实施例中,广告布局被修改的方面是在搜索结果页面的主要广告位置中示出的广告数。优选地,主要广告位置是搜索结果页面的北部广告区间。
在某些实施例中,用户行为数据包括结合赞助列表的内容和位置,用户已经对赞助列表执行的点击数据,以及返回用户浏览器的页面数量。
在某些实施例中,如果用户的参与指数满足参与阈值,则用户基于用户行为数据被分类为:重度点击者、平均水平点击者和轻度点击者。优选地,相同类中的用户被呈现相同的广告布局。
在某些实施例中,呈现给参考指数满足参考阈值的广告布局基于用户的历史点进率(crt)。例如,在某些实施例中,历史的用户点进率(crt)被用作在给定查询和用户的情况下用来增大、减小或保持有关广告的预期收益的比例因子。另外,在某些实施例中,历史的用户点进率(crt)被用作在给定查询和用户以及从查询和匹配的广告得到的其它因子的情况下对有关广告的预期收益进行建模的因子。
某些实施例还包括收集用户的兴趣数据,并且其中,当用户的参与指数满足参与阈值时,广告布局也基于所收集的用户兴趣数据。
某些实施例还包括收集用户特征数据,其中当用户的参与指数满足参与阈值时,广告布局也基于所收集的用户特征数据。
在某些实施例中,参与指数基于用户过去与搜索引擎的交互的时间分布。优选地,参与指数基于用户访问搜索引擎的新近度、强度和频率。
尽管已经关于具体示例性实施例描述了本发明,但是将了解,本领域技术人员可以在不偏离本发明的精神和范围的情况下进行各种修改和改变。本发明的范围不限于所述示例性实施例并且通过检查权利要求来限定。