识别活动中缺少的语言的制作方法
【专利摘要】一种技术,包括:确定第一万维网页是否包括第一语言的内容,其中,第一万维网页是与内容赞助者的广告活动相关联的登陆页;确定第二万维网页是否包括不同的第二语言的该内容,其中,第二万维网页不是广告活动中的登陆页;为做出用于扩展广告活动以包括第二万维网页的推荐,对一个或更多标准进行评估;至少部分地基于该评估来识别用于扩展广告活动以包括第二万维网页的推荐。
【专利说明】识别活动中缺少的语言
[0001]相关申请的交叉引用
[0002]本申请要求2011年6月2日提交的临时申请61/492,600号的优先权,其全部内容通过引用合并于此。
【技术领域】
[0003]本说明书涉及信息呈现。
【背景技术】
[0004]互联网提供对各种各样的资源的访问。例如,通过互联网可以访问视频和/或音频文件以及特定主题或特定新闻文章的万维网页。对这些资源的访问呈现使用这些资源来提供内容的机会。例如,万维网页可以包括在该万维网页中定义的或使用万维网页呈现的广告槽位(slot),在广告槽位中可以呈现广告。在一些情况下,广告商跨多种语言提供他们的资源,但不具有与每种单独语言的资源相关联的广告活动。
【发明内容】
[0005]本说明书描述与识别广告活动中缺少的语言有关的技术。
[0006]通常,本说明书中所描述的主题的一个方面可以用以下技术来实施,该技术包括:确定包括第一语言的内容的第一万维网页,其中,第一万维网页是与内容赞助者的广告活动相关联的登陆页;确定包括不同的第二语言的该内容的第二万维网页,其中,第二万维网页不是该广告活动中的登陆页;为了做出用于扩展广告活动以包括第二万维网页的推荐,使用一个或更多处理器对一个或更多标准进行评估;以及至少部分地基于该评估来识别用于扩展广告活动以包括第二万维网页的推荐。
[0007]另一方面,工具包括一个或更多处理器以及存储器,它们被配置为进行交互以执行操作,该操作包括:确定包括第一语言的内容的第一万维网页,其中,第一万维网页是与内容赞助者的广告活动相关联的登陆页;确定包括不同的第二语言的该内容的第二万维网页,其中,第二万维网页不是该广告活动中的登陆页;为了做出用于扩展广告活动以包括第二万维网页的推荐,使用一个或更多处理器对一个或更多标准进行评估;以及至少部分地基于该评估来识别用于扩展广告活动以包括第二万维网页的推荐。
[0008]另一方面,本说明书中所描述的主题涉及指令,这些指令被编码在计算机可读介质上,这些指令在被执行时使数据处理设备执行操作,该操作包括:确定包括第一语言的内容的第一万维网页,其中,第一万维网页是与内容赞助者的广告活动相关联的登陆页;确定包括不同的第二语言的该内容的第二万维网页,其中,第二万维网页不是该广告活动中的登陆页;为了做出用于扩展广告活动以包括第二万维网页的推荐,使用一个或更多处理器对一个或更多标准进行评估;以及至少部分地基于该评估来识别用于扩展广告活动以包括第二万维网页的推荐。
[0009]可选地,这些实施例和其它实施例可以包括下面的特征中的一个或更多。例如,标准选自与第一万维网页的执行或广告活动的执行有关的标准。
[0010]在一些实现中,确定第一万维网页和第二万维网页包括识别被翻译的文档对。每个被翻译的文档对可以包括包含一种语言的内容的第一文档和包含不同语言的该内容的第二文档。识别被翻译的文档对可以包括基于该内容对被翻译的文档的集合进行过滤以提供被翻译的文档对。可替代地或另外,对被翻译的文档的集合进行过滤还可以基于与该内容相关联的一个或更多域。可替代地或另外,对被翻译的文档对的集合进行过滤还可以基于实体在广告该内容方面的花费等级。可替代地或另外,对被翻译的文档对的集合进行过滤可以基于与该内容相关联的用户交互数据。
[0011]在一些实现中,识别被翻译的文档对可以包括基于与内容赞助者相关联的客户标识对被翻译的文档对的集合进行过滤以提供被翻译的文档对。可替代地或另外,识别被翻译的文档对包括可以基于与内容赞助者相关联的一个或更多域来对被翻译的文档对的集合进行过滤以提供被翻译的文档对。一个或更多域可以包括与内容赞助者相关联的一个或更多URL。
[0012]另一方面,一种技术包括:确定包括第一语言的内容的第一内容项目,其中,该内容项目包括与实体相关联的登陆页;确定包括不同的第二语言的该内容的第二不同内容项目,其中,第二内容项目不包括与该实体相关联的登陆页;为了做出用于包括第二不同内容项目作为登陆页的推荐,对一个或更多标准进行评估;以及基于该评估来识别用于包括第二不同内容项目的推荐。
[0013]另一方面,本说明书中所描述的主题涉及一种计算机实现的技术,该技术包括:接收万维网页对的集合,每对包括包含第一语言的公共内容的第一万维网页并且包括包含第二不同语言的该公共内容的第二万维网页,每对中的至少一个万维网页对应于来自源万维网页的翻译;对万维网页对的集合进行过滤以识别与内容赞助者相关联的一个或更多对;确定所识别的对中的第一万维网页是与内容赞助者的广告活动相关联的广告的登陆页;确定所识别的对中的第二万维网页不是广告活动中的登陆页;为了做出用于扩展广告活动以包括第二万维网页的推荐,对一个或更多标准进行评估;以及至少部分地基于该评估来提供用于扩展广告活动以包括第二万维网页的推荐。
[0014]在一些实现中,对一个或更多标准进行评估包括对第一万维网页的执行进行评估。
[0015]在一些实现中,对一个或更多标准进行评估包括对广告活动的执行进行评估。
[0016]在一些实现中,对一个或更多标准进行评估包括对与内容赞助者相关联的被翻译的万维网页的量进行评估。
[0017]在一些实现中,对一个或更多标准进行评估包括对与内容赞助者相关联的广告融资活动的等级进行评估。
[0018]在一些实现中,确定所识别的对中的第二不同万维网页不是广告活动中的登陆页包括:交叉核对第二万维网页的地址与合并到广告活动的一个或更多广告中的万维网页链接的地址,或交叉核对第二万维网页与包含与广告活动相关联的登陆页的网站。
[0019]附图和下面的说明书中阐述了一个或更多实施例的细节。根据说明书、附图和权利要求,其它特征和优点将明显。【专利附图】
【附图说明】
[0020]图1A是其中广告管理工具管理广告服务的示例环境100的框图。
[0021]图1B是示例万维网页的框图。
[0022]图2是用于识别广告商当前不用其登广告的语言的示例例程200的流程图。
[0023]图3是用于识别包含相同内容的万维网页的示例例程300的流程图。
[0024]图4是示例计算机工具的图。
【具体实施方式】
[0025]一般地,本说明书中所描述的主题的一个方面涉及一种识别在线内容的计算机实现的技术,对于该在线内容可能期望将内容(例如,广告)活动扩展为一种或更多种不同语言。所公开的技术可以包括例如获取或提供被翻译的万维网页对的集合,以及从该集合中识别出与特定内容赞助者(例如,广告商)相关联的许多被翻译的万维网页以及这些万维网页被翻译的语言。然后,被翻译的万维网页被针对驻留(host)内容活动的登陆页的网站而交叉引用。基于交叉引用的结果,识别内容赞助者当前未参与的一种或更多种语言。则,可以向内容赞助者提供以一种或更多种识别的语言提供内容的建议。
[0026]图1是其中内容管理工具110 (例如,互联网广告管理工具)管理内容传送服务的示例环境100的框图。环境100包括网络102,诸如局域网(LAN)、广域网(WAN)、互联网或其组合。网络102连接网站104a至140c、设备106、内容管理工具110和广告商108。内容管理工具110包括语言识别引擎120、内容数据库130和相互翻译文档对数据库140。尽管被示出为单个工具110的一部分,但是语言识别引擎120、内容数据库130和相互翻译文档对数据库140中的每一个可以包括作为单独独立的工具的数据处理设备。
[0027]网站104可以包括与域名相关联并且由一个或更多个服务器驻留的一个或更多资源105。示例网站可以包括用超文本标记语言(HTML)格式化的万维网页的集合,其包含文本、图像、多媒体内容和/或诸如脚本的编程元素。每个网站104a至104c可以由发行人/内容提供者来维护,发行人/内容提供者包括控制、管理和/或拥有相应网站104的实体。
[0028]资源105包括可以通过网络102提供的任意合适的数据。资源105由与资源105相关联的资源地址来标识。资源包括诸如HTML页、字处理文档和可移植文档格式(PDF)文档的万维网页、图像、视频和feed源等。资源可以包括内容,诸如字、短语、图像和声音,内容可以包括嵌入的信息(诸如超链接中的元信息)和/或嵌入的指令(诸如JavaScript脚本)。
[0029]用户设备106包括处于用户的控制下并且能够通过网络102请求和接收资源的电子设备。示例用户设备106包括个人计算机、移动通信设备以及可以通过网络102发送和接收数据的其它设备。用户设备106通常包括用户应用,诸如网络浏览器,以有助于通过网络102发送和接收数据并且用于查看网络资源105以及与网络资源105交互。
[0030]用户设备可以从网站104中请求资源105。反过来,呈现资源105的数据可以被提供至用户设备106以由用户设备106来呈现。呈现资源105的数据还可以包括指定资源的一部分或可以呈现内容(例如,广告)的用户显示的一部分(例如,弹出窗口或万维网页的插口中的呈现)的数据。可替代地或另外,资源105可以包括作为广告的登陆页的万维网页。
[0031]登陆页包括在操作用户设备106的潜在客户选择独立引用资源105中的广告时出现的万维网页,诸如独立引用资源105中的万维网页或弹出窗口。例如,可以通过点击显示文本或图像的广告链接选择广告。登陆页通常会显示与广告链接中标识的特定产品或服务有关的附加信息,诸如文本或图像。例如,广告的用户选择可以启动呈现由(或为)内容赞助者108提供的万维网页的请求。在一些实现中,登陆页可以包括允许潜在客户输入购买信息(诸如合同信息或信用卡信息)的选项,购买信息允许客户为特定产品或服务下购买订单或请求附加信息。登陆页可以与引用万维网页位于相同或不同的域。
[0032]包括在引用资源105中的内容(例如,广告)由内容管理工具110来选择和放置在诸如万维网页的资源105中。可以基于资源105的特性和/或基于包括在由内容管理工具110接收的内容的请求中的信息来选择内容。例如,如果广告具有与网站中的广告槽位的特性相匹配的特征,那么内容管理工具110可以在万维网页中选择和放置适合的广告。这种特性可以包括例如以关键字和站点(Site)为目标的广告活动。
[0033]内容管理工具110可以在万维网页或其它资源105中选择和放置内容。在一些实现中,响应于搜索查询来放置内容。例如,当用户通过用户设备106将搜索查询提交给搜索工具(未示出)时,搜索查询可以伴随着待使用搜索结果或使用响应于查询所获得的资源105来提供的对附加内容(例如,广告)的请求。对附加内容的请求可以包括为所请求的资源或搜索结果页定义的插口(slot)的特性。这种特性的示例包括这样的关键字:这些关键字包括在可以用于有助于与资源或搜索查询有关的内容的识别的搜索查询中。然后,内容管理工具110选择具有与插口的特性相匹配的特征、并且被识别为与指定的资源关键字或搜索查询有关的内容,并且通过显示搜索结果的资源105或万维网页向用户呈现这些所选择的内容项目。
[0034]可以由内容赞助者108 (例如,广告商)通过网络102向内容管理工具110提供内容(例如,广告)。内容赞助者包括寻求在市场上出售、销售诸如待售或消费的产品的内容或为其做广告的任何人、群体或企业等。在一些实现中,内容赞助者108向内容管理工具110提交用于控制内容在一个或更多资源105中的分发和布置的活动参数(例如,目标关键字和相应出价(bid))。活动参数是用于响应于内容请求和/或搜索查询来控制内容分发的内容分发活动的参数。例如,活动参数可以包括目标关键字和相应出价、地理、心理或人口统计目标标准、语言目标以及与内容项目的集合相对应的其它参数。
[0035]活动可以包括一个或更多个内容项目的集合以及一起分组成相同单元的相应活动参数。例如,诸如运动装备广告的内容可以被一起分组成活动。在活动内,内容项目的子集可以被分组为“广告组”。例如,上面提及的运动装备活动中的广告组可以包括棒球装备的广告的集合。在一些实现中,内容赞助者108可以访问内容管理工具110以监视由内容管理工具分发的内容项目的执行。例如,内容赞助者可以访问活动执行报告,活动执行报告识别诸如广告的内容项目在资源105中已经呈现多少次(例如,印象)、用户已经与内容项目交互(例如,点击)多少次,以及在选择(例如,转换)之后期望交易(例如,广告中标识的产品的出售)发生多少次。
[0036]关于每个内容赞助者108的信息可以存储在内容数据库130中。例如,每个内容赞助者108可以与单独的消费者标识(ID)相关联。然后,客户ID可以与一个或更多活动相关联。在一些实现中,内容赞助者108在通过内容管理工具进行的放置内容的交易中向内容管理工具110支付。支付信息,诸如每个内容请求的量、频率和细节也可以存储在内容数据库130中。关于赞助者的其它信息,包括但不限于名称、合同信息、万维网地址、活动的数目、以及与活动相关联的活动参数,也可以存储在内容数据库130中。
[0037]在一些实现中,内容赞助者108用多于一种语言来进行买卖和/或提供万维网页。在一些实现中,内容赞助者108可以公布多个网站104a至104c,其中,每个网站与赞助者的买卖相关并且包括不同的相应语言的万维网页。例如,网站104a可以包括用德语呈现诸如文本的资源105的万维网页。相反,网站104b和104c可以包括分别用中国普通话和英语语言呈现资源105的万维网页。网站104a至104c中的每个可以与相同域或不同域上的特定赞助者相关联。可替代地或另外,单个网站可以包括与单种语言相对的多种语言的万维网页。
[0038]在一些实现中,内容赞助者108为网站104a至104c中的至少一个或为网站104a至104c中的至少一个中的一个或更多万维网页建立活动。也就是说,内容赞助者108准备内容项目的集合以及与一个或更多网站或网站内的一个或更多万维网页有关的相应活动参数,并且将内容和/或活动参数提供给内容管理工具110。然后,内容管理工具110基于活动参数将由赞助者提供的内容项目或链接合并到其它万维网页或资源105中。当用户例如通过点击与广告相关联的链接来选择所呈现的内容项目时,用户被重新定向(107)到登陆页,其中,登陆页对应于由网站104a至104c之一驻留的万维网页。
[0039]然而,在一些实现中,内容赞助者108在仅用多种不同语言的子集来做广告的同时,用该多种不同语言提供万维网页和/或网站。例如,图1B是由内容提供者维护的示例网站104的示意图,其中,网站104包括其中用第一语言(英语)呈现内容103 (例如,文本、图像、视频、音频)的万维网页105a。网站104还包括第二万维网页105b,除了现在用第二不同语言(德语)呈现内容103之外,第二万维网页105b包括与万维网页105a相同的内容。第一万维网页105a用作广告活动中的登陆页。也就是说,可以位于或可以不位于网站104上的第三万维网页113包括广告117,广告117在被用户选择(例如,通过点击广告117)时将用户重新定向(119)回万维网页105a。这种重新定向可以包括例如在显示万维网页105a的用户的互联网浏览器中打开新窗口,或可替代地改变由用户的互联网浏览器当前显示的万维网页。相反,万维网页105b不用作广告活动中的登陆页,例如,在将用户的浏览器重新定向到万维网页105b的其它万维网页中没有广告或链接。在没有将用户重新定向到万维网页105b的广告的情况下,内容提供者会失去在市场上将内容103出售给消费第二语言的信息的观众的机会。
[0040]为了扩展内容提供者的买卖和/或曝光,因此可能期望识别以下这些语言:内容赞助者用这些语言进行买卖但内容赞助者当前没有用这些语言登广告或不具有已建立的广告活动。一旦赞助者进行买卖但没有用其做广告的语言被识别,则内容赞助者108可以做出是否通过扩展现有活动以包括所识别的语言或通过创建针对所识别的语言的全新活动来将他们的内容(例如,广告)扩展成另外的语言的决策。例如,参照图1B,用英语呈现内容103的万维网页105a可以是广告活动的一部分,而用德语呈现相同的内容103的万维网页105b不是广告活动的一部分。因此,对于内容赞助者,可以将德语识别为内容赞助者可能希望用其扩展现有广告活动的语言。可替代地或另外,该语言对于内容赞助者可以被识别为新的广告活动的建议语言。
[0041]一种可能的方法是识别在内容赞助者的(例如,广告商的)网站上呈现的语言的数目。尽管该方法可以用于识别特定网站的语言的数目,但该方法不能够正确地确定赞助者用这些语言中的哪种语言进行他们的买卖。例如,广告商可以将网站驻留在多个域(例如,示例域.com、示例域.de、示例域.c0.kr)上。另外,网站上的多种语言的识别可以不是商业活动的强指示器。因此,这种识别不向赞助者提供可以用于确定是否将广告活动扩展或建立成其它语言的附加信息。
[0042]图2是用于识别诸如广告商或企业的内容赞助者当前不用其推销其内容的语言的示例例程200的流程图。例程200中获得的信息可以用于给网站的出版商或管理者提供关于是否将网站的内容扩展成附加语言和/或建立到网站内的万维网页的附加广告链接的推荐。例如,该例程可以用于向广告商或企业提供关于是否将广告活动扩展/建立成广告商/企业当前不用其登广告的语言的推荐。尽管下面参照来自网站的广告内容描述例程200,但例程200也可以用于其它语言识别目的。
[0043]例程200可以例如通过图1的内容管理工具110来实现。在一些实现中,内容管理工具110是包括被配置为执行例程200的动作的一个或更多处理器的数据处理装置。在一些实现中,计算机可读介质可以包括这样的指令:这些指令在由计算机执行时使得计算机执行例程200的动作。
[0044]例程200包括确定包括第一语言的内容的第一万维网页,其中,第一万维网页包括与内容赞助者的活动相关联的登陆页(202)。内容的示例可以包括文本、字处理文档、可移植文档格式(PDF)文档、图像、视频和feed源。例程200还包括确定包括不同的第二语言的该内容的第二不同万维网页,其中,第二万维网页不是活动中的登陆页(204)。对一个或更多标准进行评估,以便做出扩展活动以包括第二不同万维网页的推荐(206)。至少部分地基于该评估来识别扩展活动以包括第二不同万维网页的推荐(208)。扩展活动可以包括例如包括第二不同万维网页的地址作为广告中的链接,使得第二不同万维网页变成与广告活动相关联的登陆页。
[0045]识别包括第一语言的内容的第一万维网页和包括不同的第二语言的该内容的第二万维网页例如包括:识别与诸如广告商的特定实体相关联的相互翻译的万维网页对。图3是识别包含相同内容的万维网页的示例例程的流程图,其中,在每个相应页上用不同的相应语言呈现内容。例程300可以例如通过图1的语言识别引擎120来实现。首先,提供了相互翻译的万维网页对的集合(302)。在一些实现中,集合可以包括除了万维网页之外的文档。相互翻译的万维网页对是这样的万维网页对:其中,对中的每个万维网页包括可以认为与对中的其它万维网页中的内容的翻译或来自公共源万维网页的内容的翻译相对应的内容。例如,被翻译的万维网页对的集合包括包含第一语言的内容的多个万维网页,其中,文档中的一个或更多个已经被从不同的语言翻译出。集合中的万维网页成对布置,其中,每对包括已经被翻译成(例如,使用机器转换工具)与对中的第二万维网页相同的语言的第一万维网页,以及其中,第一万维网页包括与第二万维网页基本上相同的内容。给定文档之间的特征的相似性,从而第一万维网页(在翻译成与第二万维网页相同的语言之前)和第二万维网页被识别为相互翻译的万维网页对。也就是说,可以认为对中的每个万维网页与对中的其它万维网页的翻译相对应。可替代地,万维网页的集合可以包括一个或更多万维网页对,其中,每对包括第一语言的第一万维网页和第二不同语言的第二万维网页,每个万维网页包含与其它万维网页中的内容或公共源万维网页中的内容的翻译相对应的内容。万维网页可以从包括例如新闻文章、博客帖子和网站等的多个源和/或多个不同网络中获得。相互翻译的万维网页对的集合可以存储在相互翻译的文档对数据库140中。
[0046]在获得相互翻译的万维网页对的集合时,对集合进行过滤以识别与诸如广告商的特定内容赞助者相关联的这些万维网页对(304)。例如,在一些实现中,广告商与特定域相关联。然后,对相互翻译的万维网页对的集合进行过滤以移除在指定域上不可利用的或不存在的所有万维网页。例如,不包括在域示例域.com下的仟何万维网页将被过滤到捭索之外。在一些实现中,内容赞助者与多于一个域相关联。在这些情况下,可以对相互翻译的对的集合进行过滤以仅包括跨多个指定域的相互翻译的万维网页对。例如,相互翻译的万维网页对的集合可以包括:与广告商相关联的第一万维网页,其中,第一万维网页驻留在德语域(例如,www.示例域.de)上;以及与该广告商相关联的第二万维网页,其中,第二万维网页对应于第一万维网页的英语翻译并且驻留在加拿大域(例如。www.示例域.ea)上。在一些实现中,可以对相互翻译的对的集合进行过滤以还包括在除了顶级域之外的方面也不同的那些相互翻译的万维网页。例如,相互翻译的万维网页对可以包括与第一域(例如,WWW.示例域.com)相关联的第一万维网页以及与第二不同域(例如,WWW.示例域2.com)相关联的第二相应的被翻译的万维网页,其中,第一域和第二域两者与相同的内容赞助者相关联。
[0047]在一些实现中,过滤不需要被域限制。反而,在一些实现中,统一资源定位符(URL)地址的任何级可以用于识别与由URL地址指定的路径相关联的相互翻译的万维网页对。例如,可以对文档的集合进行过滤以识别在指定路径(例如,http://www.示例域.com/示例监径)下可利用的集合内的所有万维网页。
[0048]在其上内容赞助者可利用的不同的域可以是未知的。因此,在一些实现中,为了识别包括期望内容的相互翻译的万维网页对,可以基于内容本身,而不是与实体相关联的域,来对集合进行过滤。例如,在一些实现中,与赞助者的成功的活动相关联的第一万维网页是以第一语言(例如,英语)可利用的。赞助者可能对扩展活动以包括与第一网站的版本相对应、但用一种或更多种不同语言的登陆页感兴趣。为了确定相同内容是否已经以一种或更多种不同语言存在,基于第一万维网页的一部分或全部对相互翻译的万维网页的集合进行过滤。这种过滤可以使用例如基于文本的比较来实现。因此,可以识别包含相似或相同内容的第一万维网页的翻译版本。
[0049]一旦已经获得相互翻译的万维网页的集合,则对每对万维网页进行分析以确定对中的第二万维网页(例如,对中的第一万维网页的翻译版本)是否包括指定的活动中的登陆页(306)。在一些实现中,内容赞助者(例如,广告商)或其它用户可以交叉核对第二万维网页的地址与合并到广告活动的一个或更多广告中的链接的地址。广告和相关联的地址信息可以存储在例如内容管理工具110的数据库中。如果没有发现匹配,被翻译的万维网页不对应于内容项目的登陆页。另一方面,如果该地址与由广告万维网页提供的地址相匹配,则将被翻译的万维网页识别为该特定内容项目的登陆页。在这种情况下,对中的两个文档对应于登陆页,并且赞助者已经用翻译的语言登广告。然后,可以将其中两个文档是指定广告的登陆页的相互翻译的万维网页对从该集合中过滤掉/丢弃。
[0050]可替代地或另外,内容管理工具110交叉核对对中的被翻译的万维网页与包含广告活动的广告组的登陆页的网站。例如,内容管理工具110校验以查看被翻译的万维网页的地址是否被驻留在包含活动的特定广告组的登陆页的网站的域上。如果地址没有被驻留在指定网站上,则被翻译的万维网页不对应于活动中的登陆页。相反,在一些实现中,如果地址被驻留在网站上,则可以将被翻译的万维网页识别为已经是活动的一部分的登陆页。然而,在一些实例中,被翻译的万维网页可以位于驻留现有活动的登陆页的域上,其中,被翻译的万维网页不对应于登陆页。在这些情形下,可以交叉核对被翻译的万维网页与由内容管理工具存储的登陆页地址。
[0051]当已经对相互翻译的万维网页的集合进行了过滤以识别作为翻译并且不对应于登陆页的那些万维网页时,则可以对一个或更多标准进行评估,以便向内容赞助者或其它用户做出扩展活动的推荐。在一些实现中,内容管理工具可以为广告商或其它用户识别当前被网站中的广告商采用的但未由广告商作为目标的不同语言的数目和/或类型。例如,对于对应于第一语言(例如,英语)的登陆页的第一万维网页,内容管理工具110可以识别一个或更多其它另外的万维网页,这些万维网页中的每个对应于第一万维网页的不同语言(例如,俄语、西班牙语、普通话)的翻译。然后,如上面所说明的,对第一万维网页的一个或更多翻译版本进行评估,以确定它们是否已经是活动的一部分(例如,如果另外的万维网页对应于广告活动中的登陆页)。如果一个或更多另外的万维网页中的任一个当前不是活动的一部分,则内容管理工具识别不与活动相关联的万维网页的语言的特定类型和/或数目。
[0052]可以在推荐中对赞助者或其它用户识别不对应于登陆页的万维网页的语言。推荐可以以各种形式提供给广告商,该各种形式例如包括以内容管理工具的操作者与赞助者之间的口头上或通过诸如电子邮件的电子通信的对话,其中,电子邮件包括与用于扩展当前活动的建议语言有关的信息。这种电子邮件可以由用户手动生成或由内容管理工具自动生成。
[0053]在一些实现中,被评估以做出推荐的标准可以包括与相互翻译的对中的第一万维网页(例如,当前是广告的登陆页的万维网页)的执行有关的标准。在一些实现中,与第一万维网页的执行有关的标准包括第一万维网页的地址已经被包括/显示为广告中的链接的次数、用户已经选择第一万维网页针对其包括登陆页的广告(例如,点击)的次数、和/或在第一万维网页针对其包括登陆页的广告的用户选择(例如,转换)之后期望交易(例如,广告中标识的产品的销售)出现的次数。例如,如果针对相互翻译的万维网页对中的第一万维网页的转换的数目(其中,第一万维网页包括广告的登陆页,第二万维网页不包括登陆页)在指定量/阈值以上,则推荐可以包括将广告活动扩展以还包括相互翻译的对中的第二万维网页作为广告的登陆页的建议。
[0054]可以基于与第一万维网页相关联的用户交互数据来测量第一万维网页的执行。这种用户交互数据可以包括例如第一万维网页的页视图的数量。在一些实现中,可以基于页视图的最小数目对相互翻译的万维网页的集合进行过滤,使得以第一语言呈现信息并且具有超过最小数目的页视图的万维网页被保持在该集合中。相反,以第一语言呈现信息并且具有不超过最小数目的页视图的其它万维网页可以从该集合中被过滤掉。与第一万维网页的执行有关的数据可以例如存储在内容数据库130中。
[0055]可替代地或另外,被评估的标准可以与如下活动的执行有关:相互翻译的对中的第一万维网页与该活动相关联(其中,第一万维网页包括活动中的登陆页)。这种标准可以包括用户与活动中的内容项目交互的次数和/或在活动中的任何内容项目的用户选择之后出现期望交易的次数。可以被评估以确定活动的执行的度量包括与活动相关联的总收入、广告商收入、与指定时间周期内的活动相关联的收入、或显示与活动相关联的内容的频率等。例如,在一些实现中,可以对相互翻译的万维网页的集合进行过滤,使得以第一语言呈现信息并且与超过一个月的时段内的指定收入的广告活动相关联的万维网页被保持在该集合中。相反,以第一语言呈现信息并且不与超过指定收入的广告活动相关联的其它万维网页可以被从该集合中过滤掉。用于评估活动的执行的其它度量包括广告的点击次数、每次点击的花费、每个印象的点击次数(例如,点击通过速率)、转换的数目和/或转换速率、每转换的花费、花费预算比、到达的人数、用户查看特定广告的平均频率和/或每一千印象的花费。
[0056]用于过滤的其它度量可以包括例如登陆页质量、电子商务卡的存在或不存在、网站是否是安全网站(例如,https站点)、网站的页等级,或网站是否是分析使能(analyticsenabled)的网站。
[0057]在一些实现中,扩展活动的推荐限于来自作为足够多语言的网站的万维网页。也就是说,内容赞助者可以使其万维网页中的相对少数万维网页被翻译成一种或更多种不同语言。通过限制对其中相对大量的万维网页被翻译的网站的分析(例如,足够多语言的网站),可以增强推荐的质量,以向更有可能对扩展他们的活动感兴趣的内容赞助者提供推荐。在示例中,还可以对相互翻译的万维网页的集合进行过滤以丢弃从如下网站中获得的万维网页:其中,不存在对于小于指定数目或百分比的页的翻译(例如,小于网站的约80%、小于网站的约70%、小于网站的约60%或小于网站的约50%)。可以替代地使用其它百分比。相反,如果在指定网站上被翻译的万维网页的数目超过期望等级,则指定网站可以被识别为足够多的语言。因此,用于扩展活动的随后的推荐可以包括将来自多语言网站的万维网页添加至活动的推荐。在一些实现中,可以对相互翻译的万维网页的集合进行进一步过滤以丢弃从与特定实体(或多个实体)相关联的多个不同网站中获得的万维网页,其中,在该特定实体(或多个实体)中,跨多个网站对小于指定数目或百分比的页不存在翻译。
[0058]可替代地或另外,扩展活动的推荐可以限于识别网站的指定数量(例如,最小数目或百分比)的万维网页针对其已经进行了翻译的语言。例如,在一些实现中,网站可以包括被翻译为第一语言的万维网页的一部分。如果被翻译为第一语言的网站上的万维网页的百分比小于指定量(例如,小于约40%、小于约30%、小于约20%或小于约10%),则在推荐中不将第一语言识别为赞助者可能希望将活动扩展到的语言。相反,如果被翻译为第一语言的网站上的万维网页的百分比大于指定等级,则推荐可以建议将活动扩展到第一语言。在一些实现中,推荐可以基于跨多个网站被翻译为不同语言的万维网页的百分比或数目。
[0059]在一些实现中,推荐可以针对当前有效的赞助者。也就是说,扩展活动的推荐可以限于正积极地对活动投资或最近已经对活动投资的赞助者的万维网页。在一些实现中,这种内容赞助者比当前没有将资源致力于特定活动的赞助者更有可能考虑扩展目前活动。作为示例,可以对相互翻译的万维网页的集合进行过滤以丢弃与在指定时间周期内未为广告提供资金(例如,在至少I周没有在广告方面花费、在至少2周没有在广告方面花费、或在至少4周没有在广告方面花费)的特定赞助者(例如,广告商)相关联的万维网页。然而,可以保留与在指定时间周期内已经为广告或登广告活动提供资金的内容赞助者相关联的万维网页。如先前所说明的,万维网页可以基于万维网域或URL等其它识别技术被识别为与特定内容赞助者相关联。可以将关于内容赞助者在一个或更多活动方面的花费的信息包含在内容数据库130中。
[0060]在一些实现中,扩展活动的推荐可以限于基于赞助者的花费等级的万维网页。例如,可以对相互翻译的万维网页的集合进行过滤以丢弃与在活动方面已经花费小于指定量(例如,小于约$ 1000、小于约$ 10,000、或小于约$ 50,000)的赞助者相关联的万维网页。花费的指定量可以关于设定的时间周期(例如,I周、2周或4周)来定义。在一些实现中,扩展活动的推荐可以限于与已经建立多个活动的赞助者相关联的万维网页。在一些实现中,与多个活动相关联的赞助者可以具有对于赞助内容可利用的较大资源,从而更倾向于扩展当前活动。
[0061]图4是示例计算机工具400的示意图,示例计算机工具400可以用于执行本说明书中所描述的操作和技术,包括但不限于图2和图3各自的技术200和300。工具400可以包括处理器410、存储器420、存储设备430和输入/输出设备440。部件410、420、430和440中的每个使用工具总线450互连。处理器410能够处理在工具400内执行的指令。在一些实现中,处理器410是单线程处理器。在一些实现中,处理器410是多线程处理器。处理器410能够处理存储器420中或存储设备430上存储的指令以在输入/输出设备440上显示用户界面的图形信息。
[0062]存储器420包括计算机可读介质,诸如存储工具400内的信息的易失性或非易失性存储器。存储设备430能够为工具400提供永久存储。存储设备430可以是软盘设备、硬盘设备、光盘设备、或磁带设备或其它合适的永久存储设备。输入/输出设备440提供工具400的输入/输出操作。在一个实现中,输入/输出设备440包括键盘和/或定点设备。在另一实现中,输入/输出设备440包括用于显示图形用户界面的显示单元。
[0063]本说明书中所描述的主题和功能操作的实施例可以用数字电子电路、或者用计算机软件、固件或硬件、包括本说明书中所公开的结构及其结构等同物、或用其一个或更多的组合来实现。本说明书中所描述的主题的实施例可以实现为一个或更多计算机程序产品,即,计算机程序指令的一个或更多个模块,其中,该计算机程序指令被编码在计算机可读介质上,用于由数据处理设备来执行或控制数据处理设备的操作。计算机可读介质可以是机器可读存储设备、机器可读存储基片(substrate)、存储器设备或其一个或更多个的组合。术语“数据处理设备”包括用于处理数据的所有设备、装置和机器,包括例如可编程处理器、计算机、或者多个处理器或计算机。除了硬件之外,该设备还可以包括创建所讨论的计算机程序的执行环境的代码,例如构成处理器固件、协议堆栈、数据库管理工具、操作系统或其一个或更多个的组合的代码。
[0064]计算机程序(也已知为程序、软件、软件应用、脚本或代码)可以用任何形式的编程语言来书写,包括汇编语言或解释性语言,并且计算机程序可以用任何形式来部署,包括独立程序、或模块、部件、子例程或适合用于计算环境中的其它单元。计算机程序不一定对应于文件系统中的文件。程序可以存储在:保存其它程序或数据(例如,存储在标记语言文档中的一个或更多脚本)的文件的一部分中、专用于所讨论的程序的单个文件中、或多个协同(coordinated)文件(例如,存储一个或更多模块、子程序或代码的部分的文件)中。计算机程序可以被部署成在一个计算机或多个计算机上来执行,多个计算机位于一个站点处,或分布在多个站点之间并且由通信网络互连。
[0065]本说明书中所描述的处理和逻辑流可以由一个或更多可编程处理器来执行,该一个或更多个可编程处理器执行一个或更多计算机程序以通过操作输入数据和生成输出来执行功能。处理和逻辑流也可以由专用逻辑电路来执行,并且设备也可以被实现为专用逻辑电路,例如FPGA (现场可编程门阵列)或ASIC (专用集成电路)。
[0066]适合于执行计算机程序的处理器例如包括通用微处理器和专用微处理器两者、以及任何类型的数字计算机的任何一个或更多处理器。通常,处理器将接收来自只读存储器或随机存取存储器或两者的指令和数据。计算机的主要元件是用于执行指令的处理器以及用于存储指令和数据的一个或更多存储器设备。通常,计算机也可以包括用于存储数据的一个或更多海量存储设备,或操作上耦接到用于存储数据的一个或更多海量存储设备以接收来自其的数据或向其发送数据,或既包括海量存储设备又操作上耦接到海量存储设备,海量存储设备例如是磁盘、磁光盘或光盘。然而,计算机不必具有这种设备。此外,可以将计算机嵌入另一设备中,例如移动电话、个人数字助理(PDA)、移动音频播放器、全球定位系统(GPS)接收器等。适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如半导体存储器设备,例如EPROM、EEPROM和快擦写存储器设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及DC ROM盘和DVD-ROM盘。处理器和存储器可以由专用逻辑电路来补充或可以合并到专用逻辑电路中。
[0067]为了提供与用户的交互,本说明书中所描述的主题的实施例可以在计算机上来实现,该计算机具有用于向用户显示信息的显示设备,例如CRT (阴极射线管)或LCD (液晶显示器)监测器,以及通过其用户可以向计算机提供输入的键盘和定点设备,例如鼠标或跟踪球。其它类型的设备也可以用于提供与用户的交互;例如,提供至用户的反馈可以是任何形式的感官反馈,例如视觉反馈、听觉反馈或触觉反馈;并且可以接收来自用户的任何形式的输入,包括声音、语音或触觉输入。
[0068]本说明书中描述的主题的实施例可以在计算设备中实现,计算设备包括例如作为数据服务器的后端部件,或包括中间件部件(例如应用服务器),或包括前端部件(例如具有用户通过其可以与本说明书中所描述的主题的实现进行交互的图形用户界面或万维网浏览器的客户计算机),或者包括一个或更多这种后端部件、中间件部件或前端部件的任何组合。设备的部件可以通过数字数据通信例如通信网络的任何形式或介质互连。通信网络的示例包括局域网(“LAN”)和广域网(“WAN”),例如,互联网。
[0069]计算设备可以包括客户机和服务器。客户机和服务器通常彼此远离,并且一般通过通信网络交互。由于在相应计算机上运行的并且彼此具有客户机-服务器关系的计算机程序,产生了客户机与服务器的关系。
[0070]尽管本说明书包含很多细节,但这些细节不应当被理解为对所公开的主题或可以被要求保护的内容的范围的限制,而是应当被理解为针对所公开的主题的特定实施例的特征的描述。在本说明书中的不同实施例的上下文中所描述的某些特征也可以在单个实施例中以组合的方式来实现。相反,在单个实施例的上下文中所描述的各种特征也可以在多个实施例中单独地或以任何合适的子组合的方式来实现。此外,尽管上面可以将特征描述为以某些组合甚至如初始地要求保护的那样来执行,但是在某些情况下,所要求保护的组合的一个或更多特征可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
[0071]类似地,虽然在附图中以特定顺序描绘了操作,但这不应当被理解为要求以示出的特定顺序或按顺序执行这样的操作或执行所有示出的操作以实现期望的结果。在某些情况下,多任务和并行处理会是有利的。此外,上述实施例中的各种设备部件的分离不应当被理解为在所有的实施例中要求这样的分离,而应当理解的是,所描述的程序部件和设备通常可以一起被集成在单个软件产品中或被打包成多个软件产品。
[0072]已经描述了大量实现和实施例。然而,应当理解的是,可以在不偏离所公开的主题的精神和范围的情况下进行各种修改。其它实施例也在以下权利要求的范围内。
【权利要求】
1.一种计算机实现的方法,包括: 接收万维网页对的集合,每对包括包含第一语言的公共内容的第一万维网页,并且包括包含第二不同语言的所述公共内容的第二万维网页,每对中的至少一个万维网页对应于来自源万维网页的翻译; 对所述万维网页对的集合进行过滤以识别与内容赞助者相关联的一个或更多对;确定所识别的对中的第一万维网页是与所述内容赞助者的广告活动相关联的广告的登陆页; 确定所述识别的对中的第二万维网页不是所述广告活动中的登陆页; 为做出用于扩展所述广告活动以包括所述第二万维网页的推荐,使用一个或更多处理器对一个或更多标准进行评估;以及 至少部分地基于所述评估来提供用于扩展所述广告活动以包括所述第二万维网页的所述推荐。
2.根据权利要求1所述的计算机实现的方法,其中,对一个或更多标准进行评估包括对所述第一万维网页的执行进行评估。
3.根据权利要求1所述的计算机实现的方法,其中,对一个或更多标准进行评估包括对所述广告活动的执行进行评估。
4.根据权利要求1所述的计算机实现的方法,其中,对一个或更多标准进行评估包括对与所述内容赞助者相关联的被翻译的万维网页的量进行评估。
5.根据权利要求1所述的计算机实现的方法,其中,对一个或更多标准进行评估包括对与所述内容赞助者相关联的广告融资活动的等级进行评估。
6.根据权利要求1所述的计算机实现的方法,其中,确定所述识别的对中的第二万维网页不是所述广告活动中的登陆页包括:交叉核对所述第二万维网页的地址与合并到所述广告活动的一个或更多广告中的万维网页链接的地址,或交叉核对所述第二万维网页与包含和所述广告活动相关联的登陆页的网站。
7.一种计算机实现的方法,包括: 确定第一万维网页包括第一语言的内容,其中,所述第一万维网页是与内容赞助者的广告活动相关联的登陆页; 确定第二万维网页包括不同的第二语言的所述内容,其中,所述第二万维网页不是所述广告活动中的登陆页; 为做出用于扩展所述广告活动以包括所述第二万维网页的推荐,使用一个或更多处理器对一个或更多标准进行评估;以及 至少部分地基于所述评估来识别用于扩展所述广告活动以包括所述第二万维网页的推荐。
8.根据权利要求1所述的计算机实现的方法,其中,所述标准选自包括与所述第一万维网页的执行或所述广告活动的执行有关的标准的组。
9.根据权利要求1所述的计算机实现的方法,其中,确定所述第一万维网页和所述第二万维网页包括识别被翻译的文档对。
10.根据权利要求9所述 的计算机实现的方法,其中,每个被翻译的文档对包括包含一种语言的所述内容的第一文档,和包含不同语言的所述内容的第二文档。
11.根据权利要求9所述的计算机实现的方法,其中,识别所述被翻译的文档对包括基于所述内容对被翻译的文档的集合进行过滤以提供所述被翻译的文档对。
12.根据权利要求11所述的计算机实现的方法,其中,对所述被翻译的文档的集合进行过滤还基于与所述内容相关联的一个或更多域。
13.根据权利要求11所述的计算机实现的方法,其中,对所述被翻译的文档对的集合进行过滤基于与所述内容相关联的用户交互数据。
14.根据权利要求9所述的计算机实现的方法,其中,识别所述被翻译的文档对包括:基于与所述内容赞助者相关联的顾客标识对被翻译的文档对的集合进行过滤,以提供所述被翻译的文档。
15.—种系统,包括: 一个或更多处理器以及存储器,能够操作以进行交互,从而执行操作,所述操作包括: 确定包括第一语言的内容的第一万维网页,其中,所述第一万维网页是与内容赞助者的广告活动相关联的登陆页; 确定包括不同的第二语言的所述内容的第二万维网页,其中,所述第二万维网页不是所述广告活动中的登陆页; 为做出用于扩展所述广告活动以包括所述第二万维网页的推荐,使用一个或更多处理器对一个或更多标准进行评估;以及 至少部分地基于所述评估来识别用于扩展所述广告活动以包括所述第二万维网页的推荐。
16.根据权利要求15所述的系统,其中,所述标准选自包括与所述第一万维网页的执行或所述广告活动的执行有关的标准的组。
17.根据权利要求15所述的系统,其中,确定所述第一万维网页和所述第二万维网页包括识别被翻译的文档对。
18.根据权利要求17所述的系统,其中,每个被翻译的文档对包括(I)包含一种语言的所述内容的第一文档以及(2)包含不同语言的所述内容的第二文档。
19.根据权利要求17所述的系统,其中,识别所述被翻译的文档对包括基于所述内容对被翻译的文档的集合进行过滤以提供所述被翻译的文档对。
20.根据权利要求19所述 的系统,其中,对所述被翻译的文档的集合进行过滤还基于与所述内容相关联的一个或更多域。
【文档编号】G06F17/30GK103890798SQ201180072044
【公开日】2014年6月25日 申请日期:2011年8月23日 优先权日:2011年6月2日
【发明者】雅各布·乌斯科赖特, 杰弗里·金, 露西娅·庞塞拉, 尼古拉斯·德凯尔马代克 申请人:谷歌公司