针对在线系统中的用户动作的定制化预测器的制造方法
【技术领域】
[0001] 本发明涉及预测例如社交网络系统的在线系统中的用户动作,并且具体地涉及针 对在线系统中的用户动作的定制化预测器的生成,特别地旨在加快在线系统内的潜在用户 交互。
【背景技术】
[0002] 在线系统通常向用户呈现有用的信息并且允许用户与在线系统交互。在线系统可 使用技术以在向用户呈现信息之前确定用户可能感光趣的信息。如果给他们呈现他们喜欢 的信息,则用户更可能定期地访问在线系统。在线系统经常从广告赚取收益。广告商更喜 欢在由他们的用户定期访问的在线系统中做广告。因此,用户忠实度可确定使用在线系统 生成的收益。因此,在线系统向用户呈现感兴趣信息的能力通常影响通过在线系统赚取的 收益。
[0003] -些系统使用机器学习技术确定与单个用户相关的信息以预测用户动作。例如, 如果机器学习模型预测用户可能观看某些内容,则在线系统可选择向用户呈现该内容而不 是其他内容。另一方面,如果机器学习模型预测用户可能对某些信息不感兴趣,则在线系统 可选择向用户呈现的一些其他信息。
[0004] 然而,开发机器学习模型需要在线系统的开发人员的大量努力。通常,机器学习模 型的开发人员指定使用的机器学习技术、与机器学习模型相关的各种特征,并且提供用于 训练机器学习模型的训练数据。在复杂的在线系统中,开发人员可能不知道各种特征对预 测器模型的影响。通常,开发人员甚至可能不知道能够在模型中使用的复杂系统中可获得 的所有可能特征。此外,各种特征对模型的影响可随着时间而改变。在技术方面的新开发 可能以不可预测的方式影响各种特征对模型的影响。例如,虽然未结合在线系统开发新技 术,但是如果新类型的移动技术是可获得的,则系统的用户可以表现得不同。在用户行为方 面的变化能够改变各种特征对模型的影响。当考虑到他们自己在线系统的所有可能方面以 及能够影响模型的外部因素时,这对于机器学习模型的开发人员开发并且维持模型是困难 的。因此,传统技术给机器学习模型的开发人员施加沉重负担。
【发明内容】
[0005] 本发明的实施方式允许在线系统生成用于预测在线系统的用户动作的模型。例 如,诸如社交网络系统的在线系统可使用模型预测用户是否可能建立与另一用户的联系、 用户是否可能评论图像、或用户是否可能加入社交群。这些模型在本文中也被称为预测器。 社交网络系统使用预测器选择向社交网络系统的用户呈现的信息,例如,提出与用户的潜 在联系、选择向用户呈现的内容、或向用户推荐社交群。
[0006] 在实施方式中,在线系统接收请求以生成用于预测用户是否可能采取特定动作类 型的动作的新预测器。例如,动作类型可对应于用户喜欢图像、用户发送请求与另一用户联 系、或用户加入社交群。请求指定动作类型和用于识别动作类型的成功或失败的标准。例 如,如果动作类型对应于用户发送请求以与另一用户联系,则动作的成功实例(successful instance,成功情形)对应于用户发送请求以与由在线系统提出的潜在朋友联系,并且失 败实例对应于用户不能联系到潜在朋友或试图隐藏朋友建议。在线系统从用户在一段时 间中与在线系统的交互中收集包括动作类型的成功和失败实例的数据。在线系统使用生 成的数据生成不同类型的一个或多个预测器。例如,一个预测器可使用线性回归(linear regression),另一预测器可以使用逻辑回归(logistic regression),并且第三预测器可 以使用提升树(boosting tree)或权重决策树。在线系统评估并且比较生成的不同预测器 的性能并且基于性能选择预测器。在线系统将用于访问生成的预测器的句柄(handle)返 回至预测器的请求者。因此,请求方接收针对动作的定制化预测器而不用了解关于机器学 习的任何事情。
[0007] 在实施方式中,在线系统基于通过在线系统收集的新数据再生成新预测器以替换 现有预测器。新预测器能够可以是使用完全不同的机器学习技术的新模型、或使用相同机 器学习技术但是具有在模型内使用的新系数值的模型。可以预定速率定期地生成新预测 器。可自适应地修改生成新预测器的速率。例如,如果在新预测器中观察的性能相比于针 对动作类型的现有预测器的改善低于阈值,则可降低针对该具体动作类型的预测器的再生 成速率。
[0008] 在本
【发明内容】
部分和以下详细说明中所述的特征和优势不是全部包含的。鉴于附 图、说明书、和权利要求,很多其他特征和优点对于本领域普通技术人员将是显而易见的。
[0009] 涉及方法、存储介质和系统的所附权利要求中具体地公开了根据本发明的实施方 式,其中,在一个权利要求类型(例如,方法)中提及的任何特征也能够在另一权利要求类 型(例如,系统)中要求保护。
[0010] 在实施方式中,根据本发明,提供了特别旨在加快在线系统内的潜在用户交互的 计算机实施的方法,包括:
[0011] 通过在线系统接收用于生成预测器的多个请求,每个请求指定通过在线系统的用 户执行的动作类型和用于识别动作类型的成功实例的标准;
[0012] 为与动作类型相关联的每个请求,通过在线系统生成用于该动作类型的预测器, 该生成包括:
[0013] 识别包括通过在线系统用户执行的动作类型的多个成功实例和多个失败实例的 训练数据组;
[0014] 使用识别的数据组训练一个或多个候选预测器,其中,每个候选预测器包括机器 学习模型;
[0015] 通过对包括由在线系统的用户执行的动作类型的多个成功实例和多个失败实例 的测试数据组执行每个预测器来评估每个候选预测器的性能;以及
[0016] 通过比较一个或多个候选预测器的性能选择用于动作类型的预测器;以及
[0017] 将与生成的预测器对应的句柄返回至所选择的预测器的请求者。
[0018] 计算机实施的方法可进一步包括:
[0019] 接收来自在线系统中运行的处理的针对预测器的请求,请求指定用户信息的实例 和句柄;
[0020] 对用户信息的实例执行与指定的句柄对应的预测器;以及
[0021] 将预测器的结果返回至请求处理。
[0022] 优选地,动作类型的成功实例对应于存储在线系统中的指示响应于给用户呈现允 许用户采取该动作类型的动作的用户界面用户采取该类型的动作的信息。
[0023] 具体地,请求进一步指定针对失败实例的标准,其中,动作类型的失败实例对应于 存储在线系统中的指示响应于给用户呈现允许用户采取该动作类型的动作的信息用户未 采取该类型的动作的信息。
[0024] 动作类型的失败实例可对应于存储在线系统中的指示用户提供表示不喜欢在与 动作类型关联的用户界面中呈现的信息的输入的信息。
[0025] 优选地,每种类型的动作瞄准在线系统中表示的实体。
[0026] 具体地,对应于动作类型的实体是在线系统的用户、社交群、或图像之一。
[0027]候选预测器能够是基于线性回归(linear regression)、逻辑回归(logistic regression)、提升树(boosting tree)、权重决策树之一的机器学习模型的类型。
[0028] 计算机实施的方法进一步可包括为动作类型的每个生成的预测器:
[0029] 将生成的预测器的性能与该类型动作的现有预测器的性能比较;以及
[0030] 响应于生成的预测器的性能超过现有预测器的性能,利用生成的预测器替换现有 预测器。
[0031] 计算机实施的方法可进一步包括,为每个动作类型,定期地生成新预测器:
[0032] 将新预测器的性能与之前生成的预测器的性能进行比较;以及
[0033] 响应于新预测器的性能超过之前生成的预测器的性能,利用新预测器替换之前生 成的预测器。
[0034] 优选地,基于新预测器的性能与之前生成的预测器的性能的比较确定定期生成用 于每种动作类型的新预测器的速率。
[0035] 具体地,响应于新预测器的性能相比现有预测器的性能的改善低于阈值降低定期 为每种动作类型生成新预测器的速率。
[0036] 在也能够要求保护的又一实施方式中,提供了计算机实施的方法,包括:
[0037] 通过在线系统存储多个预测器,每个预测器用于预测在线系统的用户是否执行某 种类型的动作,每个预测器与用于确定该类型动作的成功实例的标准相关联;
[