一种推送信息点击率估计方法和装置的制造方法
【技术领域】
[0001] 本发明涉及一种互联网技术领域,尤其涉及一种推送信息点击率估计方法和装 置。
【背景技术】
[0002] 随着互联网的快速发展,信息推荐系统在互联网技术领域得到了广泛的使用,如 在电商,视频,文学等互联网服务当中。现有的信息推荐系统,主要考虑用户与用户之间,或 推送对象与推送对象之间的相似程度,即给用户推荐与他相似的用户评价高或点击过的推 送对象,或推荐用户看过的推送对象的近似对象。在推荐系统的应用中,针对新的用户,或 新的推送对象或初始化的推荐系统,由于缺乏用户的历史行为数据,而造成的问题叫做冷 启动问题。
【发明内容】
[0003] 本发明实施例所要解决的技术问题在于,提供一种推送信息点击率估计方法和装 置,可有效解决信息推荐系统的冷启动问题。
[0004] 为了解决上述技术问题,本发明实施例提供了一种推送信息点击率估计方法,所 述方法包括:
[0005] 获取信息点击行为数据,所述信息点击行为数据包括多个用户分别对被推送至该 多个用户的推送信息的点击行为记录和不点击行为记录;
[0006] 根据所述多个用户中各个用户的多维用户特征,以及所述被推送至该多个用户的 推送信息中各个推送信息的多维信息特征,对所述信息点击行为数据进行分解得到训练语 料,所述训练语料包括各个用户特征分别对各个信息特征的点击行为记录和不点击行为记 录;
[0007] 对任意某个用户特征对任意某个信息特征的点击率建立二分类算法模型,并根据 所述训练语料对所述二分类算法模型进行参数优化,得到最逼近所述信息点击行为数据的 点击率算法模型;
[0008] 根据经过参数优化得到的所述点击率算法模型,计算目标推送信息相对于目标用 户的点击率。
[0009 ]相应地,本发明实施例还提供了一种推送信息点击率估计装置,所述装置包括: [0010]点击数据获取模块,用于获取信息点击行为数据,所述信息点击行为数据包括多 个用户分别对被推送至该多个用户的推送信息的点击行为记录和不点击行为记录;
[0011]训练语料获取模块,用于根据所述多个用户中各个用户的多维用户特征,以及所 述被推送至该多个用户的推送信息中各个推送信息的多维信息特征,对所述信息点击行为 数据进行分解得到训练语料,所述训练语料包括各个用户特征分别对各个信息特征的点击 行为记录和不点击行为记录;
[0012]算法模型优化模块,用于对任意某个用户特征对任意某个信息特征的点击率建立 二分类算法模型,并根据所述训练语料对所述二分类算法模型进行参数优化,得到最逼近 所述信息点击行为数据的点击率算法模型;
[0013] 点击率估计模块,用于根据经过参数优化得到的所述点击率算法模型,计算目标 推送信息相对于目标用户的点击率。
[0014] 本发明实施例通过将已有的信息点击行为数据分解为多个维度的用户特征对多 个维度的信息特征之间的点击行为记录,进而基于用户特征与信息特征之间的点击行为作 为训练语料进行二分类算法模型优化,能够充分理由已有的点击行为数据,能够实现根据 非常少的点击行为记录得到较为准确的点击率估算模型,同时对于新用户或新生成的推送 信息,依然可以根据其自身的用户特征或信息特征估算出点击率,可以很好的解决推荐系 统冷启动的问题。
【附图说明】
[0015] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0016] 图1是本发明实施例中的一种推送信息点击率估计方法的流程示意图;
[0017] 图2是本发明实施例中对信息点击行为数据进行分解得到训练语料的示意图;
[0018] 图3是本发明实施例中的一种推送信息点击率估计装置的结构示意图。
【具体实施方式】
[0019] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0020] 本发明实施例中的推送信息点击率估计方法和装置,可以实现在冯若依曼体系的 计算机系统之上。例如可以以计算机程序的形式运行,该计算机程序可集成在应用中,也可 作为独立的工具类应用运行。该计算机系统可以是个人电脑、平板电脑、笔记本电脑、掌上 电脑、智能手机等具有触控功能的终端设备,也可以以互联网后台服务器的形式实施,例如 网络搜索服务器。
[0021] 图1是本发明实施例中的一种推送信息点击率估计方法的流程示意图,如图所示 本实施例中的推送信息点击率估计方法可以包括以下流程:
[0022] S101,获取信息点击行为数据,所述信息点击行为数据包括多个用户分别对被推 送至该多个用户的推送信息的点击行为记录和不点击行为记录。
[0023] 具体实现中,所述信息点击行为数据,可以为通过指定推送信息集合推送至指定 用户集合后,将该用户集合中对该指定推送集合的点击行为汇总得到的,例如指定用户集 合包括用户A、用户B、用户C,推送信息集合包括信息a、信息b、信息c以及信息d,那么得到的 信息点击行为数据可以包括该用户集合中各个用户在接收到推送信息集合中的信息后,是 否点击了各个信息的行为记录,比如将点击描述为1,不点击描述为〇,那么用户A的点击行 为数据就可以描述为(1,0,1,0)表示其点击了信息a和信息c,未点击信息b和信息d,以此类 推。
[0024] S102,根据所述多个用户中各个用户的多维用户特征,以及所述被推送至该多个 用户的推送信息中各个推送信息的多维信息特征,对所述信息点击行为数据进行分解得到 训练语料,所述训练语料包括各个用户特征分别对各个信息特征的点击行为记录和不点击 行为记录。
[0025] 具体的,例如图2所示的分解过程,所述用户特征可以包括用户的基础属性特征, 例如包括年龄、性别、所在地等,还可以包括用户的兴趣特征,如爱好听歌、旅游等,本发明 实施例中将所有用户均按照相同的h维用户特征进行描述,若某个用户缺少某项特征信息 则可以缺省处理;同理的,本发明实施例将所有推送信息均按照相同的i维信息特征进行描 述,例如推送的信息涉及的商品的商品类型或标题分词特征,此外在可选实施例中还可以 包括是否商品广告、商品/服务类型等维度的特征。根据所述多个用户中各个用户的h维用 户特征,以及所述被推送至该多个用户的推送信息中各个推送信息的i维信息特征,对所述 信息点击行为数据进行分解得到训练语料,即每一条用户对接收到的推送信息的点击与否 的记录,均可以分解得到该用户的h个用户特征分别对该推送信息的i个信息特征的点击与 否的记录,以便后续作为算法模型的训练语料。在可选实施例中,如图2所示,可以将用户特 征集合与商品特征集合之间进行笛卡尔内积,进而根据点击与否的记录对每个内积进行赋 值,即可得到代表各个用户特征对各个信息特征的点击与否的训练语料数据。
[0026] S103,对任意某个用户特征对任意某个信息特征的点击率建立二分类算法模型, 并根据所述训练语料对所述二分类算法模型进行参数优化,得到最逼近所述信息点击行为 数据的点击率算法模型。
[0027] 具体实现中,可以根据某个信息特征的全局点击率、某个用户特征的全局点击率 以及该信息特征与该用户特征之间的相关度,建立代表该用户特征对该信息特征的点击率 的二分类算法模型。其中,所述信息特征与用户特征之