专利名称:一种个性化的信息推送方法及装置的制作方法
技术领域:
本申请涉及网络技术领域,尤其涉及一种个性化的信息推送方法及装置。
背景技术:
目前的商品买卖网站中,向用户推荐卖家,最常用的方式是:根据用户最近搜索过的关键词,去搜索引擎查询匹配得到卖家,从而向用户推荐。这种推荐方式比较单一,无法根据卖家、买家以及运营商各方的推荐要求。例如:在实际的应用中某些运营部门要求向买家推荐最热门的商品、多推荐买家用户已经熟悉的用户(因为对于已经有过联系的买卖用户,再次发生交易的概率会更大)。上述技术方案除了方式单一之外,因为如果用户近期没有搜索行为,则不能搜索到对应的搜索关键词,所以为了实现向尽量多的用户提供卖家推荐操作,则需要系统保存大量而且长时间的搜索数据。从而会导致存储数据占用大量的系统存储空间。另外,即使买家近期搜索了相关内容,如果要在用户浏览、交易或者收藏某个具体的商品时向用户推荐卖家,也需要临时提取出当前商品的关键词进行搜索。临时提取关键词进行搜索,首先提取关键词的操作需要花费一定的时间,另外,利用关键词进行搜索操作需要对用户的所有行文都进行分析处理,因此,会带来非常大的计算量,而且计算效率低,计算得到的结果也存在不够准确的问题。
发明内容
本申请提供一种个性化的信息推送方法及装置,本申请所提供的方法和装置根据设定时间窗中的网络行为的次数向用户推荐信息,使得推荐信息更精确。一种个性化的信息推送方法,该方法包括:当多个用户终端访问多个信息提供终端存储在网络服务器的信息时,网络服务器获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与有过关联的每个信息提供终端的关联度数值;根据第一用户终端在设定时间窗内与信息提供终端的关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集;根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。根据上述方法一种个性化的信息推送装置,该装置包括:关联度数值确定模块,用于当多个用户终端访问多个信息提供终端存储在网络服务器的信息时,获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与有过关联的每个信息提供终端的关联度数值;第一数据集生成模块,用于根据第一用户终端在设定时间窗内与信息提供终端的关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集;信息推送模块,用于根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。上述技术方案中的一个或两个,至少具有如下技术效果:本申请实施例所提供的方法和装置,设置了一个固定时长的时间窗,对该时间窗中的数据进行分析,从而只需要存储并分析所述固定时长用户访问网站所生成的数据,所以减少了数据存储的空间同时也减少了待分析数据的数量,从而提到了数据分析的效率。
图1为本申请实施例一种个性化的信息推送方法的流程图;图2为本申请实施例中确定关联度数值的方法流程图;图3为本申请实施例偏好P随天数t的衰减趋势的示意图;图4为本申请实施例获取第二数据集的方法流程图;图5为本申请实施例获取第三数据集的方法流程图;图6为本申请实施例一种个性化的信息推送装置的结构示意图。
具体实施例方式本申请实施例提供一种个性化的信息推送方法,该方法包括:当多个用户终端访问多个信息提供终端存储在网络服务器的信息时,网络服务器获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与有过关联的每个信息提供终端的关联度数值;根据第一用户终端在设定时间窗内与信息提供终端的关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集Si ;根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。如图1所示,本申请实施例提供一种个性化的信息推送方法,下面结合说明书附图对本申请的具体实施方式
进行详细说明,该方法具体包括步骤:步骤101,当多个用户终端访问多个信息提供终端存储在网络服务器的信息时,网络服务器获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与有过关联的每个信息提供终端的关联度数值;步骤102,根据第一用户终端在设定时间窗内与信息提供终端的关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集Si ;步骤103,根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。如图2所示,本申请实施例在步骤101中,根据所述网络行为数据确定在设定时间窗口内每个用户终端与有过关联的每个信息提供终端的关联度数值的具体实现方式可以是:步骤201,根据所述网络行为数据确定任一用户终端在设定时间窗中每个预设时间周期对任一信息提供终端的各网络行为的次数;当本申请实施例所提供的方法应用于网络商店提供相关的店铺信息和商品信息时,则本申请实施例中的用户终端则可视为与网络店铺具有关联操作的用户端设备,则所述信息提供终端则为提供店铺信息的终端。则所述网络行为包括交易行为、收藏行为、联系行为(发email、通过即时通讯工具沟通等)和浏览店铺商品行为等;对于每一个(用户终端,信息提供终端)对,先筛选出每个用户终端存在关联的信息提供终端的行为数据(本申请实施例中存在广联是指用户终端与信息提供终端之间有网络行为操作);当然,本申请实施例并不限于应用于网络商店提供相关的店铺信息和商品信息,也可以应用于视频网站提供的视频信息或其他各种信息提供平台。步骤202,将各网络行为的次数分别乘以对应的行为权重后乘以所述时间周期对应的时间衰减系数得到所述任一用户终端与所述任一信息提供终端在一个时间周期的关联度数值;因为在具体的应用中交易行为和浏览行为都体现了用户对某个店铺或商品的关注度,但是根据网络行为的不同类型所表明的关注度并不相同,所以对于不同的行为,分别设定对应的行为权重wl, w2, w3, w4等;因为服务器设备的数据容量有限,所以,在设定用于计算的时间窗时,需要根据实际的需要确定。例如最近90天内,也可以根据数据保存期限设定为30天或者60天等;将收集到的计算时间窗内所有的行为数据参与计算;因为用户的偏好会随时间衰减。当前用户喜欢某一个类目,不代表一个月后仍然会喜欢这个类目。30天前的行为所表现出来的对偏好的兴趣,对当前用户偏好的影响没有最近几天的行为影响大。偏好P随天数t的衰减趋势如图3所示的指数模型表示,即P (t) = Ki+exp ((t_K2) /K3),t ( O,这里的天数 t 是负数。参数K1, K2, K3可以根据应用场景`和数据的不同而调整。因为在时间窗的时间相对较长,所以对应了好几种不同的衰减系数,所以本申请实施例中进一步将所述时间窗划分为多个计算时间周期(例如,I天、5天、7天或者10天),对于每个计算周期,对应有一个时间衰减系数;其中,所述衰减系数与所述时间周期的对应关系是所述时间周期与当前时间间隔的长度越大则对应的衰减系数愈小。即离当前计算日越远的计算时间周期,时间衰减越大,也就意味着时间衰减系数值越小。例如在60天内从I逐步衰减到0.01,计算周期为I天。则时间衰减因子a = 0.9261,相当于60天从I衰退到 0.01);显然,不同的行为所代表的用户喜好程度会不一样。设一共有η个行为,某用户某天针对某一类目下的各行为发生的次数累计分别为X1,...,χη。则这一天里该用户表现出来的对该类目的偏好为Y = W1X1+...+wnxn。作为买家的偏好和作为卖家的偏好会分别计算。目前各行为的权重,即各w的值,根据实际应用中各行为所对应的关联度确定,具体形式可以是如表I所述的格式:
权利要求
1.一种个性化的信息推送方法,其特征在于,该方法包括: 当多个用户终端访问多个信息提供终端存储在网络服务器的信息时,网络服务器获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与有过关联的每个信息提供终端的关联度数值; 根据第一用户终端在设定时间窗内与信息提供终端的关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集; 根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。
2.如权利要求1所述的方法,其特征在于,根据所述网络行为数据确定在设定时间窗口内每个用户终端与有过关联的每个信息提供终端的关联度数值包括: 根据所述网络行为数据确定任一用户终端在设定时间窗中每个预设时间周期对任一信息提供终端的各网络行为的次数; 将各网络行为的次数分别乘以对应的行为权重后乘以所述时间周期对应的时间衰减系数得到所述任一用户终端与所述任一信息提供终端在一个时间周期的关联度数值;将所述时间窗中任一用户终端与对应的任一信息提供终端的所有预设时间周期的关联度数值累加,得到所述任一用户终端与对应任一信息提供终端的关联度数值。
3.如权利要求2所述的方法,其特征在于,所述衰减系数与所述时间周期的对应关系是所述时间周期与当前时间间隔的长度越大则对应的衰减系数愈小。
4.如权利要求1所述的方法,其特征在于,将获取到的第一信息提供终端信息推送给所述用户终端之前,进一步包括: 获取多个用户终端访问信息提供终端的信息,根据每个信息所属的类目,确定每个用户终端的偏好类目以及对应的第一偏好数值; 信息提供终端提供的信息所属的不同类目和每个类目对应的信息数量,确定每个信息提供终端的偏好类目以及对应的第二偏好数值; 根据所述第一偏好数值和第二偏好数值应用相关性计算方式得到每个用户终端与每个信息提供终端的相关性数值; 根据所述相关性数值,获取多个信息提供终端形成第二数据集; 根据相关性数值的大小顺序从所述第二数据集中获取多个信息提供终端信息,并将获取到的信息提供终端信息添加到第一信息提供终端信息中。
5.如权利要求4所述的方法,其特征在于,将获取到的第一信息提供终端信息推送给所述用户终端之前, 进一步包括: 根据任一信息提供终端的网络行为数据的来源方式分别将不同来源的网络行为次数乘上对应的权重后乘以所述时间周期对应的时间衰减系数得到该信息提供终端在一个时间周期的区段热度值; 将一个时间窗中多个时间周期对应的区段热度值进行累加得到信息提供终端的热度值; 根据信息提供终端的热度值,获取多个信息提供终端形成第三数据集S3 ; 根据所述热度值的大小顺序从所述第三数据集中获取多个信息提供终端信息,并将获取到的信息提供终端信息添加到第一信息提供终端信息中。
6.如权利要求5所述的方法,其特征在于,将获取到的第一信息提供终端信息推送给所述用户终端之前,从第一数据集、第二数据集和第三数据集获取N个客户终端信息,包括: 将第一数据集、第二数据集和第三数据集预设的对应百分比ratl,rat2, rat3分别乘上N,确定需从每个数据集中获取的客户终端信息个数,其中,ratl+rat2+rat3 = 100%。
7.—种个性化的信息推送装置,其特征在于,该装置包括: 关联度数值确定模块,用于当多个用户终端访问多个信息提供终端存储在网络服务器的信息时,获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与有过关联的每个信息提供终端的关联度数值; 第一数据集生成模块,用于根据第一用户终端在设定时间窗内与信息提供终端的关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集; 信息推送模块,用于根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。
8.如权利要求7所述的装置,其特征在于,该装置还包括: 第二数据信息获取模块,用于获取多个用户终端访问信息提供终端的信息,根据每个信息所属的类目,确定每个用户终端的偏好类目以及对应的第一偏好数值;信息提供终端提供的信息所属的不同类目和每个类目对应的信息数量,确定每个信息提供终端的偏好类目以及对应的第二偏好数值;根据所述第一偏好数值和第二偏好数值应用相关性计算方式得到每个用户终端与每个信息提供终端的相关性数值;根据所述相关性数值,获取多个信息提供终端形成第二数据集;根据相关性数值的大小顺序从所述第二数据集中获取多个信息提供终端信息 ,并将获取到的信息提供终端信息添加到第一信息提供终端信息中。
9.如权利要求8所述的装置,其特征在于,该装置还包括: 第三数据信息获取模块,用于根据任一信息提供终端的网络行为数据的来源方式分别将不同来源的网络行为次数乘上对应的权重后乘以所述时间周期对应的时间衰减系数得到该信息提供终端在一个时间周期的区段热度值,将一个时间窗中多个时间周期对应的区段热度值进行累加得到信息提供终端的热度值;根据信息提供终端的热度值,获取多个信息提供终端形成第三数据集S3 ;根据所述热度值的大小顺序从所述第三数据集中获取多个信息提供终端信息,并将获取到的信息提供终端信息添加到第一信息提供终端信息中。
10.如权利要求9所述的装置,其特征在于,该装置还还包括: 选择模块,用于将第一数据集、第二数据集和第三数据集预设的对应百分比ratl,rat2,rat3分别乘上N,确定需从每个数据集中获取的客户终端信息个数,其中,ratl+rat2+rat3 = 100%。
全文摘要
本申请公开了一种个性化的信息推送方法及装置,应用于网络技术领域。该方法包括网络服务器获取所述多个用户终端进行访问操作的网络行为数据,并根据所述网络行为数据确定在设定时间窗内每个用户终端与每个信息提供终端的关联度数值;根据所述关联度数值,获取与第一用户终端对应的多个信息提供终端形成第一数据集;根据关联度数值的大小顺序从所述第一数据集中获取多个信息提供终端的信息生成第一信息提供终端信息,并将获取到的第一信息提供终端信息推送给所述第一用户终端。本申请公开的方法和装置根据设定时间窗中的网络行为的次数向用户推荐信息,使得推荐信息更加精确。
文档编号G06Q30/02GK103164804SQ20111042466
公开日2013年6月19日 申请日期2011年12月16日 优先权日2011年12月16日
发明者杨志雄, 邓中华, 苏宁军 申请人:阿里巴巴集团控股有限公司