一种精确头条信息的推荐方法及装置与流程

文档序号:16784417发布日期:2019-02-01 19:20阅读:210来源:国知局
一种精确头条信息的推荐方法及装置与流程

本发明涉及计算机技术领域的大数据挖掘技术,尤其涉及一种精确头条信息的推荐方法及装置。



背景技术:

随着互联网的迅速发展,网络技术日趋成熟,成本逐步降低,除了传统的宽带业务,各大通讯公司还提供了高速稳定也相对便宜的移动网络,有利于网络广泛应用到各行各业,既提高了社会生产力,也方便了人们的生活。在软件产业的推动下,企业信息化程度也越来越高,提供的各种网络产品和服务覆盖到人们的衣食住行及消费娱乐,极大的方便了人们的生活,如电子商务行业的各大厂商纷纷推出各具特色的移动应用程序,为用户提供便捷的商品浏览、购买支付、物流配送、售后服务等网上购物功能。但是随着电子商务规模的不断扩大,商品的数量和种类迅速增长,大量的信息变成了长尾淹没在数据的海洋中。要从海量的商品中快速找到自己想买的商品,并不是一件简单的事情,用户面临着“信息过载”的问题。

因此,在信息类目繁多爆炸的时代,人们面对的选择越来越多,选择过多,信息超载,也常常会使人无所适从。在这种情况下,推荐引擎便开始展现技术优势,发挥威力。

分类目录和搜索引擎是缓解信息过载问题的传统解决方案。根据商品的属性和特征进行分门别类,方便了用户的查找。然而随着商品种类和数量的快速增加,商品分类只能覆盖到少量流行的商品。搜索引擎是获取指定条件信息的传统技术。用户可以在购物平台上搜索商品的关键字,比如商品的名称、品牌、材质等。通过关键字的检索,用户可以查询到自己想要的各个品牌指定材质的商品信息,通过比对筛选出物美价廉同时也符合自己需求的商品。但是这需要有明确的关键字体现用户的需求,搜索的结果也是限制在用户已知的信息范围之内,无法检索到用户可能感兴趣的未知商品信息。因此需要有一个系统能了解用户的兴趣偏好和消费习惯,主动推荐用户感兴趣的或者可能需要的商品。推荐系统应运而生,不需要用户提供关键字,通过分析用户的历史行为数据找到用户的个性化需求,主动推荐适合用户的商品,包括处于长尾的商品,有效解决了信息过载的问题。

推荐系统采用合理有效的挖掘算法,通过分析用户浏览、购买、评分等各种行为的海量数据,挖掘用户的消费倾向,推荐用户有潜在购买需求的商品,实现精准营销。对于推荐系统的研究,无论是对科技的发展还是社会的进步都有积极的意义。

推荐系统是解决信息超载问题比较有效的方法,它根据用户行为的历史数据分析用户的兴趣爱好等,将用户感兴趣的商品等推荐给用户。resnick和varian在1997年是如此定义推荐系统:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。电子商务的推荐系统主要包含候选商品,推荐方法和目标用户。利用推荐算法从海量的候选商品中筛选出合适的商品推荐给目标用户。



技术实现要素:

有鉴于此,本发明的主要目的在于提供一种能够准确分析出用户想要浏览的内容的头条信息推荐方法,避免用户在面对海量互联网内容时不知所措。

本发明旨在至少解决现有技术中存在的技术问题之一。为此,公开了一种精确头条信息的推荐方法,用户通过浏览器访问网络,获取用户行为,包括:访问的广告信息、浏览信息和搜索关键词,并根据所述用户行为确定用户的感兴趣的多个信息标签,在设定的时间阈值内,设置多个时间点监测所述用户行为,对于每一个信息标签,对用户的多种行为设置不同的系数,加权得到信息标签的推荐值,并根据所述用户的感兴趣的信息标签确定针对该用户的头条信息推荐组,并将所述头条信息推荐组发送至该用户客户端。

优选地,所述对用户的多种行为设置不同的系数,所述系数符合正态分布。

优选地,根据用户行为的相似度对用户进行分组,确定同组内的用户具有相同的兴趣,对同组内的所有用户访问的广告信息、浏览信息和搜索关键词进行统计,对用户访问信息进行兴趣度排名,选择最高得分的方案推荐给用户。

优选地,对所生成的至少一套头条信息推荐方案进行评分,所述评分根据用户关闭头条的时间、鼠标在头条上悬停的时间、用户是浏览击条信息的时间、用户是否发表评论、是否在其他搜索引擎中输入推荐的头条信息的关键词,对上述用户操作行为进行加权计算头条推荐信息的准确性,判断用户是否对推荐的头条信息感兴趣,若不感兴趣,则重新推荐头条信息,直到用户满意为止。

优选地,所述头条信息推荐组内的信息是由大数据的并行计算根据余弦相似度进行归集,其中余弦相似度,通过计算夹角的余弦值来衡量两个向量的相似度,余弦值取值范围是[-1,1],夹角越小,余弦值越接近于1,两个向量的方向趋向一致,相似度也越高,其计算方法如公式所示;

sim(i,j)=cos(i,j)=u∈uru,i×ru,ju∈ur2u,iu∈ur2u,j

其中sim(i,j)表示物品i和物品j的相似度,ru表示用户u对物品i的评分,ru,j表示用户u对物品j的评分,所述评分基于基于用户行为。

优选地,分析用户历史行为特征,建立用户历史行为特征库,通过计算用户访问的广告信息、浏览信息和搜索关键词,用fp-tree算法挖掘出与用户浏览内容最具相关性的信息,通过数据挖掘得到上述用户浏览内容最具相关性的信息的同类型信息。

本发明还公开了一种精确头条信息的推荐装置,其特征在于,包括:用户行为收集模块,用于获取用户行为,包括:访问的广告信息、浏览信息和搜索关键词;数据分析模块,用于根据用户的行为轨迹数据,结合用户资料,分析用户需求;数据挖掘模块,根据所述用户行为确定用户的感兴趣的多个信息标签;数据匹配模块,用于在设定的时间阈值内,设置多个时间点监测所述用户行为,对于每一个信息标签,对用户的多种行为设置不同的系数,加权得到信息标签的推荐值,并根据所述用户的感兴趣的信息标签确定针对该用户的头条信息推荐组。

优选地,所述对用户的多种行为设置不同的系数,所述系数符合正态分布。

优选地,评分推荐模块,用于对所生成的至少一套头条信息推荐方案进行评分,所述评分根据用户关闭头条的时间、鼠标在头条上悬停的时间、用户是浏览击条信息的时间、用户是否发表评论、是否在其他搜索引擎中输入推荐的头条信息的关键词,对上述用户操作行为进行加权计算头条推荐信息的准确性,判断用户是否对推荐的头条信息感兴趣,若不感兴趣,则重新推荐头条信息,直到用户满意为止。

优选地,用户行为存储模块:用于分析用户历史行为特征,建立用户历史行为特征库,通过计算用户访问的广告信息、浏览信息和搜索关键词,用fp-tree算法挖掘出与用户浏览内容最具相关性的信息,通过数据挖掘得到上述用户浏览内容最具相关性的信息的同类型信息。

附图说明

从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在图中,在不同的视图中,相同的附图标记指定对应的部分。

图1是本发明的一种精确头条信息的推荐方法的流程图。

图2是本发明的一种精确头条信息的推荐方法结构图。

具体实施方式

实施例一

图2所示的本发明的系统结构图,具体如图1所示的一种精确头条信息的推荐方法,用户通过浏览器访问网络,获取用户行为,包括:访问的广告信息、浏览信息和搜索关键词,并根据所述用户行为确定用户的感兴趣的多个信息标签,在设定的时间阈值内,设置多个时间点监测所述用户行为,对于每一个信息标签,对用户的多种行为设置不同的系数,加权得到信息标签的推荐值,并根据所述用户的感兴趣的信息标签确定针对该用户的头条信息推荐组,并将所述头条信息推荐组发送至该用户客户端。

更进一步地,所述对用户的多种行为设置不同的系数,所述系数符合正态分布。

更进一步地,根据用户行为的相似度对用户进行分组,确定同组内的用户具有相同的兴趣,对同组内的所有用户访问的广告信息、浏览信息和搜索关键词进行统计,对用户访问信息进行兴趣度排名,选择最高得分的方案推荐给用户。

更进一步地,对所生成的至少一套头条信息推荐方案进行评分,所述评分根据用户关闭头条的时间、鼠标在头条上悬停的时间、用户是浏览击条信息的时间、用户是否发表评论、是否在其他搜索引擎中输入推荐的头条信息的关键词,对上述用户操作行为进行加权计算头条推荐信息的准确性,判断用户是否对推荐的头条信息感兴趣,若不感兴趣,则重新推荐头条信息,直到用户满意为止。

更进一步地,所述头条信息推荐组内的信息是由大数据的并行计算根据余弦相似度进行归集,其中余弦相似度,通过计算夹角的余弦值来衡量两个向量的相似度,余弦值取值范围是[-1,1],夹角越小,余弦值越接近于1,两个向量的方向趋向一致,相似度也越高,其计算方法如公式所示;

sim(i,j)=cos(i,j)=u∈uru,i×ru,ju∈ur2u,iu∈ur2u,j

其中sim(i,j)表示物品i和物品j的相似度,ru表示用户u对物品i的评分,ru,j表示用户u对物品j的评分,所述评分基于基于用户行为。

更进一步地,分析用户历史行为特征,建立用户历史行为特征库,通过计算用户访问的广告信息、浏览信息和搜索关键词,用fp-tree算法挖掘出与用户浏览内容最具相关性的信息,通过数据挖掘得到上述用户浏览内容最具相关性的信息的同类型信息。

显而易见地,在该实施例中,采用了两种推荐头条信息的方法,通过分析用户的行为数据,采用对用户进行分组的同时对用户浏览内容的感兴趣的内容进行分组,由大数据技术,实现头条信息的推荐功能。

实施例二

例如用户在网上购物过程中,面对的是琳琅满目的商品,来自不同的供应商和不同的品牌,产品的材质和做工也是良莠不齐,如何选择需要花大量的时间进行浏览和比较,消耗较多的精力去分析商品的历史评价记录等等,为了解决上述问题实施例二公开了一种精确头条信息的推荐方法,用户通过浏览器访问网络,获取用户行为,包括:访问的广告信息、浏览信息和搜索关键词,并根据所述用户行为确定用户的感兴趣的多个信息标签,在设定的时间阈值内,设置多个时间点监测所述用户行为,对于每一个信息标签,对用户的多种行为设置不同的系数,加权得到信息标签的推荐值,并根据所述用户的感兴趣的信息标签确定针对该用户的头条信息推荐组,并将所述头条信息推荐组发送至该用户客户端。

优选地,所述对用户的多种行为设置不同的系数,所述系数符合正态分布。

优选地,根据用户行为的相似度对用户进行分组,确定同组内的用户具有相同的兴趣,对同组内的所有用户访问的广告信息、浏览信息和搜索关键词进行统计,对用户访问信息进行兴趣度排名,选择最高得分的方案推荐给用户。

优选地,对所生成的至少一套头条信息推荐方案进行评分,所述评分根据用户关闭头条的时间、鼠标在头条上悬停的时间、用户是浏览击条信息的时间、用户是否发表评论、是否在其他搜索引擎中输入推荐的头条信息的关键词,对上述用户操作行为进行加权计算头条推荐信息的准确性,判断用户是否对推荐的头条信息感兴趣,若不感兴趣,则重新推荐头条信息,直到用户满意为止。

优选地,所述头条信息推荐组内的信息是由大数据的并行计算根据余弦相似度进行归集,其中余弦相似度,通过计算夹角的余弦值来衡量两个向量的相似度,余弦值取值范围是[-1,1],夹角越小,余弦值越接近于1,两个向量的方向趋向一致,相似度也越高,其计算方法如公式所示;

sim(i,j)=cos(i,j)=u∈uru,i×ru,ju∈ur2u,iu∈ur2u,j

其中sim(i,j)表示物品i和物品j的相似度,ru表示用户u对物品i的评分,ru,j表示用户u对物品j的评分,所述评分基于基于用户行为。

优选地,分析用户历史行为特征,建立用户历史行为特征库,通过计算用户访问的广告信息、浏览信息和搜索关键词,用fp-tree算法挖掘出与用户浏览内容最具相关性的信息,通过数据挖掘得到上述用户浏览内容最具相关性的信息的同类型信息。

本发明还公开了一种精确头条信息的推荐装置,其特征在于,包括:用户行为收集模块,用于获取用户行为,包括:访问的广告信息、浏览信息和搜索关键词;数据分析模块,用于根据用户的行为轨迹数据,结合用户资料,分析用户需求;数据挖掘模块,根据所述用户行为确定用户的感兴趣的多个信息标签;数据匹配模块,用于在设定的时间阈值内,设置多个时间点监测所述用户行为,对于每一个信息标签,对用户的多种行为设置不同的系数,加权得到信息标签的推荐值,并根据所述用户的感兴趣的信息标签确定针对该用户的头条信息推荐组。

优选地,所述对用户的多种行为设置不同的系数,所述系数符合正态分布。

优选地,评分推荐模块,用于对所生成的至少一套头条信息推荐方案进行评分,所述评分根据用户关闭头条的时间、鼠标在头条上悬停的时间、用户是浏览击条信息的时间、用户是否发表评论、是否在其他搜索引擎中输入推荐的头条信息的关键词,对上述用户操作行为进行加权计算头条推荐信息的准确性,判断用户是否对推荐的头条信息感兴趣,若不感兴趣,则重新推荐头条信息,直到用户满意为止。

优选地,用户行为存储模块:用于分析用户历史行为特征,建立用户历史行为特征库,通过计算用户访问的广告信息、浏览信息和搜索关键词,用fp-tree算法挖掘出与用户浏览内容最具相关性的信息,通过数据挖掘得到上述用户浏览内容最具相关性的信息的同类型信息。

在实施例二中,推荐装置为一个多源信息装置,与多个信息、购物平台连接,采用用户行为收集和存储模块,又或者日志采集模块,对用户行为分析,在采用日志采集模块时,用户在浏览器上发生的行为,将被日志采集模块捕捉并传递给用户行为存储模块。推荐系统根据用户行为存储系统中的用户行为挖掘用户的浏览偏好,产生的头条信息推荐清单将通过页面展示用户客户端呈现给用户。

虽然上面已经参考各种实施例描述了本发明,但是应当理解,在不脱离本发明的范围的情况下,可以进行许多改变和修改。因此,其旨在上述详细描述被认为是例示性的而非限制性的,并且应当理解,以下权利要求(包括所有等同物)旨在限定本发明的精神和范围。以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1