一种基于用户兴趣的信息聚合方法、系统与流程

文档序号:11832560阅读:288来源:国知局
一种基于用户兴趣的信息聚合方法、系统与流程

本发明涉及信息处理领域,特别涉及基于用户兴趣的信息聚合方法、系统。



背景技术:

现在的网络资讯可以用泛滥来形容,每天人们在纷杂的网络世界中寻找自己需要的新闻信息,常常借用的工具是搜索引擎,但不太懂得搜索逻辑命令的人,很难迅速、精确地找到自己所需要的信息内容,大多数的受众往往需要查询并排除掉海量无用的搜索结果后,才有可能找到自己要想的东西。而基于网页搜索的信息聚合技术,可以通过软件和智能筛选等功能,帮助人们提高搜索的精准性,大大地缩短了找到所需信息的时间。早期的RSS信息定制、Digg(掘客)等都能提供较好的信息聚合功能。

随着社交化网络的普及,用户对精确化、个性化的信息需求变得越来越高,原有的信息聚合功能已无法满足人们的需要。在社交网络平台上,用户不仅可以分享自己的动态或新鲜事,还可以在上面关注自己感兴趣的内容,这些内容也包括了其他用户分享的动态。而这些用户所关注的信息就汇成了一种信息流。当用户与一些内容源建立了硬链接后,这些内容源产生的动态,就会源源不断地流向用户,多个内容源产生的动态会被聚合后呈现在用户面前。也就是说,当一个用户加入一个社交网络,就成为了这个网络中的节点之一。每个节点都希望能够了解到某一些其他的节点的风吹草动,而且网络中任何一个节点“动一下”,都会产生一个能在整个网络中荡漾的信息流。

上述基于社交化的信息聚合技术一面世,就得到了用户的推崇。传统的基于社交网络的信息聚合系统通常都是默认按照内容产生的时间先后顺序排列。然而,这种基于时间线的信息聚合方式越来越不能够满足用户的需求。产生这个现象的主要是因为智能手机的普及和移动网络的提速,这些因素都使得UGC越来越容易,而用户浏览和发布动态却越来越碎片化,数量陡增。以前用户消费无压力的基于时间线的信息聚合,开始出现信息过载或者用户会因为这种排序方式而错过一些他们更感兴趣的内容的问题。



技术实现要素:

本发明要解决的技术问题是,基于传统的用于社交网络中基于时间线的信息聚合算法,按照与用户兴趣的相关程度进行重排序和展示。通过分析用户的兴趣,帮助用户过滤出更能符合用户兴趣的内容,解决了传统信息聚合系统在社交网络中信息流过大的情况下,导致的信息过载问题。

解决上述技术问题,本发明提供了一种基于用户兴趣的信息聚合系统,包括:内容分类模块、分类内容存储模块、信息流生成模块、信息聚合模块以及常规内容存储模块,

所述内容分类模块,用以接收社交网络中用户产生的新内容,并根据所述新内容的不同来源进行评分后分类存放;

所述分类内容存储模块,用以根据上述评分,将所述新内容和原有但用户未阅读的内容一同排序并存放;

所述信息流生成模块,用以接收新内容的请求,并在接收到所述请求后从所述分类内容存储模块中提取并返回该请求前产生并未阅读的新内容或者所有新内容;

所述常规内容存储模块,用以将所述信息流生成模块中返回给用户的内容,按照当时返回时的顺序进行保存;

所述信息聚合模块,用以接收从所述信息流生成模块返回的新内容,以及合并从所述常规内容存储模块中提取的用户已阅读过的历史内容组成的信息流;按照所述信息流将所述新内容和所述历史内容进行合并后推送。

更进一步,在所述内容分类模块,对于同一内容根据不同的接收用户设置不同的权重评分,所述内容分类为:

来自所关注用户的内容,

与已采集的内容相似或者相关的内容,

来自所关注分类中的内容。

更进一步,在所述内容分类模块通过智能排序方法对每个来源的内容进行评分,所述智能排序方法具体为:

对内容的样本采样后进行特征生成,开始准备训练数据;

将所述训练数据按照机器学习模型生成训练模型,

根据所述训练模型在接收到请求后提供内容服务。

更进一步,所述特征生成包括,内容特征、产生内容对应的用户特征以及互动特征;

所述内容特征,用以定义内容属性;

所述产生内容对应的用户特征,用以定义用户的属性;

所述互动特征,用以定义内容与用户之间的相互关系。

更进一步,所述机器学习模型包括:逻辑回归算法、支持向量机SVM算法,梯度提升树算法以及深度学习之卷积神经网络算法。

更进一步,若所述信息流生成模块不可用时,则所述信息聚合模块进行优雅降级;用户发送新内容请求时,返回常规内容存储模块中历史内容的列表的结果。

更进一步,当用户登陆后或者手动刷新时,向所述信息流生成模块请求新的内容;在所述信息流生成模块,用以返回用户上次访问后未获取的新内容;同时,用户已浏览过的内容将从所述分类内容存储模块中删除。

更进一步,上述请求新的内容中返回内容的数量根据用户访问频繁程度以及该次请求前用户阅读的新内容确定。

基于上述本发明还提供了基于用户兴趣的信息聚合方法,包括如下步骤:

采集得到社交网络中用户产生的新内容,并根据所述新内容的不同来源进行评分后分类;按照上述评分将所述新内容和用户原有但未阅读的内容一同排序并存放;

当接收到用户阅读新内容的请求时,提取并返回在该请求前产生且未阅读的新内容或者所有新内容;

将所述新内容与用户已阅读的历史内容进行合并后推送。

更进一步,所述排序按照如下智能排序模型进行:

对内容的样本采样后进行特征生成,准备训练数据;

将所述训练数据按照机器学习模型生成训练模型;

根据所述训练模型在接收到请求后提供内容服务。

本发明的有益效果:

1)由于本发明基于用户兴趣的信息聚合系统,包括:内容分类模块、分类内容存储模块、信息流生成模块、信息聚合模块以及常规内容存储模块,所述内容分类模块,用以接收社交网络中用户产生的新内容,并根据所述新内容的不同来源进行评分后分类存放;所述分类内容存储模块,用以根据上述评分,将所述新内容和原有但用户未阅读的内容一同排序并存放;所述信息流生成模块,用以接收新内容的请求,并在接收到所述请求后从所述分类内容存储模块中提取并返回该请求前产生并未阅读的新内容或者所有新内容;所述常规内容存储模块,用以将所述信息流生成模块中返回给用户的内容,按照当时返回时的顺序进行保存;所述信息聚合模块,用以接收从所述信息流生成模块返回的新内容,以及合并从所述常规内容存储模块中提取的用户已阅读过的历史内容组成的信息流;按照所述信息流将所述新内容和所述历史内容进行合并后推送。通过内容分类模块、信息流生成模块以及信息聚合模块,三个不同的服务模块,实现了对社交网络内容更新返回聚合后的内容灵活的控制,每个服务都有自己明确的职责,达到了每个用户都具备个性化返回内容的目标。

2)更进一步,在所述内容分类模块中采用智能排序算法利用机器学习,分析一个用户对一条内容产生互动的可能性,并根据用户的兴趣点进行内容推送,解决了用户在社交网络下信息过载问题。

3)不仅如此,在本系统中为了保证服务的高可用性,将信息流生成功能与内容聚合功能通过模块化分离,从而实现当事故发生时可以优雅降级。当所述信息流生成模块中的服务不可用时,信息聚合模块可以优雅降级。即用户仍然可以获取历史的列表,返回常规内容存储模块中的结果。这时候从用户端看到的效果就是还没有产生新内容。如果上一次发生了优雅降级,那么用户本次访问时获得的新内容会比正常要多。

4)本发明基于用户兴趣的信息聚合方法,能够通过分析用户的兴趣,帮助用户过滤出更能符合用户兴趣的内容,解决了传统信息聚合系统在社交网络中信息流过大的情况下,导致的信息过载问题,实现信息聚合的“精确化”和“轻量化”。

附图说明

图1是本发明一实施例中的基于用户兴趣的信息聚合系统结构示意图。

图2是图1中的内容分类模块包含的内容的分类示意图。

图3是图1中的内容分类模块中的聚类算法示意图。

图4是图3中的特征生成示意图。

图5是本发明一实施例中的基于用户兴趣的信息聚合方法流程示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。

图1是本发明一实施例中的基于用户兴趣的信息聚合系统结构示意图。

本实施例中基于用户兴趣的信息聚合系统,包括:内容分类模块100、分类内容存储模块101、信息流生成模块102、信息聚合模块103以及常规内容存储模块104,

所述内容分类模块100,用以接收社交网络中用户产生的新内容,并根据所述新内容的不同来源进行评分后分类存放;所述内容分类模块100是整个内容聚合系统框架中的后台作业模块。它接收社交网络中用户产生的新内容,并根据接收的用户的不同,赋予这些新内容不同的权重并保存。也就是说,对于同一个内容,不同的接收用户会有不同的权重评分。该模块会将这些内容分为三类:来自所关注用户的,跟已采集的内容相似或相关的内容,和来自所关注分类的内容。然后该模块会通过一种智能排序算法,给每个来源的内容评分之后,分开存入分类内容存储模块101里面。

在一些实施例中,所述社交网络包括但不限于,新浪微博、微信朋友圈、facebook、QQ、分类专题、论坛。

在一些实施例中,所述新内容包括但不限于,按照时间更新的内容、按照用户手动刷新更新的内容、用户未阅读的内容、用户阅读但未标记的内容等。

在一些实施例中,所述新内容的来源包括但不限于,用户关注的内容、用户感兴趣的内容、用户阅读过的相关内容。

在一些实施例中,所述新内容的来源为,基于主题模型LDA的推荐算法。

在一些实施例中,推荐的内容包括但不限于,新闻、生活、体育、国际、娱乐、时尚。

作为本实施例中的优选,在所述内容分类模块,对于同一内容根据不同的接收用户设置不同的权重评分,所述内容按照如下进行分类:

来自所关注用户的内容,

与已采集的内容相似或者相关的内容,

来自所关注分类中的内容。

在一些实施例中,权重评分按照用户的关注度和阅读频率进行划分。

在一些实施例中,来自所关注用户的内容包括但不限于,在微博中关注的感兴趣的人所发布的内容、在微信中互为好友的人所发布的内容、在微博中被@的人发布的内容、在QQ中互为好友的人所发布的内容。

在一些实施例中,与已采集的内容相似或者相关的内容包括但不限于,基于用户的推荐(User-based Recommendation)算法、基于项目的推荐(Item-based Recommendation)算法、基于模型的推荐(Model-based Recommendation)算法。

在一些实施例中,所述来自所关注分类中的内容是指按照关注内容分类专题中的分类内容。关注内容分类至少包括一级标签,还可以包括二级标签、三级标签,对内容进行细粒度划分。

作为本实施例中的优选,在所述内容分类模块通过智能排序方法对每个来源的内容进行评分,所述智能排序方法具体为:

对内容的样本采样后进行特征生成,开始准备训练数据;

将所述训练数据按照机器学习模型生成训练模型,

根据所述训练模型在接收到请求后提供内容服务。

更进一步,所述机器学习模型包括:逻辑回归算法、支持向量机SVM算法、梯度提升树算法以及深度学习之卷积神经网络算法。

作为本实施例中的优选,所述特征生成包括,内容特征、产生内容对应的用户特征以及互动特征;

所述内容特征,用以定义内容属性;包括但不限于内容所属于领域、内容的长度、内容中是否有附图、内容中是否有视频、内容的转发量、内容的点赞量、内容的引用量。

所述产生内容对应的用户特征,用以定义用户的属性;包括但不限于用户的年龄层、用户的性别、用户是否结婚、用户所在的位置、用户的活跃度。

所述互动特征,用以定义内容与用户之间的相互关系,包括但不限于,用户与内容的关联程度、用户对内容的关注度、用户对内容的引用次数、用户感对内容的感兴趣度。

所述分类内容存储模块101,用以根据上述评分,将所述新内容和原有但用户未阅读的内容一同排序并存放;在所述分类内容存储模块101的存储结构是一个优先队列(Priority Queue),按照评分排序,新的内容进来和原来用户还未看过的内容一起排序。

作为本实施例中的优选,每次送入分类内容存储模块101中的数据是一个三元组{用户,内容,评分}。其中评分根据权重而定,内容与用户按照互动特征而定。比如,{小王,语文高考,85分};{小明,体育新闻,80分}。

所述信息流生成模块102,用以接收新内容的请求,并在接收到所述请求后从所述分类内容存储模块中提取并返回该请求前产生并未阅读的新内容或者所有新内容;在所述信息流生成模块102中,用以返回用户上次访问后将要获取的新内容。比如,当用户登陆后或者手动刷新时,就会向信息流生成模块102中请求新的内容,也就是用户还未浏览过的内容。

在一些实施例中,所述信息流生成模块102在收到请求后,该模块就会从分类内容存储模块101中提取并返回前n条或者所有新的内容。更进一步,用户已浏览过的内容就会从分类内容存储模块101中删除,以保证每次请求的内容都是用户没看过的。

在一些实施例中,上述根据请求返回内容的数量不是固定的,而是会根据用户访问频繁程度,以及该次请求前浏览的新内容多少决定。

更进一步,所述信息流生成模块102还用以将多个发表源的内容按照一定规则重新排列,但是不能改变内容在分类内容存储模块101中优先队列返回的优先顺序。即队列中高优先级的会被优先取出,再将内容会按照评分排序,再推送给信息聚合模块103。

在一些实施例中,若所述信息流生成模块不可用时,则所述信息聚合模块进行优雅降级;用户发送新内容请求时,返回常规内容存储模块中历史内容的列表的结果。

在一些实施例中,当用户登陆后或者手动刷新时,向所述信息流生成模块102请求新的内容;在所述信息流生成模块102,用以返回用户上次访问后未获取的新内容;同时,用户已浏览过的内容将从所述分类内容存储模块中删除。

更进一步,上述请求新的内容中返回内容的数量根据用户访问频繁程度以及该次请求前用户阅读的新内容确定。

所述常规内容存储模块104,用以将所述信息流生成模块中返回给用户的内容,按照当时返回时的顺序进行保存;常规内容存储104用于保存用户上次获得推送的内容列表的快照。此服务不需要对信息流重新排序。也就是说,常规内容存储模块104会将上次返回给用户的内容,按照当时呈现的顺序完整保存。

所述快照是指网页快照,WebCache,指网页缓存。搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。当用户使用搜索引擎在因特网上搜索网页时,那其实就在搜索引擎的网页数据库中搜索,用户误认为搜索引擎一下子就在因特网上找到了包含关键词的网页。

所述信息聚合模块103,用以接收从所述信息流生成模块返回的新内容,以及合并从所述常规内容存储模块中提取的用户已阅读过的历史内容组成的信息流;按照所述信息流将所述新内容和所述历史内容进行合并后推送。所述信息聚合模块104接收从信息流生成模块102返回的新内容,再合并从常规内容存储模块104中提取的用户已浏览过的历史内容组成的信息流,且不需要对内容顺序做任何修改,只是把新旧内容合并在一起,通过客户端应用推送给用户。

在一些实施例中,所述客户端应用通过应用程序API与信息聚合模块103连接。

在一些实施例中,所述客户端应用基于智能手机端、PAD端、PC端。

在一些实施例中,所述信息聚合模块104接收从信息流生成模块102返回的新内容为用户未阅读过的内容。

本发明的系统至少包括如下的技术效果:通过内容分类模块、信息流生成模块以及信息聚合模块,三个不同的服务模块,实现了对社交网络内容更新返回聚合后的内容灵活的控制,每个服务都有自己明确的职责,达到了每个用户都具备个性化返回内容的目标。更进一步,在所述内容分类模块中采用智能排序算法利用机器学习,分析一个用户对一条内容产生互动的可能性,并根据用户的兴趣点进行内容推送,解决了用户在社交网络下信息过载问题。不仅如此,在本系统中为了保证服务的高可用性,将信息流生成功能与内容聚合功能通过模块化分离,从而实现当事故发生时可以优雅降级。当所述信息流生成模块中的服务不可用时,信息聚合模块可以优雅降级。即用户仍然可以获取历史的列表,返回常规内容存储模块中的结果。这时候从用户端看到的效果就是还没有产生新内容。如果上一次发生了优雅降级,那么用户本次访问时获得的新内容会比正常要多。

图2是图1中的内容分类模块包含的内容的分类示意图。

在本实施例中,在所述内容分类模块,对于同一内容根据不同的接收用户设置不同的权重评分,所述内容20按照如下进行分类:来自所关注用户的内容200,与已采集的内容相似或者相关的内容201,来自所关注分类中的内容202。

在一些实施例中,权重评分按照用户的关注度和阅读频率进行划分。

在一些实施例中,来自所关注用户的内容200包括但不限于,在微博中关注的感兴趣的人所发布的内容、在微信中互为好友的人所发布的内容、在微博中被@的人发布的内容、在QQ中互为好友的人所发布的内容。

在一些实施例中,与已采集的内容相似或者相关的内容包201括但不限于,基于用户的推荐(User-based Recommendation)算法、基于项目的推荐(Item-based Recommendation)算法、基于模型的推荐(Model-based Recommendation)算法。

在一些实施例中,所述来自所关注分类中的内容202是指按照关注内容分类专题中的分类内容。关注内容分类至少包括一级标签,还可以包括二级标签、三级标签,对内容进行细粒度划分。

图3是图1中的内容分类模块中的聚类算法示意图。

本实施例中,在所述内容分类模块通过智能排序方法对每个来源的内容进行评分,所述智能排序方法具体为:

步骤S200对内容的样本采样后进行特征生成,开始准备训练数据;

步骤S201将所述训练数据按照机器学习模型生成训练模型,

步骤S202根据所述训练模型在接收到请求后提供内容服务。

内容分类模块100会通过智能排序算法,给每个来源的内容评分之后,分开存入分类内容存储模块101中。这种智能排序算法是一组机器学习模型,用于衡量一个用户对一条内容产生互动的可能性。

作为本实施例中的优选,机器学习模型包括但不限于,逻辑回归(Logistic Regression),支持向量机SVM(Support Vector Machines),梯度提升树(Gradient Boosted Decision Trees),和深度学习之卷积神经网络(CNN,Convolutional Neural Networks)。

具体地,在步骤S200中的准备训练数据的时候主要是对样本采样和特征生成。由于通常曝光样本的数量远多于正样本的数量,以及严重不平衡的类别分布,所以在训练时,特别需要对负样本即那些展示给用户但没产生互动的内容,进行采样。

具体地,模型建立时用到特征包含了文本特征和图像特征,主要分为三类:

更进一步,内容本身的特征,包含了内容特征,包括一些内容统计特征如历史热度之类,新鲜程度,是垃圾的可能性等。

更进一步,产生这个内容的用户的特征。比如用户的活跃度,用户性别,用户看板状态等。

更进一步,互动特征,即待推送的这个用户之前和类似的内容互动的程度。

在一些实施例中,每条训练样本包含三部分:目标值(正负样本)、特征、元数据(包括但不限于用户ID类,时间戳等,用于在MapReduce阶段分割样本,用于交叉测试)。

当模型进行训练时,训练样本必须通过上述的所有算法进行计算,并用AUC(Area Under Curve,用来度量分类模型好坏的一个标准)作为模型的主要评价指标,发现同样的特征集合。在大多数的情况下,逻辑回归和梯度提升树模型的表现均会优于其他几个算法。而深度学习之卷积神经网络模型(CNN)主要用于图像特征的分析。确定算法之后,特征选择也是必须的,做了很多特征筛选工作,保留了最具区分性的特征。到此,推荐模型就生成了。推荐模型上线之后就是以一个服务形式存在,当模型把新的内容和要推送给的用户进行分析,并逐一预测出每个用户可能会对该内容产生互动的概率,将概率作为分数返回并存储进分类内容存储模块101中。

在一些实施例中,每次推荐模型根据新的数据更新之后,先用历史数据做离线测试,然后上线AB测试,最后再全局铺开。

图4是图3中的特征生成示意图。

在本实施例中,所述特征生成包括,内容特征300、产生内容对应的用户特征301以及互动特征302;

所述内容特征300,用以定义内容属性;

所述产生内容对应的用户特征301,用以定义用户的属性;

所述互动特征302,用以定义内容与用户之间的相互关系。

更进一步,所述内容特征300,包括一些内容统计特征如历史热度之类,新鲜程度,是垃圾的可能性等。

更进一步,所述产生内容对应的用户特征301,包括产生这个内容的用户的特征。比如用户的活跃度,用户性别,用户看板状态等。

更进一步,互动特征302,即待推送的这个用户之前和类似的内容互动的程度。

图5是本发明一实施例中的基于用户兴趣的信息聚合方法流程示意图。

本实施例中基于用户兴趣的的信息聚合方法,具体包括如下步骤:

步骤S400采集得到社交网络中用户产生的新内容,并根据所述新内容的不同来源进行评分后分类;

步骤S401按照上述评分将所述新内容和用户原有但未阅读的内容一同排序并存放;

步骤S402当接收到用户阅读新内容的请求时,提取并返回在该请求前产生且未阅读的新内容或者所有新内容;

步骤S403将所述新内容与用户已阅读的历史内容进行合并后推送。

具体地,信息聚合方法中,

假设了一个使用了该信息聚合系统框架的社交平台上,用户A关注了该社交平台上的三个数据源,这三个数据源会分别不定期更新用户A最感兴趣的三个不同类别的话题:体育,科技和星座。除了这三个他感兴趣的数据源,用户A同时还关注了1个他其实并不感兴趣的乐队(比如,这可能是他为了让女朋友开心而假装关注的他女朋友喜欢的乐队)。

自从上一次用户A阅读过之后,这三个他感兴趣的数据源分别更新了3条新的内容。而他并不感兴趣的乐队(很少打开该乐队发布的更新内容)也更新了2条新内容。这时候,内容分类模块100会采集到这11条信息(9条来自感兴趣的数据源,2条来自乐队),外加系统从别的数据源(其他的几个跟体育,科技和星座相关的源)采集到的用户可能感兴趣的4条更新。这时候,总共15条更新会被当作未阅读过的新内容放入智能排序算法中进行打分排序。

在这次打分排序之前,智能排序算法已经拥有了一个推荐模型。获取推荐模型的步骤分成准备训练数据,训练模型和提供内容服务三步。准备训练数据步骤将用户A的数据和他以往关注的历史内容进行采样,得出一系列需要的特征:用户A的性别,活跃度以及新内容的新鲜程度,和用户A与相似内容的历史互动程度等。这些训练样本会被放入通过LR,SVM,GBDT,和CNN(只处理图像内容)这些算法进行计算,并得出相应的分数。分数可能是个小数。再根据系统预先设定好的AUC值(例如,0.7)进行选择。在实际应用中,LR和GBDT对于文本特征的处理能力最强,CNN对图像特征处理结果最靠谱。在后台根据计算出来的模型特征进行手动筛选和模型调优(当然,这个模型调优步骤会分析不止用户A的数据,还会结合许多用户的数据训练结果)。然后推荐模型就生成了。

而这15条内容更新也会相应的根据用户A刷新并浏览这些内容后,对内容的反馈信息(打开内容浏览表示感兴趣,没有打开忽略掉的表示不感兴趣)进行进一步的帮助推荐模型学习和调优(可以是每天累加调整一次,其中的一些参数的配置会需要后台进行调整)。这样,下一次再为用户A推荐就能够更加精准。

接下来,这15条内容就会被放入推荐模型里面进行判断。当模型把新的内容和要推送给的用户进行分析,并逐一预测出每个用户可能会对该内容产生互动的概率,将概率作为分数返回并生成一个优先顺序的队列,存到分类内容存储模块101里面。在本实施例中,这样的优先顺序很可能是:排在最前面的是用户A最感兴趣的那9条内容(取决于他最喜欢哪个话题),然后是4条可能感兴趣的来自其他相似兴趣数据源的内容,最后的是2条乐队更新。

这时,用户A通过应用程序比如,手机端应用登陆了平台,刷新内容的请求会随着用户的登陆而发送到信息流生成模块102。这时,信息流生成模块102就会从分类内容储存模块101里面把这15条排好顺序的内容提取出来,并删除分类内容储存模块101里关于这15条内容的记录,然后把内容推送给信息聚合模块103。

信息聚合模块103会在不影响这15条新内容排序的基础上,在后面加上用户之前已浏览过的,从常规内容存储104中提取的旧内容,推送到用户A的手机端应用中。当用户A看到这些更新后,这15条新内容就会被存储到常规内容存储104中,形成快照,以便下次最为旧内容返回给用户。

作为本实施例中的优选,所述排序按照如下智能排序模型进行:

对内容的样本采样后进行特征生成,准备训练数据;

将所述训练数据按照机器学习模型生成训练模型;

根据所述训练模型在接收到请求后提供内容服务。

在一些实施例中,与已采集的内容相似或者相关的内容包201括但不限于,基于用户的推荐(User-based Recommendation)算法、基于项目的推荐(Item-based Recommendation)算法、基于模型的推荐(Model-based Recommendation)算法。

所属领域的普通技术人员应当理解:以上,所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1