基于时间迁移的知识推荐方法与流程

文档序号:11620702阅读:292来源:国知局
基于时间迁移的知识推荐方法与流程

本发明属于数据挖掘、自然语言处理和推荐系统领域,涉及知识推荐、在线学习、时间迁移和协同过滤推荐技术,尤其是一种基于时间迁移的知识推荐方法。



背景技术:

目前,推荐的相关技术主要分为两类:一种是基于内容的推荐技术。另一种是基于协同过滤的推荐技术。

基于内容的推荐系统,指系统为用户推荐与用户过去兴趣类似的物品,即根据用户的已知偏好、兴趣,建立与物品内容属性相匹配的关系。例如,若某个用户对一部喜剧电影有正面评价,则系统会从喜剧类型中为该用户推荐其他电影。基于内容的推荐技术的主要处理过程是:抽取相关的结构化信息,得到用户的偏好数据,建立用户的兴趣模型;将用户个人信息和物品的空间表示进行匹配,最后得出推荐结果列表进行相应的用户推荐。

协同过滤推荐算法一般采用最近邻技术,根据用户的历史偏好信息计算用户之间的相似度,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的偏好,从而根据这一偏好来对目标用户进行推荐。协同过滤算法的推荐结果来自于用户(推荐的目标用户和其它用户)的历史行为数据。因此,随着时间的推移,用户的历史行为数据量逐渐增多,推荐的准确度和性能都会相应提升。

基于内容的推荐算法,其主要缺点是内容的可分析性有限,本质上无法推荐具有惊喜度的物品;并且无法显式地得到其它用户的判断情况等。协同过滤推荐算法的也存在一定的缺陷,如稀疏问题,用户的行为数据存在大量的空值;可扩展性差,随着用户或者物品数量的增加,user-item矩阵不断增加,导致相似度矩阵不断增加,最终会因为空间不足或时间过长而导致系统无法使用。



技术实现要素:

为克服现有技术的不足,本发明旨在提出一种短期学习和长期学习两种不同学习模式下的时间迁移影响模型,能够充分考虑时间迁移影响的知识推荐算法,形成可根据不同在线学习平台进行调整的知识推荐方法。本发明采用的技术方案是,基于时间迁移的知识推荐方法,具体步骤如下:

步骤一:提取原始数据的有效特征,建立学习用户模型、知识项目模型,通过选取能够代表学习用户的特征建立学习用户模型;选取能够代表知识项目特征建立知识项目模型;

步骤二:计算学习用户-知识项目评分矩阵,确定学习用户-知识项目关系模型,根据步骤一中所完成的模型,提取学习用户与知识项目的关系特征,并建立学习用户-知识项目关系模型;

步骤三:针对学习用户和知识项目的特征,拟合不同的时间影响因子,在步骤一、二的基础上添加时间影响因子模型,根据现代人的生活方式,确定适合学习用户的短期时间影响因子和长期时间影响因子;

步骤四:结合协同过滤框架、时间影响因子拟合模型,确定基于时间迁移的知识推荐算法,在步骤一到三的基础上,组合学习用户、知识项目、时间影响因子拟合函数等进行组合建模,得出具体的推荐框架;

步骤五:在步骤一到步骤四的基础上,使用各评价指标综合衡量准确度,将得到的预测推荐结果与用户的实际选择结果进行比较,得出推荐预测的准确度,包括用户满意度、预测准确度、分类准确度以及物品覆盖率等,由此衡量准确度。

验证步骤,使用准确率、召回率以及两者综合计算得出的f值作为预测评分的评价标准,准确率、召回率、f值的计算公式如公式(1)(2)(3)所示。

其中ns表示既被推荐算法又被用户喜爱的项目个数,nr表示被推荐算法推荐的项目个数,na表示用户喜欢的项目的总个数。

一个具体实例中步骤如下:

步骤s0101:首先进行数据分析,分析用户的学习能力、兴趣、背景,提取学习用户特征;分析知识项目的知识强度,知识效果,提取知识项目特征,完成学习用户、知识项目的建模;

步骤s0201:根据前者建立的模型,提取用户偏好信息,建立学习用户u与学习过的题目集合vu之间的关系,得以计算用户喜好向量likeu,l,建立学习用户与知识项目的关系模型;

步骤s0301:完成题目间相似度的计算,根据题目不同类型,进行不同方式的题目间相似度的计算;

设i,u为两个不同的题目,求两者相似度simi,j如公式(1)所示:

其中u表示学习用户集合,i表示题目集合,学习用户与题目间关系模型使用二维评分矩阵rm×n表示,矩阵中元素ru,i表示学习用户u对题目i的整体偏好程度,δtu,i表示学习用户u完成题目i时的当前时间的掌握程度偏移值,其计算方式如公式(2)所示:

δtu,i=tu,k-tu,i(2)

其中k表示当前时间,tu,k表示学习用户u完成题目k时掌握程度偏移值,tu,i表示学习用户u完成题目i时掌握程度偏移值,其计算方式如公式(3)所示:

其中vu为学习用户u学习过的题目集合,为题j的平均得分,weight(u,i)函数定义为题目i对学习用户u的时间影响因子;

步骤s0302:根据题目的关系,分析用户在各个时间段的学习内容的迁移变化情况,包括短期时间内的碎片学习,和长期的深入探究情况,来确定时间影响因子;

步骤s0401:确定推荐框架。结合学习用户模型、知识项目模型以及时间影响因子拟合模型,确立具体推荐方式:预测用户对其未提交过的题目的掌握程度,计算学习用户u对其未提交过的题目i的掌握程度graspu,i,其计算方式如公式(4)所示:

步骤s0501:通过计算用户i对推荐项目的预测评分,计算出本发明的准确率、召回率以及两者综合计算得出的f值,从而衡量推荐算法的准确度。

本发明的特点及有益效果是:

本发明基于时间迁移的知识推荐算法从知识项目的相似度入手,在计算项目间相似度时加入了时间影响因子,从而对传统的协同过滤算法(collectivefilter)进行了改进,从最终实验室结果可证明,基于时间迁移的知识推荐算法比传统的协同过滤推荐算法更具有优势。

附图说明:

图1为整体示意图。

图2为面向在线测评系统各算法效果对比。图中,a:n=20时各算法准确率;bn=100时各算法准确率。

具体实施方式

本发明提出一种基于时间迁移的知识推荐算法,包含以下步骤:

步骤一:提取原始数据的有效特征,建立学习用户模型、知识项目模型。通过选取能够代表学习用户的特征建立学习用户模型;选取能够代表知识项目特征建立知识项目模型。

步骤二:计算学习用户-知识项目评分矩阵,确定学习用户-知识项目关系模型。根据步骤一中所完成的模型,提取学习用户与知识项目的关系特征,并建立学习用户-知识项目关系模型。

步骤三:针对学习用户和知识项目的特征,拟合不同的时间影响因子。在步骤一、二的基础上添加时间影响因子模型。根据现代人的生活方式,可以确定适合学习用户的短期时间影响因子和长期时间影响因子。

步骤四:结合协同过滤框架、时间影响因子拟合模型,确定基于时间迁移的知识推荐算法。在步骤一到三的基础上,组合学习用户、知识项目、时间影响因子拟合函数等进行组合建模,得出具体的推荐框架。

步骤五:在步骤一到步骤四的基础上,使用各评价指标综合衡量本发明的准确度。将得到的预测推荐结果与用户的实际选择结果进行比较,得出推荐预测的准确度,包括用户满意度、预测准确度、分类准确度以及物品覆盖率等,由此衡量本发明的准确度。

实验在改变推荐个数为20、100等不同近邻值k时,测试使用sin函数模拟时间影响因子的基于时间迁移的推荐方法及使用tan函数模拟时间影响因子的基于时间迁移的推荐方法得出预测评分的准确度。

同时,本发明使用准确率(precision)、召回率(recall)以及两者综合计算得出的f值作为预测评分的评价标准。准确率、召回率、f值的计算公式如公式(1)(2)(3)所示。

其中ns表示既被推荐算法又被用户喜爱的项目个数,nr表示被推荐算法推荐的项目个数,na表示用户喜欢的项目的总个数。

实验结果表明,不同学习方式应使用不同的时间影响因子拟合函数。sin函数的拟合方式更适合需要长期学习的项目如电影,书籍等,而tan函数的拟合方式更适合短期学习的项目如题目、作业等。

当k小于40时实验结果往往较差,当k值取40,推荐个数为20时能够获得较好的推荐效果和推荐效率,如图2所示。选取合适的时间影响因子拟合函数后,基于时间迁移的知识推荐算法在实际数据中能取得不错的效果,并对知识推荐的结果有所改善,可以达到改善传统的协同过滤算法的目的。

基于时间迁移的知识推荐算法从知识项目的相似度入手,在计算项目间相似度时加入了时间影响因子,从而对传统的协同过滤算法(collectivefilter)进行了改进,从最终实验室结果可证明,基于时间迁移的知识推荐算法比传统的协同过滤推荐算法更具有优势。

如图2所示,当n=20时,k值取值为40后,k值的增大对准确率、召回率、f值的影响不大,反而会有所下降,同时k值增大会增加计算复杂度,延长计算时间,因此可根据实际情况调整k值。实验中k取40效果较佳,但当n=100时,由于推荐个数增加,k值的增加对准确率、召回率和f值的影响变大,当k取100时才有平稳趋势,表明此时确定的候选集范围较为合适。同时实践中为用户推荐20个项目较为合适。

本发明提供了一种基于时间迁移的知识推荐算法,如图1所示,为本发明产品推荐方法的具体实施例的整体示意图,包括:

步骤s0101:首先进行数据分析,分析用户的学习能力、兴趣、背景等,提取学习用户特征;分析知识项目的知识强度,知识效果等,提取知识项目特征,完成学习用户、知识项目的建模。

步骤s0201:根据前者建立的模型,提取用户偏好信息,建立学习用户u与学习过的题目集合vu之间的关系,得以计算用户喜好向量likeu,l,建立学习用户与知识项目的关系模型。

步骤s0301:完成题目间相似度的计算。根据题目不同类型,进行不同方式的题目间相似度的计算。

设i,u为两个不同的题目,求两者相似度simi,j如公式(1)所示。

其中u表示学习用户集合,i表示题目集合。学习用户与题目间关系模型使用二维评分矩阵rm×n表示。矩阵中元素ru,i表示学习用户u对题目i的整体偏好程度。

其中δtu,i表示学习用户u完成题目i时的当前时间的掌握程度偏移值,其计算方式如公式(2)所示。

δtu,i=tu,k-tu,i(2)

其中k表示当前时间,tu,i表示学习用户u完成题目i时掌握程度偏移值,其计算方式如公式(3)所示。

其中vu为学习用户u学习过的题目集合,为题j的平均得分,weight(u,i)函数定义为题目i对学习用户u的时间影响因子。

步骤s0302:根据题目的关系,分析用户在各个时间段的学习内容的迁移变化情况,如短期时间内的碎片学习,和长期的深入探究等情况,来确定时间影响因子。

步骤s0401:确定推荐框架。结合学习用户模型、知识项目模型以及时间影响因子拟合模型等,确立具体推荐方式:预测用户对其未提交过的题目的掌握程度,计算学习用户u对其未提交过的题目i的掌握程度graspu,i,其计算方式如公式(4)所示。

步骤s0501:通过计算用户i对推荐项目的预测评分,计算出本发明的准确率(precision)、召回率(recall)以及两者综合计算得出的f值,从而可以衡量本发明提出的推荐算法的准确度。

本发明所述的一种基于时间迁移的知识推荐方法,为在线学习平台的推荐技术提供了一种新思路,提出并定义一种基于时间迁移的知识推荐框架,基于学习用户建模,知识项目建模,学习用户与知识项目关系建模方法,充分考虑学习的增长性,为学习用户推荐更适合其继续学习的知识项目的面向在线测评系统的知识推荐算法。通过实验结果验证,基于时间迁移的知识推荐算法在实际数据中取得不错的效果,这种方法对在线平台的知识推荐的结果有所改善,可以很好的提高推荐效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1