一种基于马尔科夫链的图书推荐方法

文档序号:6616028阅读:319来源:国知局
专利名称:一种基于马尔科夫链的图书推荐方法
技术领域
本发明涉及一种基于马尔科夫链的图书推荐方法,属于网络应用技术领域。
背景技术
随着移动、互联网技术的飞速发展,图书的数字化成为一个必然趋势。越来越多的图书阅读平台受到了用户的高度关注,并取得了迅猛发展,已经成为人们获取信息和知识的重要途径。图书阅读平台上通常拥有海量的数字图书资源,如何有效地利用这些丰富而宝贵的资源,让用户能够更快捷地找到并充分地利用它们就显得非常重要,因此图书的个性化智能推荐是图书阅读平台的一个很重要的功能。目前,图书的个性化智能推荐主要分为基于内容的图书推荐、协同过滤图书推荐、基于知识的图书推荐和组合图书推荐。基于内容的图书推荐根据用户的行为记录,建立符合用户口味的兴趣档案,根据推荐对象的内容特征匹配用户的兴趣档案,发现用户可能感兴趣的商品,常用于文本类的推荐,例如新闻和邮件等。协同过滤图书推荐是应用比较广泛的推荐方法,发现用户的相似用户,根据相似用户群体的行为信息对用户进行推荐。基于知识的图书推荐主要是根据行业内的一些专家意见进行推荐,往往是一定固定的推荐规则。组合图书推荐是综合利用各种推荐算法,把推荐算法的结果进行整合,形成更加全面的推荐结果。以上的推荐方法都是根据用户的历史行为记录的静态数据进行推荐,而没有考虑用户的行为实际上是一个动态的过程,即用户的行为是一个时间序列上的数据,而不是简单的对某个物体的喜欢或者厌恶。在对用户进行图书推荐时,用户的阅读喜好很有可能正慢慢地发生改变,这一点可以根据用户最近的阅读图书反映出来,如果仅仅利用用户的静态数据,而没有结合时间特性,就不可能在第一时间发现用户对图书的喜好变化,从而造成信息缺失,导致向用户推荐的图书不符合用户的当前喜好。因此,如何根据用户的动态行为,向用户进行图书的个性化推荐,仍是一个急需要解决的技术难题。

发明内容
有鉴于此,本发明的目的是提供一种基于马尔科夫链的图书推荐方法,能根据用户的动态行为,向用户进行图书的个性化推荐。为了达到上述目的,本发明提供了一种基于马尔科夫链的图书推荐方法,所述方法包括有
步骤一、查询用户的阅读历史数据,并基于朴素贝叶斯算法,计算用户的初始状态概率向量
权利要求
1.一种基于马尔科夫链的图书推荐方法,其特征在于,所述方法包括有 步骤一、查询用户的阅读历史数据,并基于朴素贝叶斯算法,计算用户的初始状态概率向量P= ( ;;_ :,:,Pパて >:),其1卜,分別圮用户对图书的喜欢、不喜欢状态,}[是用户当前阅读图书的标签向量,P:__こX、?._C: X丨分别是用户对图书的喜欢、不喜欢状态概率; 步骤ニ、查询用户的当前阅读图书和所有未阅读图书,井根据所有用户对该用户的当前阅读图书和未阅读图书的喜欢和不喜欢状态,分别计算该用户当前阅读图书到每个未阅读图书的转移概率矩阵; 步骤三、根据用户的初始状态概率向量、和用户当前阅读图书到未阅读图书的转移概率矩阵,分别计算用户从当前阅读图书转移到每个未阅读图书的状态概率向量,所述状态概率向量包括有用户对未阅读图书的喜欢状态概率,并据此向用户推荐未阅读图书。
2.根据权利要求I所述的方法,H:特征/I:Γ,所述ル·骤· ·|||,Ρ:_€. X〕的计算公式如下,j=o表示喜欢
3.根据权利要求2所述的方法,其特征在于,所述CI的计算公式是PvC. ■= Π;;., ;·;, (:,其中,η是用户的当前阅读图书包含的标签总数,にI是用户的当前阅读图书所包含的标签k,P (.:是用户喜欢或不喜欢标签k的概率。
4.根据权利要求3所述的方法,其特征在于,所述Ρ :ν_ 〕'的计算公式是 _ = 一,其中,·p是用户阅读过,并且喜欢或不喜欢的所有图书包含的标签总.*I 1J数,T <是用户阅读过,并且喜欢或不喜欢的所有图书包含的标签k的总数。
5.根据权利要求2所述的方法,其特征在于,所述P.C .的计算公式是P; O =: -,其中,是用户喜欢或不喜欢的图书总数,S是用户阅读过的图书总数。
I
6.根据权利要求2所述的方法,其特征在于,根据用户的阅读历史数据来计算P' 和P ;ン >:的比例,井根据エ· Pu: = I.,即可计算出P: C :ぐ.和P C- X具体数值。
7.根据权利要求I所述的方法,其特征在于,所述步骤ニ中,用户的当前阅读图书U到未阅读图书V的转移概率矩阵ノ M,其中,; .,t是从喜欢图书u到喜欢图书V的状态转移概率,Iii是从喜欢图书u到不喜欢图书V的状态转移概率,qi。是从不喜欢图书U到喜欢图书V的状态转移概率, I是从不喜欢图书U到不喜欢图书V的状态转移概率。
8.根据权利要求7所述的方法,其特征在于,所述-ij的计算公式如下,i/或t=0表示对图书u/或V是喜欢状态,i/或t=l表示对图书u/或V是不喜欢状态_q ,=,其中,U是连续读过图书u和V的用户总数,U .是在连续读过图书u和V的用户中,由对图书u的状态i直接转移到对图书V的状态j的用户总数。
9.根据权利要求I所述的方法,其特征在于,所述步骤三中,用户从当前阅读图书u转移到未阅读图书V的状态概率向量的计算公式如下
10.根据权利要求9所述的方法,其特征在干,P = ; ρ ··' 0· Λ- p ·' C. L _,其中,p__’_ C.幻是用户对未阅读图书V的喜欢状态概率,P " C. 是用户对未阅读图书V的不喜欢状态概率。
11.根据权利要求 ο所述的方法,其特征在于,按照用户对未阅读图书的喜欢状态概率值的大小,对所有未阅读图书进行排序,并从中挑选出喜欢状态概率值最大的若干本图书向用户推荐。
全文摘要
一种基于马尔科夫链的图书推荐方法,方法包括有步骤一、查询用户的阅读历史数据,并基于朴素贝叶斯算法,计算用户的初始状态概率向量;步骤二、查询用户的当前阅读图书和所有未阅读图书,并根据所有用户对该用户的当前阅读图书和未阅读图书的喜欢和不喜欢状态,分别计算该用户当前阅读图书到每个未阅读图书的转移概率矩阵;步骤三、根据用户的初始状态概率向量、和用户当前阅读图书到未阅读图书的转移概率矩阵,分别计算用户从当前阅读图书转移到每个未阅读图书的状态概率向量,所述状态概率向量包括有用户对未阅读图书的喜欢状态概率,并据此向用户推荐未阅读图书。本发明属于网络应用技术领域,能根据用户的动态行为进行图书的个性化推荐。
文档编号G06F17/30GK102982131SQ201210460908
公开日2013年3月20日 申请日期2012年11月16日 优先权日2012年11月16日
发明者廖建新, 郭伟东, 张雷, 赵贝尔, 崔晓茹 申请人:杭州东信北邮信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1