一种基于协同过滤的个性化屏幕推荐方法与流程

文档序号:18552450发布日期:2019-08-30 22:11阅读:150来源:国知局
一种基于协同过滤的个性化屏幕推荐方法与流程

本发明涉及一种屏幕的推荐方法,尤其涉及一种基于协同过滤的个性化屏幕推荐方法。



背景技术:

近年随着互联网广告的迅速崛起,传统广告形式电视、报纸、杂志类等广告市场份额比重逐年降低,已从2012年的接近60%的市场份额降至2016年的不足30%。屏幕类广告如户外led广告、电梯广告、互联网广告却保持强劲的增长态势。目前已经有开发者,充分利用互联网平台,实现屏幕联网,对屏幕实时、集中管理,打造海量屏幕的交易平台,带给客户(广告投放商)更快捷、高效、优质的广告体验。

目前将屏幕联网、集中管理并提供用户(广告投放商)更快捷、高效地找到合适的屏幕(位置好、人流量大的屏幕)的技术是:基于lbs定位技术及搜索引擎查找屏幕,此技术通过在已经采集好屏幕位置信息的移动app上直接看地图查找屏幕或搜索屏幕名称查找屏幕,然后发布需上传的(广告)信息。

由于屏幕在持续地增加,大量的屏幕让用户手足无措,单通过地图查找屏幕或搜索屏幕名称查找屏幕效率较底;另一方面用户也不知道自己所交易的屏幕是否有很好的广告效果,实地考察又不现实。因此如何高效的从繁杂的屏幕中筛选出自己感兴趣的、对自己有效的屏幕成为一个急需解决的技术问题。



技术实现要素:

为了克服以上技术的不足,本发明的目的在于提出一种基于协同过滤的个性化屏幕推荐方法,该方法考虑了用户与用户之间的兴趣关联,并通过此关联高效地帮助用户从繁杂的屏幕中筛选出自己感兴趣的、对自己有效的屏幕。

为了达到上述目的,本发明所采用的技术方案是:一种基于协同过滤的个性化屏幕推荐方法,其特征在于,包括以下步骤:

(1)对数据库中用户信息表及屏幕评分表进行预处理,屏幕评分表是每个用户通过移动终端购买各种屏幕(户外led屏、液晶显示屏、电梯广告屏)播放时间段后对屏幕评分后的数据表;然后将数据库中的用户对屏幕的评分表、屏幕gps定位信息表及用户信息表提取出来;

(2)根据屏幕定位坐标信息通过k-means算法对屏幕进行聚类,将屏幕分成k类(簇);

(3)分别对每一簇屏幕建立用户-屏幕倒查表,对还没有评价行为的屏幕进行补零,建立完整的用户对屏幕的评分表;

(4)分别计算出目标用户与除目标用户外的其他用户的相似度;

(5)计算用户对屏幕i的感兴趣程度,将目标用户对未评价的屏幕感兴趣程度分别计算出来;

(6)设定兴趣程度阈值,将大于这个阈值的屏幕推荐给目标用户;

(7)将推荐给目标用户的屏幕,根据兴趣程度进行降序排列输出。

进一步的,步骤(1)中对数据预处理,将数据库中屏幕gps定位信息表以及用户信息表和用户对屏幕的评分表提取出来,建立屏幕定位坐标信息表。

进一步的,步骤(2)包括以下子步骤:

第一步,根据屏幕定位坐标信息表及用户对屏幕的评分表提取出包含屏幕的定位信息及评分的数据集,随机在数据集d={x1,x2,…,xj}中,选取k个样本作为初始聚类中心{μ1,μ2,…,μk},其中xj代表屏幕样本,其包含两个属性:坐标及评分,μi(1≤i≤k)作为初始聚类中心的屏幕,其包含两个属性:坐标及评分;j代表屏幕数量;

第二步,根据公式计算屏幕样本xj与各个初始聚类中心的屏幕μi(1≤i≤k)的距离,ci代表着屏幕样本间距离小的划分为一类,e代表着屏幕样本与聚类中心的距离;

第三步,将剩余屏幕样本划分至与聚类中心的距离e最小的类别中,分配完成c={c1,c2,…,ci,ck},采用平均值法再次计算每一类别的聚类中心,重复第二步,不断迭代更新使屏幕样本与最终的聚类中心μi的距离e最小,最后将屏幕样本划分为k类;e越小则每类屏幕间的相似度越高,减小了步骤(4)中目标用户与其他用户相似度的计算复杂度,提高了推荐精确度。

进一步的,步骤(3)和步骤(4)中将用户id与屏幕id关联起来,并分别建立每类屏幕完整的用户-屏幕倒查表,根据用户-屏幕倒查表计算目标用户与除目标用户外的其他用户的相似度,其公式为:u为目标用户,v为除目标用户外的某一其他用户,n(u)为目标用户曾经评价过的屏幕集合,n(v)为除目标用户外的某一其他用户曾经评价过的屏幕集合。

进一步的,为了找出用户与用户之间的关联,步骤(5)中目标用户u对物品i的感兴趣程度计算公式为:s(u,k)包含和目标用户u兴趣最接近的k个用户,n(i)是对物品i有过评价的用户集合,wuv是目标用户u分别与除目标用户外的其他用户的兴趣相似度。

进一步的,步骤(6)和步骤(7)中将兴趣程度大于设定阈值的屏幕进行降序排列推荐给目标用户。

与现有技术相比,本发明的有益效果是:本发明提出了一种基于协同过滤的个性化屏幕推荐方法,与现有技术相比,其显著优点在于:

(1)传统的技术方法,通过地图查找屏幕或搜索屏幕名称查找屏幕,此方法遇到屏幕数量大时,不便于快速找到用户自己想要的屏幕。本发明在原有的服务器上增加了基于协同过滤的个性化屏幕推荐算法,能快速帮助用户找到对自己有效的屏幕。

(2)本发明利用了k-means聚类算法找出屏幕与屏幕之间的相似性,减少了协同过滤算法的复杂度,提高了推荐精确度;还充分考虑不同人群有不同的喜好,因此能有效的向目标用户推荐与其兴趣相似的、适合目标用户的屏幕。

(3)本发明不仅步骤简单、方便,因此能较为快速的更新推荐列表,便于用户快速筛选出有效的屏幕进行广告投放。

附图说明

图1是本发明基于屏幕物联网平台的整体流程图。

图2是基于协同过滤的个性化屏幕推荐方法的数据处理模型。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。

如图1所示,是本发明基于屏幕物联网平台的整体流程图,在传统的技术上增加了推荐列表,用户通过移动端直接查找推荐列表的屏幕,然后发布需上传的(广告)信息至屏幕端。重要的推荐列表是所有用户交易记录在服务器中通过数据处理所得,本发明采用的是基于协同过滤的个性化屏幕推荐算法,在原服务器上增加了对用户交易的历史记录的处理,挖掘用户感兴趣的屏幕。如何获取目标用户的推荐列表,例如:某考研机构a在高校交易过[(屏幕1、4分)、(屏幕2、5分)、(屏幕4、5分)、(屏幕6、4分)];机构b交易过[(屏幕1、5分)、(屏幕2、5分)、(屏幕3、5分)];机构c交易过[(屏幕2、4分)、(屏幕3、5分)、(屏幕4、5分)、(屏幕8、4分)];机构d在其他高校交易过[(屏幕11、2分)、(屏幕12、3分),(屏幕13、4分)]其如何给机构b推荐,本发明的数据分析与处理过程,如图2基于协同过滤的个性化屏幕推荐算法的数据处理模型。如下步骤:

步骤1:对历史数据进行预处理,将三个机构交易记录提取出来,得到用户对屏幕的评分表、屏幕cps定位信息表及用户信息表。

步骤2:根据屏幕定位坐标信息表及用户对屏幕的评分表提取出包含屏幕的定位信息及评分的数据集,若以机构b为聚类中心,由于机构d分别与a、b、c三个机构不在同一高校,并且评分上差异性较大,因此通过k-means聚类算法得到的结果是机构b与机构a、机构c的距离小、相似度高,因此a、b、c三个机构分为一类c1、机构d为另外一类c2。

步骤3:然后对c1建立用户-屏幕倒查表,根据余弦相似度公式:计算出机构b与机构a的相似度wba=0.5,以及机构b与机构c的相似度wbc=0.5。

步骤4:上例中涉及两个相似用户,因此k=2,并且机构b对屏幕6、屏幕8、屏幕4是没有任何购买行为,可根据感兴趣程度计算公式:分别计算出机构b对屏幕6、屏幕8、屏幕4的感兴趣程度,分别为p(b,6)=wba=0.5、p(b,8)=wbc=0.5、p(b,4)=wba+wbc=1。

步骤5:对上述计算出来的结果,若设定阈值大于等于0.5,那么降序排列的推荐列表将包括[屏幕4、屏幕6、屏幕8],最后将此列表从服务器传输至用户端输出,用户可根据推荐列表快速找到自己感兴趣、对自己有效的屏幕。本发明不需要用户提出明确的需求信息,通过分析用户对屏幕的评分记录,主动的给用户推荐他们感兴趣的屏幕。

应当理解的是,本说明书未详细阐述的部分均属于现有技术。

应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1