一种内容推荐方法与流程

文档序号:30344213发布日期:2022-06-08 08:45阅读:109来源:国知局
一种内容推荐方法与流程

1.本发明涉及计算机技术领域,具体涉及一种内容推荐方法。


背景技术:

2.个性化、定制化、精准化的内容推荐能带来更好的用户体验,帮助互联网平台提升用户粘性、带来营收增长,以低运算成本高推荐准确度为目标的内容推荐方法成为各互联网平台的核心竞争力之一。近些年,游戏市场不断增长,面向游戏应用的内容推荐也成为互联网应用平台、尤其是游戏应用平台促进业务增长的主要手段之一。
3.考虑到游戏应用不同于文字视频内容,用户尝试新游戏应用付出的时间成本更高,导致一旦推荐无效,用户对游戏应用平台的评价将受到较大消极影响,带来用户流失风险。然而,当前面向游戏应用的内容推荐往往受限于用户在平台上的行为数据缺乏、游戏内容玩法多样等因素限制,面向游戏应用的内容推荐方法往往达不到较好的效果。不仅如此,由于游戏画面体验对用户有很大影响,在实际场景中,即便传统内容推荐方法推荐到玩法、类型符合用户喜好的游戏应用,用户也会因为游戏画面与喜好不符而放弃推荐内容,导致推荐无效。


技术实现要素:

4.针对上述存在的技术局限性,本发明提出了一种内容推荐方法,用于根据游戏画面进行游戏内容推荐以提升内容推荐准确率,通过分析用户在游戏内的操作画面获取用户偏好数据进行游戏应用推荐。
5.为实现上述目的,本发明采用以下技术方案:本发明的发明点是提供一种内容推荐方法,用于根据用户游戏操作画面进行游戏应用推荐包括以下步骤:步骤1、对服务器收集到的目标用户的游戏画面数据进行图像预处理,对预处理后的图像进行特征值提取,并将提取到的画面特征值数据存储至用户数据库中;步骤2、从用户数据库中提取预设时间范围内的画面特征值数据,得到画面特征集合;步骤3、将所述画面特征集合输入预先训练的聚类模型中得到画面分类结果及聚类指标,并组合得到目标用户画面偏好特征;步骤4、根据目标用户画面偏好特征从游戏数据库中筛选具有相似特征的游戏id作为第一内容推荐结果;步骤5、根据目标用户画像数据在用户数据库中匹配相似用户群,获取相似用户群的历史游戏id,剔除目标用户的历史游戏id后作为第二内容推荐结果;步骤6、根据第一内容推荐结果与第二内容推荐结果获得第三内容推荐结果,作为最终的内容推荐结果。
6.本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明
提供的一种内容推荐方法达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:(1)本发明借助对用户游戏操作画面及游戏元素图片的分析进行游戏应用推荐,可针对用户对游戏画面的需求和偏好提供更准确的应用推荐;(2)将根据游戏画面偏好的推荐结果与基于相似用户的推荐结合,弥补了单一推荐方法带来的偏差,带来更好的推荐效果。
7.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
8.图1为本发明实施例提供的一种内容推荐方法的流程图。
具体实施方式
9.为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种内容推荐方法,详细说明如后。
10.在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时处理可以被终止,但是还可以具有未包括在附图中的附加步骤。处理可以对应于方法、函数、规程、子例程、子程序等等。
11.本发明实施例提供了本发明提出了一种内容推荐方法,用于根据游戏画面进行游戏内容推荐,参考图1所示包括以下步骤:步骤1、对服务器收集到的目标用户的游戏画面数据进行图像预处理,对预处理后的图像进行特征值提取,并将提取到的画面特征值数据存储至用户数据库中;所述特征值提取采用包括方向梯度直方图(hog)特征算法、sift特征算法、csift特征算法、surf算法、orb算法、lbp算法中的一种或多种算法的组合;步骤2、从用户数据库中提取预设时间范围内的画面特征值数据,得到画面特征集合;步骤3、将所述画面特征集合输入预先训练的聚类模型中得到画面分类结果,并计算当前的聚类指标;将聚类结果、聚类指标、原始画面特征数据进行组合,得到目标用户画面偏好特征;所述画面分类结果包括类别数量、各类别包含的元素数量、各类别的图像元素;所述目标用户画面偏好特征包括画面分类结果、各分类对应的聚类指标数值、各分类对应的图像元素的画面特征值;步骤4、通过计算目标用户画面偏好特征与游戏数据库中其他游戏的画面相似度,筛选具有相似特征的游戏id作为第一内容推荐结果;步骤5、通过计算目标用户画像数据与用户数据库中其他用户的画像相似度,筛选具有相似画像的用户群,并获取相似用户群的历史游戏id,剔除目标用户的历史游戏id后
作为第二内容推荐结果;步骤6、根据第一内容推荐结果与第二内容推荐结果获得第三内容推荐结果,作为最终的内容推荐结果。
12.步骤1-6涉及到的相关数据存储于服务器中的数据库中,数据库包括用户数据库和游戏数据库。
13.所述用户数据库包括用户基本信息列表、用户游戏记录表、用户游戏画面记录表、用户画像列表;所述用户基本信息列表用于存储用户基本信息,包括用户id、用户名、年龄、地区;所述用户游戏记录表用于存储用户所注册游戏应用的相关操作数据,包括用户id、游戏id、游戏时长、游戏消费记录;所述用户游戏画面记录表用于存储用户的游戏画面数据,包括用户id、游戏id、画面id、画面特征值;所述用户画像列表用于存储用户画像数据,包括用户id、年龄、地域、职业、游戏类型偏好标签、时间偏好标签、消费偏好标签;所述游戏数据库包括游戏基本信息列表、游戏画面特征列表、游戏用户列表;所述游戏基本信息列表用于存储游戏基本信息,包括游戏id、名称、发行商、上市日期、类型标签;所述游戏画面特征列表用于存储游戏画面特征数据,包括游戏id、画面类型id、画面特征值;所述游戏用户列表用于存储游戏的所有用户信息。
14.作为一种实施例,所述图像预处理包括图像裁剪、图像滤波、图像增强;其中,图像滤波可采用均值滤波、方框滤波、均值滤波、中值滤波及双边滤波中的一种或多种方法的组合;图像增强可采用直方图均衡化算法、基于拉普拉斯算子的图像增强、基于对数变换的图像增强、基于伽马变换的图像增强中的一种或多种方法的组合。
15.所述画面分类结果包括类别数量、各类别包含的元素数量、各类别的图像元素;所述目标用户画面偏好特征包括画面分类结果、各分类对应的聚类指标数值、各分类对应的图像元素的画面特征值;作为一种实施例,所述聚类指标采用轮廓系数、calinski-harabasz指数、davies-bouldin指数、邓恩指数(dvi)、簇内误差平方和(sse)中的一种或多种的组合。
16.可以理解的是,上述聚类指标的计算方法为常规技术手段,本技术领域内的技术人员完全可根据实施方式的描述顺利实现,在此不进行赘述。
17.作为一种实施例,步骤3中所述聚类模型通过以下方式得到:(1)从所述用户数据库种提取原始游戏画面图像集经特征标准化处理后拆分为聚类模型训练集和聚类模型测试集(2)采用机器学习算法依靠聚类模型训练集训练聚类模型,并利用聚类模型测试集对聚类模型进行评估;所述机器学习算法包括k-means算法、k-means++算法、bi-kmeans算法、dbscan算法、optics算法、层次聚类算法中的一种或多种的组合;(3)进行参数优化,直到召回率和准确率满足预设阈值,并输出聚类模型。
18.可以理解的是,当采用不同的机器学习算法时程序设计有所差异,但均为成熟的技术手段,本领域的技术人员根据上述实施例的描述,完全可以顺利实现该算法,在此不赘述。
19.作为一种实施例,步骤4还包括:
步骤41、提取所述目标用户画面偏好特征中各类别的图像元素作为参考数据集i;其中i=[p1,p2,
……
,pn], pi(i=1,2,
……
,n)为第i个分类下的所有图像元素的画面特征值所组成的集合;步骤42、从游戏数据库中提取各游戏的游戏画面特征数据,按照游戏id分别计算各游戏画面特征值与参考数据集中各子集的相似度,得到对应游戏的相似度数组l;其中l=[l1,l2,
……
,ln],lj(j=1,2,
……
,n)为游戏画面特征值与参考数据集中第j个子集的相似度;步骤43、根据所述相似度数组计算各游戏的画面相似度,若画面相似度大于预设相似度阈值,则该游戏id放入第一内容推荐结果;所述相似度采用包括欧氏距离、汉明距离、余弦相似度、皮尔逊相关系数中的任一种方法,均为本领域成熟的计算方法,在此不赘述;所述画面相似度取相似度数组l中的最大值。
[0020]
作为一种实施例,步骤5还包括:步骤51、根据目标用户id在用户画像列表中查询目标用户的画像数据;步骤52、计算目标用户的画像数据与其他用户的画像数据之间的画像相似度;步骤53、选取画像相似度大于预设画像相似度阈值的用户作为相似用户群;步骤54、以相似用户群中的用户id为关键字,在用户游戏记录表中查询游戏时长大于预设游戏时长阈值的游戏id,得到相似用户群推荐集合;步骤55、剔除所述相似用户群推荐集合中与目标用户的历史游戏id重合的游戏id,得到第二内容推荐结果。
[0021]
所述画像相似度采用包括欧氏距离、汉明距离、余弦相似度、皮尔逊相关系数中的任一种方法,均为本领域成熟的计算方法,在此不赘述。
[0022]
作为一种实施例,步骤6中所述第三内容推荐结果通过以下方式得到:(1)计算第一内容推荐结果与第二内容推荐结果中所有元素的内容推荐指数;(2)提取第一内容推荐结果与第二内容推荐结果中内容推荐指数大于预设推荐指数阈值的元素作为第三内容推荐结果。
[0023]
所述内容推荐指数的计算方法为:rk=ri*i
1k
+n*r
p
*i
2k
,其中,rk为元素k的内容推荐指数,ri、r
p
分别为第一推荐系数和第二推荐系数,n为元素k在第二内容推荐结果中出现的次数,i
nk
(n=1,2)为元素k的推荐权值;当元素k在第一内容推荐结果中时i
1k
取1,否则i
1k
取0;当元素k在第二内容推荐结果中时i
2k
取1,否则i
2k
取0。
[0024]
第二推荐系数r
p
与所述第一推荐系数ri的关系为:r
p
=1
‑ꢀri
作为一种实施例,第一推荐系数可通过对所述聚类指标进行数据归一化得到:当所述聚类指标使用具有数值越大效果越好特征的评价指标(如calinski-harabasz指数、邓恩指数)时,直接采用数据归一化函数进行数据归一化;当所述聚类指标使用具有数值越大效果越好特征的评价指标(如davies-bouldin指数、簇内误差平方和)时,可对聚类指标数值取倒数后采用数据归一化函数进行数据归一
化进行优化;所述数据归一化函数可采用反正切函数或sigmoid函数。
[0025]
作为一种实施例,第一推荐系数还可直接由所述聚类指标计算得到,具体方法如下:若所述聚类指标采用轮廓系数时,第一推荐系数ri与聚类指标数值ci的关系为:;若所述聚类指标采用calinski-harabasz指数时,第一推荐系数ri与聚类指标数值ci的关系为:当ci小于0.1时,ri取值为0;当ci大于等于0.1小于1时,ri取值为0.2;当ci大于等于1小于5时,ri取值为0.5;当ci大于等于5小于10时,ri取值为0.8;当ci大于10时,ri取值为0.9;若所述聚类指标采用davies-bouldin指数时,第一推荐系数ri与聚类指标数值ci的关系为:当ci小于0.01时,ri取值为1;当ci大于等于0.01小于0.1时,ri取值为0.8;当ci大于等于0.1小于0.5时,ri取值为0.5;当ci大于等于0.5小于1时,ri取值为0.2;当ci大于等于1时,ri取值为0.1;若所述聚类指标采用邓恩指数(dvi)时,第一推荐系数ri与聚类指标数值ci的关系为:当ci小于1时,ri取值为0.1;当ci大于等于1小于5时,ri取值为0.4;当ci大于等于5小于50时,ri取值为0.6;当ci大于等于50小于100时,ri取值为0.8;若所述聚类指标采用簇内误差平方和(sse)时,第一推荐系数ri与聚类指标数值ci的关系为:当ci小于0.001时,ri取值为1;当ci大于等于0.001小于0.01时,ri取值为0.8;当ci大于等于0.01小于0.1时,ri取值为0.5;当ci大于等于0.1小于1时,ri取值为0.2;当ci大于等于1时,ri取值为0.1。
[0026]
作为一种实施例,本发明所述方法可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(asic)、通用计算机或任何其他类似硬件设备来实现。
[0027]
本发明所述的方法可以软件程序的形式实施,所述软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,所述软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,ram存储器,磁或光驱动器或软磁盘及类似设备。
[0028]
另外,本发明所述方法的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0029]
另外,本发明所述的方法的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本技术的方法和/或技术方案。而调用本发明所述方法的程序指令,可被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。
[0030]
作为一种实施例,本发明还提供一个装置,该装置包括用于存储计算机程序指令
的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述的多个实施例的方法和/或技术方案。
[0031]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0032]
最后,需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0033]
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1