一种破除信息茧房问题的冷启动个性化推荐方法及装置与流程

文档序号:33300412发布日期:2023-02-28 22:38阅读:102来源:国知局
一种破除信息茧房问题的冷启动个性化推荐方法及装置与流程

1.本技术涉及数据处理技术领域,尤其涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置。


背景技术:

2.近年来,伴随着信息技术的蓬勃发展,人工智能技术在互联网应用过程中逐渐走向成熟,其中个性化内容推荐技术是一种基于用户行为产生的数据(例如,用户浏览记录、购物记录、关注信息、个人兴趣点标签等数据)构建个性化用户内容推荐模型进行用户喜好内容预测的智能技术。但是新注册用户在使用互联网的初始阶段产生的数据较少,系统推荐的内容就会集中在较小范围,这样一来,为冷启动阶段用户推荐的内容趋于同质化,极易造成信息茧房现象。
3.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本技术提供了一种破除信息茧房问题的冷启动个性化推荐方法及装置,以解决上述“为冷启动阶段用户推荐的内容趋于同质化”的技术问题。
5.根据本技术实施例的一个方面,本技术提供了一种破除信息茧房问题的冷启动个性化推荐方法,包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集,其中,候选推荐集包括候选推荐数据以及候选推荐数据与目标兴趣矩阵的特征相关度;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。
6.可选地,确定与目标账号的用户行为相似度达到第一阈值的对照账号包括:获取目标账号的第一兴趣数据,并从用户数据库中获取多个用户账号以及用户账号的第二兴趣数据,其中,用户数据库用于存储当前不处于冷启动阶段的用户账号在冷启动阶段时的兴趣数据;利用第一兴趣数据生成第一兴趣矩阵,以及利用第二兴趣数据生成第二兴趣矩阵;确定第一兴趣矩阵与各个第二兴趣矩阵的矩阵相似度,以获得目标账号与各个用户账号的用户行为相似度;将用户行为相似度达到第一阈值的用户账号确定为对照账号。
7.可选地,利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵包括:获取对照账号的当前兴趣数据,并利用当前兴趣数据生成对照兴趣矩阵;利用目标账号的第一兴趣矩阵对对照兴趣矩阵进行矩阵扩充,生成目标兴趣矩阵。
8.可选地,利用目标兴趣矩阵在预设内容池中确定候选推荐集包括:获取预设内容池,其中,预设内容池包括系统内容池和正能量内容池;利用目标兴趣矩阵分别从系统内容池和正能量内容池中提取系统候选集和正能量候选集;将系统候选集和正能量候选集确定为候选推荐集。
9.可选地,利用目标兴趣矩阵分别从系统内容池和正能量内容池中提取系统候选集和正能量候选集包括:利用目标兴趣矩阵从系统内容池召回第一内容池,以及利用目标兴趣矩阵从正能量内容池召回第二内容池;确定第一内容池中的数据与目标兴趣矩阵的第一相关度,并确定第二内容池中的数据与目标兴趣矩阵的第二相关度;提取第一内容池中的第一相关度达到第三阈值的数据,得到系统候选集,以及提取第二内容池中的第二相关度达到第四阈值的数据,得到正能量候选集。
10.可选地,利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数包括:利用目标账号的目标浏览数据和目标账号所在平台的全部账号的总浏览数据确定账号量化因子,其中,账号量化因子用于表征目标账号的目标浏览数据在总浏览数据中的占比,量化因子包括账号量化因子和系统量化因子,账号量化因子与系统量化因子之和为固定值;将账号量化因子与系统候选集的第一相关度相乘,得到第一推荐指数,以及将系统量化因子与正能量候选集的第二相关度相乘,得到第二推荐指数,其中,特征相关度包括第一相关度和第二相关度,推荐指数包括第一推荐指数和第二推荐指数。
11.可选地,利用目标账号的目标浏览数据和目标账号所在平台的全部账号的总浏览数据确定账号量化因子包括:获取目标账号的目标浏览数据,并利用目标浏览数据确定第一浏览频率以及第一类别数量;以及获取全部账号的总浏览数据,并利用总浏览数据确定第二浏览频率以及第二类别数量;确定第一浏览频率与第二浏览频率的第一比值,并确定第一类别数量与第二类别数量的第二比值;将第一比值与第二比值相乘,并将得到的乘积确定为账号量化因子。
12.根据本技术实施例的另一方面,本技术提供了一种破除信息茧房问题的冷启动个性化推荐装置,包括:账号确定模块,用于在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;矩阵确定模块,用于利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;推荐集确定模块,用于利用目标兴趣矩阵在预设内容池中确定候选推荐集,其中,候选推荐集包括候选推荐数据以及候选推荐数据与目标兴趣矩阵的特征相关度;调整模块,用于利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;数据确定模块,用于将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。
13.根据本技术实施例的另一方面,本技术提供了一种电子设备,包括存储器、处理器、通信接口及通信总线,存储器中存储有可在处理器上运行的计算机程序,存储器、处理器通过通信总线和通信接口进行通信,处理器执行计算机程序时实现上述方法的步骤。
14.根据本技术实施例的另一方面,本技术还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述的方法。
15.本技术实施例提供的上述技术方案与相关技术相比具有如下优点:
16.本技术通过一种破除信息茧房问题的冷启动个性化推荐方法,包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集,其中,候选推荐集包括候选推荐数据以及候选推荐数
据与目标兴趣矩阵的特征相关度;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵召回候选推荐集,最后结合目标账号的浏览记录来选出推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
18.为了更清楚地说明本技术实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
19.图1为根据本技术实施例提供的一种可选的破除信息茧房问题的冷启动个性化推荐方法的硬件环境示意图;
20.图2为根据本技术实施例提供的一种可选的破除信息茧房问题的冷启动个性化推荐方法的流程图;
21.图3为根据本技术实施例提供的一种可选的破除信息茧房问题的冷启动个性化推荐装置的框图;
22.图4为本技术实施例提供的一种可选的电子设备结构示意图。
具体实施方式
23.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
24.在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本技术的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
25.近年来,伴随着信息技术的蓬勃发展,人工智能技术在互联网应用过程中逐渐走向成熟,其中个性化内容推荐技术是一种基于用户浏览记录、购物记录、关注信息、个人兴趣点标签等数据构建个性化用户内容推荐模型进行用户喜好内容预测的智能技术。算法推荐技术因其可以精准、快速、全面地为互联网公司找到潜在目标用户群体而受到广泛重视。然而,算法推荐在给用户带来方便的同时,也产生了一些问题。信息茧房问题就是被互联网业界诟病的突出问题。算法推荐不断为用户推荐其感兴趣的内容,让用户的信息选择空间局限的某一狭小范围,用户陷入沉迷在兴趣推荐中,关注视野越来越窄。当用户在互联网平台新注册或者重置用户推荐设置操作后,内容推荐系统获取用户数据极其稀疏,致使用户的不经意点击某类内容,尤其是低俗、媚俗内容后,内容推荐系统会频繁、扎推推送同质化内容,使得某些受众沉迷于低级趣味。这样一来,为冷启动阶段用户推荐的内容趋于同质化,极易造成信息茧房现象甚至更严重的后果。
26.为了解决背景技术中提及的问题,根据本技术实施例的一方面,提供了一种破除信息茧房问题的冷启动个性化推荐方法的实施例。
27.可选地,在本技术实施例中,上述破除信息茧房问题的冷启动个性化推荐方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(数据对比服务、数据召回服务及数据推送服务等),可在服务器上或独立于服务器设置数据库105,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101包括但不限于pc、手机、平板电脑等。
28.本技术实施例中的一种破除信息茧房问题的冷启动个性化推荐方法可以由服务器103来执行,还可以是由服务器103和终端101共同执行,如图2所示,包括:
29.步骤201,在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;
30.步骤203,利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;
31.步骤205,利用目标兴趣矩阵在预设内容池中确定候选推荐集,其中,候选推荐集包括候选推荐数据以及候选推荐数据与目标兴趣矩阵的特征相关度;
32.步骤207,利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;
33.步骤209,将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。
34.事实上,用户也可选择直接关闭算法推荐,避免形成信息茧房产生价值观偏差,然而,用户直接关闭了算法推荐选项后,便不能获取其自身感兴趣的合适内容,无法享受到个性化推送服务。
35.为此,有必要针对用户冷启动环境(即新注册用户或者重置算法推荐设置后的用户群体)下,设计一种冷启动个性化内容推荐技术用于破除信息茧房问题带来的弊端,推荐系统收集到足够用户兴趣数据后度过冷启动阶段可继续享受个性化推荐服务。
36.当用户在互联网平台完成注册或者重置用户推荐设置后,个性化推荐系统对于用户行为数据几乎为空,在这种没有或者仅有极少数量用户行为数据的情况下,被称之为推荐系统的冷启动问题。
37.本技术提出一种面向破除信息茧房问题的冷启动个性化内容推荐方法的实施例。具体包括:利用量化公式来区分用户是否处于冷启动阶段;通过协同过滤技术获取与用户在冷启动阶段具有相似兴趣行为的用户群体的兴趣点弥补冷启动用户结构稀疏的兴趣矩阵;推荐系统主动引入积极正能量内容池丰富用户推荐内容。
38.一方面,本技术对用户的目标账号所处冷启动阶段开展量化定义,来对该阶段用户群体优化个性化内容推送技术。
39.具体地,确定目标账号的使用阶段是否处于冷启动阶段的方法包括:获取目标账号的目标浏览数据,并利用目标浏览数据确定第一类别数量;以及获取全部账号的总浏览数据,并利用总浏览数据确定第二类别数量;确定第一类别数量与第二类别数量的第二比值;将第二比值与目标阈值进行对比,在第二比值达到目标阈值(例如,20%)的情况下,确定目标账号处于冷启动阶段。只有当用户浏览内容所属分类足够代表用户兴趣点时,用户
即可离开冷启动阶段。
40.另一方面,需要对用户稀疏数据进行属性丰富,尽可能扩充用户兴趣点,提升冷启动阶段个性化推荐内容的多样性。
41.具体地,本技术利用相似的对照账号的当前兴趣矩阵来预测目标账号的目标兴趣矩阵,然后利用目标兴趣矩阵从预设内容池召回候选推荐集,最后根据用户的喜好权重来选出用户最有可能感兴趣的推荐数据。
42.作为一种可选的实施例,确定与目标账号的用户行为相似度达到第一阈值的对照账号包括:获取目标账号的第一兴趣数据,并从用户数据库中获取多个用户账号以及用户账号的第二兴趣数据,其中,用户数据库用于存储当前不处于冷启动阶段的用户账号在冷启动阶段时的兴趣数据;利用第一兴趣数据生成第一兴趣矩阵,以及利用第二兴趣数据生成第二兴趣矩阵;确定第一兴趣矩阵与各个第二兴趣矩阵的矩阵相似度,以获得目标账号与各个用户账号的用户行为相似度;将用户行为相似度达到第一阈值的用户账号确定为对照账号。
43.为了探索到所有与目标用户的目标账号在冷启动阶段具有相似兴趣的用户群体,本技术需要预先存储所有处于冷启动阶段的用户兴趣矩阵,需要额外的存储开销用于辅助计算冷启动阶段用户相似群体计算任务。
44.具体地,通过计算目标账号的第一兴趣矩阵和其他用户账号的第二兴趣矩阵之间的矩阵相似度得出目标账号与其他用户账号之间的用户行为相似度。
45.可选地,采用皮尔森系数来度量用户间的相似性以获取相似群体,构建冷启动阶段用户行为相似性以预测用户的兴趣矩阵。
46.示例地,用户u为处于冷启动阶段的用户,用户j为系统度过冷启动阶段的用户,且通过用户相似度计算u与j处于冷启动阶段的兴趣矩阵获取与u在冷启动阶段兴趣爱好相似的用户群体集合。
47.计算相似度的公式为:
[0048][0049]
其中,表示用户u对所有兴趣内容的平均评分,r
u,label
表示用户u对单个兴趣内容(特定标签label)的评分,表示用户j对所有兴趣内容(全部标签)的平均评分,r
j,label
表示用户j对单个兴趣内容(特定标签label)的评分,all_labels表示所有兴趣内容(全部标签)的集合。
[0050]
在获得目标账号与各个用户账号的用户行为相似度之后,对用户行为相似度进行排名,若需要选取n个相似账号,则将顺序为第n个的相似度确定为第一阈值,并将用户行为相似度达到第一阈值的用户账号确定为对照账号。
[0051]
作为一种可选的实施例,利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵包括:获取对照账号的当前兴趣数据,并利用当前兴趣数据生成对照兴趣矩阵;利用目标账号的第一兴趣矩阵对对照兴趣矩阵进行矩阵扩充,生成目标兴趣矩阵。
[0052]
由于具有相似兴趣用户群体规模并不会太大,通过动态随机方式从上述多个对照
账号选取一个对照账号的当前兴趣数据,然后生成对照兴趣矩阵,接着与目标账号的第一兴趣矩阵进行矩阵求和运算,扩充形成目标兴趣矩阵,将目标兴趣矩阵暂定为目标用户在冷启动阶段的兴趣矩阵。
[0053]
作为一种可选的实施例,利用目标兴趣矩阵在预设内容池中确定候选推荐集包括:获取预设内容池,其中,预设内容池包括系统内容池和正能量内容池;利用目标兴趣矩阵分别从系统内容池和正能量内容池中提取系统候选集和正能量候选集;将系统候选集和正能量候选集确定为候选推荐集。
[0054]
系统内容池包括推荐系统的数据,正能量内容池包括积极向上的正能量数据。
[0055]
利用目标兴趣矩阵分别从系统内容池和正能量内容池中提取系统候选集和正能量候选集,其实就是分别从系统内容池和正能量内容池召回与目标兴趣矩阵相关的数据集,得到对应的集合,接下来对该步骤进行进一步说明。
[0056]
作为一种可选的实施例,利用目标兴趣矩阵分别从系统内容池和正能量内容池中提取系统候选集和正能量候选集包括:利用目标兴趣矩阵从系统内容池召回第一内容池,以及利用目标兴趣矩阵从正能量内容池召回第二内容池;确定第一内容池中的数据与目标兴趣矩阵的第一相关度,并确定第二内容池中的数据与目标兴趣矩阵的第二相关度;提取第一内容池中的第一相关度达到第三阈值的数据,得到系统候选集,以及提取第二内容池中的第二相关度达到第四阈值的数据,得到正能量候选集。
[0057]
可选地,若目标兴趣矩阵中包括兴趣标签,那么可以使用标签从系统内容池和正能量内容池中召回与兴趣标签匹配的数据;若目标兴趣矩阵中不包括兴趣标签,那么也可以将目标兴趣矩阵中出现频率最高的数据作为召回依据。
[0058]
另外,对召回的数据进行排序及精排处理,得到新的相关度更高的兴趣数据,接着利用兴趣数据与目标兴趣矩阵的相关度(包括第一相关度和第二相关度)进行排序,然后将第一相关度达到第三阈值的数据确定为系统候选集,并将第二相关度达到第四阈值的数据确定为正能量候选集,其中,第三阈值和第四阈值均可以根据情况设定,本技术不作具体限定。
[0059]
以目标兴趣矩阵作为匹配依据,从预设内容池中选出相关度高的数据,可以让选出来的数据与目标账号的兴趣保持一定的相关度。候选推荐集既包括系统候选集又包括正能量候选集,可以丰富推荐数据的类别。
[0060]
作为一种可选的实施例,利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数包括:利用目标账号的目标浏览数据和目标账号所在平台的全部账号的总浏览数据确定账号量化因子,其中,账号量化因子用于表征目标账号的目标浏览数据在总浏览数据中的占比,量化因子包括账号量化因子和系统量化因子,账号量化因子与系统量化因子之和为固定值;将账号量化因子与系统候选集的第一相关度相乘,得到第一推荐指数,以及将系统量化因子与正能量候选集的第二相关度相乘,得到第二推荐指数,其中,特征相关度包括第一相关度和第二相关度,推荐指数包括第一推荐指数和第二推荐指数。
[0061]
可选地,若将factor(u)定义为账号量化因子,那么系统量化因子为(1-factor(u)),可以简单将账号量化因子理解为目标用户的主观点击行为产生的数据在系统总数据中的权重或者兴趣矩阵的稀疏程度,即主观权重,那么系统量化因子就可以理解为客观权
重。
[0062]
将账号量化因子与系统候选集的第一相关度相乘,得到第一推荐指数,第一推荐指数就是进行权重调整后的系统候选集中的数据的用户喜好度;将系统量化因子与正能量候选集的第二相关度相乘,得到第二推荐指数,第二推荐指数就是进行权重调整后的正能量候选集中的数据与用户的适配度。
[0063]
优选地,在得到各个候选推荐数据的推荐指数之后,按照推荐指数的顺序向目标账号推荐数据。可以将第一推荐指数和第二推荐指数分开排序,这样推送出来的就是单独的系统推荐内容和正能量内容,这样可以保证用户接收到的推荐内容的多元化;也可以将第一推荐指数和第二推荐指数一起排序,然后按照顺序从高到低向目标用户推荐内容,这样可以保证用户接收到的推荐内容是与用户喜好最适配的。
[0064]
作为一种可选的实施例,利用目标账号的目标浏览数据和目标账号所在平台的全部账号的总浏览数据确定账号量化因子包括:获取目标账号的目标浏览数据,并利用目标浏览数据确定第一浏览频率以及第一类别数量;以及获取全部账号的总浏览数据,并利用总浏览数据确定第二浏览频率以及第二类别数量;确定第一浏览频率与第二浏览频率的第一比值,并确定第一类别数量与第二类别数量的第二比值;将第一比值与第二比值相乘,并将得到的乘积确定为账号量化因子。
[0065]
示例地,计算账号量化因子factor(u)的公式为:
[0066][0067]
需要说明的是,第二比值在本技术实施例一开始就需要通过计算得出,因为第二比值还用于判定目标账号的使用阶段是否为冷启动阶段。
[0068]
本技术还具有以下有益效果:

应用协同过滤相关技术:采用以用户为基础的协同过滤的技术,探索与用户兴趣爱好相同的另一组用户,解决冷启动用户兴趣信息稀疏的问题,构建更为紧凑的冷启动用户兴趣候选矩阵;

应用自然语言处理相关技术:word2vec、文本编辑距离、nlpir及维特比算法等,通过计算用户兴趣集文本与正能量内容池的文本编辑距离,可为用户个性化推荐正能量内容,提升用户展示内容的多样性,打破信息茧房,避免用户陷于低俗兴趣爱好;

算法多参数可调,可根据需求设置,算法内部耦合性低,可移植性好。
[0069]
本技术通过一种破除信息茧房问题的冷启动个性化推荐方法,包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集,其中,候选推荐集包括候选推荐数据以及候选推荐数据与目标兴趣矩阵的特征相关度;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵召回候选推荐集,最后结合目标账号的浏览记录来选出推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
[0070]
根据本技术实施例的另一方面,本技术提供了一种破除信息茧房问题的冷启动个性化推荐装置,如图3所示,包括:
[0071]
账号确定模块302,用于在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;
[0072]
矩阵确定模块304,用于利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;
[0073]
推荐集确定模块306,用于利用目标兴趣矩阵在预设内容池中确定候选推荐集,其中,候选推荐集包括候选推荐数据以及候选推荐数据与目标兴趣矩阵的特征相关度;
[0074]
调整模块308,用于利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;
[0075]
数据确定模块310,用于将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。
[0076]
需要说明的是,该实施例中的账号确定模块302可以用于执行本技术实施例中的步骤201,该实施例中的矩阵确定模块304可以用于执行本技术实施例中的步骤203,该实施例中的推荐集确定模块306可以用于执行本技术实施例中的步骤205,该实施例中的调整模块308可以用于执行本技术实施例中的步骤207,该实施例中的数据确定模块310可以用于执行本技术实施例中的步骤209。
[0077]
可选地,账号确定模块302还用于获取目标账号的第一兴趣数据,并从用户数据库中获取多个用户账号以及用户账号的第二兴趣数据,其中,用户数据库用于存储当前不处于冷启动阶段的用户账号在冷启动阶段时的兴趣数据;利用第一兴趣数据生成第一兴趣矩阵,以及利用第二兴趣数据生成第二兴趣矩阵;确定第一兴趣矩阵与各个第二兴趣矩阵的矩阵相似度,以获得目标账号与各个用户账号的用户行为相似度;将用户行为相似度达到第一阈值的用户账号确定为对照账号。
[0078]
可选地,矩阵确定模块304还用于获取对照账号的当前兴趣数据,并利用当前兴趣数据生成对照兴趣矩阵;利用目标账号的第一兴趣矩阵对对照兴趣矩阵进行矩阵扩充,生成目标兴趣矩阵。
[0079]
可选地,推荐集确定模块306包括:
[0080]
获取单元,用于获取预设内容池,其中,预设内容池包括系统内容池和正能量内容池;
[0081]
提取单元,用于利用目标兴趣矩阵分别从系统内容池和正能量内容池中提取系统候选集和正能量候选集;将系统候选集和正能量候选集确定为候选推荐集。
[0082]
可选地,提取单元还用于利用目标兴趣矩阵从系统内容池召回第一内容池,以及利用目标兴趣矩阵从正能量内容池召回第二内容池;确定第一内容池中的数据与目标兴趣矩阵的第一相关度,并确定第二内容池中的数据与目标兴趣矩阵的第二相关度;提取第一内容池中的第一相关度达到第三阈值的数据,得到系统候选集,以及提取第二内容池中的第二相关度达到第四阈值的数据,得到正能量候选集。
[0083]
可选地,调整模块308包括:
[0084]
确定单元,用于利用目标账号的目标浏览数据和目标账号所在平台的全部账号的总浏览数据确定账号量化因子,其中,账号量化因子用于表征目标账号的目标浏览数据在总浏览数据中的占比,量化因子包括账号量化因子和系统量化因子,账号量化因子与系统量化因子之和为固定值;
[0085]
相乘单元,用于将账号量化因子与系统候选集的第一相关度相乘,得到第一推荐指数,以及将系统量化因子与正能量候选集的第二相关度相乘,得到第二推荐指数,其中,特征相关度包括第一相关度和第二相关度,推荐指数包括第一推荐指数和第二推荐指数。
[0086]
可选地,确定单元还用于获取目标账号的目标浏览数据,并利用目标浏览数据确定第一浏览频率以及第一类别数量;以及获取全部账号的总浏览数据,并利用总浏览数据确定第二浏览频率以及第二类别数量;确定第一浏览频率与第二浏览频率的第一比值,并确定第一类别数量与第二类别数量的第二比值;将第一比值与第二比值相乘,并将得到的乘积确定为账号量化因子。
[0087]
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中。
[0088]
根据本技术实施例的另一方面,本技术提供了一种电子设备,如图4所示,包括存储器401、处理器403、通信接口405及通信总线407,存储器401中存储有可在处理器403上运行的计算机程序,存储器401、处理器403通过通信接口405和通信总线407进行通信,处理器403执行计算机程序时实现上述方法的步骤。
[0089]
上述电子设备中的存储器、处理器通过通信总线和通信接口进行通信。所述通信总线可以是外设部件互连标准(peripheral componentinterconnect,简称pci)总线或扩展工业标准结构(extended industrystandard architecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
[0090]
存储器可以包括随机存取存储器(random access memory,简称ram),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0091]
上述的处理器可以是通用处理器,包括中央处理器(centralprocessing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processing,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现场可编程门阵列(field-programmable gate array,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0092]
根据本技术实施例的又一方面还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质。
[0093]
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
[0094]
本技术实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
[0095]
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(application specific integrated circuits,asic)、数字信号处理器(digital signal processing,dsp)、数字信号处理设备(dsp device,dspd)、可编程逻辑设备(programmable logic device,pld)、现场可编程门阵列(field-programmable gate array,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
[0096]
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代
码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
[0097]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0098]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0099]
在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0100]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0101]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0102]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0103]
以上所述仅是本技术的具体实施方式,使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1