数据处理方法、装置、服务器及存储介质与流程

文档序号:30610313发布日期:2022-07-01 23:27阅读:72来源:国知局
数据处理方法、装置、服务器及存储介质与流程

1.本公开涉及通信技术领域,具体涉及一种数据处理方法、装置、服务器及存储介质。


背景技术:

2.随着互联网技术的不断发展,人们每天都可以通过应用程序获取多种信息如文字信息、视频信息、音频信息等,对于用户而言从这些应用程序提供的海量信息中筛选出所需信息是非常困难的。由此,如何向用户推荐用户所需的信息受到了越来越多应用程序的关注。
3.在相关技术中,应用程序会将海量用户关注的热门视频向用户进行推荐,但是,在采用这种推荐方式进行推荐时,用户可能会对推荐的视频不感兴趣,导致向用户推荐的准确度不高。


技术实现要素:

4.本公开实施例的目的是提供一种数据处理方法、装置、服务器及存储介质,以至少解决目前多媒体推荐不准确的问题。
5.本公开的技术方案如下:
6.根据本公开实施例的第一方面,提供一种数据处理方法,该方法可以包括:
7.获取待确定属性信息的发布帐户,其中,发布帐户为在平台上发布过作品的帐户;
8.获取发布帐户的关联帐户集合,其中,关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户;
9.获取关联帐户与发布帐户的互动行为;
10.基于互动行为确定发布帐户的属性信息。
11.在一种可能的实施例中,在上述涉及的获取发布帐户的关联帐户集合的步骤中,可以包括:
12.从日志中提取发布帐户的初始关联帐户集合,初始关联帐户集合包括预定时间内与发布帐户主动建立社交关联关系的关联帐户;
13.从初始关联帐户集合中,筛选出符合预定条件的关联帐户,得到关联帐户集合。
14.基于此,在另一种可能的实施例中,上述涉及的从初始关联帐户集合中,筛选出符合预定条件的关联帐户的步骤中,具体可以包括:
15.获取初始关联帐户集合中各关联帐户的关联帐户属性;
16.从初始关联账户集合中,筛选出关联帐户属性与发布帐户的帐户属性关联度小于预定阈值的关联帐户,其中,预定条件为关联帐户属性与发布帐户的帐户属性关联度小于预定阈值。
17.另外,在又一种可能的实施例中,上述涉及的获取关联帐户与发布帐户的互动行为的步骤中,可以包括:
18.获取关联帐户在与发布帐户建立关联关系之后的预定时间段内、在指定页面与发布帐户的交互操作行为,交互操作行为为正向交互操作行为;
19.汇总交互操作行为的行为时长,得到互动行为的表征数据。。
20.基于此,本公开实施例中的指定页面包括平台为关联帐户展示指定帐户作品的页面,和/或,发布帐户的作品展示页面,指定帐户为关联帐户主动建立社交关系的帐户。
21.在再一种可能的实施例中,上述涉及的基于互动行为确定发布帐户的属性信息的步骤中,具体可以包括:
22.基于互动行为的表征数据,确定发布帐户的初始属性信息;
23.判断关联帐户集合中关联帐户的数量是否超过预定阈值;
24.若关联帐户集合中关联帐户的数量未超过预定阈值,则调整初始属性信息,得到发布帐户的属性信息;
25.若关联帐户集合中关联帐户的数量超过预定阈值,则确定初始属性信息为发布帐户的属性信息。
26.在再一种可能的实施例中,上述涉及的基于互动行为的表征数据,确定发布帐户的初始属性信息的步骤中,可以包括:
27.汇总在预设时间段内新增的各关联账户的互动行为的表征数据,得到表征数据的累计数据;
28.计算累计数据与预设时间段内的新增的关联账户数量的比值,将比值作为发布帐户的初始属性信息。
29.基于此,上述涉及的调整初始属性信息,得到发布帐户的属性信息的步骤中,可以包括:
30.获取发布账户的预设关联帐户集合,其中,预设关联帐户集合中记录有预设关联帐户;
31.获取预设关联帐户的预设属性信息;
32.汇总预设关联帐户的预设属性信息,得到预设属性信息累计值,并汇总关联帐户集合中各关联帐户的初始属性信息,得到初始属性信息累计值;
33.汇总预设属性信息累计值和初始属性信息累计值,得到属性信息汇总结果;
34.计算属性信息汇总结果与目标关联账户数量的比值,得到发布帐户的属性信息;目标关联账户数量为预设关联帐户集合中预设关联帐户数量和关联帐户集合中互联帐户数量之和。
35.另外,在再一种可能的实施例中,在上述涉及的基于互动行为确定发布帐户的属性信息的步骤之后,该数据处理方法还可以包括下述至少之一:
36.根据发布帐户的属性信息以及预设的发布账户等级条件,确定发布帐户在平台上的等级信息;
37.在展示页面展示发布帐户的属性信息和等级信息;
38.根据发布帐户的属性信息和预设的发布作品等级条件,确定发布帐户在平台上发布作品的等级信息。
39.根据本公开实施例的第二方面,提供一种数据处理装置,该装置可以包括:
40.第一获取模块,被配置为执行获取待确定属性信息的发布帐户,其中,发布帐户为
在平台上发布过作品的帐户;
41.第二获取模块,被配置为执行获取发布帐户的关联帐户集合,其中,关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户;
42.第三获取模块,被配置为执行获取关联帐户与发布帐户的互动行为;
43.第一确定模块,被配置为执行基于互动行为确定发布帐户的属性信息。
44.在一种可能的实施例中,上述涉及的第二获取模块可以包括:
45.提取模块,被配置为执行从日志中提取发布帐户的初始关联帐户集合,初始关联帐户集合包括预定时间内与发布帐户主动建立社交关联关系的关联帐户;
46.第一筛选模块,被配置为执行从初始关联帐户集合中,筛选出符合预定条件的关联帐户,得到关联帐户集合。
47.基于此,在另一种可能的实施例中,上述涉及的第一筛选模块可以包括:
48.第四获取模块,被配置为执行获取初始关联帐户集合中各关联帐户的关联帐户属性;
49.第二筛选模块,被配置为执行从初始关联账户集合中,筛选出关联帐户属性与发布帐户的帐户属性关联度小于预定阈值的关联帐户,其中,预定条件为关联帐户属性与发布帐户的帐户属性关联度小于预定阈值。
50.另外,在又一种可能的实施例中,上述涉及的第三获取模块可以包括:
51.第五获取模块,被配置为执行获取关联帐户在与发布帐户建立关联关系之后的预定时间段内、在指定页面与发布帐户的交互操作行为,交互操作行为为正向交互操作行为;
52.第一汇总模块,被配置为执行汇总交互操作行为的行为时长,得到互动行为的表征数据。
53.基于此,本公开实施例中指定页面包括平台为关联帐户展示指定帐户作品的页面,和/或,发布帐户的作品展示页面,指定帐户为关联帐户主动建立社交关系的帐户。
54.在再一种可能的实施例中,上述涉及的第一确定模块可以包括:
55.第二确定模块,被配置为执行基于互动行为的表征数据,确定发布帐户的初始属性信息;
56.判断模块,被配置为执行判断关联帐户集合中关联帐户的数量是否超过预定阈值;
57.调整模块,被配置为执行若关联帐户集合中关联帐户的数量未超过预定阈值,则调整初始属性信息,得到发布帐户的属性信息;
58.第三确定模块,被配置为执行若关联帐户集合中关联帐户的数量超过预定阈值,则确定初始属性信息为发布帐户的属性信息。
59.基于此,在再一种可能的实施例中,上述涉及的第二确定模块可以包括:
60.第二汇总模块,被配置为执行汇总在预设时间段内新增的各关联账户的互动行为的表征数据,得到表征数据的累计数据;
61.第一计算模块,被配置为执行计算累计数据与预设时间段内的新增的关联账户数量的比值,将比值作为发布帐户的初始属性信息。
62.基于此,在再一种可能的实施例中,上述涉及的调整模块可以包括:
63.第六获取模块,被配置为执行获取发布账户的预设关联帐户集合,其中,预设关联
帐户集合中记录有预设关联帐户;
64.第七获取模块,被配置为执行获取预设关联帐户的预设属性信息;
65.第三汇总模块,被配置为执行汇总预设关联帐户的预设属性信息,得到预设属性信息累计值,并汇总关联帐户集合中各关联帐户的初始属性信息,得到初始属性信息累计值;
66.第四汇总模块,被配置为执行汇总预设属性信息累计值和初始属性信息累计值,得到属性信息汇总结果;
67.第二计算模块,被配置为执行计算属性信息汇总结果与目标关联账户数量的比值,得到发布帐户的属性信息;目标关联账户数量为预设关联帐户集合中预设关联帐户数量和关联帐户集合中互联帐户数量之和。
68.在再一种可能的实施例中,上述涉及的数据处理装置还包括下述至少之一:
69.第四确定模块,被配置为执行根据发布帐户的属性信息以及预设的发布账户等级条件,确定发布帐户在平台上的等级信息;
70.展示模块,被配置为执行在展示页面展示发布帐户的属性信息和等级信息;
71.第五确定模块,被配置为执行根据发布帐户的属性信息和预设的发布作品等级条件,确定发布帐户在平台上发布作品的等级信息。
72.根据本公开实施例的第三方面,提供一种服务器,该服务器可以包括:
73.处理器;
74.被配置为存储处理器可执行指令的存储器;
75.其中,处理器被配置为执行指令,以实现如第一方面的任一项实施例中所示的数据处理方法。
76.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由第三方面的服务器执行时,以使第三方面的服务器实现如第一方面的任一项实施例中所示的数据处理方法。
77.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,计算机程序存储在可读存储介质中,设备的至少一个处理器从存储介质读取并执行计算机程序,以使设备执行如第一方面的任一项实施例中所示的数据处理方法。
78.本公开的实施例提供的技术方案至少带来以下有益效果:
79.本公开实施例通过获取待确定属性信息的发布帐户和发布帐户的关联帐户集合,得到关联帐户与发布帐户的互动行为。然后,基于关联帐户与发布帐户的互动行为确定发布帐户的属性信息。其中,发布帐户为在平台上发布过作品的帐户和关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户。这样,通过应用程序平台中发布帐户的属性信息,筛选出帐户发布的属性信息表示的优质发布帐户,并将发布帐户在平台上发布的作品向观看者推荐,由此,在提高多媒体推荐准确度的同时,提高了用户的体验感。
80.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限值本公开。
附图说明
81.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施
例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
82.图1是一种视频发布者骗取社交关系行为的界面示意图;
83.图2是根据一示例性实施例示出的一种数据处理的架构示意图;
84.图3是根据一示例性实施例示出的一种数据处理方法的流程图
85.图4是根据一示例性实施例示出的一种基于发布帐户的属性信息调整及监控应用程序的流量分配合理性的示意图;
86.图5是根据一示例性实施例示出的一种数据处理装置的结构框图;
87.图6是根据一示例性实施例示出的一种计算设备的结构框图。
具体实施方式
88.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
89.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
90.目前,电子设备依托于应用程序向用户提供服务,多种多样的应用程序可以为用户推荐多种多媒体资源如视频、直播或者文本,以便用户找到自己需要的资源。其中,一些应用程序(如视频类应用程序或者购物类应用程序)可以向用户提供播放短视频、直播等服务。由于每天都有用户浏览这些应用程序中的多媒体资源,应用程序可以根据用户浏览这些应用程序中的多媒体资源调整及监控应用程序的流量分配的合理性,例如,将关注率较高的视频的推送到应用程序的首页或者热门页。
91.相关技术中,关注率是由发布视频的关注量与视频的点击量的比值确定。但是,这种方式得到的关注率是比较容易被发布者控制的,例如,发布者只要骗取视频的关注量和点击量既可以提高关注率,如图1所示,有些发布者在发布视频的标题或者内容中标注“给个双击再走呗”、“没有你们的双击,我们上不了热门”以及“求求大家了,给个赞”,等求关注等骗取关注率的行为。如果应用程序将这种方式确定的高关注率对应的视频,推送到应用程序的热门页或者首页,那么会导致用户对应用程序的整体观感和体验下降。
92.由此,为了向用户准确的进行视频推荐,本公开实施例提供了一种数据处理方法,以至少解决目前确定关注率不准确,导致多媒体推荐不准确的问题。
93.本公开所提供的多媒体推荐方法,可以应用于如图2所示的推荐系统架构中,具体结合图2进行详细说明。以至少解决目前多媒体推荐不准确的问题。
94.推荐系统20可以包括应用程序对应的服务器21,和与应用程序对应的客户端22。其中,该客户端22在该推荐系统20中以安装有该应用程序的电子设备表示。
95.基于此,服务器21可以获取海量客户端22中待确定属性信息的发布帐户,其中,发布帐户为在平台上发布过作品的帐户。接着,获取发布帐户的关联帐户集合,其中,关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户。再者,获取关联帐户与发
布帐户的互动行为。然后,基于互动行为确定发布帐户的属性信息。
96.基于此,服务器21可以将发布帐户的属性信息作为一个指标,用一个评分值表示,这样,该评分值在一定程度上可以反应每个发布账户(目前或者在未来一段时间)的优劣程度,即评分值越高,表示该发布账户受欢迎程度越高,其发布的作品的质量越高,以及将该发布账户发布的作品推荐到应用程序首页或者热门页的概率越高;反之,评分值越低,表示发布账户不受欢迎,其发布的作品的质量越低,以及将发布账户发布的作品推荐到应用程序首页或者热门页的概率越低。
97.这样,在服务器21接收到某个客户端c发送的视频推荐请求时,服务器21根据确定的各个发布帐户的属性信息,筛选出评分值高于预设阈值的发布账户,并将这些评分值高于预设阈值的发布账户发布过的作品向第一账户推荐。
98.由此,本公开实施例通过应用程序平台中发布帐户的属性信息,筛选出帐户发布的属性信息表示的优质发布帐户,并将发布帐户在平台上发布的作品向观看者推荐,这样,在提高多媒体推荐准确度的同时,提高了用户的体验感。
99.另外,上述涉及的发布帐户的属性信息除了可以应用于上述视频推荐的场景外,还可以应用于帐户划分等级的场景中,例如,根据发布帐户的属性信息构建账户分级体系,能够根据发布帐户的属性信息表征的评分值,划分出劣质发布账户和优质发布账户,以便服务器根据划分出的劣质发布账户和优质发布账户,向其他用户推荐一些优质账户以及优质账户在平台上发布的作品,以提高推荐多媒体信息的准确度。
100.当然,还可以将发布帐户的属性信息作为表示发布账户的帐户画像展示在发布帐户的展示页面中,以便将应用程序中的发布者进行排序。另外,还可将发布帐户的属性信息作为账户价值衡量体系的一部分,如,可以根据该发布帐户的属性信息,衡量发布账户在预定时间段内各发布帐户在应用程序中所在的比例,以及在预定时间段内发布账户访问应用程序的访问程度。此外,还可以根据发布帐户的属性信息调整及监控应用程序整体流量分配的合理性。
101.根据上述架构以及应用场景,下面结合图3对本公开实施例提供的数据处理方法进行详细说明,该数据处理方法可以由图2中所示的服务器21执行,本公开实施例对此不作限定。
102.图3是根据一示例性实施例示出的一种数据处理方法的流程图。
103.如图3所示,该数据处理方法具体可以包括如下步骤310至步骤340,具体如下所示:
104.步骤310,获取待确定属性信息的发布帐户,其中,发布帐户为在平台上发布过作品的帐户;
105.步骤320,获取发布帐户的关联帐户集合,其中,关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户;
106.步骤330,获取关联帐户与发布帐户的互动行为;
107.步骤340,基于互动行为确定发布帐户的属性信息。
108.这样,通过应用程序平台中发布帐户的属性信息,筛选出帐户发布的属性信息表示的优质发布帐户,并将发布帐户在平台上发布的作品向观看者推荐,由此,在提高多媒体推荐准确度的同时,提高了用户的体验感。
109.下面对上述步骤进行详细说明,具体如下所示:
110.步骤320,在本公开实施例中,该步骤320具体可以包括步骤3201和步骤3202。
111.步骤3201,从日志中提取发布帐户的初始关联帐户集合,初始关联帐户集合包括预定时间内与发布帐户主动建立社交关联关系的关联帐户。
112.步骤3202,从初始关联帐户集合中,筛选出符合预定条件的关联帐户,得到关联帐户集合。
113.其中,可以通过下述步骤筛选出符合预定条件的关联帐户,具体如下所示:
114.获取初始关联帐户集合中各关联帐户的关联帐户属性;
115.从初始关联账户集合中,筛选出关联帐户属性与发布帐户的帐户属性关联度小于预定阈值的关联帐户,其中,预定条件为关联帐户属性与发布帐户的帐户属性关联度小于预定阈值。
116.这里,为了保证得到关联帐户集合的准确性,本公开实施例中,是在初始关联账户集合中,排除掉与发布帐户可能认识的人。例如,可以从初始关联帐户集合中,排除掉注册地址与发布帐户同属一个区域,互关好友重合度高于一定预设阈值,互相评论、点赞发布的作品、在其他平台上有互相关注的行为的帐户。
117.步骤330,在本公开实施例中,该步骤330具体可以包括步骤3301和步骤3302。
118.其中,步骤3301,获取关联帐户在与发布帐户建立关联关系之后的预定时间段内、在指定页面与发布帐户的交互操作行为,交互操作行为为正向交互操作行为。
119.其中,指定页面包括平台为关联帐户展示指定帐户作品的页面,和/或,发布帐户的作品展示页面,指定帐户为关联帐户主动建立社交关系的帐户。
120.步骤3302,汇总交互操作行为的行为时长,得到互动行为的表征数据。
121.其中,在建立关联关系之后,可以根据汇总各关联帐户在发布帐户的作品展示页面浏览的时长,或者点赞、评论、转发的频次等交互操作行为,得到互动行为的表征数据。
122.步骤340,在本公开实施例中,该步骤340具体可以包括步骤3401和步骤3304。
123.其中,步骤3401,基于互动行为的表征数据,确定发布帐户的初始属性信息。
124.其中,汇总在预设时间段内新增的各关联账户的互动行为的表征数据,得到表征数据的累计数据;
125.计算累计数据与预设时间段内的新增的关联账户数量的比值,将比值作为发布帐户的初始属性信息。
126.这里,可以通过如下公式(1)得到初始属性信息:
[0127][0128]
其中,score为发布帐户的初始属性信息,n为预设时间段内如30天内的新增的关联账户数量,ti为在预设时间段内如30天新增的各关联账户的互动行为的表征数据。
[0129]
需要说明的是,上述在n中涉及一个预设时间段,在ti中也涉及一个预设时间段,两个时间段可以取相同的值如30天。当然,也可以取不同的时间段,但不同时间段相差的时长要满足一定阈值,如n中的预设时间段可以取30天,ti中涉及的预设时间段可以取25天,相差的天数尽量不超过整体时长的三分之一,具体预设时间段的取值可以根据实际情况设置。
[0130]
步骤3402,判断关联帐户集合中关联帐户的数量是否超过预定阈值。
[0131]
步骤3403,若关联帐户集合中关联帐户的数量未超过预定阈值,则调整初始属性信息,得到发布帐户的属性信息。
[0132]
其中,获取发布账户的预设关联帐户集合,其中,预设关联帐户集合中记录有预设关联帐户;
[0133]
获取预设关联帐户的预设属性信息;
[0134]
汇总预设关联帐户的预设属性信息,得到预设属性信息累计值,并汇总关联帐户集合中各关联帐户的初始属性信息,得到初始属性信息累计值;
[0135]
汇总预设属性信息累计值和初始属性信息累计值,得到属性信息汇总结果;
[0136]
计算属性信息汇总结果与目标关联账户数量的比值,得到发布帐户的属性信息;目标关联账户数量为预设关联帐户集合中预设关联帐户数量和关联帐户集合中互联帐户数量之和。
[0137]
举例说明,有些发布账户在平台上发布的作品相比主流元素来说,相对小众化,可以理解为如果要比较两部电影的好坏,至少应该请同样多的观众观看和评分,此时,并不能说明这些发布账户为不受欢迎的账户或者劣质的账户。
[0138]
在这种情况下,由于各个发布账户的关联帐户的数量在同一个时间段会出现不同,所以会对初始属性信息进行一定的平滑处理。
[0139]
基于此,在本公开实施例中采取了贝叶斯平滑算法,对于关联帐户集合中关联帐户的数量未超过预定阈值时,可以假设有c个发布帐户的预设关联帐户,将这些预设关联帐户组成的预设关联帐户集合的预设属性信息对公式(1)中得到的初始属性信息进行平滑处理,具体可以通过公式(2)得到初始属性信息调整后的发布帐户的属性信息。
[0140]
follow_socre=(cm+ns)/(c+n)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0141]
其中,follow_socre为发布帐户的属性信息;s为score即发布帐户的初始属性信息;c为预设关联帐户的数量,这里可以取c=15;m为预设关联帐户的预设属性信息;n为预设时间段内如30天内的新增的关联账户数量。
[0142]
步骤3404,若关联帐户集合中关联帐户的数量超过预定阈值,则确定初始属性信息为发布帐户的属性信息。
[0143]
另外,在步骤340之后,本公开实施例提供的数据处理方法还提供了发布帐户的属性信息的用途,具体可以包括下述至少之一:
[0144]
(1)根据发布帐户的属性信息以及预设的发布账户等级条件,确定发布帐户在平台上的等级信息。
[0145]
这里,在发布帐户的属性信息作为一个指标,用百分制评分值表示时,预设的发布帐户等级条件可以设置为发布帐户等级条件a-85,b-60和c-30。这样,根据发布帐户的属性信息的百分制评分值,得到发布帐户在平台上的等级信息,如百分制评分值为90,则等级信息为a级,或者,百分制评分值为25,则等级信息为c级,以便平台根据等级信息评定发布帐户是优质账户、中级帐户和劣质帐户。这里优质账户与a级对应,中级帐户与b级对应,劣质帐户与c级对应。
[0146]
由此,若等级信息为a级,则表示该发布账户受欢迎程度越高,其发布的作品的质量越高,以及将该发布账户发布的作品推荐到应用程序首页或者热门页的概率越高;反之,
若等级信息为c级,则表示发布账户不受欢迎,其发布的作品的质量越低,以及将发布账户发布的作品推荐到应用程序首页或者热门页的概率越低。
[0147]
(2)在展示页面展示发布帐户的属性信息和等级信息。
[0148]
这里,可以将发布帐户的属性信息作为表示发布账户的帐户画像展示在发布帐户的展示页面中,以便用户根据等级信息决定是否浏览该发布帐户在平台上发布的作品。
[0149]
(3)根据发布帐户的属性信息和预设的发布作品等级条件,确定发布帐户在平台上发布作品的等级信息。
[0150]
与(1)类似,若发布帐户的等级信息为a级,则表示该发布账户受欢迎程度越高,其发布的作品的质量越高。即发布帐户在平台发布的作品也为a级,以便平台将a级的作品推荐到应用程序首页或者热门页。
[0151]
(4)根据发布帐户的属性信息,进行视频推荐。
[0152]
这里,对于应用程序平台来说,向用户推荐该平台中优质作品,以提高应用程序的用户粘度。本公开实施例还提供了基于发布帐户的属性信息进行视频推荐的方式,具体结合公式(3)进行说明:
[0153]
s=wtr*log(follow_score+1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0154]
其中,s为视频推荐系数,wtr为视频的关注系数,follow_score为发布帐户的属性信息。这里,视频的关注量与视频的点击量的比值为视频的关注系数。
[0155]
基于此,视频推荐系数值越高,将该发布账户发布的作品推荐到应用程序首页或者热门页的概率越高。如发布帐户a的视频推荐系数为90,发布帐户b的视频推荐系数为70,以及发布帐户c的视频推荐系数为25。则将发布账户发布的作品推荐到应用程序首页或者热门页的概率为发布帐户a>发布帐户b>发布帐户c。
[0156]
(5)根据发布帐户的属性信息调整及监控应用程序的流量分配。
[0157]
下面结合图4对发布帐户的属性信息调整及监控应用程序的流量分配的合理性进行详细说明。
[0158]
这里,发布帐户的属性信息表示的优质账户的关联账户会以稳定且活跃的状态在应用程序中活动,这些关联账户会浏览优质的发布账户在平台上发布过的优质作品。那么当前应用程序的流量分配给了多少优质的发布账户和劣质的发布账户也是一个可以衡量当前应用程序的流量分配合理性的维度。这里,本公开实施例提供计算量低且能够有效衡量的方式,即结合分类模型中模型评价指标(auc)的概念,首先按照应用程序中多个发布帐户的属性信息所表示的评分值的倒排顺序,计算发布账户的发布帐户的属性信息所表示的分位点,将该分位点确定为横轴。接着,确定每个分位点历史发布作品的累计占比作为纵轴,统计出入图4所示的受试者工作特征曲线(receiver operating characteristic curve,roc)曲线,计算其面积,这里,该面积越小,表示应用程序中这种流量分发的策略是不友好,不正确的;反之,该面积越大,表示应用程序中这种流量分发的策略是有利于应用程序发展,向用户推荐的多媒体信息准确,用户体验感好。
[0159]
需要说明的是,上述本公开实施例描述的应用场景是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域普通技术人员可知,随着新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
[0160]
基于相同的发明构思,本公开还提供了一种数据处理装置。具体结合图5进行详细说明。
[0161]
图5是根据一示例性实施例示出的一种数据处理装置的结构框图。
[0162]
如图5所示,该数据处理装置50具体可以包括:
[0163]
第一获取模块501,被配置为执行获取待确定属性信息的发布帐户,其中,发布帐户为在平台上发布过作品的帐户;
[0164]
第二获取模块502,被配置为执行获取发布帐户的关联帐户集合,其中,关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户;
[0165]
第三获取模块503,被配置为执行获取关联帐户与发布帐户的互动行为;
[0166]
第一确定模块504,被配置为执行基于互动行为确定发布帐户的属性信息。
[0167]
在一种可能的实施例中,上述涉及的第二获取模块502可以包括:
[0168]
提取模块,被配置为执行从日志中提取发布帐户的初始关联帐户集合,初始关联帐户集合包括预定时间内与发布帐户主动建立社交关联关系的关联帐户;
[0169]
第一筛选模块,被配置为执行从初始关联帐户集合中,筛选出符合预定条件的关联帐户,得到关联帐户集合。
[0170]
基于此,在另一种可能的实施例中,上述涉及的第一筛选模块可以包括:
[0171]
第四获取模块,被配置为执行获取初始关联帐户集合中各关联帐户的关联帐户属性;
[0172]
第二筛选模块,被配置为执行从初始关联账户集合中,筛选出关联帐户属性与发布帐户的帐户属性关联度小于预定阈值的关联帐户,其中,预定条件为关联帐户属性与发布帐户的帐户属性关联度小于预定阈值。。
[0173]
另外,在又一种可能的实施例中,上述涉及的第三获取模块503可以包括:
[0174]
第五获取模块,被配置为执行获取关联帐户在与发布帐户建立关联关系之后的预定时间段内、在指定页面与发布帐户的交互操作行为,交互操作行为为正向交互操作行为;
[0175]
第一汇总模块,被配置为执行汇总交互操作行为的行为时长,得到互动行为的表征数据。
[0176]
基于此,本公开实施例中指定页面包括平台为关联帐户展示指定帐户作品的页面,和/或,发布帐户的作品展示页面,指定帐户为关联帐户主动建立社交关系的帐户。
[0177]
在再一种可能的实施例中,上述涉及的第一确定模块504可以包括:
[0178]
第二确定模块,被配置为执行基于互动行为的表征数据,确定发布帐户的初始属性信息;
[0179]
判断模块,被配置为执行判断关联帐户集合中关联帐户的数量是否超过预定阈值;
[0180]
调整模块,被配置为执行若关联帐户集合中关联帐户的数量未超过预定阈值,则调整初始属性信息,得到发布帐户的属性信息;
[0181]
第三确定模块,被配置为执行若关联帐户集合中关联帐户的数量超过预定阈值,则确定初始属性信息为发布帐户的属性信息。
[0182]
基于此,在再一种可能的实施例中,上述涉及的第二确定模块可以包括:
[0183]
第二汇总模块,被配置为执行汇总在预设时间段内新增的各关联账户的互动行为
的表征数据,得到表征数据的累计数据;
[0184]
第一计算模块,被配置为执行计算累计数据与预设时间段内的新增的关联账户数量的比值,将比值作为发布帐户的初始属性信息。
[0185]
基于此,在再一种可能的实施例中,上述涉及的调整模块可以包括:
[0186]
第六获取模块,被配置为执行获取发布账户的预设关联帐户集合,其中,预设关联帐户集合中记录有预设关联帐户;
[0187]
第七获取模块,被配置为执行获取预设关联帐户的预设属性信息;
[0188]
第三汇总模块,被配置为执行汇总预设关联帐户的预设属性信息,得到预设属性信息累计值,并汇总关联帐户集合中各关联帐户的初始属性信息,得到初始属性信息累计值;
[0189]
第四汇总模块,被配置为执行汇总预设属性信息累计值和初始属性信息累计值,得到属性信息汇总结果;
[0190]
第二计算模块,被配置为执行计算属性信息汇总结果与目标关联账户数量的比值,得到发布帐户的属性信息;目标关联账户数量为预设关联帐户集合中预设关联帐户数量和关联帐户集合中互联帐户数量之和。
[0191]
在再一种可能的实施例中,上述涉及的数据处理装置还包括下述至少之一:
[0192]
第四确定模块,被配置为执行根据发布帐户的属性信息以及预设的发布账户等级条件,确定发布帐户在平台上的等级信息;
[0193]
展示模块,被配置为执行在展示页面展示发布帐户的属性信息和等级信息;
[0194]
第五确定模块,被配置为执行根据发布帐户的属性信息和预设的发布作品等级条件,确定发布帐户在平台上发布作品的等级信息。
[0195]
本公开实施例通过获取待确定属性信息的发布帐户和发布帐户的关联帐户集合,得到关联帐户与发布帐户的互动行为。然后,基于关联帐户与发布帐户的互动行为确定发布帐户的属性信息。其中,发布帐户为在平台上发布过作品的帐户和关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户。这样,通过应用程序平台中发布帐户的属性信息,筛选出帐户发布的属性信息表示的优质发布帐户,并将发布帐户在平台上发布的作品向观看者推荐,由此,在提高多媒体推荐准确度的同时,提高了用户的体验感。
[0196]
基于同一发明构思,本公开实施例还提供了一种计算设备,具体结合图6进行详细说明。
[0197]
图6是根据一示例性实施例示出的一种计算设备的结构框图。
[0198]
如图6所示,该计算设备6能够实现根据本公开实施例中的数据处理方法以及数据处理装置的计算设备的示例性硬件架构的结构图。该计算设备可以指代本公开实施例中的服务器。
[0199]
该计算设备6可以包括处理器601以及存储有计算机程序指令的存储器602。
[0200]
具体地,上述处理器601可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
[0201]
存储器602可以包括被配置为信息或指令的大容量存储器。举例来说而非限制,存储器1202可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁
带或通用串行总线(universal serial bus,usb)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器1202可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器1202可在综合网关设备的内部或外部。在特定实施例中,存储器1202是非易失性固态存储器。在特定实施例中,存储器1202包括只读存储器(rom)。在合适的情况下,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存,或者两个或及其以上这些的组合。
[0202]
处理器601通过读取并执行存储器602中存储的计算机程序指令,以执行如下步骤:
[0203]
处理器601,被配置为执行获取待确定属性信息的发布帐户,其中,发布帐户为在平台上发布过作品的帐户;获取发布帐户的关联帐户集合,其中,关联帐户集合中记录有主动与发布帐户建立社交关联关系的关联帐户;获取关联帐户与发布帐户的互动行为;以及,基于互动行为确定发布帐户的属性信息。
[0204]
在一种可能的实施例中,上述涉及的处理器601被配置为执行,从日志中提取发布帐户的初始关联帐户集合,初始关联帐户集合包括预定时间内与发布帐户主动建立社交关联关系的关联帐户;以及,从初始关联帐户集合中,筛选出符合预定条件的关联帐户,得到关联帐户集合。
[0205]
基于此,在另一种可能的实施例中,上述涉及的处理器601被配置为执行,获取初始关联帐户集合中各关联帐户的关联帐户属性;从初始关联账户集合中,筛选出关联帐户属性与发布帐户的帐户属性关联度小于预定阈值的关联帐户,其中,预定条件为关联帐户属性与发布帐户的帐户属性关联度小于预定阈值。
[0206]
另外,在又一种可能的实施例中,上述涉及的处理器601被配置为执行,获取关联帐户在与发布帐户建立关联关系之后的预定时间段内、在指定页面与发布帐户的交互操作行为,交互操作行为为正向交互操作行为;汇总交互操作行为的行为时长,得到互动行为的表征数据。
[0207]
基于此,本公开实施例中指定页面包括平台为关联帐户展示指定帐户作品的页面,和/或,发布帐户的作品展示页面,指定帐户为关联帐户主动建立社交关系的帐户。
[0208]
在再一种可能的实施例中,上述涉及的处理器601被配置为执行,基于互动行为的表征数据,确定发布帐户的初始属性信息;判断关联帐户集合中关联帐户的数量是否超过预定阈值;若关联帐户集合中关联帐户的数量未超过预定阈值,则调整初始属性信息,得到发布帐户的属性信息;以及,若关联帐户集合中关联帐户的数量超过预定阈值,则确定初始属性信息为发布帐户的属性信息。
[0209]
基于此,在再一种可能的实施例中,上述涉及的处理器601被配置为执行,汇总在预设时间段内新增的各关联账户的互动行为的表征数据,得到表征数据的累计数据;计算累计数据与预设时间段内的新增的关联账户数量的比值,将比值作为发布帐户的初始属性信息。
[0210]
基于此,在再一种可能的实施例中,上述涉及的处理器601被配置为执行,获取发布账户的预设关联帐户集合,其中,预设关联帐户集合中记录有预设关联帐户;获取预设关联帐户的预设属性信息;汇总预设关联帐户的预设属性信息,得到预设属性信息累计值,并汇总关联帐户集合中各关联帐户的初始属性信息,得到初始属性信息累计值;汇总预设属
性信息累计值和初始属性信息累计值,得到属性信息汇总结果;计算属性信息汇总结果与目标关联账户数量的比值,得到发布帐户的属性信息;目标关联账户数量为预设关联帐户集合中预设关联帐户数量和关联帐户集合中互联帐户数量之和。
[0211]
在再一种可能的实施例中,上述涉及的处理器601被配置为执行下述至少之一:
[0212]
根据发布帐户的属性信息以及预设的发布账户等级条件,确定发布帐户在平台上的等级信息;
[0213]
在展示页面展示发布帐户的属性信息和等级信息;
[0214]
执行根据发布帐户的属性信息和预设的发布作品等级条件,确定发布帐户在平台上发布作品的等级信息。
[0215]
需要说明的是,该计算设备60还可包括收发器603和总线604。其中,如图6所示,处理器601、存储器602和收发器603通过总线604连接并完成相互间的通信。
[0216]
总线604包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围控件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线1003可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
[0217]
本公开实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机可执行指令,计算机可执行指令被配置为实现本公开实施例所记载的数据处理方法。
[0218]
在一些可能的实施方式中,本公开提供的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码被配置为使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的方法中的步骤,例如,计算机设备可以执行本公开实施例所记载的数据处理方法。
[0219]
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0220]
本公开是参照根据本公开的方法、设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生被配置为实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0221]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指
令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0222]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供被配置为实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0223]
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1