本技术涉及大数据,特别涉及一种基于大数据分析的推广方法、装置、设备及存储介质。
背景技术:
1、随着移动互联网的快速发展,人们的信息获取途径和方式发生了巨大变革。用户的需求越来越多样化,对于信息的获取也变得更加迅速和便捷。为了满足用户的个性化需求,各大互联网企业纷纷采用推送技术为用户提供个性化的信息服务。
2、推送技术作为一种广泛应用的信息传递手段,其主要目的是将相关的信息内容推送给目标用户,以满足用户的需求。
3、目前的推广方法通常是根据用户的点击行为,为其推荐相同类型的数据,推广方式非常的单一,且对用户分析不足,经常无法获知用户真实需求。
技术实现思路
1、本技术实施例提供了一种基于大数据分析的推广方法、装置、设备及存储介质,能够达到精准推广效果。所述技术方案如下:
2、一方面,提供了一种基于大数据分析的推广方法,所述方法包括:
3、从社交网络平台、数据库获取用户数据,所述用户数据包括不同用户相关联的文本数据、图像数据和视频数据中至少两项;
4、对所述用户数据进行特征提取,得到不同用户的文本特征和图像特征;
5、利用分类算法、社区发现算法以及社区画像算法,根据所述用户数据中的显性信息和隐性信息,确定所述不同用户的画像特征2
6、通过图聚类算法,分别根据所述不同用户的文本特征、图像特征和画像特征,对所述不同用户进行分组,得到单一特征对应的第一用户分组;
7、通过图聚类算法,根据所述不同用户的文本特征、图像特征和画像特征的组合特征,对所述不同用户进行分组,得到所述组合特征对应的第二用户分组;
8、根据所有用户分组中不同用户被分到同一个用户分组中的概率或频次,确定所述不同用户之间的相似评分,所述相似评分与所述概率或频次正相关;
9、通过所述不同用户之间的相似评分,对所述不同用户进行重新分组,得到多个第三用户分组;
10、根据待推广数据与所述多个第三用户分组的匹配程度,将所述待推广数据推广至所述多个第三用户分组中的目标用户分组。
11、在一些实施例中,所述利用分类算法、社区发现算法以及社区画像算法,根据所述用户数据中的显性信息和隐性信息,确定所述不同用户的画像特征,包括:
12、利用分类算法和社区发现算法,分别根据所述用户数据中的显性信息和隐性信息,划分得到显性社区和隐形社区;
13、基于用户相似性和社区差异性的画像方法,对所述显性社区和隐形社区中的用户进行社区画像,得到所述不同用户的画像特征。
14、在一些实施例中,所述根据待推广数据与所述多个第三用户分组的匹配程度,将所述待推广数据推广至所述多个第三用户分组中的目标用户分组,包括:
15、对每个第三用户分组中不同用户的文本特征、图像特征和画像特征进行共享,得到每个第三用户分组的共享特征;
16、对所述待推广数据与所述每个第三用户分组的共享特征进行匹配,得到每个第三用户分组与所述待推广数据的匹配程度;
17、将匹配程度符合目标匹配条件的第三用户分组确定为目标用户分组;
18、将所述待推广数据推广至所述目标用户分组。
19、在一些实施例中,所述对所述待推广数据与所述每个第三用户分组的共享特征进行匹配,得到每个第三用户分组与所述待推广数据的匹配程度,包括:
20、将所述待推广数据与所述每个第三用户分组的共享特征输入卷积神经网络cnn模型中,由所述cnn模型对所述待推广数据与所述每个第三用户分组的共享特征进行特征提取,得到多模态特征;
21、将提取的多模态特征输入长短期记忆lstm网络中,由所述lstm网络对所述多模态特征进行处理输出多模态长期特征;
22、将所述多模态长期特征输入全连接层,输出所述每个第三用户分组与所述待推广数据的匹配程度。
23、在一些实施例中,所述根据所有用户分组中不同用户被分到同一个用户分组中的概率或频次,确定所述不同用户之间的相似评分,包括:
24、对所述第一用户分组和所述第二用户分组中任两个用户分组进行重合率计算,得到所述任两个用户分组之间的重合率;
25、响应于所述任两个用户分组之间的重合率大于或等于目标重合率,将所述任两个用户分组合并为一个用户分组;
26、基于合并后的用户分组,执行所述根据所有用户分组中不同用户被分到同一个用户分组中的概率或频次,确定所述不同用户之间的相似评分的步骤。
27、在一些实施例中,所述任两个用户分组之间的重合率通过下述公式一计算:
28、j(ai,aj)=ai∩aj/ai∪aj, 公式一
29、其中,ai为任一用户分组,aj为区别于ai的另一用户分组,i和j为用户分组标识,j(ai,aj)为用户分组ai和用户分组aj之间的重合率,所述j(ai,aj)的值域为[0,1]。
30、在一些实施例中,所述方法还包括:
31、通过下述公式二,计算所述待推广数据的展示完整率:
32、q=pv/bv, 公式二
33、其中,pv为所述待推广数据的完整展示次数,bv为所述待推广数据的次数;
34、根据所述待推广数据的展示完整率,通过下述公式三,确定本次推广的误差率:
35、
36、其中,e为本次推广的误差率,e的值域为(0,1),qi为用户i观看所述待推广数据的播放率;
37、所述qpred通过下述公式四确定:
38、qpred=ti/(1-u0), 公式四
39、其中,ti为用户i观看所述待推广数据的时长,u0为所述待推广数据与所述目标用户分组的匹配程度;
40、基于所述本次推广的误差率,对所述第三用户分组的分组情况进行修正。
41、一方面,提供了一种基于大数据分析的推广装置,所述装置包括:
42、获取模块,用于从社交网络平台、数据库获取用户数据,所述用户数据包括不同用户相关联的文本数据、图像数据和视频数据中至少两项;
43、提取模块,用于对所述用户数据进行特征提取,得到不同用户的文本特征和图像特征;
44、确定模块,用于利用分类算法、社区发现算法以及社区画像算法,根据所述用户数据中的显性信息和隐性信息,确定所述不同用户的画像特征;
45、分组模块,用于通过图聚类算法,分别根据所述不同用户的文本特征、图像特征和画像特征,对所述不同用户进行分组,得到单一特征对应的第一用户分组;
46、所述分组模块,用于通过图聚类算法,根据所述不同用户的文本特征、图像特征和画像特征的组合特征,对所述不同用户进行分组,得到所述组合特征对应的第二用户分组;
47、所述确定模块,用于根据所有用户分组中不同用户被分到同一个用户分组中的概率或频次,确定所述不同用户之间的相似评分,所述相似评分与所述概率或频次正相关;
48、所述分组模块,用于通过所述不同用户之间的相似评分,对所述不同用户进行重新分组,得到多个第三用户分组;
49、推广模块,用于根据待推广数据与所述多个第三用户分组的匹配程度,将所述待推广数据推广至所述多个第三用户分组中的目标用户分组。
50、在一些实施例中,所述确定模块用于:
51、利用分类算法和社区发现算法,分别根据所述用户数据中的显性信息和隐性信息,划分得到显性社区和隐形社区;
52、基于用户相似性和社区差异性的画像方法,对所述显性社区和隐形社区中的用户进行社区画像,得到所述不同用户的画像特征。
53、在一些实施例中,所述推广模块用于:
54、对每个第三用户分组中不同用户的文本特征、图像特征和画像特征进行共享,得到每个第三用户分组的共享特征;
55、对所述待推广数据与所述每个第三用户分组的共享特征进行匹配,得到每个第三用户分组与所述待推广数据的匹配程度;
56、将匹配程度符合目标匹配条件的第三用户分组确定为目标用户分组;
57、将所述待推广数据推广至所述目标用户分组。
58、在一些实施例中,所述推广模块用于:
59、将所述待推广数据与所述每个第三用户分组的共享特征输入卷积神经网络cnn模型中,由所述cnn模型对所述待推广数据与所述每个第三用户分组的共享特征进行特征提取,得到多模态特征;
60、将提取的多模态特征输入长短期记忆lstm网络中,由所述lstm网络对所述多模态特征进行处理输出多模态长期特征;
61、将所述多模态长期特征输入全连接层,输出所述每个第三用户分组与所述待推广数据的匹配程度。
62、在一些实施例中,所述确定模块用于:
63、对所述第一用户分组和所述第二用户分组中任两个用户分组进行重合率计算,得到所述任两个用户分组之间的重合率;
64、响应于所述任两个用户分组之间的重合率大于或等于目标重合率,将所述任两个用户分组合并为一个用户分组;
65、基于合并后的用户分组,执行所述根据所有用户分组中不同用户被分到同一个用户分组中的概率或频次,确定所述不同用户之间的相似评分的步骤。
66、在一些实施例中,所述任两个用户分组之间的重合率通过下述公式一计算:
67、j(ai,aj)=ai∩aj/ai∪aj, 公式一
68、其中,ai为任一用户分组,aj为区别于ai的另一用户分组,i和j为用户分组标识,j(ai,aj)为用户分组ai和用户分组aj之间的重合率,所述j(ai,aj)的值域为[0,1]。
69、在一些实施例中,所述装置还包括修正模块,所述修正模块用于:
70、通过下述公式二,计算所述待推广数据的展示完整率:
71、q=pv/bv, 公式二
72、其中,pv为所述待推广数据的完整展示次数,bv为所述待推广数据的次数;
73、根据所述待推广数据的展示完整率,通过下述公式三,确定本次推广的误差率:
74、
75、其中,e为本次推广的误差率,e的值域为(0,1),qi为用户i观看所述待推广数据的播放率;
76、所述qpred通过下述公式四确定:
77、qpred=ti/(1-u0), 公式四
78、其中,ti为用户i观看所述待推广数据的时长,u0为所述待推广数据与所述目标用户分组的匹配程度;
79、基于所述本次推广的误差率,对所述第三用户分组的分组情况进行修正。
80、一方面,提供了一种电子设备,所述电子设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器加载并执行以实现上述基于大数据分析的推广方法的各种可选实现方式。
81、一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现上述基于大数据分析的推广方法的各种可选实现方式。
82、一个方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或所述计算机程序包括一条或多条程序代码,所述一条或多条程序代码存储在计算机可读存储介质中。电子设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条程序代码,所述一个或多个处理器执行所述一条或多条程序代码,使得电子设备能够执行上述任一种可能实施方式的基于大数据分析的推广方法。
83、本技术实施例通过从各个地方收集不同类型的用户数据,采用不同的方法得到了用户的多种特征,然后采用图聚类算法得到单一特征对应的分组情况和组合特征对应的分组情况,这样通过多样化得分组方式,能够尽可能的得到多种多样的用户分组情况,之后再进一步按照用户的分组情况分析不同用户之间的相似情况,从而依据该相似情况再重新分组,也即对用户分组进行了精细处理,得到更加准确的用户分组情况,再基于重新分组情况进行数据推广,这样由于用户分组更加准确,将相似用户分到同一组,能够精准对用户进行推广,避免误推广的情况出现。