数据推送方法、装置及电子设备与流程

文档序号:30494734发布日期:2022-06-22 03:40阅读:172来源:国知局
数据推送方法、装置及电子设备与流程

1.本公开涉及互联网技术领域,尤其涉及一种数据推送方法、装置及电子设备。


背景技术:

2.随着推荐技术,人工智能技术的兴起,短视频,资讯等信息流产品层出不穷,用户在资讯和短视频中的浏览时间越来越多,传统的营销广告也越来越向信息流广告倾斜。
3.在信息流广告投放中,为了实现精细化用户流量,有效提升广告主链路转化效果,保证广告主稳定投放,促进广告平台长效健康发展,需要精准定位广告推送人员。相关技术中,对于应用下载类广告的广告主,可以根据经验选择与自身推送的广告类似的应用程序,并定向已经安装该应用程序的用户。但是,上述方案对广告主或代理商的经验要求较高,如果无法精准确定相似应用程序,则无法实现精细化精准定向,导致广告投放效果较差。


技术实现要素:

4.本公开提供一种数据推送方法、装置及电子设备,以至少解决相关技术中数据推送方法依靠广告主或代理商的经验,导致数据推送准确度较低,推送效果较差的问题。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种数据推送方法,包括:获取第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序;基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序,其中,第二应用程序与第一应用程序的相似度大于预设阈值;获取符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件;推送推荐数据至目标终端,其中,推荐数据用于推荐安装第一应用程序。
6.可选地,基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序的步骤包括:基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用程序,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
7.可选地,在基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:获取多个终端中已安装的多个应用程序的应用信息;利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量;基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;基于任意两个应用程序之间的相似度,构建目标数据库。
8.可选地,利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量的步骤包括:对多个应用程序的应用信息进行特征提取,得到多个应用程序的特征向量,其中,应用信息包括如下至少之一:应用名称、应用类型、下载量、下载来源和用户画像。
9.可选地,利用多个应用程序对向量化表示模型进行训练的步骤包括:利用多个应用程序对快速文本分类模型进行训练,其中,快速文本分类模型中的文本表示模型采用向量化表示模型。
10.可选地,在训练的过程中,快速文本分类模型的窗口大小为100,维度为32维。
11.可选地,基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度的步骤包括:基于多个应用程序的特征向量,通过相似度计算方法确定任意两个应用程序之间的相似度。
12.可选地,在获取多个终端中已安装的多个应用程序的应用信息的步骤之前,数据推送方法还包括:确定预设时间段内登陆预设应用程序的终端集合;随机确定终端集合中目标数量的终端;获取目标数量的终端中已经安装的应用程序的数量;确定目标数量的终端中的多个终端,其中,多个终端中已安装的应用程序的数量小于预设数量。
13.可选地,按照预设更新周期对目标数据库中存储的至少一个应用程序进行更新。
14.可选地,基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序的步骤包括:基于第一应用程序的应用信息查询目标数据库;基于匹配类型对从目标数据库中查询出的应用程序进行筛选,得到与第一应用程序匹配的第二应用程序。
15.可选地,在基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:获取第一应用程序的应用信息中,满足应用维度的应用信息;基于满足应用维度的应用信息,确定与第一应用程序匹配的第二应用程序。
16.可选地,基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序的步骤包括:获取至少一个应用程序;分别对至少一个应用程序和第一应用程序进行处理,得到至少一个应用程序的第一特征向量,以及第一应用程序的第二特征向量;基于第一特征向量和第二特征向量,确定至少一个应用程序与第一应用程序的相似度;确定至少一个应用程序中相似度大于预设阈值的应用程序为第二应用程序。
17.可选地,推荐数据还用于推荐与第一应用程序关联的多媒体数据。
18.根据本公开实施例的第二方面,提供一种数据推送方法,包括:响应于在交互界面中检测到的输入操作信号,在交互界面中显示第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序;在交互界面中显示与第一应用程序匹配的第二应用程序,其中,第二应用程序基于第一应用程序的应用信息确定,第二应用程序与第一应用程序的相似度大于预设阈值;响应于在交互界面中检测到的推送操作信号,推送推荐数据至符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件,推荐数据用于推荐安装第一应用程序。
19.可选地,在显示与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
20.可选地,在基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:获取多个终端中已安装的多个应用程序的应用信息;利用多个应用程序的应用信息对向量化表示模型进行训练,
得到多个应用程序的特征向量;基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;基于任意两个应用程序之间的相似度,构建目标数据库。
21.可选地,在显示与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:在交互界面中显示多个匹配类型;响应于在交互界面中检测到的选择操作信号,在交互界面中显示选中的匹配类型,其中,第二应用程序是基于选中的匹配类型从目标数据库中查询出的应用程序进行筛选得到的应用程序,从目标数据库中查询出的应用程序是基于第一应用程序的应用信息查询目标数据库得到的应用程序。
22.可选地,在显示第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:在交互界面中显示多个应用维度,其中,多个应用维度包括:应用分类和应用名称;响应于在交互界面中检测到的选择操作信号,在交互界面中显示选中的应用维度,其中,第二应用程序是基于获取第一应用程序的应用信息中,满足应用维度的应用信息所确定。
23.根据本公开实施例的第三方面,提供一种数据推送装置,包括:第一获取单元,被配置为获取第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序;应用确定单元,被配置为基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序,其中,第二应用程序与第一应用程序的相似度大于预设阈值;第二获取单元,被配置为获取符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件;推送单元,被配置为推送推荐数据至目标终端,其中,推荐数据用于推荐安装第一应用程序。
24.可选地,应用确定单元包括:应用查询单元,被配置为基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
25.可选地,数据推送装置还包括:第三获取单元,被配置为获取多个终端中已安装的多个应用程序的应用信息;训练单元,被配置为利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量;相似度确定单元,被配置为基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;构建单元,被配置为基于任意两个应用程序之间的相似度,构建目标数据库。
26.可选地,训练单元包括:提取单元,被配置为对多个应用程序的应用信息进行特征提取,得到多个应用程序的特征向量,其中,应用信息包括如下至少之一:应用名称、应用类型、下载量、下载来源和用户画像。
27.可选地,数据推送装置还包括:集合确定单元,被配置为确定预设时间段内登陆预设应用程序的终端集合;随机确定单元,被配置为随机确定终端集合中目标数量的终端;数量获取单元,被配置为获取目标数量的终端中已经安装的应用程序的数量;终端确定单元,被配置为确定目标数量的终端中的多个终端,其中,多个终端中已安装的应用程序的数量小于预设数量。
28.可选地,数据推送装置还包括:更新单元,被配置为按照预设更新周期对目标数据库中存储的至少一个应用程序进行更新。
29.可选地,应用查询单元包括:数据查询单元,被配置为基于第一应用程序的应用信息查询目标数据库;筛选单元,被配置为基于匹配类型对从目标数据库中查询出的应用程
序进行筛选,得到与第一应用程序匹配的第二应用程序。
30.可选地,数据推送装置还包括:第四获取单元,被配置为获取第一应用程序的应用信息中,满足应用维度的应用信息;应用确定单元还被配置为基于满足应用维度的应用信息,确定与第一应用程序匹配的第二应用程序。
31.根据本公开实施例的第四方面,提供一种数据推送装置,包括:第一显示单元,被配置为响应于在交互界面中检测到的输入操作信号,在交互界面中显示第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序;第二显示单元,被配置为在交互界面中显示与第一应用程序匹配的第二应用程序,其中,第二应用程序基于第一应用程序的应用信息确定,第二应用程序与第一应用程序的相似度大于预设阈值;推送单元,被配置为响应于在交互界面中检测到的推送操作信号,推送推荐数据至符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件,推荐数据用于推荐安装第一应用程序。
32.可选地,数据推送装置还包括:查询单元,被配置为基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
33.可选地,数据推送装置还包括:获取单元,被配置为获取多个终端中已安装的多个应用程序的应用信息;训练单元,被配置为利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量;确定单元,被配置为基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;构建单元,被配置为基于任意两个应用程序之间的相似度,构建目标数据库。
34.根据本公开实施例的第五方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现如上述实施例的数据推送方法。
35.根据本公开实施例的第六方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如上述实施例的数据推送方法。
36.根据本公开实施例的第七方面,提供一种计算机程序产品,当计算机程序产品中的计算机程序由服务器的处理器执行时,使得服务器能够执行如上述实施例的数据推送方法。
37.本公开的实施例提供的技术方案至少带来以下有益效果:
38.通过在获取到第一应用程序的应用信息之后,确定与第一应用程序匹配的第二应用程序,并推送推荐数据至符合推送条件的目标终端,实现了基于应用程序之间的相似度精确定位第二应用程序,进而准确定向目标终端并进行推荐数据推送的目的,无需广告主或代理商基于经验确定第二应用程序,达到提高推送准确度,提升推送效果的效果,进而解决相关技术中数据推送方法依靠广告主或代理商的经验,导致数据推送准确度较低,推送效果较差的问题。
39.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
40.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
41.图1是根据一示例性实施例示出的一种计算设备100的框图。
42.图2是根据一示例性实施例示出的一种数据推送方法的流程图。
43.图3是根据一示例性实施例示出的一种可选的交互界面的示意图。
44.图4是根据一示例性实施例示出的一种数据推送方法的流程图。
45.图5是根据一示例性实施例示出的一种数据推送方法的流程图。
46.图6是根据一示例性实施例示出的一种可选的数据推送方法的流程图。
47.图7是根据一示例性实施例示出的另一种数据推送方法的流程图。
48.图8是根据一示例性实施例示出的一种数据推送装置框图。
49.图9是根据一示例性实施例示出的另一种数据推送装置框图。
50.图10是根据一示例性实施例示出的一种用于执行数据推送方法的电子设备200的框图。
具体实施方式
51.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
52.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
53.首先,对本公开实施例中出现的技术名称或技术术语进行如下解释说明:
54.用户画像月活表:可以是指基于用户画像中用户的活跃时间段,确定上个与登陆特定应用程序的用户。
55.fasttext:快速文本分类模型,是facebook开源的用来文本标识和分类的开源库。
56.item2vec:基于项目的向量化表示模型,可以利用用户行为将item(例如应用程序)转化为特征向量。
57.ann:approximate nearest neighbor search,近邻最近检索,其核心思想是搜索属于近邻的数据项而不再只局限于返回最可能的项目,在牺牲可接受范围内的精度的情况下提高检索效率。
58.annoy:可以是开源的高维空间球近似最近邻的系统,可以被称为邻域检索系统。
59.对于本公开实施例中记载的技术方案可以在移动设备、计算机终端、服务器或者类似的计算设备中执行。如图1所示,该计算设备100可以包括基本配置102(包括系统存储器10、处理器104、存储器控制器118,存储器控制器118通过存储器总线108与系统存储器106连接,存储器控制器118与处理器104连接)、存储设备132、总线/接口控制器130、输出设备142、外围接口144、通信设备146和其他计算机设备162,总线/接口控制器130通过接口总
线140与输出设备142、外围接口144和通信设备146连接。
60.其中,系统存储器(rom/ram)106可以用于存储操作系统120、应用程序122以及相关的程序数据124等;处理器(up/uc/dsp)104可以包括一级高速缓存110、二级高速缓存112、处理核(例如alu/fpu/dsp)114、寄存器116;存储设备132可以包括可移动存储设备(例如cd/vcd)136和不可移动存储设备(例如hdd)138,可移动存储设备136和不可移动存储设备138通过存储接口总线134与总线/接口控制器130连接;输出设备142可以包括:图形处理单元148、音频处理单元150和a/v端口152,图形处理单元148和音频处理单元150与a/v端口152连接;外围接口144可以包括:串行接口控制器154、并行接口控制器156和i/o端口158,串行接口控制器154和并行接口控制器156与i/o端口158连接;通信设备146可以包括:网络控制器160和通信接口164,通信接口164用于连接网络控制器160和其他计算设备162。
61.需要说明的是,计算设备可以包括比图1中所示的更多或更少的组件,或者具有如图1所示不同的配置。
62.图2是根据一示例性实施例示出的一种数据推送方法的流程图,如图2所示数据推送方法用于广告定向平台中,包括以下步骤。
63.在步骤s21中,获取第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序。
64.上述步骤中的第一应用程序可以是广告主或代理商自身向用户推荐安装的应用程序,或者需要进行应用类下载广告推荐的应用程序,但不仅限于此。广告主或代理商可以输入第一应用程序的名称、类型、下载路径等能够唯一确定应用程序的应用信息,从而计算设备可以根据应用信息确定第一应用程序。
65.在步骤s22中,基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序,其中,第二应用程序与第一应用程序的相似度大于预设阈值。
66.上述步骤中的预设阈值可以是根据广告主或代理商等不同客户的定向需求,所确定的相似度阈值,也可以是预先通过试验等方式所确定的一个固定值,当两个应用程序的相似度大于该预设阈值时,表明两个应用程序为相似应用程序。
67.在一种可选的实施例中,可以通过计算第一应用程序和其他应用程序的相似度,进而通过与预设阈值进行比较,将相似度大于预设阈值的应用程序确定为第二应用程序。在另一种可选的实施例中,还可以预先针对应用程序构建一个相似应用程序的数据库,该数据库中存储相似应用程序的映射关系,从而直接通过从该数据库中进行查询,即可确定第二应用程序,达到提升第二应用程序定向速度的目的。
68.需要说明的是,第二应用程序的数量可以根据客户的定向需求进行确定,也可以是预先设置的一个固定值,例如,第二应用程序的数量为10个,但不仅限于此。由于第二应用程序的数量受到所有进行匹配的应用程序的限定,而且,数量越多则应用下载类广告的推送范围越广,因此,可以在满足上述限定的情况下,尽量设置较多的数量。
69.还需要说明的是,由于相似度大于预设阈值的应用程序的数量往往大于实际需要筛选出的相似应用程序的数量,因此,可以将相似度大于预设阈值的所有应用程序按照相似度从大较小进行排序,并选取排序最高一定数量的应用程序作为第二应用程序。
70.在步骤s23中,获取符合推送条件目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件。
71.上述步骤中的推送条件可以是由广告主或代理商设定的条件,可以基于移动终端(例如智能手机、平板电脑、掌上电脑等)、计算机终端(个人电脑、笔记本电脑等)上,用户针对第二应用程序的应用管理行为(包括但不限于:安装、卸载、浏览、是否允许应用程序内安装其他应用、是否允许推送通知等)进行设定,例如,推送条件是筛选当前安装有第二应用程序的终端;又例如,推送条件可以是筛选允许第二应用程序推送通知的终端。
72.上述步骤中的目标终端可以是符合推送条件的智能手机、平板电脑、掌上电脑等移动终端,也可以是符合推送条件的笔记本电脑、个人计算机等计算机终端。例如,当广告主或代理商希望对安装第二应用程序的用户进行定向时,可以设置推送条件为筛选安装有第二应用程序的终端,因此,上述的目标终端可以是安装有第二应用程序的移动终端、计算机终端等。又例如,当广告主或代理商希望对卸载第二应用程序的用户进行排除时,可以设置推送条件为筛选未卸载过第二应用程序的终端,因此,上述的目标终端可以是未卸载过第二应用程序的移动终端、计算机终端等。在实际处理过程中,可以根据广告主或代理商对用户的定向需要进行确定。
73.在步骤s24中,推送推荐数据至目标终端,其中,推荐数据用于推荐安装第一应用程序。
74.其中,上述步骤中的推荐数据可以是指第一应用程序的下载路径、安装包等数据。可选的,推荐数据还用于推荐与第一应用程序关联的多媒体数据,多媒体数据可以是指应用下载类广告、品牌广告、内容咨询等图片、文字或视频类型的数据。在实际处理过程中,可以根据客户的推送需求进行确定。
75.例如,在应用下载类广告的推荐场景中,可以提供给广告主或代理商一个如图3所示的交互界面,广告主或代理商可以在该界面中输入应用程序的名称,例如美图秀秀,从而可以准确确定与美图秀秀相似的10个应用,例如,可以是b612咔叽、faceu激萌、无他相机、轻颜相机、芒果tv等。而且,为了方便广告主或代理商输入应用程序的名称,可以在下拉框中提供包含有广告主或代理商输入内容的所有应用程序的名称,广告主或代理商可以在其中进行选择,例如,广告主或代理商选择美图秀秀。在确定出b612咔叽、faceu激萌、无他相机、轻颜相机、芒果tv等之后,假设广告主或代理商希望向安装上述应用程序的用户推荐美图秀秀,可以确定安装上述任意一个应用程序的用户为最终的定向用户,并向定向用户推荐美图秀秀。
76.需要说明的是,为了方便客户对不同的目标终端进行区分,客户可以在人群包名称的输入区域中设置目标终端的名称。
77.本公开通过在获取到第一应用程序的应用信息之后,确定与第一应用程序匹配的第二应用程序,并推送推荐数据至符合推送条件的目标终端,实现了基于应用程序之间的相似度精确定位第二应用程序,进而准确定向目标终端并进行推荐数据推送的目的,无需广告主或代理商基于经验确定第二应用程序,达到提高推送准确度,提升推送效果的效果,进而解决相关技术中数据推送方法依靠广告主或代理商的经验,导致数据推送准确度较低,推送效果较差的问题。
78.作为一种可选的实施例,如图4所示,基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序的步骤可以包括以下步骤:
79.在步骤s41中,基于第一应用程序的应用信息查询已构建的目标数据库,得到与第
一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
80.上述步骤中的目标数据库可以基于目前已有的大量应用程序构建,将每个应用程序和其相似应用程序的对应关系进行存储。例如,目标数据库可以是mysql,但不仅限于此,可以是其他类型。
81.可选的,可以按照预设更新周期对目标数据库中存储的至少一个应用程序进行更新,例如,可以按年、月、周、日等更新周期进行更新。由于应用程序更新迭代的频率较高,为了进一步提升第二应用程序的定向准确度,在本公开实施例中可以采用天级别的更新周期。通过定期对目标数据库进行更新,确保每次获取到的相似应用程序都是最近确定的相似应用程序,达到了提高数据推送准确度的效果,解决了由于目标数据库中存储的相似应用程序固定不变,无法准确反应当前的相似应用程序,导致数据推送准确度降低的问题。
82.上述步骤中的查询可以是指将第一应用程序的应用信息和目标数据中存储的至少一个应用程序的应用信息进行比较,判断是否相同,如果某个应用程序的应用信息与第一应用程序的上述信息相同,则可以确定该应用程序与第一应用程序为同一个应用程序,可以从目标数据库中读取该应用程序的相似应用程序作为第二应用程序。
83.通过上述步骤,预先针对不同应用程序确定相似应用程序,并构建目标数据库,从而可以通过查询目标数据库的方式,确定第二应用程序,达到了提高第二应用程序的确定效率,进而提高数据推送效率的效果,解决了每次确定第二应用程序时都需要进行相似度计算,导致数据推送效率较低的问题。
84.作为一种可选的实施例,如图4所示,在基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还可以包括如下步骤:
85.在步骤s42中,获取多个终端中已安装的多个应用程序的应用信息。
86.实际定向中往往需要定向安装相似应用程序的用户,因此,可以基于不同用户的终端中已安装的所有应用程序构建目标数据库,将每个已安装的应用程序和其相似应用程序的对应关系进行存储。
87.在步骤s43中,利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量。
88.上述步骤中的向量化表示模型可以是item2vec模型,通过多个应用程序对item2vec模型进行训练,最终可以得到每个已安装的应用程序的特征向量(embedding)。
89.在步骤s44中,基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度。
90.在步骤s45中,基于任意两个应用程序之间的相似度,构建目标数据库。
91.在一种可选的实施例中,可以将任意两个已安装的应用程序与之间的相似度与预设阈值进行比较,确定每个已安装的应用程序的相似应用程序,并基于上述对应关系构建目标数据库,也即,将上述对应关系存储至目标数据库中。
92.通过上述步骤,通过终端上已安装的应用程序构建目标数据库,达到了满足实际用户定向需求的效果,解决了根据所有应用程序构建目标数据库,在大量应用程序未被安
装或卸载的情况下,无法准确进行用户定位的问题。并且通过向量化表示模型确定每个已安装的应用程序的特征向量,并基于特征向量确定任意两个已安装的应用程序之间的相似度,达到了提高相似应用程序的确定准确度,进而提高了数据推送准确度的效果,解决了两个应用程序之间由于相似度计算准确度较低,导致相似应用程序的确定准确度较低的问题。
93.作为一种可选的实施例,利用多个应用程序对向量化表示模型进行训练,得到多个应用程序的特征向量的步骤包括:对多个应用程序的应用信息进行特征提取,得到多个应用程序的特征向量,其中,应用信息包括如下至少之一:应用名称、应用类型、下载量、下载来源和用户画像。
94.上述步骤中的应用信息可以是用于计算应用程序之间相似度的信息,例如,应用信息可以是应用名称、应用类型、下载量、下载来源和用户画像等,其中,下载量可以是指预设更新周期内的下载量,下载来源可以是指应用市场、浏览器等,用户画像可以是指下载应用程序的用户年龄、性别、消费水平、兴趣爱好等。在实际过程中可以根据广告主或代理商的定位需要确定匹配应用程序所需要的应用信息,并不再用固定的应用信息,从而确保相似app搜索的过程可以满足不同广告主或代理商的需要。
95.通过上述步骤,通过对应用程序的应用信息进行特征提取,可以在确保后续应用程序相似度计算的准确度的同时,提高应用程序匹配的灵活性,解决了两个应用程序之间由于特征向量提取较为固定,导致计算准确度较低,无法满足不同广告主或代理商需求的问题。
96.作为一种可选的实施例,利用多个应用程序对向量化表示模型进行训练的步骤可以包括如下步骤:利用多个应用程序对快速文本分类模型进行训练,其中,快速文本分类模型中的文本表示模型采用向量化表示模型。
97.item2vec原理与word2vec原理非常相似,在此基础上,可以利用fasttext进行训练实现item2vec训练的目的,其中,fasttext的文本表示的训练方法可以采用item2vec训练原理。可选的,在训练的过程中,可以通过将fasttext的窗口扩大到一定程序,例如,窗口大小为100,但不仅限于此,可以根据不同定向需求进行确定。而且,fasttext的维度可以为32维,从而最终得到的embedding为32维的特征向量。
98.通过上述步骤,通过设定快速文本分类模型的窗口大小和维度,并通过快速文本分类模型的训练实现向量化表示模型的训练目的,解决了用户需要构建向量化表示模型才能进行训练,导致模型构建流程复杂且模型训练效率低的问题,进而达到了模型构建流程,提高模型训练效率的效果。
99.作为一种可选的实施例,基于多个应用程序的特征向量,确定每个已安装的应用程序与第二应用程序的相似度的步骤可以包括如下步骤:基于多个应用程序的特征向量,通过相似度计算方法确定每个已安装的应用程序与第二应用程序的相似度。
100.在模型训练完成之后,可以生成后缀为.vec的文本,里面包含了所有应用程序的embedding,进一步可以采用相似度计算方法,例如,ann相似计算接口或annoy计算相似度,并将计算结果导入到hdfs中,进一步将计算结果从hdfs中导入到mysql中。
101.通过上述步骤,通过利用机器学习技术计算应用程序之间的相似度,并且可以根据不同需要选择不同的相似度计算方法进行相似度计算,从而解决了相似度计算准确度较
低导致数据推送的准确度降低,进而达到了提高数据推送准确度的效果。
102.作为一种可选的实施例,如图4所示,在获取多个终端中已安装的多个应用程序的应用信息的步骤之前,数据推送方法还可以包括如下步骤:
103.在步骤s46中,确定预设时间段内登陆预设应用程序的终端集合。
104.上述步骤中的预设时间段可以是根据实际处理需求进行确定,例如可以是一天、一周、一个月、一年等,在本公开实施例中,以一个月为例进行说明,也可以确定上个月内登陆预设应用程序的终端。
105.上述步骤中的预设应用程序可以是具备获取用户行为权限的应用程序,例如,对于不同的广告定向平台,可以采用不同的应用程序获取用户的终端中已安装的应用程序。
106.在步骤s47中,随机确定终端集合中目标数量的终端。
107.确定出的终端数量越多,获取到的应用程序数量越大,但是往往导致模型训练速率较低,计算设备性能消耗较大,因此,可以基于定向精度和模型训练速度的需求确定上述的目标数量,在确保目标数量充分的情况下尽可能减少目标数量,例如,目标数量可以是2000万,但不仅限于此。
108.在步骤s48中,获取目标数量的终端中已经安装的应用程序的数量。
109.在步骤s49中,确定目标数量的终端中的多个终端,其中,多个终端中已安装的应用程序的数量小于预设数量。
110.为了避免异常用户对定向精度的影响,例如,大量下载应用程序的用户,可以预先设置上述的预设数量,也即设置用户安装的应用程序的最大数量,例如,可以是150个,但不仅限于此,可以根据需要进行设定。
111.在一种可选的实施例中,可以从用户画像月活表中确定上个月登陆预设应用程序的所有用户,并随机选取2000万用户,同时对安装应用程序的数量超过150个的用户进行过滤,从而确定多个终端。
112.通过上述步骤,通过随机筛选目标数量的终端,并通过对异常终端进行剔除,解决了应用程序数据量较大,导致模型训练速率降低,计算设备性能消耗增大,而且容易受到异常用户的影响的问题,达到了提高模型训练速率、降低计算设备性能消耗,避免受到异常用户影响的效果。
113.作为一种可选的实施例,基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序的步骤包括:基于第一应用程序的应用信息查询目标数据库;基于匹配类型对从目标数据库中查询出的应用程序进行筛选,得到与第一应用程序匹配的第二应用程序。
114.上述的匹配类型可以是指对不同应用程序进行分类的类型,例如,可以是网红粉丝类别、移动应用安装、使用活跃度、应用渗透率、应用商店等。
115.为了精准定位需要进行推荐数据推送的用户,可以基于用户选中的匹配类型确定第二应用程序。为了实现上述方案,可以在从目标数据库中确定第一应用程序之后,基于匹配类型进行进一步筛选,从而得到第二应用程序;或者在获取到多个应用程序之后,首先基于匹配类型进行筛选,然后基于筛选后的应用程序进行相似度计算,从而得到第二应用程序。
116.例如,如图3所示,当客户选中的匹配类型是移动应用安装时,可以从移动应用安
装类型中的应用程序中,确定与客户提供的第一应用程序相似度大于预设阈值的应用程序,得到第二应用程序。
117.通过上述步骤,通过匹配类型确定第二应用程序,达到了精准定位需要进行推荐数据推送的用户,提升数据推送效果的效果,解决了向用户无差别的推送相同数据,导致数据推送效果较差的问题。
118.作为一种可选的实施例,在基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:获取第一应用程序的应用信息中,满足应用维度的应用信息;基于满足应用维度的应用信息,确定与第一应用程序匹配的第二应用程序。
119.上述的应用维度可以是指第一应用程序的信息维度,例如,可以是类型、名称、下载来源等。在本公开实施例中,以应用分类和应用名称为例进行说明。
120.例如,如图3所示,当客户选中的应用维度是应用名称时,客户可以输入需要进行用户定向的第一应用程序的名称,并基于该名称确定相似名称的第二应用程序。当客户选中的应用维度是应用分类时,客户可以输入需要进行用户定向的第一应用程序的类型,并基于该类型确定相似类型的第二应用程序。
121.通过上述步骤,通过应用维度确定第二应用程序,达到了精准定位需要进行推荐数据推送的用户,提升数据推送效果的效果,解决了向用户无差别的推送相同数据,导致数据推送效果较差的问题。
122.作为一种可选的实施例,如图5所示,基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序的步骤可以包括如下步骤:
123.在步骤s51中,获取至少一个应用程序。
124.上述步骤的具体实现方式可以采用如步骤s44所述的方式实现,在此不做赘述。
125.在步骤s52中,分别对至少一个应用程序和第一应用程序进行处理,得到至少一个应用程序的第一特征向量,以及第一应用程序的第二特征向量。
126.上述步骤的具体实现方式可以采用如步骤s45所述的方式实现,在此不做赘述。
127.在步骤s53中,基于第一特征向量和第二特征向量,确定至少一个应用程序与第一应用程序的相似度。
128.上述步骤的具体实现方式可以采用如步骤s46所述的方式实现,在此不做赘述。
129.在步骤s54中,确定少一个应用程序中相似度大于预设阈值的应用程序为第二应用程序。
130.通过上述步骤,通过直接将第一应用程序和获取到的至少一个应用程序进行相似度计算,避免需要预先构建数据库,达到了提高第二应用程序确定的灵活性的效果,解决了从预先构建的数据库中获取第二应用程序,导致灵活性较差的问题。
131.需要说明的是,上述步骤的实现方案与前述的实现方案的区别在于,在前述方案中预先建立目标数据库,并通过目标数据库查询的方式确定第二应用程序,第二应用程序的确定速度较快;而本实现方案中直接通过将第一应用程序和获取到的至少一个应用程序进行相似度计算,无需预先构建目标数据库并进行定期更新,灵活性较高。在实际处理过程中,可以针对不同实现方案向客户提供不同的定向策略,也可以根据客户的定向需求进行策略定制。
132.下面结合如图6对本公开的一种优选的实施例进行详细说明,如图6所示,该实施例可以由推荐结果生成器执行,推荐结果生成器可以包括:数据预处理模块、训练模块、相似度计算模块、推荐结果展示模块。其中,数据预处理模块可以执行步骤s61,从用户画像月活表获取用户安装的app列表,和步骤s62,随机选取2000万用户当前安装的app信息作为训练数据,同时,对安装个数超过150个的用户进行过滤。训练模块可以执行步骤s63,将2000万左右训练数据进行item2vec训练,可以直接使用fasttext来进行训练—通过将窗口扩大到一定从程度即可,在app的训练当中,窗口使用100的大小,维度设定为32维,以及步骤s64,获取app的embedding,也即32维特征向量,训练完成后会生成后缀为.vec的文本,里面包含了所有的app的embedding信息。相似度计算模块可以执行步骤s65,embedding相似计算,使用ann相似计算接口或annoy进行相似度计算,由于app的数量相对较少,大概为24w左右,也可以直接使用annoy计算相似度,并将计算的结果导入到hdfs中。推荐结果展示模块可以执行步骤s66,从hdfs中获取计算结果,并将每个app的top10相似的app存储到mysql中,并进行天级别更新,并且可以展示出最相似的十个应用进行推荐,广告主可直接对着十个应用当前安装,近期安装,或者近期卸载的用户进行打包,最终进行广告定向或排除。
133.通过将app的embedding计算出top10相似app,用于广告定向平台的相似应用推荐,极大地方便的客户的定向需求,优化的客户的定向效果,从而广告主精准定向相似app安装用户,实现定向人群与广告之间的精准推荐;而且,相似应用不仅仅可以用在定向app推荐,也可以作为信息流推荐及广告推荐的特征。
134.图7是根据一示例性实施例示出的另一种数据推送方法的流程图,如图7所示数据推送方法用于广告定向平台中,包括以下步骤。
135.在步骤s71中,响应于在交互界面中检测到的输入操作信号,在交互界面中显示第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序。
136.上述步骤中的交互界面可以是提供给广告主或代理商等客户输入第一应用程序的应用信息的界面,输入操作信号可以是输入信息时触发的信号,例如,如图3所示,当在应用名称的输入框中检测到输入操作信号时,可以在输入框中显示广告主或代理商输入的文字,也即第一应用程序的名称。
137.在步骤s72中,在交互界面中显示与第一应用程序匹配的第二应用程序,其中,第二应用程序基于第一应用程序的应用信息确定,第二应用程序与第一应用程序的相似度大于预设阈值。
138.为了方便客户查看第一应用程序的相似应用程序,可以在交互界面中显示一个新的页面显示第二应用程序,或者直接在交互界面的特定区域中显示第二应用程序。例如,如图3所示,当用户输入应用名称为美图秀秀时,可以确定第二应用程序可以是b612咔叽、faceu激萌、无他相机、轻颜相机、芒果tv等。
139.在步骤s73中,响应于在交互界面中检测到的推送操作信号,推送推荐数据至符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件,推荐数据用于推荐安装第一应用程序。
140.上述步骤中的推送操作信号可以是交互界面中特定按钮被触发后生成的操作信号,例如,该按钮可以是数据推荐按钮,当客户确定需要进行数据推荐时,可以点击该按钮,从而计算设备检测到推送操作信号,并直接推送推荐数据至目标终端。
141.作为一种可选的实施例,在显示与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
142.在本公开实施例中,上述的目标数据库可以由服务器构建,并存储在安装有客户端的电子终端、计算机终端等设备中;或者,目标数据库也可以由客户端利用电子终端、计算机终端等设备的计算资源在本地构建,客户端可以从服务器获取构建数据库所需要的应用程序,并通过对应用程序进行相似度计算,达到构建目标数据的目的,其中,构建好的目标数据库存储在安装有客户端的电子终端、计算机终端等设备中。在此基础上,客户端在获取到第一应用程序之后,可以直接通过本地查询到与第一应用程序匹配的第二应用程序,无需通过网络从服务器获取。
143.通过上述方案,通过将目标数据库存储在客户端本地,或者通过客户端构建目标数据库,实现本地化处理的目的,避免由于网络较差影响第二应用程序的获取,达到提高第二应用程序的获取效率的效果。
144.作为一种可选的实施例,在基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:获取多个终端中已安装的多个应用程序的应用信息;利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量;基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;基于任意两个应用程序之间的相似度,构建目标数据库。
145.在本公开实施例中,在目标数据库由客户端构建的情况下,客户端可以通过网络从服务器中获取到多个终端中已安装的多个应用程序的应用信息,并利用电子终端、计算机终端等设备的计算资源进行目标数据库的构建,具体构建过程如下:利用获取到的多个应用程序的应用信息对本地存储的向量化表示模型(该模型可以从服务器获取,并存储在客户端本地)进行训练,得到多个应用程序的特征向量,并计算应用程序之间的相似度,确定于每个应用程序的相似度大于阈值的应用程序,基于上述关联关系构建目标数据库,并存储在客户端本地。
146.通过上述方案,通过客户端利用本地计算资源构建目标数据库,实现本地构建数据库,并利用数据库进行本地化处理的目的,避免数据库存储应用程序数量较大,传输较慢,影像客户端的正常使用。
147.作为一种可选的实施例,在显示与第一应用程序匹配的第二应用程序的步骤之前,数据推送方法还包括:在交互界面中显示多个匹配类型;响应于在交互界面中检测到的选择操作信号,在交互界面中显示选中的匹配类型,其中,第二应用程序是基于选中的匹配类型从目标数据库中查询出的应用程序进行筛选得到的应用程序,从目标数据库中查询出的应用程序是基于第一应用程序的应用信息查询目标数据库得到的应用程序。
148.上述步骤中的选择操作信号可以是对匹配类型进行选择的点击信号,在检测到选择操作信号之后,可以基于该信号的生成位置,确定选中的匹配类型。
149.作为一种可选的实施例,在显示第一应用程序的步骤之后,数据推送方法还包括:
在交互界面中显示多个应用维度,其中,多个应用维度包括:应用分类和应用名称;响应于在交互界面中检测到的选择操作信号,在交互界面中显示选中的应用维度,其中,第二应用程序是基于获取第一应用程序的应用信息中,满足应用维度的应用信息所确定。
150.上述步骤中的选择操作信号可以是对应用维度进行选择的点击信号,在检测到选择操作信号之后,可以基于该信号的生成位置,确定选中的应用维度。
151.关于上述实施例中的方法,其中各个步骤的具体方式已经在前述方法的实施例中进行了详细描述,此处将不做详细阐述说明。
152.图8是根据一示例性实施例示出的一种数据推送装置框图。参照图8,该装置包括第一获取单元82,应用确定单元84、第二获取单元86和推送单元88。
153.该第一获取单元82被配置为获取第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序。
154.该应用确定单元84被配置为基于第一应用程序的应用信息,确定与第一应用程序匹配的第二应用程序,其中,第二应用程序与第一应用程序的相似度大于预设阈值。
155.该第二获取单元86被配置为获取符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件。
156.该推送单元88被配置为推送推荐数据至目标终端,其中,推荐数据用于推荐安装第一应用程序。
157.作为一种可选的实施例,应用确定单元包括:应用查询单元,被配置为基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
158.作为一种可选的实施例,数据推送装置还包括:第三获取单元,被配置为获取多个终端中已安装的多个应用程序的应用信息;训练单元,被配置为利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量;相似度确定单元,被配置为基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;构建单元,被配置为基于任意两个应用程序之间的相似度,构建目标数据库。
159.作为一种可选的实施例,训练单元包括:提取单元,被配置为对多个应用程序的应用信息进行特征提取,得到多个应用程序的特征向量,其中,应用信息包括如下至少之一:应用名称、应用类型、下载量、下载来源和用户画像。
160.作为一种可选的实施例,数据推送装置还包括:集合确定单元,被配置为确定预设时间段内登陆预设应用程序的终端集合;随机确定单元,被配置为随机确定终端集合中目标数量的终端;数量获取单元,被配置为获取目标数量的终端中已经安装的应用程序的数量;终端确定单元,被配置为确定目标数量的终端中的多个终端,其中,多个终端中已安装的应用程序的数量小于预设数量。
161.作为一种可选的实施例,数据推送装置还包括:更新单元,被配置为按照预设更新周期对目标数据库中存储的至少一个应用程序进行更新。
162.作为一种可选的实施例,应用查询单元包括:数据查询单元,被配置为基于第一应用程序的应用信息查询目标数据库;筛选单元,被配置为基于匹配类型对从目标数据库中查询出的应用程序进行筛选,得到与第一应用程序匹配的第二应用程序。
163.作为一种可选的实施例,数据推送装置还包括:第四获取单元,被配置为获取第一应用程序的应用信息中,满足应用维度的应用信息;应用确定单元还被配置为基于满足应用维度的应用信息,确定与第一应用程序匹配的第二应用程序。
164.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
165.图9是根据一示例性实施例示出的另一种数据推送装置框图。参照图2,该装置包括第一显示单元92,第二显示单元94和推送单元96。
166.该第一显示单元92被配置为响应于在交互界面中检测到的输入操作信号,在交互界面中显示第一应用程序的应用信息,其中,第一应用程序为待推荐安装的应用程序。
167.该第二显示单元94被配置为在交互界面中显示与第一应用程序匹配的第二应用程序,其中,第二应用程序基于第一应用程序的应用信息确定,第二应用程序与第一应用程序的相似度大于预设阈值。
168.该推送单元96被配置为响应于在交互界面中检测到的推送操作信号,推送推荐数据至符合推送条件的目标终端,其中,推送条件是基于终端对第二应用程序的应用管理行为所设定的条件,推荐数据用于推荐安装第一应用程序。
169.作为一种可选的实施例,数据推送装置还包括:查询单元,被配置为基于第一应用程序的应用信息查询已构建的目标数据库,得到与第一应用程序匹配的第二应用程序,其中,目标数据库存储有至少一个应用程序的应用信息,以及与至少一个应用程序的相似度大于预设阈值的应用程序,至少一个应用程序中包含第一应用程序。
170.作为一种可选的实施例,数据推送装置还包括:获取单元,被配置为获取多个终端中已安装的多个应用程序的应用信息;训练单元,被配置为利用多个应用程序的应用信息对向量化表示模型进行训练,得到多个应用程序的特征向量;确定单元,被配置为基于多个应用程序的特征向量,确定多个应用程序中任意两个应用程序之间的相似度;构建单元,被配置为基于任意两个应用程序之间的相似度,构建目标数据库。
171.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
172.需要说明的是,上述各个单元可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个单元可以位于同一处理器中;或者,上述各个单元以任意组合的方式位于不同的处理器中。
173.图10是根据一示例性实施例示出的一种用于执行数据推送方法的电子设备200的框图。
174.在示例性实施例中,还提供了一种包括可执行指令的存储介质,例如用于存储可执行指令的存储器202,上述指令可由电子设备200的处理器204执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
175.在示例性实施例中,还提供了一种计算机程序产品,当计算机程序产品中的计算机程序由服务器的处理器执行时,使得服务器能够执行如上述实施例的数据推送方法。
176.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或
者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
177.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1