本发明涉及用户扩量,特别是涉及一种用于用户扩量的数据处理系统。
背景技术:
1、对于目标服务平台来说,进行用户扩量能够增强其知名度和影响力,也能够获取到更多用户关于目标服务平台的反馈,使目标服务平台能够更好的了解用户需求进而提升自身的竞争力;
2、专利(申请号为:202210714812.7)提供了一种基于模型选择的人群扩量方法及装置,该专利中的方法确定出了目标学习模型,将与种子用户数据相似度高的候选用户数据作为正样本,将与种子用户数据相似度低的候选用户数据作为负样本,根据所述正负样本对所述目标学习模型进行训练,得到目标扩量模型;将所述用户池中的候选用户数据输入至所述目标扩量模型,以确定出数量小于或等于所述目标扩量用户数量的扩量用户数据,确定为所述种子用户数据对应的扩量用户数据。
3、但是上述方法也存在以下技术问题:
4、将候选用户数据区分为正样本或负样本,根据正负样本对目标学习模型进行训练,得到目标扩量模型,又将候选用户数据作为目标扩量模型的输入获取一定数量的扩量用户,训练目标学习模型的正负样本和目标扩量模型的输入均为候选用户数据而不是来源不同的两种数据,因此,根据上述方法获取到的扩量用户数据的精准度较低。
技术实现思路
1、针对上述技术问题,本发明采用的技术方案为:
2、一种用于用户扩量的数据处理系统,系统包括:处理器、存储有计算机程序的存储器、预设指标数值列表集合a={a1,a2,……,ai,……,am},其中,ai为第i个预设指标数值列表,i的取值为1到m,m预设指标数值列表的数量,ai={a1i,a2i},a1i为第一预设指标名称在ai中对应的第一预设指标数值,a2i为a1i对应的第二预设指标数值列表,a2i={a2i1,a2i2,……,a2ij,……,a2in},a2ij为第j个第二预设指标名称在a2i中对应的第二预设指标数值,j的取值为1到n,n为第二预设指标名称的数量,当计算机程序被处理器执行时,实现如下步骤:
3、s1、将a2i中a2ij作为y0(x1,x2,……,xj,……,xn)中的xj获取gi并构建g={g1,g2,……,gi,……,gm},其中,y0(x1,x2,……,xj,……,xn)为目标回归模型对应的目标回归函数,xj为y0(x1,x2,……,xj,……,xn)中的第j个自变量,gi为a2i对应的最终指标数值,g为a对应的最终指标数值列表,gi符合:gi=y0(a2i1,a2i2,……,a2ij,……,a2in)。
4、s2、若gi>△g1且|a1i-gi|>△g2,则将ai作为正样本数据列表并将其插入到正样本数据列表集合中,若gi≤△g1或|a1i-gi|≤△g2,则将ai作为负样本数据列表并将其插入到负样本数据列表集合中,其中,△g1为预设指标数值,△g2为预设指标数值差,正样本数据列表集合初始为null,负样本数据列表集合初始不为null,即负样本数据列表集合初始包括若干个预设负样本数据列表。
5、s3、根据正样本数据列表集合中的正样本数据列表和负样本数据列表集合中的负样本数据列表对预设二分类模型进行训练,以获取目标二分类模型。
6、s4、将h输入到目标二分类模型中获取h0,其中,h={h1,h2,……,hr,……,hs},h为指定指标数值列表集合,hr为第r个预设用户id对应的指定指标数值列表,r的取值为1到s,s为预设用户id的数量,h0={h01,h02,……,h0r,……,h0s},h0为h对应的用户类型标识列表,h0r为hr对应的预设用户id对应的用户类型标识,其中,用户类型标识为目标二分类模型输出的标识,目标二分类模型输出的标识为标识“1”或标识“-1”,标识“1”表征为预设用户id为目标服务平台对应的扩量用户id。
7、s5、当h0r为标识“1”时,将hr对应的预设用户id作为目标服务平台对应的目标扩量用户id以构建目标服务平台对应的目标扩量用户id列表。
8、本发明至少具有以下有益效果:
9、本发明提供了一种用于用户扩量的数据处理系统,所述系统将第二预设指标数值作为目标回归模型的因变量以获取最终指标数值,根据最终指标数值和第一预设指标数值将预设指标数值列表分为正样本或负样本,根据正负样本对预设二分类模型进行训练获取目标二分类模型,将预设用户id对应的指定指标数值列表输入到目标二分类模型中获取目标扩量用户id,可知,对预设二分类模型进行训练的正负样本和目标二分类模型是输入不是相同的数据,而是两种来源不同的数据,有利于提高获取扩量用户数据的精准度。
1.一种用于用户扩量的数据处理系统,其特征在于,所述系统包括:处理器、存储有计算机程序的存储器、预设指标数值列表集合a={a1,a2,……,ai,……,am},其中,ai为第i个预设指标数值列表,i的取值为1到m,m预设指标数值列表的数量,ai={a1i,a2i},a1i为第一预设指标名称在ai中对应的第一预设指标数值,a2i为a1i对应的第二预设指标数值列表,a2i={a2i1,a2i2,……,a2ij,……,a2in},a2ij为第j个第二预设指标名称在a2i中对应的第二预设指标数值,j的取值为1到n,n为第二预设指标名称的数量,当所述计算机程序被所述处理器执行时,实现如下步骤:
2.根据权利要求1所述的用于用户扩量的数据处理系统,其特征在于,预设指标数值列表中的第一预设指标数值和第二预设指标数值为当前数据采集周期内目标服务平台在目标服务平台对应的若干个预设信息流推广渠道中采集到的指标数值。
3.根据权利要求1所述的用于用户扩量的数据处理系统,其特征在于,第一预设指标名称对应的第一预设指标数值和第二预设指标名称对应的第二预设指标数值可以为null值。
4.根据权利要求1所述的用于用户扩量的数据处理系统,其特征在于,指定指标数值列表中包括第一预设指标名称对应的指定指标数值和第二预设指标名称对应的指定指标数值。
5.根据权利要求4所述的用于用户扩量的数据处理系统,其特征在于,指定指标数值列表中的指定指标数值为目标服务平台在目标服务平台对应的若干个预设信息流推广渠道中采集到的与目标用户对应的移动终端设备相关的指标数值。
6.根据权利要求1所述的用于用户扩量的数据处理系统,其特征在于,标识“-1”表征为预设用户id非目标服务平台对应的扩量用户id。
7.根据权利要求1所述的用于用户扩量的数据处理系统,其特征在于,在步骤s1之前还通过如下步骤s10-s50获取目标回归模型和y0(x1,x2,……,xj,……,xn):
8.根据权利要求7所述的用于用户扩量的数据处理系统,其特征在于,在步骤s30中还包括如下子步骤: