基于联邦学习的数据处理方法、系统及相关设备与流程

文档序号:35984774发布日期:2023-11-10 05:55阅读:29来源:国知局
基于联邦学习的数据处理方法、系统及相关设备与流程

本申请涉及隐私计算以及计算机,具体涉及一种基于联邦学习的数据处理方法、系统及相关设备。


背景技术:

1、随着经济的不断发展和人民生活水平的提高,短视频已经成为了现代人不可或缺的一部分,短视频平台也成为了各类品牌和企业进行广告宣传的重要渠道,通过在短视频平台上发布有趣、有吸引力的内容,品牌可以与用户进行互动,增加粉丝数量,建立品牌忠诚度,并促进用户转化为潜在消费者。

2、随着短视频行业的爆燃,以保险为例,保险行业也开始积极探索短视频营销。传统的基于联邦学习的数据处理方式在很大程度上依赖于传媒渠道和市场调研数据,由于可获得的数据有限、且与用户的购买意向相关性不高,常常存在效果不佳、成本高昂的问题。因此,如何提升广告投放效果的问题亟待解决。


技术实现思路

1、本申请实施例提供了一种基于联邦学习的数据处理方法、系统及相关设备,可以提升广告投放效果。

2、第一方面,本申请实施例提供一种基于联邦学习的数据处理方法,应用于两方计算系统,所述两方计算系统包括:建模发起方和数据提供方;所述建模发起方对应第一数据,所述数据提供方对应第二数据;所述方法包括:

3、通过所述数据提供方获取预设场景下的第一互动数据,所述第一互动数据包括以下至少一种:弹幕、评论、是否点赞、是否收藏、观看时长;将所述第一互动数据转化为词向量库;

4、通过所述建模发起方确定建模样本;

5、通过所述建模发起方和所述数据提供方对所述第一数据和所述第二数据进行数据对齐,并确定所述建模发起方和所述数据提供方的共有样本;

6、通过所述数据提供方确定所述共有样本的特征数据,根据所述共有样本和所述词向量库确定句向量,得到k个句向量,k为正整数;

7、通过所述建模发起方对所述建模样本进行划分,得到训练集和测试集,对所述k个句向量进行预处理,得到目标特征数据,根据所述目标特征数据、所述训练集和所述测试集训练预设联邦lightgbm模型并调整所述预设联邦lightgbm模型的模型参数,得到目标联邦lightgbm模型;

8、通过所述建模发起方获取目标用户数据,将所述目标用户数据输入到所述目标联邦lightgbm模型,得到目标预测结果;确定与所述目标预测结果对应的目标处理策略。

9、第二方面,本申请实施例提供了一种两方计算系统,所述两方计算系统包括:建模发起方和数据提供方;所述建模发起方对应第一数据,所述数据提供方对应第二数据;其中,

10、所述数据提供方,用于获取预设场景下的第一互动数据,所述第一互动数据包括以下至少一种:弹幕、评论、是否点赞、是否收藏、观看时长;将所述第一互动数据转化为词向量库;

11、所述建模发起方,用于确定建模样本;

12、所述建模发起方和所述数据提供方,用于对所述第一数据和所述第二数据进行数据对齐,并确定所述建模发起方和所述数据提供方的共有样本;

13、所述数据提供方,用于确定所述共有样本的特征数据,根据所述共有样本和所述词向量库确定句向量,得到k个句向量,k为正整数;

14、所述建模发起方,用于对所述建模样本进行划分,得到训练集和测试集,对所述k个句向量进行预处理,得到目标特征数据,根据所述目标特征数据、所述训练集和所述测试集训练预设联邦lightgbm模型并调整所述预设联邦lightgbm模型的模型参数,得到目标联邦lightgbm模型;获取目标用户数据,将所述目标用户数据输入到所述目标联邦lightgbm模型,得到目标预测结果;确定与所述目标预测结果对应的目标处理策略。

15、第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。

16、第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。

17、第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

18、实施本申请实施例,具备如下有益效果:

19、可以看出,本申请实施例中所描述的基于联邦学习的数据处理方法、系统及相关设备,应用于两方计算系统,两方计算系统包括:建模发起方和数据提供方;建模发起方对应第一数据,数据提供方对应第二数据;通过数据提供方获取预设场景下的第一互动数据,第一互动数据包括以下至少一种:弹幕、评论、是否点赞、是否收藏、观看时长;将第一互动数据转化为词向量库,通过建模发起方确定建模样本,通过建模发起方和数据提供方对第一数据和第二数据进行数据对齐,并确定建模发起方和数据提供方的共有样本,通过数据提供方确定共有样本的特征数据,根据共有样本和词向量库确定句向量,得到k个句向量,k为正整数,通过建模发起方对建模样本进行划分,得到训练集和测试集,对k个句向量进行预处理,得到目标特征数据,根据目标特征数据、训练集和测试集训练预设联邦lightgbm模型并调整预设联邦lightgbm模型的模型参数,得到目标联邦lightgbm模型,通过建模发起方获取目标用户数据,将目标用户数据输入到目标联邦lightgbm模型,得到目标预测结果;确定与目标预测结果对应的目标处理策略,一方面,引入互动数据,丰富了建模可用的数据维度,另一方面,将数据对齐,并确定相应的句向量,再基于句向量确定相应的特征数据,以调整模型的模型参数,使得整体建模效率、准确性有了极大的提升,从而实现在保证数据安全的前提下提高投放的精准性,可以提升广告投放策略。



技术特征:

1.一种基于联邦学习的数据处理方法,其特征在于,应用于两方计算系统,所述两方计算系统包括:建模发起方和数据提供方;所述建模发起方对应第一数据,所述数据提供方对应第二数据;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述第一互动数据转化为词向量库,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述通过所述建模发起方和所述数据提供方对所述第一数据和所述第二数据进行数据对齐,包括:

4.根据权利要求1或2所述的方法,其特征在于,所述根据所述目标特征数据、所述训练集和所述测试集训练预设联邦lightgbm模型并调整所述预设联邦lightgbm模型的模型参数,得到目标联邦lightgbm模型,包括:

5.根据权利要求4所述的方法,其特征在于,所述对所述k个句向量进行预处理,得到目标特征数据,包括:

6.一种两方计算系统,其特征在于,所述两方计算系统包括:建模发起方和数据提供方;所述建模发起方对应第一数据,所述数据提供方对应第二数据;其中,

7.根据权利要求6所述的系统,其特征在于,在所述将所述第一互动数据转化为词向量库方面,所述数据提供方具体用于:

8.根据权利要求6或7所述的系统,其特征在于,在所述对所述第一数据和所述第二数据进行数据对齐方面,所述建模发起方和所述数据提供方具体用于:

9.一种电子设备,其特征在于,包括处理器、存储器,所述存储器用于存储一个或多个程序,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。

10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-5任一项所述的方法。


技术总结
本申请公开了一种基于联邦学习的数据处理方法、系统及相关设备,该方法包括:数据提供方获取预设场景下的第一互动数据,将其转化为词向量库,建模发起方确定建模样本,建模发起方和数据提供方对第一数据和第二数据进行数据对齐,并确定共有样本,数据提供方确定共有样本的特征数据,根据共有样本和词向量库确定句向量,得到k个句向量,建模发起方对建模样本进行划分,得到训练集和测试集,对k个句向量进行预处理,得到目标特征数据,根据目标特征数据、训练集和测试集训练预设联邦LightGBM模型并调整预设联邦LightGBM模型的模型参数,得到目标联邦LightGBM模型。本申请实施例能提升广告投放效果。

技术研发人员:徐章耀,李晶晶,王湾湾,何浩,姚明
受保护的技术使用者:深圳市洞见智慧科技有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1