特征处理方法、装置、设备及计算机存储介质与流程

文档序号:33809224发布日期:2023-04-19 13:11阅读:来源:国知局

技术特征:

1.一种特征处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述采用catboost算法对所述样本数据集中的m个特征进行特征交叉,得到至少一个衍生多变量特征,包括:

3.根据权利要求1所述的,其特征在于,在所述得到q个混合特征之后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述ffm模型进行训练之前,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,在所述对目标预测模型进行训练之前,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述ffm模型中包括i个二阶交叉特征,所述i个二阶交叉特征中各二阶交叉特征基于所述q个混合特征和所述m个特征中的至少两项确定得到,i为正整数;在所述将注意力机制引入所述ffm模型中,得到更新后的所述ffm模型之前,所述方法还包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述m个特征中包括在t个数值型特征和s个分类型特征,t、s为小于或者等于m的非负整数;

8.根据权利要求7所述的方法,其特征在于,第二类别特征为所述t个数值型特征中的任意一项;

9.一种特征处理装置,其特征在于,所述装置包括:

10.一种特征处理设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的特征处理方法。

12.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,所述电子设备执行如权利要求1-8任意一项所述的特征处理方法。


技术总结
本申请公开了一种特征处理方法、装置、设备及计算机存储介质,涉及大数据技术领域。该方法包括:获取样本数据集,所述样本数据集中包括N个用户样本一一对应的目标信息,所述目标信息包括样本标签和在M个特征下分别对应的M个特征标签;基于所述N个用户样本一一对应的目标信息,采用catboost算法对所述样本数据集中的M个特征进行特征交叉,得到Q个混合特征,所述Q个混合特征用于作为目标预测模型的输入特征;其中,所述Q个混合特征中任一混合特征中包括的特征的数量小于或者等于预设阈值。根据本申请实施例,能够直接对样本特征进行特征衍生,从而有效避免了高维稀疏特征的出现。

技术研发人员:吉晶,张泽,范晴,魏欣彤,王欢
受保护的技术使用者:中移信息技术有限公司
技术研发日:
技术公布日:2024/1/13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1