本申请涉及信息处理,尤其涉及一种信息处理方法及装置。
背景技术:
1、目前,用于预测数据点击率的点击率预测模型,通常是基于已曝光数据的信息进行训练的。然而,由于曝光样本和未曝光样本的分布不同,仅考虑曝光样本导致样本选择不随机、无法代表总体,从而会产生选择偏差。
技术实现思路
1、本申请实施例提供一种信息处理方法及装置。
2、根据本申请实施例第一方面,提供给一种信息处理方法,包括:获取源信息,源信息包括至少两条数据;基于点击率预测模型,确定源信息中每一条数据的点击率,其中,点击率模型是基于已曝光数据和未曝光数据训练得到的,在训练点击率预测模型的过程中,通过调低已曝光数据的贡献率或调高未曝光数据的贡献率,对点击率预测模型的预测结果进行纠偏;根据每一条数据的点击率,对源信息进行排序,以确定要展示的目标信息。
3、根据本申请一实施例,还包括:基于已曝光数据以及已曝光数据的实际点击值,确定第一样本数据,第一样本数据的点击标签值为已曝光数据的实际点击值;对未曝光数据的点击信息进行预测,得到未曝光数据的预测点击值;基于未曝光数据以及未曝光数据的预测点击值,确定第二样本数据,第二样本数据的点击标签值为未曝光数据的预测点击值;基于第一样本数据、第二样本数据和点击率预测模型,确定第一样本数据中每一条数据对应的点击率和第二样本数据中每一条数据对应的点击率;在确定第一样本数据和第二样本数据的损失函数值的过程中,调低第一样本数据的贡献率或调高第二样本数据的贡献率;根据损失函数值,对点击率预测模型进行训练。
4、根据本申请一实施例,对未曝光数据的点击信息进行预测,得到未曝光数据的预测点击值,包括:基于点击标签预测模型,对未曝光数据的点击信息进行预测,得到未曝光数据的预测点击值,其中,点击标签预测模型是基于随机数据的点击信息训练得到的,随机数据为忽略数据的曝光情况随机选取的数据。
5、根据本申请一实施例,调低第一样本数据的贡献率或调高第二样本数据的贡献率,包括:通过第一样本数据的预测曝光率,调低第一样本数据的贡献率;或,通过第二样本数据的预测曝光率,调高第二样本数据的贡献率。
6、根据本申请一实施例,还包括:基于曝光率预测模型,确定第一样本数据的预测曝光率和第二样本数据的预测曝光率,其中,根据曝光率预测模型确定的第一样本数据的预测曝光率大于第二样本数据的预测曝光率。
7、根据本申请一实施例,通过第一样本数据的预测曝光率,调低第一样本数据的贡献率,包括:使用预测曝光率作为除数因子,调低第一样本数据的贡献率。
8、根据本申请一实施例,还包括:通过超参,对预测曝光率进行放大处理,以约束损失函数的值。
9、根据本申请一实施例,通过超参对预测曝光率进行放大处理,包括:通过超参,对预测曝光率增加固定值;或,通过超参,对预测曝光率放大固定倍数。
10、根据本申请一实施例,还包括:将目标信息中的前n条数据作为训练数据,对点击率预测模型进行再训练,n为大于1的自然数。
11、根据本申请实施例第二方面,提供一种信息处理装置,包括:源信息获取模块,用于获取源信息,源信息包括至少两条数据;点击率预测模块,用于基于点击率预测模型,确定源信息中每一条数据的点击率,其中,点击率模型是基于已曝光数据和未曝光数据训练得到的,在训练点击率预测模型的过程中,通过调低已曝光数据的贡献率或调高未曝光数据的贡献率,对点击率预测模型的预测结果进行纠偏;数据排序模块,用于根据每一条数据的点击率,对源信息进行排序,以确定展示的目标信息。
12、根据本申请实施例第三方面,提供一种计算机存储介质,存储介质包括一组计算机可执行指令,当指令被执行时用于执行上述任一项的信息处理方法。
13、本申请实施例提供一种信息处理方法及装置。该方法包括:获取源信息,源信息包括至少两条数据;基于点击率预测模型,确定源信息中每一条数据的点击率,其中,点击率模型是基于已曝光数据和未曝光数据训练得到的,在训练点击率预测模型的过程中,通过调低已曝光数据的贡献率或调高未曝光数据的贡献率,对点击率预测模型的预测结果进行纠偏;根据每一条数据的点击率,对源信息进行排序,以确定要展示的目标信息。由于在训练点击率预测模型的过程中,通过调低已曝光数据的贡献率或调高未曝光数据的贡献率,对点击率预测模型的预测结果进行纠偏,点击率预测模型的预测结果更为准确。
14、需要理解的是,本申请的实施并不需要实现上面所述的全部有益效果,而是特定的技术方案可以实现特定的技术效果,并且本申请的其他实施方式还能够实现上面未提到的有益效果。
1.一种信息处理方法,包括:
2.根据权利要求1所述的方法,还包括:
3.根据权利要求2所述的方法,所述对未曝光数据的点击信息进行预测,得到所述未曝光数据的预测点击值,包括:
4.根据权利要求2所述的方法,所述调低第一样本数据的贡献率或调高第二样本数据的贡献率,包括:
5.根据权利要求4所述的方法,还包括:
6.根据权利要求4所述的方法,所述通过所述第一样本数据的预测曝光率,调低所述第一样本数据的贡献率,包括:
7.根据权利要求4所述的方法,还包括:
8.根据权利要求7所述的方法,所述通过超参对所述预测曝光率进行放大处理,包括:
9.根据权利要求1所述的方法,还包括:
10.一种数据推荐装置,包括: