一种基于行为数据分析的用户画像分类方法及系统与流程

文档序号:38785470发布日期:2024-07-26 20:02阅读:52来源:国知局
一种基于行为数据分析的用户画像分类方法及系统与流程

本技术涉及但不限于数据处理,尤其涉及一种基于行为数据分析的用户画像分类方法及系统。


背景技术:

1、随着互联网的快速发展和大数据技术的广泛应用,用户画像分类已成为许多领域,特别是电商、广告和金融等领域中不可或缺的技术手段。用户画像分类的目标是根据用户的行为、兴趣、偏好等特征将用户划分为不同的群体,以便企业能够更精准地进行个性化服务和营销,提高获客规模和质量。

2、然而,传统的用户画像分类方法往往依赖于大量的标记数据来进行监督学习。在实际应用中,标记数据的获取是昂贵且耗时的,而且很难覆盖到所有可能的用户消费画像。此外,随着互联网的不断发展和用户行为的多样化,新的用户消费画像也在不断涌现,这使得传统的基于固定标记数据的分类方法难以适应这种变化。为了解决上述问题,近年来,研究者们开始探索利用未标记数据进行学习的方法,如半监督学习、无监督学习和弱监督学习等。然而,现有的监督学习方法在用户画像分类任务中仍存在一些挑战。首先,如何有效地利用未标记数据来提高分类器的性能是一个关键问题。其次,如何确保分类器在对已知用户消费画像进行高质量训练的同时,也能对新的用户消费画像进行高质量训练,从而扩大用户画像分类的粒度,也是一个亟待解决的问题。


技术实现思路

1、有鉴于此,本技术实施例至少提供一种基于行为数据分析的用户画像分类方法及系统。本技术实施例的技术方案是这样实现的:

2、一方面,本技术实施例提供一种基于行为数据分析的用户画像分类方法,包括:获取拟分析的消费行为记录日志;基于用户画像分类网络中的行为向量抽取组件,抽取所述消费行为记录日志的行为表征向量;依据所述行为表征向量,确定所述消费行为记录日志属于q个用户消费画像的预测置信系数,所述q为不小于2的自然数;其中,所述用户画像分类网络是依据弱指导学习误差调优得到,所述弱指导学习误差是依据s个非先验标记模板中的g个第一非先验标记模板的整体行为表征向量以及对应的第二知识模板的整体行为表征向量确定的,所述第一非先验标记模板为对应的第一知识模板和对应的第二知识模板相同的非先验标记模板。

3、在一些实施例中,所述用户画像分类网络的训练过程具体包括:获取当下批次调试样本包括的w个知识模板,以及基于用户画像分类网络中的行为向量抽取组件,抽取所述w个知识模板的每一知识模板的第一行为表征向量;对所述每一个知识模板的第一行为表征向量分别进行局部和整体行为向量抽取,获得所述每一个知识模板的局部行为表征向量和整体行为表征向量;针对所述s个非先验标记模板中的第e个非先验标记模板,依据所述局部行为表征向量和所述整体行为表征向量,在所述w个知识模板中,除所述第e个非先验标记模板外的v个知识模板中,确定和所述第e个非先验标记模板的局部匹配系数最大的第一知识模板,以及和所述第e个非先验标记模板的整体匹配系数最大的第二知识模板;从所述s个非先验标记模板中选出g个第一非先验标记模板,依据所述g个第一非先验标记模板的整体行为表征向量以及对应的第二知识模板的整体行为表征向量,确定所述用户画像分类网络的弱指导学习误差,以及依据所述弱指导学习误差对所述用户画像分类网络进行调优。

4、在一些实施例中,所述依据所述局部行为表征向量和所述整体行为表征向量,在所述w个知识模板中除所述第e个非先验标记模板外的v个知识模板中,确定和所述第e个非先验标记模板的局部匹配系数最大的第一知识模板,以及和所述第e个非先验标记模板的整体匹配系数最大的第二知识模板,包括:依据所述w个知识模板中每两个知识模板的局部行为表征向量,确定所述每两个知识模板之间的局部匹配系数,以及依据所述每两个知识模板的整体行为表征向量,确定所述每两个知识模板之间的整体匹配系数;依据所述第e个非先验标记模板与所述v个知识模板的每一知识模板之间的局部匹配系数,在所述v个知识模板中确定得到与所述第e个非先验标记模板的局部匹配系数最大的第一知识模板;依据所述第e个非先验标记模板与所述v个知识模板的每一知识模板之间的整体匹配系数,在所述v个知识模板中确定得到与所述第e个非先验标记模板的整体匹配系数最大的第二知识模板;所述依据所述g个第一非先验标记模板的整体行为表征向量以及对应的第二知识模板的整体行为表征向量,确定所述用户画像分类网络的弱指导学习误差,包括:针对所述g个第一非先验标记模板中的每一个第一非先验标记模板,依据所述第一非先验标记模板的整体行为表征向量和所述第一非先验标记模板对应的第二知识模板的整体行为表征向量,确定所述第一非先验标记模板的第一差异结果;依据所述g个第一非先验标记模板的每一第一非先验标记模板对应的第一差异结果,确定第一代价值;依据所述第一代价值,获得所述弱指导学习误差。

5、在一些实施例中,所述依据所述w个知识模板中每两个知识模板的局部行为表征向量,确定所述每两个知识模板之间的局部匹配系数,包括:针对所述w个知识模板中的第f个知识模板和第a个知识模板,依据所述第f个知识模板的局部行为表征向量,确定所述第f个知识模板的局部显著性影响系数,以及依据所述第a个知识模板的局部行为表征向量,确定所述第a个知识模板的局部显著性影响系数,其中,0<f<w;0<a≤w;依据所述第f个知识模板的局部行为表征向量和局部显著性影响系数,以及所述第a个知识模板的局部行为表征向量和局部显著性影响系数,确定所述第f个知识模板与所述第a个知识模板之间的局部匹配系数。

6、在一些实施例中,所述依据所述g个第一非先验标记模板的每一第一非先验标记模板对应的第一差异结果,确定所述第一代价值,包括:依据所述g个第一非先验标记模板的每一第一非先验标记模板对应的第一差异结果,确定非先验标记差异结果;依据所述u个先验标记模板的整体行为表征向量,确定先验标记差异结果;依据所述非先验标记差异结果和所述先验标记差异结果,获得所述第一代价值;所述依据所述第一代价值,获得所述弱指导学习误差,包括:基于所述用户画像分类网络中的分类组件,对所述w个知识模板的每一知识模板的第一行为表征向量进行处理,获得所述w个知识模板中的每一个知识模板属于q个用户消费画像的第一预测置信系数,依据所述w个知识模板中一个或多个知识模板的第一预测置信系数,确定第二代价值,所述q为不小于2的自然数;依据所述第一代价值和所述第二代价值,确定所述弱指导学习误差。

7、在一些实施例中,所述依据所述u个先验标记模板的整体行为表征向量,确定先验标记差异结果,包括:针对所述u个先验标记模板中的每一个先验标记模板,如果在所述u个先验标记模板中,除所述先验标记模板外的t个先验标记模板中,具有和所述先验标记模板的先验标记相同的第三知识模板,此时依据所述先验标记模板的整体行为表征向量和所述第三知识模板的整体行为表征向量,确定所述先验标记模板的第二差异结果,其中,t=u-1;依据一个或多个先验标记模板的第二差异结果,确定所述先验标记差异结果;所述第二代价值包括第一子代价值,所述依据所述w个知识模板中一个或多个知识模板的第一预测置信系数,确定第二代价值,包括:对所述s个非先验标记模板的每一非先验标记模板的第一预测置信系数进行自标注训练,获得所述s个非先验标记模板的每一非先验标记模板的第一自标注标记;依据所述s个非先验标记模板的每一非先验标记模板的第一自标注标记和所述第一预测置信系数,获得所述第一子代价值。

8、在一些实施例中,所述依据所述s个非先验标记模板的每一非先验标记模板的第一自标注标记和所述第一预测置信系数,获得所述第一子代价值,包括:确定所述第e个非先验标记模板的第一自标注标记中,置信系数最大的第一用户消费画像;将所述第e个非先验标记模板的第一预测置信系数中,所述第一用户消费画像对应的预测置信系数,确定为所述第e个非先验标记模板的影响系数;依据所述第e个非先验标记模板的影响系数,以及所述第e个非先验标记模板的第一自标注标记和所述第一预测置信系数,确定所述第e个非先验标记模板对应的第三差异结果;依据所述s个非先验标记模板的每一非先验标记模板对应的第三差异结果,获得所述第一子代价值;其中,所述依据所述第e个非先验标记模板的影响系数,以及所述第e个非先验标记模板的第一自标注标记和所述第一预测置信系数,确定所述第e个非先验标记模板对应的第三差异结果,包括:将所述第e个非先验标记模板的第一自标注标记和所述第一预测置信系数进行内积计算,获得第二计算结果;将所述第二计算结果进行对数求解,并将对数求解的结果与所述第e个非先验标记模板的影响系数进行乘法运算,获得所述第e个非先验标记模板对应的第三差异结果。

9、在一些实施例中,所述第二代价值包括第二子代价值,所述依据所述w个知识模板中一个或多个知识模板的第一预测置信系数,确定第二代价值,包括:依据所述u个先验标记模板的每一先验标记模板的第一预测置信系数和先验标记,确定所述第二子代价值;所述第二代价值还包括第三子代价值,所述依据所述w个知识模板中一个或多个知识模板的第一预测置信系数,确定第二代价值,包括:依据所述w个知识模板的每一知识模板的第一预测置信系数,确定所述w个知识模板的预测置信系数均值;针对所述w个知识模板中的每一个知识模板,确定所述知识模板的第一预测置信系数和所述预测置信系数均值之间的kl差异;依据所述w个知识模板的每一知识模板对应的kl差异,确定所述第三子代价值。

10、在一些实施例中,所述基于用户画像分类网络中的行为向量抽取组件,抽取所述w个知识模板的每一知识模板的第一行为表征向量之前,所述方法还包括:基于所述u个先验标记模板,对所述用户画像分类网络进行前置调优;所述基于用户画像分类网络中的行为向量抽取组件,抽取所述w个知识模板的每一知识模板的第一行为表征向量,包括:基于前置调优后的所述用户画像分类网络中的行为向量抽取组件,抽取所述w个知识模板的每一知识模板的第一行为表征向量;所述依据所述弱指导学习误差对所述用户画像分类网络进行调优之后,所述方法还包括:对所述s个非先验标记模板进行划簇,获得所述s个非先验标记模板的每一非先验标记模板的第二自标注标记;依据所述u个先验标记模板,以及所述s个非先验标记模板和第二自标注标记,对依据所述弱指导学习误差训练后的所述用户画像分类网络进行微调。

11、另一方面,本技术提供一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上所述方法中的步骤。

12、本技术的有益效果至少包括:本技术在对用户画像分类网络进行调优时,基于获取当下批次调试样本包括的w个知识模板,以及基于用户画像分类网络中的行为向量抽取组件,抽取w个知识模板的每一知识模板的第一行为表征向量,该w个知识模板包括u个先验标记模板和s个非先验标记模板;对每一个知识模板的第一行为表征向量分别进行局部和整体行为向量抽取,获得每一个知识模板的局部行为表征向量和整体行为表征向量;针对s个非先验标记模板中的第e个非先验标记模板,依据每一个知识模板的局部行为表征向量和整体行为表征向量,在v个知识模板中确定得到与第e个非先验标记模板的局部匹配系数最大的第一知识模板,以及和第e个非先验标记模板的整体匹配系数最大的第二知识模板;在s个非先验标记模板中选出g个第一非先验标记模板,依据g个第一非先验标记模板的整体行为表征向量以及对应的第二知识模板的整体行为表征向量,确定用户画像分类网络的弱指导学习误差,以及依据弱指导学习误差对用户画像分类网络进行调优,该第一非先验标记模板为对应的第一知识模板和对应的第二知识模板相同的非先验标记模板。基于此,采取开集知识模板对用户画像分类网络进行弱监督的相似性学习,不但令用户画像分类网络对已知用户消费画像进行高质量训练,同时令得用户画像分类网络对新的用户消费画像进行高质量训练,以确保用户画像分类网络对多种用户消费画像的分类精度,扩大用户画像分类网络的用户消费画像分类粒度。同时,本技术实施例的知识模板为不同行为类型对应的消费行为数据,增加了用户画像分类网络的日志可分类粒度,以增加用户画像分类网络的分类质量,帮助基于用户画像进行针对性运营的转化率,提高用户体验,提高获客资源和获客质量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1