本公开涉及人工智能领域,更具体地涉及一种用户标签生成方法、装置、设备、介质和程序产品。
背景技术:
1、随着大数据发展,现阶段企业针对用户进行精准营销主要的方式主要通过使用历史数据训练神经网络人工智能算法来提取特异性较强的特征,基于人工提取用户标签的步骤后,用户标签累计有50个,则通过算法可以提取特异性较强的诸如10个特征,或新增其他特征,来动态为当前用户赋予新的标签,通过以上做法,可以了解用户的行为偏好,获取用户标签并做针对性营销。
2、但以上基于人工判断生成用户标签的方法属于较为传统的方法,其存在大量主观判断,且算法训练的数据量较小,所以可能存在一定的识别偏差,最终的导致的结果是用户标签的赋值很大程度仍然基于人工主观来进行判定,人工筛选成本较高、时效长,且无法保证生成的用户标签的准确性,进而影响平台的精准运营水平及用户体验感。
技术实现思路
1、鉴于上述问题的至少一个方面,本公开的实施例提供了提高用户标签准确性的用户标签生成方法、装置、设备、介质和程序产品。
2、根据本公开的第一个方面,提供了一种用户标签生成方法,包括:对多维用户数据进行分析,以得到m个维度的用户初始标签;m为大于1的整数;将所述m个维度的用户初始标签进行标签预处理,以获得所述m个维度的用户特征标签;以及基于所述多维用户数据,利用预先训练好的生成式大模型,对所述m个维度的用户特征标签进行筛选,以生成用户标签结果。
3、根据本公开的实施例,所述基于所述多维用户数据,利用预先训练好的生成式大模型,对所述m个维度的用户特征标签进行筛选,以生成用户标签结果,包括:调用所述预先训练好的生成式大模型;基于预设提示词格式,对所述多维用户数据和所述m个维度的用户特征标签进行特征描述,以生成标签筛选提示语;以及将所述标签筛选提示语输入所述预先训练好的生成式大模型,以生成所述用户标签结果。
4、根据本公开的实施例,所述多维用户数据包括基础数据、业务数据和行为埋点数据,在所述对多维用户数据进行分析,以得到m个维度的用户初始标签之前,所述方法还包括:获取用户的基本信息,以得到所述基础数据;获取所述用户的业务信息,以得到所述业务数据;以及获取所述用户的访问埋点信息,以得到所述行为埋点数据。
5、根据本公开的实施例,所述m个维度的用户初始标签包括用户基础属性标签、用户业务数据标签和用户访问行为标签;所述对多维用户数据进行分析,以得到m个维度的用户初始标签,包括:对所述基础数据进行基础标签分析,以得到所述用户基础属性标签;对所述业务数据进行业务标签分析,以得到所述用户业务数据标签;以及对所述行为埋点数据进行行为标签分析,以得到所述用户访问行为标签。
6、根据本公开的实施例,所述将所述m个维度的用户初始标签进行标签预处理,以获得所述m个维度的用户特征标签,包括:格式化所述m个维度的用户初始标签;以及将格式化后的用户初始标签进行维度汇总,以获得所述m个维度的用户特征标签。
7、根据本公开的实施例,所述方法,还包括:若所述用户标签结果异常,则对所述m个维度的用户特征标签进行复核,并基于复核的结果,更新标签库;以及若所述用户标签结果正常,则基于所述用户标签结果,更新所述标签库。
8、根据本公开的实施例,所述生成式大模型的训练过程,包括:从历史用户数据集中提取用户历史标签数据;基于所述用户标签数据,提取用户信息与专家判断标签的特征映射关系;以及将所述特征映射关系导入所述生成式大模型,并对所述生成式大模型进行训练。
9、本公开的第二方面提供了一种用户标签生成装置,包括:初始分析模块,用于对多维用户数据进行分析,以得到m个维度的用户初始标签;m为大于1的整数;标签预处理模块,用于将所述m个维度的用户初始标签进行标签预处理,以获得所述m个维度的用户特征标签;以及标签生成模块,用于基于所述多维用户数据,利用预先训练好的生成式大模型,对所述m个维度的用户特征标签进行筛选,以生成用户标签结果。
10、根据本公开的实施例,所述标签生成模块,包括:第一生成单元,用于调用所述预先训练好的生成式大模型;第二生成单元,用于基于预设提示词格式,对所述多维用户数据和所述m个维度的用户特征标签进行特征描述,以生成标签筛选提示语;以及第三生成单元,用于将所述标签筛选提示语输入所述预先训练好的生成式大模型,以生成所述用户标签结果。
11、根据本公开的实施例,所述多维用户数据包括基础数据、业务数据和行为埋点数据,所述装置还包括:数据获取模块,用于获取用户的基本信息,以得到所述基础数据;获取所述用户的业务信息,以得到所述业务数据;以及获取所述用户的访问埋点信息,以得到所述行为埋点数据。
12、根据本公开的实施例,所述m个维度的用户初始标签包括用户基础属性标签、用户业务数据标签和用户访问行为标签;所述初始分析模块,包括:第一分析单元,用于对所述基础数据进行基础标签分析,以得到所述用户基础属性标签;第二分析单元,用于对所述业务数据进行业务标签分析,以得到所述用户业务数据标签;以及第三分析单元,用于对所述行为埋点数据进行行为标签分析,以得到所述用户访问行为标签。
13、根据本公开的实施例,所述标签预处理模块,包括:第一预处理单元,用于格式化所述m个维度的用户初始标签;以及第二预处理单元,用于将格式化后的用户初始标签进行维度汇总,以获得所述m个维度的用户特征标签。
14、根据本公开的实施例,所述装置,还包括:更新模块,用于若所述用户标签结果异常,则对所述m个维度的用户特征标签进行复核,并基于复核的结果,更新标签库;以及若所述用户标签结果正常,则基于所述用户标签结果,更新所述标签库。
15、根据本公开的实施例,所述装置,还包括:训练模块,用于从历史用户数据集中提取用户历史标签数据;基于所述用户标签数据,提取用户信息与专家判断标签的特征映射关系;以及将所述特征映射关系导入所述生成式大模型,并对所述生成式大模型进行训练。
16、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个计算机程序,其中,上述一个或多个处理器执行上述一个或多个计算机程序以实现上述方法的步骤。
17、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有计算机程序或指令,上述计算机程序或指令被处理器执行时实现上述方法的步骤。
18、本公开的第五方面还提供了一种计算机程序产品,包括计算机程序或指令,上述计算机程序或指令被处理器执行时实现上述方法的步骤。
19、在本公开的实施例中,由于传统的用户标签生成方法中,人工筛选成本较高、时效长、且准确性不高,通过实施本公开的实施例,对多维用户数据进行分析,以得到m个维度的用户初始标签;m为大于1的整数;将m个维度的用户初始标签进行标签预处理,以获得m个维度的用户特征标签;以及基于多维用户数据,利用预先训练好的生成式大模型,对m个维度的用户特征标签进行筛选,以生成用户标签结果。实现了利用对用户标签提取环节引入预先训练好的生成式大模型技术,从而进一步提升用户标签提取和加工的时效性,提升用户标签的准确度,降低数据分析和人工筛选成本,以便进一步提升精准运营水平。