基于云计算系统的用户兴趣大数据挖掘方法及系统与流程

文档序号:30290700发布日期:2022-06-04 15:10阅读:110来源:国知局
基于云计算系统的用户兴趣大数据挖掘方法及系统与流程

1.本公开涉及大数据技术领域,尤其涉及一种基于云计算系统的用户兴趣大数据挖掘方法及系统。


背景技术:

2.当今已进入以新一代信息产业为主导的新经济发展时期,信息产业核心技术已成为各行业战略竞争的制高点。毫不夸张地说,抓住信息技术,也就等同抓住了竞争力和话语权。云计算、大数据和人工智能作为新一代信息产业技术的核心,能够为各类服务办理和服务升级提供软硬件基础。
3.在新一代信息产业背景下,针对用户分析的技术不断更新和优化。画像知识库/用户知识图谱作为用户需求/兴趣分析的其中一个重要手段,在用户分析过程中起着重要的作用。然而在结合画像知识库进行用户需求挖掘时,高可行性和抗干扰性一直是现目前难以攻克的难题。


技术实现要素:

4.本公开的一个目的是提供一种基于云计算系统的用户兴趣大数据挖掘方法及系统,能够在一定程度上保障用户兴趣大数据挖掘的可行性和抗干扰性。
5.本公开的技术方案是通过如下至少部分实施例实现的。
6.一种基于云计算系统的用户兴趣大数据挖掘方法,应用于大数据挖掘平台系统,所述方法至少包括:
7.确定基于相异云服务场景收集的目标业务用户的交互型用户活动记录以及所述交互型用户活动记录对应的已标注活动记录,所述交互型用户活动记录至少涵盖第一交互型用户活动记录和第二交互型用户活动记录;结合所述已标注活动记录对所述目标业务用户进行需求画像知识库生成,得到需求画像知识库生成过程中存在时序关联的两组已标注活动记录中的目标业务用户的兴趣关注点变化情况;
8.通过所述存在时序关联的两组已标注活动记录中的目标业务用户的兴趣关注点变化情况,确定所述第二交互型用户活动记录中的目标业务用户与所述第一交互型用户活动记录中的目标业务用户的第一兴趣关注点变化情况;通过所述第一兴趣关注点变化情况确定所述第二交互型用户活动记录中的目标业务用户相较于目标业务用户的可视化知识库的第二兴趣关注点变化情况,其中,所述可视化知识库通过所述第一交互型用户活动记录中挖掘的目标业务用户的显著活动事件确定。
9.结合相关实施例,确定基于相异云服务场景收集的目标业务用户的交互型用户活动记录以及所述交互型用户活动记录对应的已标注活动记录,包括:
10.确定用户活动分析线程基于相异云服务场景收集得到的多组可视化用户活动日志,其中,存在时序关联的两组可视化用户活动日志中具有至少部分相同内容集。
11.结合相关实施例,所述可视化知识库通过所述第一交互型用户活动记录中挖掘的
目标业务用户的显著活动事件确定,包括:
12.从所述第一交互型用户活动记录中挖掘所述目标业务用户的显著活动事件;
13.通过所述显著活动事件和设定的基础可视化知识库扩展得到所述目标业务用户的可视化知识库。
14.结合相关实施例,从所述第一交互型用户活动记录中挖掘的目标业务用户的显著活动事件统计结果大于等于设定统计判定值,所述设定统计判定值通过所述目标业务用户的目标业务类别对应的显著活动事件的统计结果确定,所述目标业务类别对应的显著活动事件统计结果大于所述目标业务用户的非目标业务类别对应的显著活动事件统计结果。
15.结合相关实施例,所述结合所述已标注活动记录对目标业务用户进行需求画像知识库生成,得到需求画像知识库生成过程中存在时序关联的两组已标注活动记录中的目标业务用户的兴趣关注点变化情况,包括:
16.确定所述已标注活动记录;对于所确定的各已标注活动记录,皆实施如下步骤:将所述已标注活动记录对应的用户需求视觉描述与已优化的用户需求视觉描述进行绑定,得到多组需求事项二元组;通过所述多组需求事项二元组确定所述已标注活动记录中的目标业务用户与所述已标注活动记录的前一组已标注活动记录中的目标业务用户的兴趣关注点变化情况。
17.结合相关实施例,所述方法还包括:
18.通过所述已标注活动记录中的目标业务用户与所述已标注活动记录的前一组已标注活动记录中的目标业务用户的兴趣关注点变化情况,将所述已标注活动记录对应的用户需求视觉描述拼接至所述已优化的用户需求视觉描述中,调整所述已优化的用户需求视觉描述。
19.结合相关实施例,所述将所述已标注活动记录对应的用户需求视觉描述与已优化的用户需求视觉描述进行绑定,得到多组需求事项二元组,包括:
20.确定所述已标注活动记录对应的用户需求视觉描述中的各需求描述特征的第一关键词信息,以及所述已优化的用户需求视觉描述中各需求描述特征的第二关键词信息;
21.通过所述第一关键词信息与所述第二关键词信息,对所述已标注活动记录对应的用户需求视觉描述和所述已优化的用户需求视觉描述进行绑定,得到多组需求事项二元组。
22.结合相关实施例,所述第一关键词信息或所述第二关键词信息涵盖如下至少一项:需求描述特征的需求主题、需求描述特征的特征识别度。
23.结合相关实施例,在通过所述已标注活动记录对所述目标业务用户进行需求画像知识库生成的过程中,所述目标业务用户的第一业务类别先于所述目标业务用户的第二业务类别优化得到,其中,所述第一业务类别对应的显著活动事件统计结果多于所述第二业务类别对应的显著活动事件统计结果。
24.结合相关实施例,所述已标注活动记录包括用户活动分析线程相对于所述目标业务用户切换设定个云服务场景的过程中收集得到的多组已标注活动记录,所述结合所述已标注活动记录对所述目标业务用户进行需求画像知识库生成,包括:
25.以包括所述目标业务用户的目标业务类别的已标注活动记录作为需求画像知识库生成的第一组已标注活动记录,依据所述用户活动分析线程的切换策略逐一从所述多组
已标注活动记录确定多组第一已标注活动记录进行需求画像知识库生成,得到第一用户需求视觉描述,其中,所述目标业务类别对应的显著活动事件多于所述目标业务用户的非目标业务类别对应的显著活动事件;
26.依据所述切换策略的逆向策略逐一从所述多组已标注活动记录中确定多组第二已标注活动记录进行需求画像知识库生成,得到第二用户需求视觉描述;
27.将所述第一用户需求视觉描述和第二用户需求视觉描述组合,得到所述目标业务用户的用户需求视觉描述。
28.结合相关实施例,所述多组第一已标注活动记录与所述多组第二已标注活动记录存在关联活动记录,存在时序关联的两组所述关联活动记录中目标业务用户的兴趣关注点变化情况通过如下步骤确定:
29.在依据所述切换策略逐一确定多组第一已标注活动记录进行需求画像知识库生成的过程中,确定所述存在时序关联的两组关联活动记录之间的第三兴趣关注点变化情况;
30.在依据所述逆向策略逐一确定多组第二已标注活动记录进行需求画像知识库生成的过程中,确定所述存在时序关联的两组关联活动记录之间的第四兴趣关注点变化情况;
31.通过所述第三兴趣关注点变化情况和所述第四兴趣关注点变化情况得到所述存在时序关联的两组关联活动记录中目标业务用户的兴趣关注点变化情况。
32.结合相关实施例,所述通过所述第三兴趣关注点变化情况和所述第四兴趣关注点变化情况得到所述存在时序关联的两组关联活动记录中目标业务用户的兴趣关注点变化情况,包括:
33.确定所述第三兴趣关注点变化情况和/或所述第四兴趣关注点变化情况对应的重要性指数,其中,所述第三兴趣关注点变化情况对应的重要性指数与所述关联活动记录与目标活动记录之间间隔的活动记录数量存在第一相关关系,所述第四兴趣关注点变化情况对应的重要性指数与所述关联活动记录与目标活动记录之间间隔的活动记录数量存在第二相关关系,所述目标活动记录为所述多组第一已标注活动记录中除所述关联活动记录之外的其中一组活动记录;
34.通过所述重要性指数对所述第三兴趣关注点变化情况和所述第四兴趣关注点变化情况进行求和操作,得到所述存在时序关联的两组关联活动记录中目标业务用户的兴趣关注点变化情况。
35.结合相关实施例,所述通过所述第一兴趣关注点变化情况确定所述第二交互型用户活动记录中的目标业务用户相较于目标业务用户的可视化知识库的第二兴趣关注点变化情况,包括:
36.通过所述第一交互型用户活动记录对应的已标注活动记录确定所述目标业务用户对应的动态用户需求视觉描述;
37.确定所述动态用户需求视觉描述相较于所述可视化知识库的第五兴趣关注点变化情况;
38.通过所述第一兴趣关注点变化情况和所述第五兴趣关注点变化情况确定所述第二交互型用户活动记录中的目标业务用户相较于所述可视化知识库的第二兴趣关注点变
化情况。
39.结合相关实施例,所述方法还包括:
40.通过所述第二兴趣关注点变化情况、以及所述用户活动分析线程的线程配置确定将所述可视化知识库映射至所述第二交互型用户活动记录的映射指标。
41.结合相关实施例,所述通过所述第二兴趣关注点变化情况、以及所述用户活动分析线程的线程配置确定将所述可视化知识库映射至所述第二交互型用户活动记录的映射指标,包括:
42.在用户活动分析线程收集目标业务用户的交互型用户活动记录的过程中,如果所述目标业务用户与所述用户活动分析线程的相关性更新情况小于设定相关性,则所述映射指标包括采用约束性映射的策略将所述可视化知识库映射至所述第二交互型用户活动记录中对应的映射指标;
43.如果所述目标业务用户与所述用户活动分析线程的相关性更新情况大于设定相关性,则所述映射指标包括采用非约束性映射的策略将所述可视化知识库映射至所述第二交互型用户活动记录中对应的映射指标。
44.结合相关实施例,所述可视化知识库的各知识库单元与所述目标业务用户的不同需求情况存在对应关系,所述方法还包括:
45.结合所述映射指标确定所述可视化知识库中的各知识库单元与所述第二交互型用户活动记录中的用户互动事件的指向情况;
46.通过所述指向情况确定所述目标业务用户的各需求情况在所述第二交互型用户活动记录中的分布标签;
47.通过所述目标业务用户的各需求情况在所述第二交互型用户活动记录中的分布标签对所述目标业务用户进行画像添加操作。
48.一种大数据挖掘平台系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
49.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
50.根据本公开的一个实施例,可以确定基于相异云服务场景收集的目标业务用户的交互型用户活动记录以及交互型用户活动记录对应的已标注活动记录,基于已标注活动记录对目标业务用户进行需求画像知识库生成,可得到其中两组已标注活动记录中的目标业务用户之间的兴趣关注点变化情况,然后可以确定其中一组交互型用户活动记录,该交互型用户活动记录是可以准确挖掘目标业务用户的显著活动事件的活动记录,结合该交互型用户活动记录可以得到目标业务用户的可视化知识库,通过确定其他交互型用户活动记录中的目标业务用户与这一组交互型用户活动记录中的目标业务用户的兴趣关注点变化情况,可确定其他交互型用户活动记录中的目标业务用户相较于该可视化知识库的兴趣关注点,进而可以结合确定的兴趣关注点进行用户画像分析挖掘。通过本技术实施例提供的技术,对于一些难以精准挖掘显著活动事件的目标业务用户的交互型用户活动记录,同样可以尽可能准确完整地确定出交互型用户活动记录中目标业务用户相较于目标业务用户的可视化知识库的兴趣关注点,从而在一定程度上保障用户兴趣大数据挖掘的可行性和抗干扰性。
附图说明
51.图1是示出可以实现本公开的实施例的大数据挖掘平台系统的一种通信配置的示意图。
52.图2是示出可以实现本公开的实施例的基于云计算系统的用户兴趣大数据挖掘方法的流程示意图。
53.图3是示出可以实现本公开的实施例的基于云计算系统的用户兴趣大数据挖掘方法的应用环境的架构示意图。
具体实施方式
54.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。为了使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开作进一步地详细描述,所描述的实施例不应视为对本公开的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开实施例的目的,不是旨在限制本公开。
55.图1是示出可以实现本公开的实施例的大数据挖掘平台系统100的一种通信配置的框图,大数据挖掘平台系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本公开实施例中基于云计算系统的用户兴趣大数据挖掘方法的处理器102。
56.图2是示出可以实现本公开的实施例的基于云计算系统的用户兴趣大数据挖掘方法的流程示意图,基于云计算系统的用户兴趣大数据挖掘方法可以通过图1所示的大数据挖掘平台系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
57.step202、确定基于相异云服务场景收集的目标业务用户的交互型用户活动记录以及所述交互型用户活动记录对应的已标注活动记录。
58.在step202中,所述交互型用户活动记录至少涵盖第一交互型用户活动记录和第二交互型用户活动记录。此外,可以确定基于相异云服务场景(不同的云服务场景,例如境内支付场景+跨境支付场景、本地办公场景+异地办公场景、rpg游戏场景+moba游戏场景等)收集的目标业务用户的交互型用户活动记录以及每组交互型用户活动记录对应的已标注活动记录。交互型用户活动记录对应的已标注活动记录是指已标注活动记录与该交互型用户活动记录在相同的云服务场景收集得到。已标注活动记录可以通过各类标注模型收集得到。对于一些可能的实施例而言,可以通过合法爬虫程序(经过用户授权的)基于相异云服务场景对目标业务用户进行活动记录收集,同时得到目标业务用户在相异云服务场景下的交互型用户活动记录和已标注活动记录(即可视化用户活动日志)。进一步地,已标注活动记录可以用于指示交互型用户活动记录的关键活动,从而为知识库建立和完善提供指引。
59.交互型用户活动记录中至少涵盖一组或多组第一交互型用户活动记录,以及一组或多组第二交互型用户活动记录,此外,还可以包括除第一交互型用户活动记录和第二交
互型用户活动记录之外的其他交互型用户活动记录。第一交互型用户活动记录可以是用户活动分析线程从指定云服务场景收集的目标业务用户的活动记录,指定云服务场景是可以定位到目标业务用户的显著活动事件较多的业务类别的云服务场景,从指定云服务场景收集的目标业务用户的交互型用户活动记录中可以准确挖掘到较多的显著活动事件。第二交互型用户活动记录可以是从不同于该指定云服务场景的其他云服务场景收集到的活动记录,例如,可以是从目标业务用户显著活动事件分布较少的业务类别收集得到的活动记录。
60.对于一些可能的实施例而言,用户活动分析线程可以是合法爬虫程序,可以指示合法爬虫程序基于相异云服务场景对目标业务用户进行活动记录收集,例如,可以指示合法爬虫程序基于目标业务用户切换设定个云服务场景(例如,5个云服务场景),在切换场景过程中收集多组可视化用户活动日志,以得到相异云服务场景下的目标业务用户的交互型用户活动记录以及各交互型用户活动记录对应的已标注活动记录。其中,相邻的两组可视化用户活动日志中具有至少部分相同内容集,以便可以基于相同内容集对存在时序关联的两组已标注活动记录进行绑定,实现需求画像知识库生成。在本技术实施例中,需求画像知识库可以是知识图谱。
61.step202、结合所述已标注活动记录对所述目标业务用户进行需求画像知识库生成,得到需求画像知识库生成过程中存在时序关联的两组已标注活动记录之间的兴趣关注点变化情况。
62.在step202中,可以确定相异云服务场景收集的目标业务用户的交互型用户活动记录对应的已标注活动记录,结合该已标注活动记录对目标业务用户进行需求画像知识库生成。其中,该已标注活动记录中包括第一交互型用户活动记录对应的已标注活动记录,以及第二交互型用户活动记录对应的已标注活动记录,当然,也还可以包括其他的已标注活动记录。由于这些已标注活动记录从目标业务用户的相异云服务场景收集得到,即这些已标注活动记录的场景维度存在差异,因而在结合这些已标注活动记录进行需求画像知识库生成的过程中,需要统一这些已标注活动记录之间的场景维度,确定收集存在时序关联的两组已标注活动记录时线程的关注点维度切换关系(例如存在时序关联的两组已标注活动记录中目标业务用户的兴趣关注点变化情况),进而可以基于该关注点维度切换关系将多组已标注活动记录对应的用户需求视觉描述拼接。这样,不仅可以完整准确地得到目标业务用户的需求画像知识库生成结果,还可以确定需求画像知识库生成过程中存在时序关联的两组已标注活动记录各自对应的交互型用户活动记录中目标业务用户的兴趣关注点变化情况,从而实时定位目标业务用户的兴趣关注点变化以实现需求画像知识库的更新。
63.对于一些可能的实施例而言,结合已标注活动记录对目标业务用户进行需求画像知识库生成,得到需求画像知识库生成过程中存在时序关联的两组已标注活动记录中的目标业务用户的兴趣关注点变化情况时,可以确定基于相异云服务场景收集的目标业务用户的已标注活动记录,对于所确定的各已标注活动记录,可以先确定该已标注活动记录对应的用户需求视觉描述,将该已标注活动记录对应的用户需求视觉描述与已优化的用户需求视觉描述进行绑定,确定两个用户需求视觉描述中表示动态映射列表中同一个动态用户偏好特征的特征二元组,从而得到多组需求事项二元组。由于这些已标注活动记录中的存在时序关联的两组已标注活动记录之间具有至少部分相同内容集,而已优化的用户需求视觉描述中已整合了该已标注活动记录的前一组已标注活动记录对应的用户需求视觉描述,因
此可以对该已标注活动记录对应的用户需求视觉描述与已优化的用户需求视觉描述进行绑定,在两个用户需求视觉描述中找出相同内容集对应的动态用户偏好特征对,即得到多组需求事项二元组。
64.进一步地,在得到该多组需求事项二元组后,可以结合该多组需求事项二元组确定该已标注活动记录中的目标业务用户与该已标注活动记录的前一组已标注活动记录中的目标业务用户的兴趣关注点变化情况,进而可以确定任意相邻的两组已标注活动记录中目标业务用户的兴趣关注点变化情况。
65.对于一些可能的实施例而言,在将已标注活动记录对应的用户需求与已优化的用户需求视觉描述进行绑定,确定多组需求事项二元组时,由于这些需求事项二元组表征动态映射列表中的相同需求主题,因而其关键词信息共性指数(相似度)较高。因此,可以基于两个用户需求视觉描述中需求描述特征的关键词信息进行绑定,确定关键词信息共性指数较高的特征二元组,作为需求事项二元组。例如,可以确定该已标注活动记录对应的用户需求视觉描述中的各需求描述特征的第一关键词信息,以及已优化的用户需求视觉描述中各需求描述特征的第二关键词信息,根据第一关键词信息与第二关键词信息,对该已标注活动记录对应的用户需求视觉描述和已优化的用户需求视觉描述进行绑定,得到多组需求事项二元组。
66.对于一些可能的实施例而言,第一关键词信息或第二关键词信息可以是各需求描述特征的需求主题、各需求描述特征的特征识别度等。其中,针对已优化的用户需求视觉描述,可以结合相关成熟的ai算法确定各需求描述特征的关键词信息。
67.对于一些可能的实施例而言,在确定需求画像知识库生成过程中存在时序关联的两组已标注活动记录之间的兴趣关注点变化情况后,可以基于所确定的兴趣关注点变化情况,将当前组已标注活动记录对应的用户需求视觉描述融合至已优化的用户需求视觉描述中,对已优化的用户需求视觉描述进行调整,然后再结合调整后的用户需求视觉描述与下一组已标注活动记录进行绑定,确定下一组已标注活动记录与该组已标注活动记录中目标业务用户的兴趣关注点变化情况。由于已优化的用户需求视觉描述除了包括当前组已标注活动记录的信息,还融合了之前多组已标注活动记录的信息,从已优化的用户需求视觉描述中挖掘的各需求描述特征的关键词信息也会尽可能精准,进而在与下一组已标注活动记录进行绑定时,得到的绑定结果也会尽可能精准,即确定的存在时序关联的两组已标注活动记录中目标业务用户的兴趣关注点变化情况也会尽可能精准。
68.当然,由于需求画像知识库生成过程中,是对已标注活动记录进行逐一优化的,偏移是累加的,越往后优化偏移越大。而在对目标业务用户进行需求画像知识库生成的过程中,通常期望目标业务用户显著活动事件较多的分布标签优化结果偏移尽可能小,以保证其准确性,而对于显著活动事件较少的分布标签,对优化偏移的严格程度较低。所以,对于一些可能的实施例而言,在基于已标注活动记录对目标业务用户进行需求画像知识库生成的过程中,目标业务用户的第一业务类别先于目标业务用户的第二业务类别优化得到,其中,第一业务类别包含的显著活动事件统计结果多于第二业务类别包含的显著活动事件统计结果。
69.对于一些可能的实施例而言,确定的已标注活动记录可以是用户活动分析线程相对于目标业务用户切换设定个云服务场景的过程中收集得到的多组已标注活动记录,存在
时序关联的两组已标注活动记录具有至少部分相同内容集。例如,可以指示用户活动分析线程基于目标业务用户进行场景切换并按一定的时间步长收集得到多组活动记录,这多组已标注活动记录中的存在时序关联的两组可以是通过不间断的收集方式得到的,也可以间隔x组活动记录(x为正整数),只要存在时序关联的两组活动记录之间存在一定的相同内容集即可。
70.对于一些可独立实施的设计思路而言,在基于收集得到的多组已标注活动记录对目标业务用户进行需求画像知识库生成时,为了保证目标业务用户的显著活动事件较多的分布标签优化结果的精度,可以包括目标业务用户的目标业务类别到的已标注活动记录作为需求画像知识库生成的第一组已标注活动记录(例如用户活动分析线程匹配目标业务用户的目标业务类别收集得到的已标注活动记录),其中,目标业务类别的显著活动事件多于目标业务用户的非目标业务类别的显著活动事件,即目标业务类别为目标业务用户显著活动事件分布最多的业务类别。然后可以依据用户活动分析线程的切换策略(例如切换顺序)逐一确定收集得到的多组已标注活动记录(后续视作第一已标注活动记录)进行需求画像知识库生成,得到第一用户需求视觉描述,并且依据该切换策略的逆向策略(例如反向的切换顺序)逐一确定收集得到的多组已标注活动记录(后续视作第二已标注活动记录)进行需求画像知识库生成,得到第二用户需求视觉描述,然后将分别依据两个策略优化得到的第一用户需求视觉描述和第二用户需求视觉描述组合,得到目标业务用户最后的用户需求视觉描述。
71.可以理解的是,由于依据用户活动分析线程的切换策略逐一确定收集的已标注活动记录进行需求画像知识库生成的过程中偏移在累积,而依据切换策略的逆向策略确定收集的已标注活动记录进行需求画像知识库生成的过程中偏移也在累积。为了保证依据两个策略分别优化得到的用户需求视觉描述在融合时可以减少描述缺失,对于一些可能的实施例而言,依据切换策略确定的多组第一已标注活动记录与依据切换策略的逆向策略确定的多组第二已标注活动记录中存在关联活动记录。对于关联活动记录,在确定存在时序关联的两组的关联活动记录中目标业务用户的兴趣关注点变化情况时,可以通过上采样的策略得到,以减少描述缺失。例如,在依据切换策略逐一确定多组第一已标注活动记录进行需求画像知识库生成的过程中,可以确定存在时序关联的两组关联活动记录之间的第三兴趣关注点变化情况,在依据切换策略的逆向策略逐一确定多组第二已标注活动记录进行需求画像知识库生成的过程中,可以确定存在时序关联的两组关联活动记录之间的第四兴趣关注点变化情况,然后可以基于第三兴趣关注点变化情况和第四兴趣关注点变化情况得到存在时序关联的两组关联活动记录中目标业务用户的兴趣关注点变化情况。
72.对于一些可能的实施例而言,在基于第三兴趣关注点变化情况和第四兴趣关注点变化情况得到存在时序关联的两组关联活动记录中目标业务用户的兴趣关注点变化情况时,可以确定第三兴趣关注点变化情况和/或第四兴趣关注点变化情况对应的重要性指数,其中,当该关联活动记录与目标活动记录之间间隔的活动记录数量越少,则第三兴趣关注点变化情况对应的重要性指数越大,第四兴趣关注点变化情况对应的重要性指数越小,其中,目标活动记录可以是多组第一已标注活动记录中除关联活动记录之外的其中一组活动记录。举个例子,假设依据用户活动分析线程在场景切换过程中确定的已标注活动记录的组号为1~400组,可以依据切换策略逐一确定1~210组第一已标注活动记录进行需求画像
知识库生成,得到关联的200~210组中相邻组的第三兴趣关注点变化情况,的同时依据切换策略的逆向策略逐一确定200~400组第二已标注活动记录进行需求画像知识库生成,得到关联的200~210组中相邻组的第四兴趣关注点变化情况。其中,关联活动记录与第199组越靠近,则第三兴趣关注点变化情况对应的重要性指数越大,第四兴趣关注点变化情况对应的重要性指数(权重)越小。然后可以基于该重要性指数对第三兴趣关注点变化情况和第四兴趣关注点变化情况进行求和操作,得到存在时序关联的两组关联活动记录的兴趣关注点变化情况。通过对融合处的已标注活动记录之间的兴趣关注点变化情况进行上采样,可以保证依据两个策略优化的用户需求视觉描述在融合过程中避免描述缺失。
73.step204、基于需求画像知识库生成过程中存在时序关联的两组已标注活动记录之间的兴趣关注点变化情况,确定所述第二交互型用户活动记录中的目标业务用户与所述第一交互型用户活动记录中的目标业务用户的第一兴趣关注点变化情况。
74.在step204中,在需求画像知识库生成过程中,可以确定任意相邻的两组已标注活动记录之间的兴趣关注点变化情况,从而可以得到其中两组已标注活动记录或已标注活动记录对应的交互型用户活动记录中目标业务用户的兴趣关注点变化情况。进一步地,也可以得到第二交互型用户活动记录中的目标业务用户与所述第一交互型用户活动记录中的目标业务用户的兴趣关注点变化情况,后续视作第一兴趣关注点变化情况。
75.step208、通过所述第一兴趣关注点变化情况确定所述第二已标注活动记录中的目标业务用户相较于目标业务用户的可视化知识库的第二兴趣关注点变化情况。
76.在step208中,所述可视化知识库通过所述第一交互型用户活动记录中挖掘的目标业务用户的显著活动事件确定。
77.在确定活动记录中目标业务用户的兴趣关注点时,为了方便确定的兴趣关注点的后续应用,通常会确定活动记录中的目标业务用户相较于目标业务用户的可视化知识库的兴趣关注点。其中,可视化知识库可以是基础化的知识图谱,该知识图谱中各知识单元的关联情况固定,各知识单元与目标业务用户各个需求情况的指向情况也是确定的确定活动记录中目标业务用户相较于该可视化知识库的兴趣关注点,可以更好的结合该可视化知识库的可视化关系。
78.目标业务用户的可视化知识库的生成需要结合活动记录中目标业务用户的显著活动事件,显著活动事件越多,生成的目标业务用户的可视化知识库越准确完整。由于第一交互型用户活动记录中包括目标业务用户显著活动事件较多的业务类别,从第一交互型用户活动记录中可以准确挖掘到较多的目标业务用户的显著活动事件,所以可以结合第一交互型用户活动记录确定目标业务用户的可视化知识库。可以从第一交互型用户活动记录中挖掘的目标业务用户的显著活动事件,基于这些显著活动事件确定目标业务用户的可视化知识库。
79.对于一些可能的实施例而言,在基于第一交互型用户活动记录中挖掘的目标业务用户的显著活动事件确定目标业务用户的可视化知识库时,可以先从第一交互型用户活动记录中挖掘出目标业务用户的显著活动事件,显著活动事件可以是活动记录中特征识别度较大的活动事件,例如,可以是可视化操作事件等。以办公活动记录为例,显著活动事件可以包含多个办公显著活动事件,当然也可以包括其他数目的办公显著活动事件。然后可以基于显著活动事件和设定的基础知识库扩展得到目标业务用户的可视化知识库。例如,可
以从数据库中确定基础的可视化知识库范例,基于挖掘到的显著活动事件的分布标签调整可视化知识库范例中各知识单元的分布标签,从而扩展得到目标业务用户的可视化知识库。
80.对于一些可能的实施例而言,为了确保确定的可视化知识库比较准确,从第一交互型用户活动记录中挖掘的显著活动事件的统计结果可以大于等于设定统计判定值,以确保可以结合足够多的显著活动事件进行扩展,得到准确的可视化知识库。其中,设定统计判定值可以基于目标业务用户的目标业务类别对应的显著活动事件的统计结果确定,其中,目标业务类别对应的显著活动事件统计结果大于目标业务用户的非目标业务类别对应的显著活动事件统计结果,即目标业务类别可以是目标业务用户显著活动事件分布最多的业务类别。例如,第一交互型用户活动记录可以是匹配于目标业务用户显著活动事件分布最多的业务类别收集到的活动记录。
81.由于可视化知识库是基于第一交互型用户活动记录生成得到,第一交互型用户活动记录中的目标业务用户相较于可视化知识库的兴趣关注点是可以确定的。进而,在确定第二交互型用户活动记录中的目标业务用户相较于第一交互型用户活动记录中的目标业务用户的第一兴趣关注点变化情况后,可以基于该第一兴趣关注点变化情况确定第二交互型用户活动记录中的目标业务用户相较于可视化知识库的第二兴趣关注点变化情况。
82.对于一些可能的实施例而言,可以先基于该第一交互型用户活动记录对应的已标注活动记录确定第一交互型用户活动记录中的目标业务用户对应的动态用户需求视觉描述,然后确定该动态用户需求视觉描述相较于可视化知识库的第五兴趣关注点变化情况,以将动态用户需求视觉描述和可视化知识库匹配,第五兴趣关注点变化情况即为第一交互型用户活动记录中的目标业务用户相较于可视化知识库的兴趣关注点。进而,可以根据需求画像知识库生成过程中的第一兴趣关注点变化情况和该第五兴趣关注点变化情况确定第二交互型用户活动记录中的目标业务用户相较于可视化知识库的第二兴趣关注点变化情况。
83.当然,可视化知识库是一个动态可变的知识图谱,在一些情况下,需要确定将可视化知识库映射至各交互型用户活动记录中的映射指标,便于后续的应用。所以,对于一些可能的实施例而言,在确定第二兴趣关注点变化情况后,可以进一步基于用户活动分析线程的线程配置数以及该第二兴趣关注点变化情况确定将可视化知识库映射至第二交互型用户活动记录中的映射指标(映射指示)。
84.对于一些可能的实施例而言,在将可视化知识库映射至第二交互型用户活动记录中,以确定映射指标时,可以基于活动记录收集过程中,目标业务用户与用户活动分析线程的相关性更新情况确定映射策略。如果目标业务用户与用户活动分析线程的相关性更新情况小于设定相关性,则可以采用约束性映射的策略,约束性映射的资源开销小,并且在相关性更新情况较小的情况下也能得到较为准确的映射结果。如果目标业务用户与用户活动分析线程的相关性更新情况大于设定相关性,则可以采用非约束性映射的策略,非约束性映射的资源开销相比于约束性映射较大,但是对于相关性更新情况较大的情况下,非约束性映射会更为准确。其中,约束性映射和非约束性映射是相对的,约束性映射具有一定的限制条件或者要求。
85.由于可视化知识库的各知识库单元与目标业务用户的不同需求情况是事先配置
的,即可视化知识库中的每个知识库单元对应于目标业务用户的哪个需求情况是已知的。所以,对于一些可能的实施例而言,在确定映射指标后,可以结合该映射指标确定可视化知识库中的各知识库单元与第二交互型用户活动记录中的用户互动事件的指向情况,然后可以基于指向情况(对应关系)确定目标业务用户的各需求情况在第二交互型用户活动记录中的分布标签(相对位置),进而可以基于该目标业务用户的各需求情况在第二交互型用户活动记录中的分布标签对目标业务用户进行画像添加操作。例如,画像添加操作可以理解为标签添加,比如“更加注重交互时效性”、“更加注重可视化质量”等用户画像标签,这样能够为后续的业务升级优化提供决策依据。
86.在上述内容的基础上,对于一些可独立实施的设计思路而言,在通过所述第一兴趣关注点变化情况确定所述第二交互型用户活动记录中的目标业务用户相较于目标业务用户的可视化知识库的第二兴趣关注点变化情况之后,该方法还可以包括以下内容:基于所述可视化知识库确定所述目标业务用户在设定时段内的待分析兴趣关注点记录;根据所述待分析兴趣关注点记录确定所述目标业务用户的衍生需求;通过所述衍生需求进行业务服务优化。
87.在本技术实施例中,可以根据可视化知识库中的知识单元的更新情况来确定目标业务用户在设定时段内的待分析兴趣关注点记录,比如可以根据知识单元的更新时段来确定待分析兴趣关注点记录,从而保障待分析兴趣关注点记录的精度和时效性。此外,可以借助ai模型从待分析兴趣关注点记录中挖掘得到目标业务用户更为潜在和隐性的衍生需求,这样能够实现前瞻性的业务服务优化,比如衍生需求可以是“在后续会话过程中减少广告弹窗”,则业务服务优化可以针对于广告拦截方向实现。
88.对于一些可独立实施的设计思路而言,所述根据所述待分析兴趣关注点记录确定所述目标业务用户的衍生需求,可以通过以下实施方式实现:对所述待分析兴趣关注点记录进行兴趣语义识别,得到所述待分析兴趣关注点记录对应的兴趣语义内容集;确定所述待分析兴趣关注点记录中目标兴趣关注片段;在所述兴趣语义内容集中,确定所述目标兴趣关注片段对应的第一兴趣语义局部内容;调用在先配置的第一衍生需求挖掘模型对所述目标兴趣关注片段和所述第一兴趣语义局部内容进行衍生挖掘处理,得到所述目标兴趣关注片段对应的衍生需求,其中,所述第一衍生需求挖掘模型是之前调用调试内容集调试所得,所述调试内容集中的调试内容集是基于所述待分析兴趣关注点记录得到的。如此设计,能够重点考虑兴趣语义(兴趣类别),从而保障衍生挖掘处理的精度和完整性,这样可以得到尽可能丰富且符合实际业务场景的衍生需求。
89.对于一些可独立实施的设计思路而言,所述调试内容集包括多个调试内容二元组,所述多个调试内容二元组中的任一调试内容二元组包括关注点记录范例和兴趣语义内容范例,其中,所述关注点记录范例是从所述待分析兴趣关注点记录中拆解出的内容集范例,所述兴趣语义内容范例是从所述兴趣语义内容集中拆解出的内容集范例,且属于同一调试内容二元组的所述关注点记录范例和所述兴趣语义内容范例对应于相同的拆解分布标签。基于此,在所述调用在先配置的第一衍生需求挖掘模型对所述目标兴趣关注片段和所述第一兴趣语义局部内容进行处理之前,所述方法还包括:对于所述多个调试内容二元组中的任一调试内容二元组,对所述关注点记录范例和所述兴趣语义内容范例进行扰动处理,得到所述关注点记录范例对应的兴趣内容扰动范例和所述兴趣语义内容范例对应的兴
趣语义扰动范例;将所述兴趣内容扰动范例和所述兴趣语义扰动范例加载到所述第一衍生需求挖掘模型,通过所述第一衍生需求挖掘模型得到所述兴趣内容扰动范例对应的兴趣内容衍生范例;根据所述兴趣内容衍生范例与所述关注点记录范例之间的比较结果,优化所述第一衍生需求挖掘模型。如此设计,能够提高第一衍生需求挖掘模型的鲁棒性。
90.图3是示出可以实现本公开的实施例的基于云计算系统的用户兴趣大数据挖掘方法的应用环境的架构示意图,基于云计算系统的用户兴趣大数据挖掘方法的应用环境中可以包括互相通信的大数据挖掘平台系统100和业务用户端200。基于此,大数据挖掘平台系统100和业务用户端200在运行时实现或者部分实现本公开实施例的基于云计算系统的用户兴趣大数据挖掘方法。
91.以上已经结合附图描述了本公开的实施例,至少具有如下有益效果:对于一些难以精准挖掘显著活动事件的目标业务用户的交互型用户活动记录,同样可以尽可能准确完整地确定出交互型用户活动记录中目标业务用户相较于目标业务用户的可视化知识库的兴趣关注点,从而在一定程度上保障用户兴趣大数据挖掘的可行性和抗干扰性。
92.以上所述,仅为本公开的较佳实施例而已,并非用于限定本公开的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1