本技术涉及大数据领域,具体而言,涉及一种用户行为分析、预测的方法、装置、电子设备和存储介质。
背景技术:
1、用户行为数据是指用户在和系统交互过程中产生的动作数据,即用户做了什么事情。例如,用户查询了安全事件,调取了风险报告等。大多数系统都采集记录了用户行为数据,当作审计数据,并没有识别与分析这些数据。
2、在实际业务中,我们常认为用户的需求、为用户提供更好的产品与服务就是我们的目标。除了用户提供的明确需求外,我们还能不能通过其他手段挖掘出用户的潜在需求,答案就在利用这部分收集记录的用户行为数据上深度理解分析用户需求。我们需要对用户行为的分析以理解用户的需求,对业务进行升级指导,并能做到预测用户行为,引领业务创新。
3、针对上述场景需求,现有技术只能对用户历史行为进行统计分析,从而依赖历史数据进行用户行为可视化呈现,而不能对用户历史行为的延续性行为进行分析,适用价值不高。其次,现有技术对用户行为的记录分析比较单一,进而对用户业务支持不足,对数据价值利用不够。
技术实现思路
1、本技术的目的在于提供一种用户行为分析、预测的方法、装置、电子设备和存储介质,用于解决现有技术存在的技术缺陷。
2、第一方面,本技术提供一种用户行为分析方法,所述方法包括:
3、获取用户历史行为数据;
4、基于所述用户历史行为数据得到分析结果,并基于所述分析结果形成行为数据基准库、用户基准库和数据热度库,其中,所述用户基准库包括关注数据和业务相同的用户。
5、本技术第一方面能够获取用户历史行为数据,进而能够基于所述用户历史行为数据得到分析结果,并基于所述分析结果形成行为数据基准库、用户基准库和数据热度库,其中,所述用户基准库包括关注数据和业务相同的用户。与现有技术相比,本技术能够形成行为数据基准库、用户基准库和数据热度库,其中,行为数据基准库、用户基准库和数据热度库可用于预测用户的延续行为,从而可充分利用用户历史行为数据、提升历史行为数据的使用价值,而现有技术仅能够统计分析用户数据,其可用的数据少,无法对用户历史行为的延续性行为进行分析,适用价值不高。其次,现有技术对用户行为的记录分析比较单一,进而对用户业务支持不足,对数据价值利用不够。
6、在可选的实施方式中,所述基于所述用户历史行为数据得到分析结果,并基于所述分析结果形成行为数据基准库、用户基准库和数据热度库,包括:
7、识别所述用户历史行为数据中的操作数据和检索数据,并将所述操作数据和所述检索数据作为原始行为数据,并将所述原始行为数据与用户id关联;
8、基于nlp自然语言处理算法分析所述检索数据并得到所述行为数据基准库;
9、基于所述行为数据基准库和欧几里得距离算法,得到所述用户基准库;
10、基于所述用户基准库和所述行为数据基准库计算得到所述数据热度库。
11、本可选的实施方式能够识别所述用户历史行为数据中的操作数据和检索数据,并将所述操作数据和所述检索数据作为原始行为数据,并将所述原始行为数据与用户id关联,进而能够基于nlp自然语言处理算法分析所述检索数据并得到所述行为数据基准库,进而基于所述行为数据基准库和欧几里得距离算法能够得到所述用户基准库,进而能够基于所述用户基准库和所述行为数据基准库计算得到所述数据热度库。
12、在可选的实施方式中,所述基于nlp自然语言处理算法分析所述检索数据并得到所述行为数据基准库,包括:
13、将所述检索数据作为训练集数据,并对所述训练集数据进行中文分词,得到分词结果;
14、基于停用词过滤模型去除所述分词结果中没有价值的分词,并得到目标文本;
15、基于编码器对所述目标文本进行标签化处理,并得到数据值数据矩阵;
16、将所述数据值数据矩阵作为多项式朴素贝叶斯模型的输入,以使所述多项式朴素贝叶斯模型对所述目标文本进行文本分类识别和确定文本分类识别结果的准确度,其中,所述多项式朴素贝叶斯模型用于将所述目标文本分类识别为用户关注实例、用户关注实例数据中的一种;
17、基于所述文本分类识别结果和所述文本分类识别结果的准确度形成所述行为数据基准库。
18、本可选的实施方式通过将所述检索数据作为训练集数据,并对所述训练集数据进行中文分词,能够得到分词结果,进而能够基于停用词过滤模型去除所述分词结果中没有价值的分词,并得到目标文本,进而能够基于编码器对所述目标文本进行标签化处理,并得到数据值数据矩阵,进而能够将所述数据值数据矩阵作为多项式朴素贝叶斯模型的输入,以使所述多项式朴素贝叶斯模型对所述目标文本进行文本分类识别和确定文本分类识别结果的准确度,其中,所述多项式朴素贝叶斯模型用于将所述目标文本分类识别为用户关注实例、用户关注实例数据中的一种,进而能够基于所述文本分类识别结果和所述文本分类识别结果的准确度形成所述行为数据基准库。
19、在可选的实施方式中,所述基于所述行为数据基准库和欧几里得距离算法,得到所述用户基准库,包括:
20、基于所述欧几里得距离算法对所述行为数据基准库进行向量之间的距离计算,得到行为相似度计算结果;
21、基于所述行为相似度计算结果确定所述行为相似度满足第一预设条件的用户,并将所述行为相似度满足第一预设条件的用户关联,以形成所述用户基准库。
22、本可选的实施方式基于所述欧几里得距离算法对所述行为数据基准库进行向量之间的距离计算,能够得到行为相似度计算结果,进而能够基于所述行为相似度计算结果确定所述行为相似度满足第一预设条件的用户,并将所述行为相似度满足第一预设条件的用户关联,以形成所述用户基准库。
23、在可选的实施方式中,所述基于所述用户基准库和所述行为数据基准库计算得到所述数据热度库,包括:
24、基于所述用户基准库和所述行为数据基准库,对用户操作行为的频率和用户检索行为的频率进行分析,以得到所述数据热度库。
25、本可选的实施方式基于所述用户基准库和所述行为数据基准库,能够对用户操作行为的频率和用户检索行为的频率进行分析,进而能够到所述数据热度库。
26、第二方面,本技术提供一种用户行为预测方法,所述方法包括:
27、当检测到目标用户登录系统后,基于行为数据基准库、用户基准库和数据热度库输出检索行为提示,其中,所述行为数据基准库、所述用户基准库和所述数据热度库基于如前述实施方式任一项所述的方法得到。
28、本技术第二方面的用户行为预测方法能够利用行为数据基准库、所述用户基准库和所述数据热度库主动提示用户关心数据,减少用户输入性搜索行为,提升用户业务场景体验、提升行为数据利用价值和效率,进而提升用户体验。
29、第三方面,本技术提供一种用户行为分析装置,所述装置包括:
30、获取模块,用于获取用户历史行为数据;
31、分析模块,用于基于所述用户历史行为数据得到分析结果,并基于所述分析结果形成行为数据基准库、用户基准库和数据热度库,其中,所述用户基准库包括关注数据和业务相同的用户。
32、本技术第三方面的装置通过执行用户行为分析方法,能够获取用户历史行为数据,进而能够基于所述用户历史行为数据得到分析结果,并基于所述分析结果形成行为数据基准库、用户基准库和数据热度库,其中,所述用户基准库包括关注数据和业务相同的用户。与现有技术相比,本技术能够形成行为数据基准库、用户基准库和数据热度库,其中,行为数据基准库、用户基准库和数据热度库可用于预测用户的延续行为,从而可充分利用用户历史行为数据、提升历史行为数据的使用价值,而现有技术仅能够统计分析用户数据,其可用的数据少,无法对用户历史行为的延续性行为进行分析,适用价值不高。其次,现有技术对用户行为的记录分析比较单一,进而对用户业务支持不足,对数据价值利用不够。
33、第四方面,本技术提供一种用户行为预测装置,所述装置包括:
34、预测模块,用于当检测到目标用户登录系统后,基于行为数据基准库、用户基准库和数据热度库输出检索行为提示,其中,所述行为数据基准库、所述用户基准库和所述数据热度库基于如前述实施方式任一项所述的方法得到。
35、本技术第四方面的装置通过执行用户行为分析方法,进而能够利用行为数据基准库、所述用户基准库和所述数据热度库主动提示用户关心数据,减少用户输入性搜索行为,提升用户业务场景体验、提升行为数据利用价值和效率,进而提升用户体验。
36、第五方面,本技术提供一种电子设备,包括:
37、处理器;以及
38、存储器,配置用于存储机器可读指令,所述指令在由所述处理器执行时,执行如前述实施方式任一项所述的用户行为分析方法和前述实施方式所述的用户行为预测方法。
39、本技术第五方面的电子设备通过执行用户行为分析方法及用户行为预测方法,能够得到行为数据基准库、所述用户基准库和所述数据热度库,进而充分利用用户历史行为数据,并能够利用行为数据基准库、所述用户基准库和所述数据热度库主动提示用户关心数据,减少用户输入性搜索行为,提升用户业务场景体验、提升行为数据利用价值和效率,进而提升用户体验。
40、第六方面,本技术提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行如前述实施方式任一项所述的用户行为分析方法和前述实施方式所述的用户行为预测方法。
41、本技术第六方面的存储介质通过执行用户行为分析方法及用户行为预测方法,能够得到行为数据基准库、所述用户基准库和所述数据热度库,进而充分利用用户历史行为数据,并能够利用行为数据基准库、所述用户基准库和所述数据热度库主动提示用户关心数据,减少用户输入性搜索行为,提升用户业务场景体验、提升行为数据利用价值和效率,进而提升用户体验。