用户行为识别方法、装置、计算机设备及可读存储介质与流程

文档序号:31035929发布日期:2022-08-06 03:09阅读:58来源:国知局
用户行为识别方法、装置、计算机设备及可读存储介质与流程

1.本发明涉及大数据的数据采集技术领域,尤其涉及一种用户行为识别方法、装置、计算机设备及可读存储介质。


背景技术:

2.埋点是数据分析领域的关键元素,对于bs架构的系统来说,用户的埋点行为分析,对于挖掘用户行为习惯、提升系统服务质量有着至关重要的作用。
3.然而,发明人发现,传统的用户埋点数据分析手段,通常是通过埋点采集大量埋点数据,并由人工对该埋点数据进行分析,不仅难以捕捉埋点数据中表征用户行为习惯的关键数据,还会因人工分析大量埋点数据,导致数据分析效率低下,人工成本投入巨大的情况发生。


技术实现要素:

4.本发明的目的是提供一种用户行为识别方法、装置、计算机设备及可读存储介质,用于解决现有技术存在的不仅难以捕捉埋点数据中表征用户行为习惯的关键数据,还会因人工分析大量埋点数据,导致数据分析效率低下,人工成本投入巨大的问题。
5.为实现上述目的,本发明提供一种用户行为识别方法,包括:
6.获取埋点数据,提取用户id的埋点数据并汇总形成所述用户id的数据集合;
7.对所述数据集合进行分层处理得到至少一个会话层,其中,所述会话层记载了用户端对服务器进行会话时所生成的埋点数据;
8.识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层中的出现次数的连续统计数据,其中,所述连续行为是表征用户端在服务器中连续触发的页面和/或进程的埋点数据;
9.汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端。
10.上述方案中,所述对所述数据集合进行分层处理得到至少一个会话层,包括:
11.识别所述数据集合中相邻的两个埋点数据的触发时间的时间差,将超过预置的时间阈值的时间差设为目标时间差;
12.以所述目标时间差对应的两个埋点数据作为会话分界线,使所述数据集合中处于所述会话分界线两侧的埋点数据划分成两个会话层,其中,所述目标时间差对应的一个埋点数据划归为所述两个会话层中的一个会话层,所述目标时间差对应的另一个埋点数据划归为所述两个会话层中的另一个会话层。
13.上述方案中,所述识别所述会话层中的连续行为,包括:
14.将所述会话层中相邻的两个埋点数据的用户行为设为一个连续行为;
15.计算各所述连续行为在所述会话层中出现的次数并汇总形成所述会话层的连续统计数据。
16.上述方案中,所述构建记载所述连续行为及其在所述会话层中的出现次数的连续统计数据之后,还包括:
17.识别所述连续统计数据的会话行为,根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案,其中,所述会话行为是表征了所述会话层中主要出现的连续行为。
18.上述方案中,所述识别所述连续统计数据的会话行为,根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案,包括:
19.获取一个会话层,将所述会话层的连续统计数据中出现次数最高的连续行为设为所述会话层的会话行为;
20.汇总所述用户id的所有会话层的会话行为形成会话集合;
21.对所述会话集合中的会话行为进行排列组合得到会话序列,汇总所述会话序列得到所述行为方案。
22.上述方案中,所述汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端,包括:
23.提取所述会话层的会话编号,将所述会话编号作为所述会话层的连续统计数据的名称,使所述连续统计数据转为会话统计数据,汇总各所述会话统计数据形成所述行为统计数据。
24.获取数据模板,将所述行为统计数据的会话编号、连续行为和所述连续行为的出现次数录入所述数据模板,使所述数据模板转为采用表格形式展示所述行为统计数据的行为统计信息。
25.提取所述数据模板中的数据联系信息,将所述行为统计信息发送至相应于所述联系信息的管理端。
26.上述方案中,所述根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案之后,所述方法还包括:
27.将所述行为方案录入预置的方案模板得到用户行为信息,将所述用户行为信息发送至管理端;
28.所述将所述行为方案录入预置的方案模板得到用户行为信息之后,所述方法还包括:
29.将所述用户行为信息上传至区块链中。
30.为实现上述目的,本发明还提供一种用户行为识别装置,包括:
31.数据输入模块,用于获取埋点数据,提取用户id的埋点数据并汇总形成所述用户id的数据集合;
32.数据分层模块,用于对所述数据集合进行分层处理得到至少一个会话层,其中,所述会话层记载了用户端对服务器进行会话时所生成的埋点数据;
33.连续统计模块,用于识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层中的出现次数的连续统计数据,其中,所述连续行为是表征用户端在服务器中连续触发的页面和/或进程的埋点数据;
34.统计反馈模块,用于汇总各所述会话层的连续统计数据形成行为统计数据,将所
述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端。
35.为实现上述目的,本发明还提供一种计算机设备,其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述计算机设备的处理器执行所述计算机程序时实现上述用户行为识别方法的步骤。
36.为实现上述目的,本发明还提供一种计算机可读存储介质,所述可读存储介质上存储有计算机程序,所述可读存储介质存储的所述计算机程序被处理器执行时实现上述用户行为识别方法的步骤。
37.本发明提供的用户行为识别方法、装置、计算机设备及可读存储介质,通过对数据集合按照一次会话进行一次分层,以便于后续对一次会话进行一次有针对性的埋点数据的分析,进而提高用户埋点分析的准确度;通过识别会话层中表征用户端在服务器中连续触发的页面和/或进程的埋点数据,以识别所述会话层中能够表征用户端的主要操作行为的埋点数据。
38.通过汇总各所述会话层的连续统计数据形成行为统计数据的方式,整合用户在各会话层中操作的连续行为,通过将所述行为统计数据录入预置的数据模板得到行为统计信息的方式,将完整展示用户在各会话层中连续行为的行为统计信息发送至所述管理端,使所述管理端根据所述行为统计信息识别用户的行为习惯,以便于后续构建相应于所述用户的用户画像,不仅能够从海量的埋点数据中快速捕捉表征用户行为习惯的关键数据,提高了用户行为识别效率,进而有利于降低构建用户画像的算力消耗,还避免了人工分析埋点数据的情况发生,提高了数据分析效率,避免了人工成本投入巨大的情况发生。
附图说明
39.图1为本发明用户行为识别方法实施例一的流程图;
40.图2为本发明用户行为识别方法实施例二中用户行为识别方法的环境应用示意图;
41.图3是本发明用户行为识别方法实施例二中用户行为识别方法的具体方法流程图;
42.图4为本发明用户行为识别装置实施例三的程序模块示意图;
43.图5为本发明计算机设备实施例四中计算机设备的硬件结构示意图。
具体实施方式
44.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.本发明提供的用户行为识别方法、装置、计算机设备及可读存储介质,适用于大数据的数据采集技术领域,为提供一种基于数据输入模块、数据分层模块、连续统计模块、统计反馈模块的用户行为识别方法。本发明通过对所述数据集合进行分层处理得到至少一个会话层,识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层中的出
现次数的连续统计数据,汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端。
46.实施例一:
47.请参阅图1,本实施例的一种用户行为识别方法,包括:
48.s101:获取埋点数据,提取用户id的埋点数据并汇总形成所述用户id的数据集合;
49.s102:对所述数据集合进行分层处理得到至少一个会话层,其中,所述会话层记载了用户端对服务器进行会话时所生成的埋点数据;
50.s103:识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层中的出现次数的连续统计数据,其中,所述连续行为是表征用户端在服务器中连续触发的页面和/或进程的埋点数据;
51.s105:汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端。
52.在示例性的实施例中,所述埋点数据是:是通过在页面和/或按钮中植入统计代码,以获取用户浏览页面和/或点击按钮所生成的数据。所述埋点数据包括:用户会话id,用户id,当前页面编码,当前事件编码,触发时间,用户设备id,ip信息等等。
53.通过对数据集合按照一次会话进行一次分层,以便于后续对一次会话进行一次有针对性的埋点数据的分析,进而提高用户埋点分析的准确度。
54.通过识别会话层中表征用户端在服务器中连续触发的页面和/或进程的埋点数据,以识别所述会话层中能够表征用户端的主要操作行为的埋点数据。
55.通过汇总各所述会话层的连续统计数据形成行为统计数据的方式,整合用户在各会话层中操作的连续行为,通过将所述行为统计数据录入预置的数据模板得到行为统计信息的方式,将完整展示用户在各会话层中连续行为的行为统计信息发送至所述管理端,使所述管理端根据所述行为统计信息识别用户的行为习惯,以便于后续构建相应于所述用户的用户画像,不仅能够从海量的埋点数据中快速捕捉表征用户行为习惯的关键数据,提高了用户行为识别效率,进而有利于降低构建用户画像的算力消耗,还避免了人工分析埋点数据的情况发生,提高了数据分析效率,避免了人工成本投入巨大的情况发生。
56.因此,本技术能够快速挖掘用户的关注版块,助力高效制定产品的推广策略、驱动业务迭代,进而帮助企业改善服务质量,提高客户满意度。
57.实施例二:
58.本实施例为上述实施例一的一种具体应用场景,通过本实施例,能够更加清楚、具体地阐述本发明所提供的方法。
59.下面,以在运行有用户行为识别方法的服务器中,对数据集合进行分层处理得到至少一个会话层,识别会话层中的连续行为并构建连续统计数据,为例,来对本实施例提供的方法进行具体说明。需要说明的是,本实施例只是示例性的,并不限制本发明实施例所保护的范围。
60.图2示意性示出了根据本技术实施例二的用户行为识别方法的环境应用示意图。
61.在示例性的实施例中,用户行为识别方法所在的服务器2通过网络分别连接用户端3和管理端4;所述服务器2可以通过一个或多个网络提供服务,网络可以包括各种网络设备,例如路由器,交换机,多路复用器,集线器,调制解调器,网桥,中继器,防火墙,代理设备
和/或等等。网络可以包括物理链路,例如同轴电缆链路,双绞线电缆链路,光纤链路,它们的组合和/或类似物。网络可以包括无线链路,例如蜂窝链路,卫星链路,wi-fi链路和/或类似物;所述用户端3和管理端4可分别为智能手机、平板电脑、笔记本电脑、台式电脑等计算机设备。
62.图3是本发明一个实施例提供的一种用户行为识别方法的具体方法流程图,该方法具体包括步骤s201至s206。
63.s201:获取埋点数据,提取用户id的埋点数据并汇总形成所述用户id的数据集合。
64.本步骤中,所述埋点数据是:是通过在页面和/或按钮中植入统计代码,以获取用户浏览页面和/或点击按钮所生成的数据。
65.所述埋点数据包括:用户会话id,用户id,当前页面编码,当前事件编码,触发时间,用户设备id,ip信息等等。
66.s202:对所述数据集合进行分层处理得到至少一个会话层,其中,所述会话层记载了用户端对服务器进行会话时所生成的埋点数据。
67.为实现对数据集合按照一次会话进行一次分层,以便于后续对一次会话进行一次有针对性的埋点数据的分析,进而提高用户埋点分析的准确度。
68.所述会话为session,其通常是指:一个终端用户与交互系统进行通信的时间间隔,通常指从注册进入系统到注销退出系统之间所经过的时间,于本实施例中,所述会话用于描述用户从注册进入系统到注销退出系统之间的过程。
69.在一个优选的实施例中,所述对所述数据集合进行分层处理得到至少一个会话层,包括:
70.s21:识别所述数据集合中相邻的两个埋点数据的触发时间的时间差,将超过预置的时间阈值的时间差设为目标时间差。
71.本步骤中,通过设置时间阈值,例如:30分钟,用来识别用户在服务器中所进行的会话。
72.s22:以所述目标时间差对应的两个埋点数据作为会话分界线,使所述数据集合中处于所述会话分界线两侧的埋点数据划分成两个会话层,其中,所述目标时间差对应的一个埋点数据划归为所述两个会话层中的一个会话层,所述目标时间差对应的另一个埋点数据划归为所述两个会话层中的另一个会话层。
73.示例性地,时间阈值为30分钟,用户m在9点-10点对服务器n进行了访问,依次访问了页面a-页面b-页面j-页面b-页面f-页面b-页面e-页面b-页面j其中,在9点-10点之间任意两个页面触发的时间间隔均不超过30分钟;用户在12点-14点对服务器进行了访问,依次访问了页面a-页面b-页面f-页面b-页面j-页面b-页面f,其中,在12点-14点之间任意两个页面触发的时间间隔均不超过30分钟;用户在17点-19点对服务器进行访问,依次访问了页面a-页面c-页面t-页面c-页面r-页面c-页面t,在17点-19点之间任意两个页面触发的时间间隔均不超过30分钟。
74.那么,就将页面a-页面b-页面j-页面b-页面f-页面b-页面e-页面b-页面j作为会话层1,将页面a-页面b-页面f-页面b-页面j-页面b-页面f作为会话层2,将页面a-页面c-页面t-页面c-页面r-页面c-页面t作为会话层3。
75.s203:识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层
中的出现次数的连续统计数据,其中,所述连续行为是表征用户端在服务器中连续触发的页面和/或进程的埋点数据。
76.为识别所述会话层中能够表征用户端的操作行为的埋点数据,本步骤通过识别会话层中的连续行为的方式,识别会话层中表征用户端在服务器中连续触发的页面和/或进程的埋点数据,通过pandas计数工具计算连续行为在会话层中出现的次数,并汇总所述次数形成所述连续统计数据。其中,pandas的主要数据结构是series(一维数据)与dataframe(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。
77.于本实施例中,采用pandas的value_counts()函数可以对series里面的每个值进行计数并且排序。
78.在一个优选的实施例中,所述识别所述会话层中的连续行为,包括:
79.s31:将所述会话层中相邻的两个埋点数据的用户行为设为一个连续行为。
80.示例性地,会话层1中的连续行为分别为:页面a-页面b页面b-页面j页面j-页面b页面b-页面f页面f-页面b页面b-页面e页面e-页面b页面b-页面j;
81.会话层2中的连续行为分别为:页面a-页面b页面b-页面f页面f-页面b页面b-页面j页面j-页面b页面b-页面f;
82.会话层3中的连续行为分别为:页面a-页面c页面c-页面t页面t-页面c页面c-页面r页面r-页面c页面c-页面t。
83.s32:计算各所述连续行为在所述会话层中出现的次数并汇总形成所述会话层的连续统计数据。
84.示例性地,会话层1的连续统计数据为:
85.页面a-页面b:1
86.页面b-页面j:2
87.页面j-页面b:1
88.页面b-页面f:1
89.页面f-页面b:1
90.页面b-页面e:1
91.页面e-页面b:1
92.会话层2的连续统计数据为:
93.页面a-页面b:1
94.页面b-页面f:2
95.页面f-页面b:1
96.页面b-页面j:1
97.页面j-页面b:1
98.会话层3的连续统计数据为:
99.页面a-页面c:1
100.页面c-页面t:2
101.页面t-页面c:1
102.页面c-页面r:1
103.页面r-页面c:1
104.s204:识别所述连续统计数据的会话行为,根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案,其中,所述会话行为是表征了所述会话层中主要出现的连续行为。
105.为实现获得表征所述用户具体行为习惯,以便于后续管理端根据该行为习惯优化页面和产品,本步骤通过识别所述连续统计数据的会话行为,根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案的方式,对各会话层的会话行为进行排列组合得到至少一个会话序列,其中,一个会话序列表征了用户对该服务器的一种行为可能性,整合所述至少一个会话序列得到所述行为方案,所述行为方案包含了用户对在该服务器中所有可能的操作,进而有利于管理端及时捕捉用户的行为习惯,进而提高了数据分析效率和准确度。
106.在一个优选的实施例中,所述识别所述连续统计数据的会话行为,根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案,包括:
107.s41:获取一个会话层,将所述会话层的连续统计数据中出现次数最高的连续行为设为所述会话层的会话行为。
108.本步骤中,通过获取会话层的连续统计系统中次数最高的连续行为作为所述会话行为,用以表征用户在会话层对应的会话中主要进行的操作,以重点识别出用户在该会话中的主要行为。
109.s42:汇总所述用户id的所有会话层的会话行为形成会话集合。
110.本步骤中,将所述会话行为进行汇总形成所述会话集合,用以获得用户在服务器的多次会话中主要进行的操作的集合。
111.s43:对所述会话集合中的会话行为进行排列组合得到会话序列,汇总所述会话序列得到所述行为方案。
112.本步骤中,通过对各所述会话行为进行排列组合得到会话序列,其中,一个会话序列表征了用户后续在服务器中进行操作的可能性。因此,所述行为方案中则记载了用户后续在服务器中进行操作的所有可能性。
113.示例性地,基于上述举例,会话层1的会话行为是:页面b-页面j:2,会话层2的会话行为是:页面b-页面f:2,会话层3的会话行为是:页面c-页面t:2。
114.按照上述技术方案获得的行为方案包括:
115.会话序列1:页面b-页面j-页面b-页面f-页面c-页面t;
116.会话序列2:页面b-页面j-页面c-页面t-页面b-页面f;
117.会话序列3:页面b-页面f-页面b-页面j-页面c-页面t;
118.会话序列4:页面b-页面f-页面c-页面t-页面b-页面j;
119.会话序列5:页面c-页面t-页面b-页面j-页面b-页面f;
120.会话序列6:页面c-页面t-页面b-页面f-页面b-页面j。
121.s205:汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端。
122.为识别用户在各次会话中连续触发页面和/或按钮的操作,以便于管理端根据所述操作构建相应于所述用户的用户画像,本步骤通过汇总各所述会话层的连续统计数据形
成行为统计数据的方式,整合用户在各会话层中操作的连续行为,通过将所述行为统计数据录入预置的数据模板得到行为统计信息的方式,将完整展示用户在各会话层中连续行为的行为统计信息发送至所述管理端,使所述管理端根据所述行为统计信息识别用户的行为习惯,以便于所述管理端根据所述行为统计信息构建相应于所述用户的用户画像,不仅能够从海量的埋点数据中快速捕捉表征用户行为习惯的关键数据,提高了用户行为识别效率,进而有利于降低构建用户画像的算力消耗,还避免了人工分析埋点数据的情况发生,提高了数据分析效率,避免了人工成本投入巨大的情况发生。
123.在一个优选的实施例中,所述汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端,包括:
124.s51:提取所述会话层的会话编号,将所述会话编号作为所述会话层的连续统计数据的名称,使所述连续统计数据转为会话统计数据,汇总各所述会话统计数据形成所述行为统计数据。
125.本步骤中,所述会话编号是所述会话层的唯一性标识,例如:会话层1,会话层2等。
126.s52:获取数据模板,将所述行为统计数据的会话编号、连续行为和所述连续行为的出现次数录入所述数据模板,使所述数据模板转为采用表格形式展示所述行为统计数据的行为统计信息。
127.本步骤中,将所述行为统计数据的会话编号录入所述数据模板的第一表格中,将所述行为统计数据中连续统计数据的连续行为录入所述数据模板的第二表格中,将所述连续行为在所述会话层中出现的次数录入所述数据模板的第三表格中。
128.s53:提取所述数据模板中的数据联系信息,将所述行为统计信息发送至相应于所述联系信息的管理端。
129.本步骤中,所述数据联系信息是预置的所述数据模板中的联系方式,其用于保证所述行为统计信息能够发送至有权查看的管理端,所述数据联系信息为邮箱、手机号、微信号中的任意一种或两种及两种以上的组合。
130.s206:将所述行为方案录入预置的方案模板得到用户行为信息,将所述用户行为信息发送至管理端。
131.为便于管理端能够直观的获得用户在服务器中可能进行的操作,本步骤通过将所述行为方案录入预置的方案模板得到用户行为信息的方式,将所述行为方案以方案模板中预置的格式进行布局得到所述用户行为信息,并将所述用户行为信息发送至管理端,以便于提高管理端理解所述行为方案的效率。
132.在一个优选的实施例中,所述将所述行为方案录入预置的方案模板得到用户行为信息,将所述用户行为信息发送至管理端,包括:
133.s61:提取所述行为方案中的一个会话序列,将所述会话序列中的埋点数据设为会话数据,其中,所述会话序列是由所述会话数据按照会话排序排列而成。
134.示例性地,会话序列1:页面b-页面j-页面b-页面f-页面c-页面t,那么将页面b、页面j、页面b、页面f、页面c、页面t作为所述会话数据,将b-j-b-f-c-t作为会话排序。
135.s62:获取方案模板;
136.将所述会话数据按照所述会话序列依次录入所述方案模板中,使所述方案模板转
为采用图像方式展示所述会话序列的方案展示信息;或
137.将所述会话数据对应的页面或按钮按照所述会话序列依次录入所述方案模板中,使所述方案模板转为采用图像方式展示所述会话序列的方案展示信息;或
138.将所述会话数据对应的页面或按钮的截图,按照所述会话序列依次录入所述方案模板中,使所述方案模板转为采用图像方式展示所述会话序列的方案展示信息;
139.本步骤中,采用图片或pdf格式将所述会话数据、或所述会话数据对应的页面或按钮、或所述会话数据对应页面或按钮的截图录入所述方案模板,使所述方案模板转为采用图像方式展示所述会话序列的方案展示信息。
140.s63:汇总所述行为方案的各所述会话序列的方案展示信息得到所述用户行为信息。
141.s64:提取所述方案模板中的方案联系信息,将所述用户行为信息发送至与所述方案联系信息对应的管理端。
142.本步骤中,所述方案联系信息是预置的所述方案模板中的联系方式,其用于保证所述用户行为信息能够发送至有权查看的管理端,所述方案联系信息为邮箱、手机号、微信号中的任意一种或两种及两种以上的组合。
143.优选的,所述将所述行为方案录入预置的方案模板得到用户行为信息之后,所述方法还包括:
144.将所述用户行为信息上传至区块链中。
145.需要说明的是,基于用户行为信息得到对应的摘要信息,具体来说,摘要信息由用户行为信息进行散列处理得到,比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息,以便查证用户行为信息是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
146.实施例三:
147.请参阅图4,本实施例的一种用户行为识别装置1,包括:
148.数据输入模块11,用于获取埋点数据,提取用户id的埋点数据并汇总形成所述用户id的数据集合;
149.数据分层模块12,用于对所述数据集合进行分层处理得到至少一个会话层,其中,所述会话层记载了用户端对服务器进行会话时所生成的埋点数据;
150.连续统计模块13,用于识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层中的出现次数的连续统计数据,其中,所述连续行为是表征用户端在服务器中连续触发的页面和/或进程的埋点数据;
151.统计反馈模块15,用于汇总各所述会话层的连续统计数据形成行为统计数据,将所述行为统计数据录入预置的数据模板得到行为统计信息,将所述行为统计信息发送至管理端。
152.可选的,所述数据分层模块12,包括:
153.时间戳识别单元121,用于识别所述数据集合中相邻的两个埋点数据的触发时间的时间差,将超过预置的时间阈值的时间差设为目标时间差。
154.会话分层单元122,用于以所述目标时间差对应的两个埋点数据作为会话分界线,使所述数据集合中处于所述会话分界线两侧的埋点数据划分成两个会话层,其中,所述目标时间差对应的一个埋点数据划归为所述两个会话层中的一个会话层,所述目标时间差对应的另一个埋点数据划归为所述两个会话层中的另一个会话层。
155.可选的,所述连续统计模块13包括:
156.连续识别单元131,用于将所述会话层中相邻的两个埋点数据的用户行为设为一个连续行为。
157.连续统计单元132,用于计算各所述连续行为在所述会话层中出现的次数并汇总形成所述会话层的连续统计数据。
158.可选的,所述用户行为识别装置1还包括:
159.行为方案模块14,用于识别所述连续统计数据的会话行为,根据各所述会话层的会话行为构建至少具有一个会话序列的行为方案,其中,所述会话行为是表征了所述会话层中主要出现的连续行为。
160.可选的,所述行为方案模块14包括:
161.行为识别单元141,用于获取一个会话层,将所述会话层的连续统计数据中出现次数最高的连续行为设为所述会话层的会话行为。
162.会话汇总单元142,用于汇总所述用户id的所有会话层的会话行为形成会话集合。
163.方案构建单元143,用于对所述会话集合中的会话行为进行排列组合得到会话序列,汇总所述会话序列得到所述行为方案。
164.可选的,所述统计反馈模块15,包括:
165.行为统计单元151,用于提取所述会话层的会话编号,将所述会话编号作为所述会话层的连续统计数据的名称,使所述连续统计数据转为会话统计数据,汇总各所述会话统计数据形成所述行为统计数据。
166.数据模板单元152,用于获取数据模板,将所述行为统计数据的会话编号、连续行为和所述连续行为的出现次数录入所述数据模板,使所述数据模板转为采用表格形式展示所述行为统计数据的行为统计信息。
167.统计反馈单元153,用于提取所述数据模板中的数据联系信息,将所述行为统计信息发送至相应于所述联系信息的管理端。
168.可选的,所述用户行为识别装置1还包括:
169.方案反馈模块16,用于将所述行为方案录入预置的方案模板得到用户行为信息,将所述用户行为信息发送至管理端。
170.可选的,所述方案反馈模块16包括:
171.序列提取单元161,用于提取所述行为方案中的一个会话序列,将所述会话序列中的埋点数据设为会话数据,其中,所述会话序列是由所述会话数据按照会话排序排列而成。
172.方案模板单元162,用于获取方案模板;
173.将所述会话数据按照所述会话序列依次录入所述方案模板中,使所述方案模板转为采用图像方式展示所述会话序列的方案展示信息;或
174.将所述会话数据对应的页面或按钮按照所述会话序列依次录入所述方案模板中,使所述方案模板转为采用图像方式展示所述会话序列的方案展示信息;或
175.将所述会话数据对应的页面或按钮的截图,按照所述会话序列依次录入所述方案模板中,使所述方案模板转为采用图像方式展示所述会话序列的方案展示信息;
176.行为汇总单元163,用于汇总所述行为方案的各所述会话序列的方案展示信息得到所述用户行为信息;
177.方案反馈单元164,用于提取所述方案模板中的方案联系信息,将所述用户行为信息发送至与所述方案联系信息对应的管理端。
178.本技术方案应用于大数据的数据采集领域,通过代码埋点获取埋点数据并汇总形成数据集合,对所述数据集合进行分层处理得到至少一个会话层,识别所述会话层中的连续行为,构建记载所述连续行为及其在所述会话层中的出现次数的连续统计数据,实现埋点追踪的技术效果。
179.实施例四:
180.为实现上述目的,本发明还提供一种计算机设备5,实施例三的用户行为识别装置的组成部分可分散于不同的计算机设备中,计算机设备5可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个应用服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于:可通过系统总线相互通信连接的存储器51、处理器52,如图5所示。需要指出的是,图5仅示出了具有组件-的计算机设备,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
181.本实施例中,存储器51(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器51可以是计算机设备的内部存储单元,例如该计算机设备的硬盘或内存。在另一些实施例中,存储器51也可以是计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。当然,存储器51还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中,存储器51通常用于存储安装于计算机设备的操作系统和各类应用软件,例如实施例三的用户行为识别装置的程序代码等。此外,存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
182.处理器52在一些实施例中可以是中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制计算机设备的总体操作。本实施例中,处理器52用于运行存储器51中存储的程序代码或者处理数据,例如运行用户行为识别装置,以实现实施例一和实施例二的用户行为识别方法。
183.实施例五:
184.为实现上述目的,本发明还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序
被处理器52执行时实现相应功能。本实施例的计算机可读存储介质用于存储实现所述用户行为识别方法的计算机程序,被处理器52执行时实现实施例一和实施例二的用户行为识别方法。
185.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
186.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
187.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1