用户访问行为数据的特征提取方法及系统与流程

文档序号:40575042发布日期:2025-01-03 11:40阅读:27来源:国知局
用户访问行为数据的特征提取方法及系统与流程

本发明涉及用户访问行为数据分析,尤其是涉及用户访问行为数据的特征提取方法及系统。


背景技术:

1、用户访问行为数据是指用户在访问网站、使用应用程序或其他在线服务时所留下的数据痕迹。这些数据对于企业来说非常宝贵,可以帮助企业更好地理解用户需求、优化产品设计、提升用户体验、制定营销策略等。

2、现有的用户访问行为数据管理一般是基于服务器自动记录访问日志,例如apache的access.log或nginx的access.log等实现,上述管理方法不能准确分析用户意图,还有甚至通过捕获用户拍摄工具进行用户兴趣分析的,通过拍摄用户头像配合眼睛朝向来分析兴趣点,或通过录音工具来获取用户语音信息,对语音信息进行关键词分析获得用户兴趣点,这些手段都涉嫌侵犯用户隐私,也不符合gdpr、ccpa等法规。

3、而且日志文件可能非常大,分析困难;无法追踪用户的具体行为,只能看到页面访问情况。


技术实现思路

1、为了解决上述用户访问行为数据分析的技术问题,本发明提供用户访问行为数据的特征提取方法及系统。采用如下的技术方案:

2、用户访问行为数据的特征提取方法,包括以下步骤:

3、步骤1,获取用户所浏览当前网页页面数据和用户访问行为数据;

4、步骤2,提取用户访问行为数据的关键特征数据,关键特征数据包括当前页面停留时间数据、鼠标滑动轨迹数据、鼠标顿点时间数据和鼠标点击数据;

5、步骤3,分析当前页面停留时间数据是否大于最小停留时间阈值,若大于则进行用户访问行为分析,得到基于当前网页页面数据和关键特征数据的当前兴趣画像数据,并基于当前兴趣画像数据在当前页面进行弹窗导向推荐;

6、步骤4,若判断当前页面停留时间数据小于等于最小停留时间阈值,则判断用户对用户所浏览当前网页不感兴趣,基于用户历史兴趣画像在当前页面进行弹窗导向推荐,弹窗导向推荐内容基于弹窗导向推荐数据库生成。

7、通过采用上述技术方案,由于法律法规限制,不能直接获取用户画面和声音数据,这里的用户访问行为数据重点关注当前页面停留时间数据和鼠标滑动轨迹数据,若当前页面停留时间数据是小于等于最小停留时间阈值,例如最小停留时间阈值可以设计1秒,在1秒钟的时间就关闭或者进入其它页面,则认为是用户对当前网页信息完全不关注;

8、若大于最小停留时间阈值,则需要收集用户访问行为数据,用户访问行为数据主要是鼠标移动相关的数据,鼠标滑动轨迹数据可以反映用户对当前页面的主要关注点区域,正常情况下,通过鼠标在某行字或者图像下方或侧方往复滑动代表了用户的主要关注点,也就是兴趣点,因此通过鼠标滑动轨迹数据的分析可以准确获得用户在浏览当前网页过程的关注点,再结合鼠标滑动轨迹数据对应的当前网页页面数据就可以进行兴趣关联的关键词获取,从而实现针对性的弹窗导向推荐,对于同一个用户记录其每次浏览网页的弹窗导向推荐数据就可以形成用户历史兴趣画像数据;

9、对于当前网页不感兴趣的弹窗导向推荐可以基于用户历史兴趣画像数据进行推荐引导;

10、大幅提升用户访问行为分析的准确性,避免大水漫灌式的推荐导致用户反感。

11、可选的,步骤2中,从用户打开当前网页页面开始计时,若在最小停留时间阈值内用户关闭当前网页页面则直接执行步骤4。

12、可选的,步骤1中,若超过最小停留时间阈值当前网页页面仍然处于打开状态,则采用以下步骤获取当前网页页面数据:

13、步骤11,使用javascript工具访问和操作网页的文档对象模型;

14、步骤12,使用javascript工具来获取当前url的查询参数、页面的滚动位置和视口大小信息;

15、步骤13,使用performance api工具来获取页面导航和加载时间的详细度量;

16、步骤14,使用浏览器的开发者工具获得网络请求、页面资源、dom元素数据。

17、通过采用上述技术方案,获取当前页面数据通常涉及前端开发技术,可以使用javascript工具获取网页的文档对象模型,从而获得当前url的查询参数、页面的滚动位置和视口大小信息,为后续鼠标轨迹在页面上的定位提供基础数据;

18、使用performance api工具来获取页面导航和加载时间的详细度量,可以在计算最小停留时间阈值时,考虑加载时间,避免因长时间加载导致的误识别;

19、使用浏览器的开发者工具获得网络请求、页面资源、dom元素数据等,可以为后续关键词的提取提供数据。

20、可选的,步骤1中,采用javascript工具跟踪鼠标滑动轨迹数据,将停留时间超过0.2mm的点记录为顿点,形成顿点集合,并将顿点按照时间顺序连接为轨迹曲线,即为鼠标滑动轨迹数据;将顿点集合嵌入停顿时间后即为鼠标顿点时间数据。

21、可选的,步骤3用户访问行为分析包括以下步骤;

22、步骤31,分析鼠标滑动轨迹数据,若鼠标起点和鼠标点击点之间存在的顿点数少于等于2个,则直接提取鼠标点击点的鼠标点击数据,获取鼠标点击数据的对应页面资源,并基于对应页面资源执行弹窗导向推荐操作;

23、步骤32,若顿点数大于2个,使用傅里叶描述符、zernike矩或hog描述轨迹的形状,判断是否存在往复折线,若存在则提取往复折线,则判断往复折线是横线还是竖线,若是横线则提取横线上方矩形区域对应页面资源,若是竖线则将往复的折线处理为粗竖线,取粗竖线中心为圆点,提取半径为r的圆形区域内的对应页面资源,并基于对应页面资源执行弹窗导向推荐操作。

24、可选的,步骤32中,计算横线上方矩形区域的方法是:

25、设矩形区域的底边起点是往复折线最上面一根横线的左端点,最上面一根横线的右端点为矩形区域的底边终点;

26、设最上面一根横线的长度为a,则矩形区域底边长为a,侧边长为;

27、计算圆形区域的半径r的方法是:

28、将往复折线处理成粗竖线,取粗竖线的中心点为圆点,计算粗竖线的长度为c,宽度为b,则,其中n为范围调整系数,在1到5之间取值。

29、通过采用上述技术方案,用户在操作鼠标浏览当前网页时,在一些点会形成顿点,这些顿点通常停留时间较短,但是会大于0.2mm时间,将这些顿点数据形成顿点集合,在具体应用时将顿点集合嵌入停顿时间后即为鼠标顿点时间数据,还可以设置顿点时间阈值,通过检测若存在鼠标顿点时间超过顿点时间阈值,可以获取附近网页页面对应关键词信息进行弹窗导向推荐;

30、将顿点按照时间顺序连接为轨迹曲线,可以对这些轨迹曲线进行形状分析,若存在往复折线,往复折线可能是横线,也可能是折线,大概率用户对这些关联区域的网页信息感兴趣,从而实现从用户的访问行为精准获得用户的关注点;

31、对于往复横线,用户通常关注的是横线上方区域,在处理往返横线时,可以将横线标准化,例如将往返横线标准化成水平粗横线,取水平粗横线的最上边代替最上面一根横线,采用矩形区域的底边长为a,侧边长为,基本可以覆盖关注区域内容;

32、对于往复竖折线,用户的关注点位于竖折线两边都有可能,因此采用圆形区域来获得关联区域的网页信息。

33、可选的,弹窗导向推荐操作包括以下步骤:提取对应页面资源的关键词,在弹窗导向推荐数据库内进行关键词匹配,将匹配成功的兴趣导向关键词进行环绕式弹窗推荐,先确定匹配成功的兴趣导向关键词数量,使用javascript工具创建并显示多个推荐方块,将多个推荐方块环绕显示在当前鼠标光标周围。

34、可选的,弹窗导向推荐操作中,方块采用淡入或旋转的方式出现,创建动态的视觉反馈效果,根据需要调整动画的持续时间、类型和复杂度。

35、通过采用上述技术方案,弹窗导向推荐操作具体应用过程中形式上做限制,弹窗导向推荐的区域是环绕在当前鼠标的周围,可以进行淡入或旋转的方式出现,具体应用时可以进行透明度的调整,当推荐方块形成后就固定位置,用户移动鼠标可以进行点击,尽量避免对用户当前操作产生干扰。

36、用户访问行为数据的特征提取系统,包括多个用户智能终端、服务器计算机和数据库存储器,所述服务器计算机分别与多个用户智能终端网络通信连接,多个用户智能终端分别通过网络访问服务器计算机的网页,服务器计算机安装采用用户访问行为数据的特征提取方法设计的程序,运行程序或用户智能终端的用户所浏览当前网页页面数据和用户访问行为数据,并基于弹窗导向推荐数据库存储的弹窗导向推荐数据进行弹窗导向推荐。

37、可选的,弹窗导向推荐数据包括推荐关键词文本、关键词配套图形数据和关键词链接数据。

38、通过采用上述技术方案,推荐数据库内还存储用户名数据对应的每次弹窗导向推荐数据,每次弹窗导向推荐数据就可以形成用户历史兴趣画像数据。

39、综上所述,本发明包括以下至少一种有益技术效果:

40、本发明能提供用户访问行为数据的特征提取方法及系统,用户访问行为数据重点关注当前页面停留时间数据和鼠标滑动轨迹数据;若大于最小停留时间阈值,则需要收集用户访问行为数据,用户访问行为数据主要是鼠标移动相关的数据,鼠标滑动轨迹数据可以反映用户对当前页面的主要关注点区域,通过鼠标滑动轨迹数据的分析准确获得用户在浏览当前网页过程的关注点,再结合鼠标滑动轨迹数据对应的当前网页页面数据就可以进行兴趣关联的关键词获取,从而实现针对性的弹窗导向推荐,对于同一个用户记录其每次浏览网页的弹窗导向推荐数据就可以形成用户历史兴趣画像数据;对于当前网页不感兴趣的弹窗导向推荐可以基于用户历史兴趣画像数据进行推荐引导;大幅提升用户访问行为分析的准确性,避免大水漫灌式的推荐导致用户反感。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1