本技术各实施例属于互联网,尤其涉及一种网络机器人识别方法及装置。
背景技术:
1、随着网络技术的飞速发展,网络机器人的应用日益广泛,它们不仅为互联网带来了便利和效率,也伴随着潜在的风险和挑战。精准识别网络机器人能够帮助我们区分真实用户与自动化程序,从而有效防范网络欺诈、保护用户隐私、维护网络秩序。
2、然而,现有网络机器人的识别过程繁琐,不利于提高网络机器人的识别效率。其原因在于,现有技术主要采用人工识别的方式,对网络机器人进行识别,而人工识别通常需要依赖数据比对,这不仅耗时耗力,而且容易受到人为因素的影响,因此不利于提高网络机器人的识别效率。
技术实现思路
1、本技术实施例提供一种网络机器人识别方法及装置,以解决上述现有网络机器人的识别过程繁琐,不利于提高网络机器人的识别效率的技术问题。
2、第一方面,本技术实施例提供了一种网络机器人识别方法,所述网络机器人识别方法包括:
3、获取目标网站的第一页面的页面元素和页面内容;
4、获取随机生成的异常链接,将所述页面元素、所述页面内容以及所述异常链接填入预设的html模板中,生成第二页面;
5、在所述第二页面上,将所述异常链接的当前状态设置为不可见状态,生成第三页面;
6、获取客户端设备在访问所述第三页面时发送的访问请求,获取所述访问请求的访问链接;
7、当所述访问链接为所述异常链接时,将所述访问请求标记为异常请求,获取预设时间内所述异常请求的统计数量;
8、当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人。
9、本技术实施例有益效果在于两方面,一方面,当所述访问链接为所述异常链接时,将所述访问请求标记为异常请求,获取预设时间内所述异常请求的统计数量;当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人,由于无需人工识别,因此减少了网络机器人的识别时间,有利于提高网络机器人的识别效率;另一方面,由于通过自动识别,不会受到人为因素的影响,因此有利于提升识别所述网络机器人的可靠性。
10、在第一方面的一种可能的实现方式中,所述获取目标网站的第一页面的页面元素和页面内容,包括:
11、获取所述目标网站的网站文件,解析所述网站文件,得到所述网站文件的网站内容;
12、在所述网站内容中获取所述第一页面的所述页面元素和所述页面内容。
13、在本技术实施例中,由于所述第一页面的所述页面元素和所述页面内容有通用性,因此用户无需重新编写所述页面元素和所述页面内容,有利于减少用户的工作量。
14、在第一方面的一种可能的实现方式中,所述获取随机生成的异常链接,将所述页面元素、所述页面内容以及所述异常链接填入预设的html模板中,生成第二页面,包括:
15、获取随机生成的所述异常链接,获取所述异常链接对应的异常标识,获取所述页面元素对应的页面标识,获取所述页面内容对应的内容标识;
16、获取所述异常标识对应的第一位置,获取所述页面标识对应的第二位置,获取所述内容标识对应的第三位置;
17、在所述html模板中,将所述异常链接填入所述第一位置中,将所述页面元素填入所述第二位置中,将所述页面内容填入所述第三位置中,生成所述第二页面,所述第一位置、所述第二位置、所述第三位置为不同的位置。
18、在本技术实施例中,在所述html模板中,将所述异常链接填入所述第一位置中,将所述页面元素填入所述第二位置中,将所述页面内容填入所述第三位置中,生成所述第二页面,简化了携带有异常链接的第二页面的生成过程,有利于提高携带有异常链接的第二页面的生成效率。
19、在第一方面的一种可能的实现方式中,所述在所述第二页面上,将所述异常链接的当前状态设置为不可见状态,生成第三页面,包括:
20、在所述第二页面上,通过调整所述异常链接的透明度至最大值,将所述异常链接的当前状态设置为不可见状态,生成所述第三页面;
21、或者,在所述第二页面上,通过控制所述页面元素或所述页面内容覆盖所述异常链接,将所述异常链接的当前状态设置为不可见状态,生成所述第三页面。
22、在本技术实施例中,将所述异常链接的当前状态设置为不可见状态,这样能确保所述异常链接在显示过程中没有被误点击,有利于维护网络的安全与稳定。
23、在第一方面的一种可能的实现方式中,所述获取客户端设备在访问所述第三页面时发送的访问请求,获取所述访问请求的访问链接,包括:
24、读取预设的获取时间,判断当前时间是否为所述获取时间;
25、如果当前时间为所述获取时间,就获取用户设备在访问所述第三页面时发送的所述访问请求,获取所述访问请求的所述访问链接。
26、在本技术实施例中,如果当前时间为所述获取时间,就获取用户设备在访问所述第三页面时发送的所述访问请求,获取所述访问请求的所述访问链接,这样可以确保获取访问链接的及时性。在第一方面的一种可能的实现方式中,所述当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人,包括:
27、当所述统计数量大于预设数量时,向所述网络机器人发送验证码,获取所述验证码的验证结果;
28、判断所述验证结果是否为预设结果;
29、当所述验证结果不为所述预设结果时,识别所述用户设备为所述网络机器人。
30、在本技术实施例中,当所述验证结果不为所述预设结果时,识别所述用户设备为所述网络机器人,这样能减少网络机器人的识别时间,有利于提高网络机器人的识别效率。
31、在第一方面的一种可能的实现方式中,所述在当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人之后,所述网络机器人识别方法,包括:
32、获取所述网络机器人的ip地址,获取防火墙或路由器的访问控制列表;
33、在所述访问控制列表上添加所述ip地址,拦截来自所述ip地址的网络流量。
34、在本技术实施例中,拦截来自所述ip地址的网络流量,可以有效目标网站免受攻击,确保目标网站的安全性和稳定性。
35、在第一方面的一种可能的实现方式中,所述在当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人之后,所述网络机器人识别方法,包括:
36、获取所述网络机器人的设备标识以及登录账号;
37、获取推送指令,执行所述推送指令,将所述设备标识以及所述登录账号推送到所述目标网站对应的监控系统中。
38、在本技术实施例中,将所述设备标识以及所述登录账号推送到所述目标网站对应的监控系统中,通过监控系统可以监控所述设备标识以及所述登录账号。
39、在第一方面的一种可能的实现方式中,所述在当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人之后,所述网络机器人识别方法,包括:
40、获取所述网络机器人的访问延迟,增大所述访问延迟,直至所述访问延迟达到预设延迟。
41、在本技术实施例中,获取所述网络机器人的访问延迟,增大所述访问延迟,直至所述访问延迟达到预设延迟,可以避免网络机器人干扰目标网站,确保目标网站的安全性和稳定性。
42、第二方面,本技术实施例提供了一种网络机器人识别装置,包括:
43、第一获取模块,用于获取目标网站的第一页面的页面元素和页面内容;
44、第二获取模块,用于获取随机生成的异常链接,将所述页面元素、所述页面内容以及所述异常链接填入预设的html模板中,生成第二页面;
45、设置模块,用于在所述第二页面上,将所述异常链接的当前状态设置为不可见状态,生成第三页面;
46、第三获取模块,用于获取客户端设备在访问所述第三页面时发送的访问请求,获取所述访问请求的访问链接;
47、标记模块,用于当所述访问链接为所述异常链接时,将所述访问请求标记为异常请求,获取预设时间内所述异常请求的统计数量;
48、识别模块,用于当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人。
49、本技术实施例有益效果在于两方面,一方面,当所述访问链接为所述异常链接时,将所述访问请求标记为异常请求,获取预设时间内所述异常请求的统计数量;当所述统计数量大于预设数量时,识别所述客户端设备为网络机器人,由于无需人工识别,因此减少了网络机器人的识别时间,有利于提高网络机器人的识别效率;另一方面,由于通过自动识别,不会受到人为因素的影响,因此有利于提升识别所述网络机器人的可靠性。