本发明涉及信息网络,尤其涉及一种虚拟专用网络的流量确定方法、装置以及存储介质。
背景技术:
1、在网络传输的过程中,使用网络爬虫的方式获取网络数据是一种较为方便的方式,可以通过网络爬虫获取大量的目标网站节点的流量。一方面,通过用户与目标网站之间建立虚拟专用网络进行访问的一类目标网站数量庞大,并且基于网络安全的原因,需要对其网络流量进行检测。
2、针对此类目标网站,使用网络爬虫的方式来大量获取其虚拟专用网络流量,可能被作为一种高效的,用于识别用户以与目标网站之间的网络流量的技术选项。
3、然而,此类特定类型的目标网站,由于其采用了ss/ssr/v2ray等加密通信协议,网站自身具备多样性和隐匿性等特点。此外,用户的通信链路均采用https协议被进行了通信加密,因此无法直接使用网络爬虫的方式针对其虚拟专用网络流量进行爬取。
技术实现思路
1、本发明提供了一种虚拟专用网络的流量确定方法、装置以及存储介质,以解决采用虚拟专用网络进行网络通信的网络流量不能被获取以及解析的技术问题。
2、根据本发明的一方面,提供了一种虚拟专用网络的流量确定方法,该方法包括:
3、获取参考网站对应的网站特征数据,基于所述网站特征数据获取与所述参考网站对应的目标网站数据,其中,所述参考网站为通过虚拟专用网络访问的网站,所述目标网站数据至少包括与所述虚拟专用网络对应的定位链接数据;
4、基于所述定位链接数据确定与所述虚拟专用网络对应的节点服务器信息;
5、获取网站访问数据,基于所述网站访问数据和所述节点服务器信息确定所述虚拟专用网络的流量数据。
6、根据本发明的另一方面,提供了一种虚拟专用网络的流量确定装置,该装置包括:
7、目标网站数据获取模块,用于获取参考网站对应的网站特征数据,基于所述网站特征数据获取与所述参考网站对应的目标网站数据,其中,所述参考网站为通过虚拟专用网络访问的网站,所述目标网站数据至少包括与所述虚拟专用网络对应的定位链接数据;
8、服务器信息确定模块,用于基于所述定位链接数据确定与所述虚拟专用网络对应的节点服务器信息;
9、流量数据确定模块,用于获取网站访问数据,基于所述网站访问数据和所述节点服务器信息确定所述虚拟专用网络的流量数据。
10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的虚拟专用网络的流量确定方法。
14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的虚拟专用网络的流量确定方法。
15、本发明实施例的技术方案,首先通过获取参考网站对应的网站特征数据,基于所述网站特征数据获取与所述参考网站对应的目标网站数据,其中,所述参考网站为通过虚拟专用网络访问的网站,所述目标网站数据至少包括与所述虚拟专用网络对应的定位链接数据。基于已知的通过虚拟专用网络访问的网站的特征数据获取到了目标网站的定位链接数据。然后基于所述定位链接数据确定与所述虚拟专用网络对应的节点服务器信息,获取到了目标网站中虚拟专用网络对应的节点服务器信息。最后获取网站访问数据,基于所述网站访问数据和所述节点服务器信息确定所述虚拟专用网络的流量数据。解决了通过用户与目标网站之间建立虚拟专用网络进行访问的目标网站的虚拟专用网络流量无法被识别和分析的问题,取得了实现对虚拟专用网络流量进行识别和分析有益效果。
16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
1.一种虚拟专用网络的流量确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述定位链接数据确定与所述虚拟专用网络对应的节点服务器信息,包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述网站特征数据获取与所述参考网站对应的目标网站数据,包括:
4.根据权利要求3所述的方法,其特征在于,所述页面关联信息包括页面内容数据和/或页面结构信息;所述基于所述页面关联信息从所述候选网站数据中确定出目标网站数据,包括:
5.根据权利要求1所述的方法,其特征在于,在所述基于所述定位链接数据确定与所述虚拟专用网络对应的节点服务器信息之后,还包括:
6.根据权利要求5所述的方法,其特征在于,所述基于所述网站访问数据和所述节点服务器信息确定所述虚拟专用网络的流量数据,包括:
7.根据权利要求1所述的方法,其特征在于,其中,所述获取参考网站对应的网站特征数据,包括:
8.一种虚拟专用网络的流量确定装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的虚拟专用网络的流量确定方法。