本发明属于网络加密流量的网站指纹识别,涉及一种基于知识融合的双分支原型网络网站指纹识别系统和方法。
背景技术:
1、随着互联网的日益普及,人们能够通过浏览网页获取信息,也可以在网上进行社交娱乐或者从事商业活动。但网络给生活带来巨大便利的同时,也带来了个人隐私泄露风险等问题。为了保护用户的隐私和敏感信息,各种各样的隐私增强技术(privacyenhancing technologie,pet)被集成到互联网节点中,用来保护合法用户权益。隐私增强技术主要包括tor代理、shadowsocks代理、anonymizer(匿名者)、i2p(匿名网络项目)、ssh(security shell)代理、jap匿名代理、stunnel软件、vpn(虚拟专用网络)和tls/ssl协议等。
2、由于隐私增强技术具有的独特优势,用户都可以使用该技术手段来隐藏自己的上网行为,这给网络安全带来了极大的挑战。对这些利用了隐私增强技术的上网行为的监管是必要但是颇有难度的,为了实现对特定目标行为的监管,网站指纹识别(websitefingerprinting identification,wf)技术应运而生。网站指纹识别认为即使网络流量是加密的,不同网站的资源加载仍然是有区分度的。因此,监管员可以提前对感兴趣的网站进行特征的学习,识别时只需要判断用户流量是否与监控网站的特征模式相同。研究员将网站指纹识别形式化为一个多分类问题,不断精进使用的机器学习算法,实现了95%以上的识别准确率。然而,传统的网站指纹识别技术仍然存在着无法利用少量辅助数据集、极少量目标数据集在跨域场景下进行准确网站指纹识别的技术问题。
技术实现思路
1、针对上述传统方法中存在的问题,本发明提出了一种基于知识融合的双分支原型网络网站指纹识别系统以及一种基于知识融合的双分支原型网络网站指纹识别系统,能够利用少量辅助数据集、极少量目标数据集在跨域场景下进行准确的网站指纹识别。
2、为了实现上述目的,本发明实施例采用以下技术方案:
3、一方面,提供一种基于知识融合的双分支原型网络网站指纹识别系统,包括:
4、流量数据处理模块,用于获取网页浏览行为产生的流量数据并以pcap的格式保存;
5、输入模块,用于读取流量数据作为网站识别的输入数据;
6、kp-wf网站识别模块,用于接入输入数据并利用训练好的双分支原型网络网站指纹识别模型进行网站类别预测,输出网页浏览行为对应的网站类别;双分支原型网络网站指纹识别模型由基于流量定制增强的kp-wf网站指纹元训练获得的高维特征提取器和基于高维特征提取器的主干网络特征提取器参数进行kp-wf网站指纹元测试构建的逻辑回归分类器组成。
7、另一方面,还提供一种基于知识融合的双分支原型网络网站指纹识别方法,包括步骤:
8、获取网页浏览行为产生的流量数据并以pcap的格式保存;
9、读取流量数据作为网站识别的输入数据;
10、接入输入数据并利用训练好的双分支原型网络网站指纹识别模型进行网站类别预测,输出网页浏览行为对应的网站类别;双分支原型网络网站指纹识别模型由基于流量定制增强的kp-wf网站指纹元训练获得的高维特征提取器和基于高维特征提取器的主干网络特征提取器参数进行kp-wf网站指纹元测试构建的逻辑回归分类器组成。
11、又一方面,还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的基于知识融合的双分支原型网络网站指纹识别方法的步骤。
12、再一方面,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的基于知识融合的双分支原型网络网站指纹识别方法的步骤。
13、上述技术方案中的一个技术方案具有如下优点和有益效果:
14、上述基于知识融合的双分支原型网络网站指纹识别系统和方法,通过在构建基于一维神经网络模型的网站指纹识别特征提取器的基础上,利用小样本学习的方法,结合原型网络思想,将流量数据样本转化为一维方向序列,利用神经网络从一维方向序列中提取高维特征并基于流量定制增强进行kp-wf(knowledge based two-branch prototypicalnetwork website fingerprinting,基于知识的两分支原型网络网站指纹识别)网站指纹元训练以优化高维特征提取器,使双分支原型网络网站指纹识别模型能够在小规模的数据集中学习到小样本分类能力。在获得高维特征提取器之后,利用高维特征提取器的主干网络特征提取器参数以极少量样本建立逻辑回归分类器,以获得在目标任务中的分类能力,最终建立了双分支的模型结构。利用该训练好的双分支原型网络网站指纹识别模型进行网站类别预测,基于模型结构能够利用少量辅助数据集、少量目标数据集在跨域场景下进行准确的网站指纹识别。
1.一种基于知识融合的双分支原型网络网站指纹识别系统,其特征在于,包括:
2.根据权利要求1所述的基于知识融合的双分支原型网络网站指纹识别系统,其特征在于,还包括:
3.根据权利要求1或2所述的基于知识融合的双分支原型网络网站指纹识别系统,其特征在于,还包括:
4.一种基于知识融合的双分支原型网络网站指纹识别方法,其特征在于,包括步骤:
5.根据权利要求4所述的基于知识融合的双分支原型网络网站指纹识别方法,其特征在于,还包括步骤:
6.根据权利要求4或5所述的基于知识融合的双分支原型网络网站指纹识别方法,其特征在于,还包括步骤:
7.一种计算机设备,包括存储器和处理器,其特征在于,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求4至6任一项所述的基于知识融合的双分支原型网络网站指纹识别方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求4至6任一项所述的基于知识融合的双分支原型网络网站指纹识别方法的步骤。