本发明涉及电数字数据处理,尤其涉及一种诈骗网站智能联合识别方法及装置。
背景技术:
1、随着互联网的普及和便利性,网络诈骗活动也不断增加。诈骗网站利用欺诈手段获取个人信息、财务信息或进行非法交易,对用户造成了巨大的损失。
2、目前,针对诈骗网站的识别方法主要有以下几种:静态规则匹配、黑白名单检测、数据挖掘和机器学习等。静态规则匹配通过定义规则并与网站进行匹配,例如url包含某些关键词、网站ip所在地等。黑白名单检测则是根据已知的恶意网站或信任网站来判断新的网站是否可信。数据挖掘技术通过分析网站的特征数据,提取出与诈骗网站相关的模式和规律。机器学习技术则通过学习大量数据中的特征和模式,构建分类模型用于判断网站是否为诈骗网站。
3、但是,现有技术中的上述技术方案,对新型诈骗网站的识别效果较差,无法及时准确地识别出这些新型诈骗网站。
技术实现思路
1、本发明提供一种诈骗网站智能联合识别方法及装置,用以解决现有技术中新型诈骗网站识别不及时不精准的技术问题。
2、第一方面,本发明提供一种诈骗网站智能联合识别方法,包括:
3、分别确定待识别网站的流量数据,图片推理结果和文本推理结果;
4、对所述流量数据、所述图片推理结果和所述文本推理结果进行联合挖掘,得到联合挖掘后的特征数据;
5、将所述联合挖掘后的特征数据输入集成学习算法模型进行推理,得到所述待识别网站的识别结果。
6、在一些实施例中,所述确定待识别网站的流量数据,包括:
7、获得待识别网站的统一资源定位符url;
8、基于所述待识别网站的url获取所述待识别网站的流量数据。
9、在一些实施例中,所述流量数据包括以下数据中的一种或多种:
10、网站访问量;
11、网站关联互联网协议ip地址。
12、在一些实施例中,所述确定待识别网站的图片推理结果,包括:
13、获得待识别网站的url;
14、基于所述待识别网站的url获取所述待识别网站的关联图片;
15、将所述关联图片输入至深度学习图片特征提取模型,得到所述深度学习图片特征提取模型输出的图片特征向量;
16、将所述图片特征向量输入至深度学习图片分类模型,得到所述深度学习图片分类模型输出的所述待识别网站的图片推理结果。
17、在一些实施例中,所述关联图片包括以下图片中的一种或多种:
18、网站架构中的图片;
19、网站页面的截图。
20、在一些实施例中,所述确定待识别网站的文本推理结果,包括:
21、获得待识别网站的url;
22、基于所述待识别网站的url获取所述待识别网站的文本内容;
23、将所述文本内容输入至深度学习文本特征提取模型,得到所述深度学习文本特征提取模型输出的文本特征向量;
24、将所述文本特征向量输入至深度学习文本分类模型,得到所述深度学习文本分类模型输出的所述待识别网站的文本推理结果。
25、在一些实施例中,所述基于所述待识别网站的url获取所述待识别网站的文本内容,包括:
26、基于所述待识别网站的url获取所述待识别网站的网站架构中的文本内容和所述待识别网站的关联图片;
27、从所述待识别网站的关联图片中提取文本内容。
28、第二方面,本发明还提供一种诈骗网站智能联合识别装置,包括:
29、数据采集模块,用于分别确定待识别网站的流量数据,图片推理结果和文本推理结果;
30、数据挖掘模块,用于对所述流量数据、所述图片推理结果和所述文本推理结果进行联合挖掘,得到联合挖掘后的特征数据;
31、集成识别模块,用于将所述联合挖掘后的特征数据输入集成学习算法模型进行推理,得到所述待识别网站的识别结果。
32、第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一方面任一种所述诈骗网站智能联合识别方法。
33、第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面任一种所述诈骗网站智能联合识别方法。
34、第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一种所述诈骗网站智能联合识别方法。
35、本发明提供的诈骗网站智能联合识别方法及装置,利用多种特征、数据源,综合多种算法联合识别,以提高诈骗网站的识别准确性和实时性。
1.一种诈骗网站智能联合识别方法,其特征在于,包括:
2.根据权利要求1所述的诈骗网站智能联合识别方法,其特征在于,所述确定待识别网站的流量数据,包括:
3.根据权利要求1或2所述的诈骗网站智能联合识别方法,其特征在于,所述流量数据包括以下数据中的一种或多种:
4.根据权利要求1所述的诈骗网站智能联合识别方法,其特征在于,所述确定待识别网站的图片推理结果,包括:
5.根据权利要求4所述的诈骗网站智能联合识别方法,其特征在于,所述关联图片包括以下图片中的一种或多种:
6.根据权利要求1所述的诈骗网站智能联合识别方法,其特征在于,所述确定待识别网站的文本推理结果,包括:
7.根据权利要求6所述的诈骗网站智能联合识别方法,其特征在于,所述基于所述待识别网站的url获取所述待识别网站的文本内容,包括:
8.一种诈骗网站智能联合识别装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述诈骗网站智能联合识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述诈骗网站智能联合识别方法。