一种钓鱼网站的识别方法及装置的制造方法

文档序号:9730173阅读:300来源:国知局
一种钓鱼网站的识别方法及装置的制造方法
【专利说明】一种钓鱼网站的识别方法及装置
[0001]
技术领域
[0002]本发明涉及一种钓鱼网站的识别方法及装置。
[0003]
【背景技术】
[0004]钓鱼网站通常指伪装成银行及电子商务,窃取用户提交的银行帐号、密码等私密信息的网站,可用电脑管家进行查杀。“钓鱼”是一种网络欺诈行为,指不法分子利用各种手段,仿冒真实网站的URL地址以及页面内容,或利用真实网站服务器程序上的漏洞在站点的某些网页中插入危险的HTML代码,以此来骗取用户银行或信用卡账号、密码等私人资料。
[0005]“钓鱼网站”的频繁出现,严重地影响了在线金融服务、电子商务的发展危害公众利益,影响公众应用互联网的信心。钓鱼网站通常伪装成为银行网站,窃取访问者提交的账号和密码信息给人们的生活带来了很大的不便,严重威胁了人们的财产安全。
[0006]针对相关技术中的问题,目前尚未提出有效的解决方案。
[0007]

【发明内容】

[0008]本发明的目的是提供一种钓鱼网站的识别方法及装置,以克服目前现有技术存在的上述不足。
[0009]本发明的目的是通过以下技术方案来实现:
一种钓鱼网站的识别方法,包括如下步骤:
接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据;
根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记;
根据获取的待测网站数据中的关键词和所述基准数据库中的关键词进行比较,当网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。
[0010]进一步的:判断带设备网站为钓鱼网站具体包括如下步骤:
将待测网站的数据中的域名信息和基准数据库中的域名信息进行比较;
当待测网站的域名信息在基准数据库中标记为黑名单时,判断该待测网站为钓鱼网站;
进一步的,钓鱼网站的判断方法还包括如下步骤:
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典,当在你基准数据库中找不到所述带待测网站的域名信息的时候利用c4.5算法将该域名信息和所述数据词典进行相似性分析,并且得出可能仿冒的域名信息;
对于相似度高的域名,则将该网站的icon信息、表单名称,以及关键数据和所述基准数据库的信息进行比较,如果上述信息一致,判定该待测网站为钓鱼网站。
[0011]进一步的,将判断为钓鱼网站的网站信息重新录入基准数据库。
[0012]一种钓鱼网站的识别装置,包括信息获取装置、基准数据库处理装置以及钓鱼网站判断装置;其中:
信息获取装置:用于接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据;
基准数据库处理装置:用于根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记;
钓鱼网站判断装置:用于根据获取的待测网站数据中的关键词和所述基准数据库中的关键词进行比较,当待测网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。
[0013]本发明的有益效果为:通过将待测网站的数据信息和基准数据库中的信息比较通过标记的黑名单信息判断贵网站是否为钓鱼网站,解决了客户端信息部署困难的问题,更提高了钓鱼网站的识别率。
[0014]
【附图说明】
[0015]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0016]图1是根据本发明实施例的钓鱼网站的识别方法的流程图。
[0017]
【具体实施方式】
[0018]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
[0019]如图1所示,根据本发明的实施例所述的一种钓鱼网站的识别方法,包括如下步骤:
接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据;
根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记;
根据获取的待测网站数据中的关键词和所述基准数据库中的关键词进行比较,当网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。
[0020]进一步的,判断带设备网站为钓鱼网站具体包括如下步骤: 将待测网站的数据中的域名信息和基准数据库中的域名信息进行比较;
当待测网站的域名信息在基准数据库中标记为黑名单时,判断该待测网站为钓鱼网站;
根据常见的英文单词、机构简写、以及各种专业术语生成数据词典,当在你基准数据库中找不到所述带待测网站的域名信息的时候利用c4.5算法将该域名信息和所述数据词典进行相似性分析,并且得出可能仿冒的域名信息;
对于相似度高的域名,则将该网站的icon信息、表单名称,以及关键数据和所述基准数据库的信息进行比较,如果上述信息一致,判定该待测网站为钓鱼网站。
[0021]其中,相似度高的域名的判断方法包括,根据最小编辑算法,距离小于三的域名,比如www.boc.cn和www.bOc.cn,这两个域名只有ο和0的差别,编辑距离为一。
[0022]进一步的,将判断为钓鱼网站的网站信息重新录入基准数据库。
[0023]一种钓鱼网站的识别装置,包括信息获取装置、基准数据库处理装置以及钓鱼网站判断装置;其中:
信息获取装置:用于接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据;
基准数据库处理装置:用于根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记;
钓鱼网站判断装置:用于根据获取的待测网站数据中的关键词和所述基准数据库中的关键词进行比较,当待测网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。
[0024]综上所述,借助于本发明的上述技术方案,通过将待测网站的数据信息和基准数据库中的信息比较通过标记的黑名单信息判断贵网站是否为钓鱼网站,解决了客户端信息部署困难的问题,更提高了钓鱼网站的识别率。
[0025]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种钓鱼网站的识别方法,其特征在于,包括如下步骤: 接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据; 根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记; 根据获取的待测网站数据中的关键词和所述基准数据库中的关键词进行比较,当待测网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。2.根据权利要求1所述的钓鱼网站的识别方法,其特征在于:判断该设备网站为钓鱼网站具体包括如下步骤: 将待测网站的数据中的域名信息和基准数据库中的域名信息进行比较; 当待测网站的域名信息在基准数据库中标记为黑名单时,判断该待测网站为钓鱼网站。3.根据权利要求2所述的钓鱼网站的识别方法,其特征在于,钓鱼网站的判断方法还包括如下步骤: 根据常见的英文单词、机构简写、以及各种专业术语生成数据词典,当在基准数据库中找不到所述待测测网站的域名信息的时候利用c4.5算法将该域名信息和所述数据词典进行相似性分析,并且得出可能仿冒的域名信息; 对于相似度高的域名,则将该网站的icon信息、表单名称,以及关键数据和所述基准数据库的信息进行比较,如果上述信息一致,判定该待测网站为钓鱼网站。4.根据权利要求3所述的钓鱼网站的识别方法,其特征在于,将判断为钓鱼网站的网站信息重新录入基准数据库。5.—种钓鱼网站的识别装置,其特征在于,包括信息获取装置、基准数据库处理装置以及钓鱼网站判断装置;其中: 信息获取装置:用于接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据; 基准数据库处理装置:用于根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记; 钓鱼网站判断装置:用于根据获取的待测网站数据中的关键词和所述基准数据库中的关键词进行比较,当待测网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。
【专利摘要】本发明公开了一种钓鱼网站的识别方法,包括如下步骤:接收所有待测网站的访问请求,并且获取待测网站的域名信息、icon信息、表单名称,以及关键数据;根据常用支付网站和金融网站域名信息、icon信息、表单名称,以及关键数据生成基准数据库;并且对所述基准数据库中的各类信息进行黑名单和白名单的标记;根据获取的网站数据中的关键词和所述基准数据库中的关键词进行比较,当网站数据信息在数据库中的显示为黑名单时,判定所述待识别网站为钓鱼网站。本发明的有益效果为:通过将待测网站的数据信息和基准数据库中的信息比较通过标记的黑名单信息判断贵网站是否为钓鱼网站,解决了客户端信息部署困难的问题,更提高了钓鱼网站的识别率。
【IPC分类】H04L29/06
【公开号】CN105491031
【申请号】CN201510854764
【发明人】储来斌
【申请人】睿峰网云(北京)科技股份有限公司
【公开日】2016年4月13日
【申请日】2015年11月30日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1