一种误报检测的方法以及系统与流程

文档序号:14684199发布日期:2018-06-12 23:02阅读:184来源:国知局
一种误报检测的方法以及系统与流程

本发明涉及数据处理的技术领域,特别是涉及一种误报检测的方法和一种误报检测的系统。



背景技术:

随着互联网技术的发展,用户可以通过浏览器进行银行账户查询、网上购物、电子商务等操作,但用户在上网冲浪浏览网页的同时,也经常会遭遇到如钓鱼网站的等恶意网站的攻击。

在具体实现中,可以通过安全软件对恶意网站进行识别,但安全网站的识别结果可能会存在误报的情况。误报是指本地引擎将正常的网站识别为恶意网站的现象,在相关技术中,通常采用人工反馈误报的方式发现误报,但这种人工反馈的方式时效性较低。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种误报检测的方法和相应的一种误报检测的系统。

依据本发明的一个方面,提供了一种误报检测的方法,所述方法包括:

接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;

基于所述标识信息,获取所述危险网站的多维特征信息;

结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

可选地,所述特征信息包括多维的特征信息,所述结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果的步骤包括:

确定符合误报规则的特征信息;

获取所述符合误报规则的特征信息的数量或者比例;

若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;

若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。

可选地,所述特征信息包括属性信息;

所述确定符合误报规则的特征信息的步骤包括:

判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;

若是,则判定所述标识信息和/或所述属性信息符合误报规则;

若否,则判定所述标识信息和/或所述属性信息不符合误报规则。

可选地,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;

所述判断所述标识信息和/或所述属性信息是否在预置的白名单列表中的步骤包括:

判断所述ICP备案信息是否在预置的ICP备案白名单列表中;

和/或,

判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;

和/或,

判断所述URL信息是否在预置的网址白名单列表中。

可选地,所述特征信息包括统计信息;

所述确定符合误报规则的特征信息的步骤包括:

根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。

可选地,所述统计信息包括如下信息的至少一种:

所述危险网站的页面浏览量和/或独立访客量;

所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;

所述危险网站的子站数量和/或URL数量;

所述危险网站中进入搜索引擎的实际记录数;

获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。

可选地,所述根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则的步骤包括:

若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;

和/或,

当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;

和/或,

当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;

和/或,

当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;

和/或,

若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。

可选地,所述识别引擎位于客户端和/或服务器端;所述方法还包括:

向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。

可选地,所述危险网站包括如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站。

依据本发明的另一个方面,提供了一种误报检测的系统,所述系统包括:

识别结果信息接收模块,适于接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;

特征信息获取模块,适于基于所述标识信息,获取所述危险网站的多维特征信息;

误报判断模块,适于结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

可选地,所述特征信息包括多维的特征信息,所述误报判断模块包括:

符合误报规则的特征信息确定子模块,适于确定符合误报规则的特征信息;

判定子模块,适于获取所述符合误报规则的特征信息的数量或者比例;若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。

可选地,所述特征信息包括属性信息;

所述符合误报规则的特征信息确定子模块包括:

白名单判断单元,适于判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。

可选地,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;

所述白名单判断单元还适于:

判断所述ICP备案信息是否在预置的ICP备案白名单列表中;

和/或,

判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;

和/或,

判断所述URL信息是否在预置的网址白名单列表中。

可选地,所述特征信息包括统计信息;

所述符合误报规则的特征信息确定子模块包括:

统计信息判断单元,适于根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。

可选地,所述统计信息包括如下信息的至少一种:

所述危险网站的页面浏览量和/或独立访客量;

所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;

所述危险网站的子站数量和/或URL数量;

所述危险网站中进入搜索引擎的实际记录数;

获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。

可选地,所述统计信息判断单元还适于:

若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;

和/或,

当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;

和/或,

当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;

和/或,

当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;

和/或,

若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。

可选地,所述识别引擎位于客户端和/或服务器端;所述系统还包括:

检测结果返回模块,适于向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。

可选地,所述危险网站包括如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站。

依据本发明的另一个方面,提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法的步骤。

依据本发明的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。

在本发明实施例中,当防误报系统接收到识别结果信息时,可以根据该识别结果获取危险网站的多维特征信息,并根据该多维特征信息以及预设的误报规则,判断该识别结果信息是否为误报的识别结果,防误报检测的过程结合多维特征信息进行检测,提高了误报检测的准确率,并进一步提升了恶意网站检测的准确率,保证了网络安全。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的一种误报检测的方法实施例的步骤流程图;

图2示出了根据本发明一个实施例的一种误报检测的系统实施例的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

参照图1,示出了根据本发明一个实施例的一种误报检测的方法实施例的步骤流程图,本发明实施例可以应用于第三方安全应用程序的防误报系统中,具体可以包括如下步骤:

步骤101,接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;

在具体实现中,该识别引擎可以位于客户端和/或服务器中,客户端或者服务器端可以通过其自身的识别引擎对用户的上网行为进行监控以及识别,以检测用户的上网行为是否存在危险。

当识别引擎识别出用户的上网行为存在危险,例如,用户访问的网站为危险网站时,可以获取该危险网站的标识信息,根据该标识信息生成识别结果信息,并将该识别结果信息发送至防误报系统,由防误报系统进行防误报确认。

在实际中,该识别引擎可以包括规则引擎和/或学习引擎。

作为一种示例,该危险网站可以包括但不限于如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站等恶意网站。

不同类型的危险网站具有不同的识别引擎。

例如,针对钓鱼网站,可以通过钓鱼识别引擎进行识别,如果某个网站的特征信息命中钓鱼识别引擎中的钓鱼识别规则,则可以判定该网站为钓鱼网站。

针对挂载有挖矿脚本的网站,可以通过挖矿识别引擎进行识别,如果某个网站的JS脚本命中挖矿识别引擎中的挖矿识别规则,则可以判定该网站为挂载有挖矿脚本的网站。

针对挂载有木马的网站,可以通过木马识别引擎进行识别,如果某个网站命中木马识别引擎中的木马识别规则,则可以判定该网站为挂载有木马的网站。

防误报系统接收来自客户端或者服务器端发送的识别结果信息以后,可以根据该识别结果信息进行防误报检测。

步骤102,基于所述标识信息,获取所述危险网站的多维特征信息;

防误报系统可以从识别结果信息中获取危险网站的标识信息,并根据该标识信息,进行数据挖掘和分析,得到该危险网站的特征信息。

在一种实施方式中,防误报系统可以根据全网的搜索数据结合预设的黑名单数据,进行数据挖掘,得到危险网站的特征信息。

作为一种示例,危险网站的标识信息可以包括URL信息、域名信息等。

在本发明实施例中,该特征信息可以是多个维度的特征信息,作为一种示例,该特征信息可以包括通过查询获得的属性信息、通过统计得到的统计信息等。

进一步的,作为一种示例,该属性信息可以包括如下信息的至少一种:所述危险网站的网络内容服务商ICP(Internet Content Provider,网络内容服务商)备案信息、WHOIS信息等。

该统计信息可以包括如下信息的至少一种:

所述危险网站的页面浏览量PV和/或独立访客量UV;

所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;

所述危险网站的子站数量和/或URL数量;

所述危险网站中进入搜索引擎的实际记录数;

获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。

需要说明的是,上述的特征信息只是本发明实施例的一种示例说明,本领域技术人员根据实际需求定义其他维度的特征信息均是可以的,本发明实施例对此不作限定。

步骤103,结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

在具体实现中,防误报系统可以结合危险网站的标识信息和/或特征信息以及预设的误报规则来判断对应的识别结果信息是否存在误报。

在本发明实施例的一种优选实施例中,步骤103可以包括如下子步骤:

子步骤S11,确定符合误报规则的特征信息;

本发明实施例中的特征信息为多维的特征信息,防误报系统可以分别将对每种特征信息与对应的误报规则进行比较,确定符合误报规则的特征信息。

在本发明实施例的一种优选实施例中,如果特征信息为属性信息,则子步骤S11可以包括如下子步骤:

判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。

具体的,上述的白名单判断方式,至少可以包括如下情况的至少一种或结合:

(1)判断所述ICP备案信息是否在预置的ICP备案白名单列表中;

在具体实现中,防误报系统中可以设置有ICP备案白名单列表,其中包含了通过验证的ICP备案信息。

如果危险网站的ICP备案信息在该ICP备案白名单列表中,则表示该危险网站实际为通过验证的网站,其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。如果危险网站的ICP备案信息不在该ICP备案白名单列表中,则该危险网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

(2)判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;

在具体实现中,防误报系统中可以设置有WHOIS注册白名单列表,其中包含了通过验证的域名信息。

如果危险网站的WHOIS信息在该WHOIS注册白名单列表中,则表示该危险网站的域名实际为通过验证的域名,其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。如果危险网站的WHOIS信息不在该WHOIS注册白名单列表中,则该危险网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

(3)判断所述URL信息是否在预置的网址白名单列表中。

在具体实现中,防误报系统中可以设置有网址白名单列表,其中包含了采集的知名站点的网址信息。

如果危险网站的URL信息在该网址白名单列表中,则表示该危险网站实际为知名网站,其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。如果危险网站的URL信息不在该网址白名单列表中,则该危险网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

在本发明实施例的另一种优选实施例中,如果特征信息为统计信息,则子步骤S11可以包括如下子步骤:

根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。

具体的,上述的通过统计信息进行误报判断的方式,至少可以包括如下情况的至少一种或结合:

(4)若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则。

具体的,如果该危险网站的PV和/或UV数据都较大,大于预设的阈值的情况下,表示该网站的访问量大,受欢迎的程度较高,则其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。否则,如果PV或者UV数据都较低,则表示该网站受欢迎的程度较低,则该危险网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

(5)当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;

在具体实现中,可以设置网站黑名单列表,根据危险网站的标识信息可以获取危险网站下的所有子站和/或URL的信息,并将该子站和/或URL的信息与网站黑名单列表进行匹配,如果存在匹配项,则将匹配的子站或者URL作为黑站,匹配完成以后,可以计算黑站的数量,并根据黑站的数量与该危险网站的总子站数量,计算黑站比例。

如果该黑站数量和/或黑站比例都较小,小于预设的阈值的情况下,表示该网站为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。否则,如果该黑站数量和/或黑站比例都较大,则表示该网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

(6)当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;

如果该危险网站下的子站数量和/或URL数量都较大,大于预设的阈值的情况下,表示该网站的结构比较复杂,模仿难度大,其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。否则,如果危险网站下的子站数量和/或URL数量都较少,表示该网站的结构比较简单,模仿难度小,则表示该网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

(7)当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;

具体的,进入搜索引擎的实际记录数可以为该网站或其子站被搜索引擎抓取的记录的数量。如果该危险网站下进入搜索引擎的实际记录数较大,大于预设的阈值的情况下,表示该网站为比较受欢迎的网站,其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。否则,如果危险网站下的进入搜索引擎的实际记录数较少,则表示该网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

(8)若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。

具体的,注册时长大于预设的时间阈值的网站,表示其注册时间比较早,通常注册时间比较早的网站很难被攻击,所以如果该危险网站下的注册时长大于预设的时间阈值,表示该网站注册时间比较早,其为危险网站的概率比较低,即其识别结果信息为误判的结果的可能性比较大,符合误报规则。否则,如果危险网站下的注册时长小于或等于预设的时间阈值,表示该网站注册时间比较晚,则表示该网站确认为恶意网站的概率比较大,即针对危险网站的识别结果信息为误报的结果的可能性较低,不符合误报规则。

需要说明的是,本发明实施例并不限于上述的特征信息的判断方式,本领域技术人员根据实际需求定义其他与特征信息匹配的误报规则均是可以的,本发明实施例对此不作限定。

子步骤S12,获取所述符合误报规则的特征信息的数量或者比例;

子步骤S13,若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;

子步骤S14,若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。

在本发明实施例中,为了提高防误报系统的检测准确度,可以结合上述特征信息中的至少两种特征信息(包括全部)的判断结果进行最终的防误报判断,例如,如果上述(1)-(8)的情况中,可以设定阈值,当上述八种判断方式中,判定符合误报规则的特征信息的数量或者比例超过该阈值,才判定该识别结果信息为误判的结果,如果低于阈值,则判定该识别结果信息不为误判的结果。

在本发明实施例的一种优选实施例中,还可以包括如下步骤:

向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。

具体的,防误报系统进行防误报检测得到检测结果以后,可以将该检测结果返回客户端和/或服务器,以通知客户端和/或服务器其识别结果是否存在误报。其中,该第一检测结果为防误报系统判定识别结果信息为误报的识别结果时生成的检测结果;该第二检测结果为防误报系统判定该识别结果信息不为误报的识别结果时生成的检测结果。

客户端和/或服务器接收到该检测结果以后,可以根据该检测结果进行相应的后续操作。例如,如果该检测结果为第一检测结果,则客户端和/或服务器可以基于该识别结果信息对应的网站的信息,进行识别引擎的更新,以提高识别引擎的识别准确度。如果该检测结果为第二检测结果,则客户端和/或服务器可以阻断对该网站的访问,避免给用户造成损失,提高访问的安全性。

在本发明实施例中,当防误报系统接收到识别结果信息时,可以根据该识别结果获取危险网站的多维特征信息,并根据该多维特征信息以及预设的误报规则,判断该识别结果信息是否为误报的识别结果,防误报检测的过程结合多维特征信息进行检测,提高了误报检测的准确率,并进一步提升了恶意网站检测的准确率,保证了网络安全。

对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

参照图2,示出了根据本发明一个实施例的一种误报检测的系统实施例的结构框图,所述系统可以包括如下模块:

识别结果信息接收模块201,适于接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;

特征信息获取模块202,适于基于所述标识信息,获取所述危险网站的多维特征信息;

误报判断模块203,适于结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

在本发明实施例的一种优选实施例中,所述特征信息包括多维的特征信息,所述误报判断模块203包括如下子模块:

符合误报规则的特征信息确定子模块,适于确定符合误报规则的特征信息;

判定子模块,适于获取所述符合误报规则的特征信息的数量或者比例;若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。

在本发明实施例的一种优选实施例中,所述特征信息包括属性信息;

所述符合误报规则的特征信息确定子模块包括如下单元:

白名单判断单元,适于判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。

在本发明实施例的一种优选实施例中,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;

所述白名单判断单元还适于:

判断所述ICP备案信息是否在预置的ICP备案白名单列表中;

和/或,

判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;

和/或,

判断所述URL信息是否在预置的网址白名单列表中。

在本发明实施例的一种优选实施例中,所述特征信息包括统计信息;

所述符合误报规则的特征信息确定子模块可以包括如下单元:

统计信息判断单元,适于根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。

在本发明实施例的一种优选实施例中,所述统计信息包括如下信息的至少一种:

所述危险网站的页面浏览量和/或独立访客量;

所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;

所述危险网站的子站数量和/或URL数量;

所述危险网站中进入搜索引擎的实际记录数;

获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。

在本发明实施例的一种优选实施例中,所述统计信息判断单元还适于:

若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;

和/或,

当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;

和/或,

当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;

和/或,

当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;

和/或,

若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。

在本发明实施例的一种优选实施例中,所述识别引擎位于客户端和/或服务器端;所述系统还可以包括如下模块:

检测结果返回模块,适于向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。

在本发明实施例的一种优选实施例中,所述危险网站包括如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站。

对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本发明实施例还公开了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现图1所述方法的步骤。

本发明实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现图1所述方法的步骤。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的误报检测的终端设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明公开了A1、一种误报检测的方法,所述方法包括:

接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;

基于所述标识信息,获取所述危险网站的多维特征信息;

结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

A2、如A1所述的方法,所述特征信息包括多维的特征信息,所述结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果的步骤包括:

确定符合误报规则的特征信息;

获取所述符合误报规则的特征信息的数量或者比例;

若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;

若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。

A3、如A1或A2所述的方法,所述特征信息包括属性信息;

所述确定符合误报规则的特征信息的步骤包括:

判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;

若是,则判定所述标识信息和/或所述属性信息符合误报规则;

若否,则判定所述标识信息和/或所述属性信息不符合误报规则。

A4、如A3所述的方法,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;

所述判断所述标识信息和/或所述属性信息是否在预置的白名单列表中的步骤包括:

判断所述ICP备案信息是否在预置的ICP备案白名单列表中;

和/或,

判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;

和/或,

判断所述URL信息是否在预置的网址白名单列表中。

A5、如A1-A4任一项所述的方法,所述特征信息包括统计信息;

所述确定符合误报规则的特征信息的步骤包括:

根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。

A6、如A5所述的方法,所述统计信息包括如下信息的至少一种:

所述危险网站的页面浏览量和/或独立访客量;

所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;

所述危险网站的子站数量和/或URL数量;

所述危险网站中进入搜索引擎的实际记录数;

获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。

A7、如A6所述的方法,所述根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则的步骤包括:

若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;

和/或,

当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;

和/或,

当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;

和/或,

当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;

和/或,

若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。

A8、如A1或A2或A3或A4或A6或A7所述的方法,所述识别引擎位于客户端和/或服务器端;所述方法还包括:

向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。

A9、如A1或A2或A3或A4或A6或A7所述的方法,所述危险网站包括如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站。

本发明还公开了B10、一种误报检测的系统,所述系统包括:

识别结果信息接收模块,适于接收识别结果信息,所述识别结果信息包括识别引擎识别出的危险网站的标识信息;

特征信息获取模块,适于基于所述标识信息,获取所述危险网站的多维特征信息;

误报判断模块,适于结合所述标识信息和/或所述特征信息以及预设的误报规则,判断所述识别结果信息是否为误报的识别结果。

B11、如B10所述的系统,所述特征信息包括多维的特征信息,所述误报判断模块包括:

符合误报规则的特征信息确定子模块,适于确定符合误报规则的特征信息;

判定子模块,适于获取所述符合误报规则的特征信息的数量或者比例;若所述数量大于或等于第一预设阈值和/或所述比例大于或等于第二预设阈值,则判定所述识别结果信息为误报的识别结果;若所述数量小于第一预设阈值和/或所述比例小于第二预设阈值,则判定所述识别结果信息不为误报的识别结果。

B12、如B10或B11所述的系统,所述特征信息包括属性信息;

所述符合误报规则的特征信息确定子模块包括:

白名单判断单元,适于判断所述标识信息和/或所述属性信息是否在预置的白名单列表中;若是,则判定所述标识信息和/或所述属性信息符合误报规则;若否,则判定所述标识信息和/或所述属性信息不符合误报规则。

B13、如B12所述的系统,所述标识信息包括URL信息,所述属性信息包括如下信息的至少一种:所述危险网站的网络内容服务商ICP备案信息、WHOIS信息;

所述白名单判断单元还适于:

判断所述ICP备案信息是否在预置的ICP备案白名单列表中;

和/或,

判断所述WHOIS信息是否在预置的WHOIS注册白名单列表中;

和/或,

判断所述URL信息是否在预置的网址白名单列表中。

B14、如B10-B13任一项所述的系统,所述特征信息包括统计信息;

所述符合误报规则的特征信息确定子模块包括:

统计信息判断单元,适于根据所述统计信息以及对应的统计阈值的比较结果,确定所述统计信息是否符合误报规则。

B15、如B14所述的系统,所述统计信息包括如下信息的至少一种:

所述危险网站的页面浏览量和/或独立访客量;

所述危险网站的服务器IP地址下的黑站数量和/或黑站比例;

所述危险网站的子站数量和/或URL数量;

所述危险网站中进入搜索引擎的实际记录数;

获取WHOIS注册时间后,计算的所述WHOIS注册时间距离当前时间的注册时长。

B16、如B15所述的系统,所述统计信息判断单元还适于:

若所述页面浏览量大于预设浏览量阈值,和/或,所述独立访客量大于预设独立访客量阈值,则判定所述统计信息符合误报规则;

和/或,

当所述服务器IP地址下的黑站数量小于预设黑站数量阈值,和/或,所述黑站比例小于预设比例值,则判定所述统计信息符合误报规则;

和/或,

当所述子站数量大于预设的子站阈值,和/或,所述URL数量大于预设的URL阈值,则判定所述统计信息符合误报规则;

和/或,

当所述进入搜索引擎的实际记录数大于预设的记录数阈值,则判定所述统计信息符合误报规则;

和/或,

若所述注册时长大于预设的时间阈值,则判定所述统计信息符合误报规则。

B17、如B10或B11或B12或B13或B15或B16所述的系统,所述识别引擎位于客户端和/或服务器端;所述系统还包括:

检测结果返回模块,适于向所述客户端和/或服务器端返回检测结果,所述检测结果包括第一检测结果或者第二检测结果,所述第一检测结果为判定所述识别结果信息为误报的识别结果时生成的检测结果;所述第二检测结果为判定所述识别结果信息不为误报的识别结果时生成的检测结果。

B18、如B10或B11或B12或B13或B15或B16所述的系统,所述危险网站包括如下网站的至少一种:钓鱼网站、挂载有挖矿脚本的网站、挂载了木马的网站。

本发明还公开了C19、一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现A1至A9任一项所述方法的步骤。

本发明还公开了D20、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现A1至A9任一项所述方法的步骤。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1