网络产品的信息识别方法、装置及设备与流程

文档序号:19253077发布日期:2019-11-27 20:35阅读:266来源:国知局
网络产品的信息识别方法、装置及设备与流程

本发明实施例涉及互联网技术领域,尤其涉及一种网络产品的信息识别方法、装置及设备。



背景技术:

随着网络通信技术的迅速发展,互联网所承载的信息日益丰富,互联网以及各种网络产品已成为人类社会重要的基础设施。在新的网络漏洞或僵尸网络爆发的时候,安全研究人员可以通过识别被感染病毒的网络产品的厂商以及产品类型等信息,评估受到影响的网络产品的数量以及影响范围。因此,对网络产品的厂商以及产品类型等信息进行识别对维护网络安全有重要意义。

现有技术中,在对网络产品的厂商以及产品类型等信息进行识别时,通常采用正则表达式对网络产品中的文字信息进行匹配。例如:识别网络产品的厂商时,获取网络产品中含有厂商标识的文字信息,分别采用不同厂商对应的正则表达式对获取的文字信息进行匹配,当匹配成功时,确定该网络产品属于该正则表达式对应的厂商。

然而,由于各厂商在网络产品中展示信息的方式、位置和格式各不相同,并且随着产品定制或者升级,信息展示的方式、位置和格式还可能发生变化,使得采用正则表达式进行识别的准确率较低。



技术实现要素:

本发明实施例提供一种网络产品的信息识别方法、装置及设备,用以提高网络产品信息识别的准确率。

第一方面,本发明实施例提供一种网络产品的信息识别方法,包括:

获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息;

访问所述网络地址,获取与所述第一网络产品对应的待识别图片;

将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配;

在所述第一特征信息与所述第二特征信息相匹配的情况下,将所述第二网络产品的属性信息作为所述第一网络产品的待识别信息。

可选的,将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配,包括:

遍历所述基准数据集合中每个第二网络产品,得到每个所述第二网络产品对应的基准图片的第二特征信息;

确定出所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度;

在所述第一特征信息和所述第二特征信息的相似度满足预设条件时,确定所述第一特征信息与所述第二特征信息相匹配。

可选的,所述第一特征信息包括模糊哈希信息和尺寸信息,所述确定出所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度,包括:

根据所述待识别图片的模糊哈希信息与每个所述第二网络产品对应的基准图片的模糊哈希信息,确定所述第一网络产品与每个所述第二网络产品之间的第一相似性;

根据所述待识别图片的尺寸信息与每个所述第二网络产品对应的基准图片的尺寸信息,确定所述第一网络产品与每个所述第二网络产品之间的第二相似性;

根据所述第一相似性和所述第二相似性,确定所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度。

可选的,所述基准数据集合还用于存储每个所述第二网络产品的模糊哈希信息对应的第一权重和尺寸信息对应的第二权重;

所述根据所述第一相似性和所述第二相似性,确定所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度,包括:

根据所述第一相似性、所述第二相似性、所述第一权重和所述第二权重,确定所述第一特征信息与每个所述第二特征信息的相似度;

所述在所述第一特征信息和所述第二特征信息的相似度满足预设条件时,确定所述第一特征信息与所述第二特征信息相匹配,包括:

在所述第一特征信息和所述第二特征信息的相似度大于等于容忍度阈值时,确定所述第一特征信息与所述第二特征信息相匹配。

可选的,所述基准数据集合还用于存储各所述第二网络产品的基准图片的地址信息;所述获取网络地址,包括:

遍历所述基准数据集合中的每个第二网络产品,得到每个所述第二网络产品对应的基准图片的地址信息;

将所述第一网络产品的地址信息与每个所述第二网络产品对应的基准图片的地址信息进行拼接,得到所述网络地址。

第二方面,本发明实施例提供一种网络产品的信息识别装置,包括:

第一获取模块,用于获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息;

第二获取模块,用于访问所述网络地址,获取与所述第一网络产品对应的待识别图片;

识别模块,用于将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配;

所述识别模块,还用于在所述第一特征信息与所述第二特征信息相匹配的情况下,将所述第二网络产品的属性信息作为所述第一网络产品的待识别信息。

可选的,所述识别模块具体用于:

遍历所述基准数据集合中每个第二网络产品,得到每个所述第二网络产品对应的基准图片的第二特征信息;

确定出所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度;

在所述第一特征信息和所述第二特征信息的相似度满足预设条件时,确定所述第一特征信息与所述第二特征信息相匹配。

可选的,所述第一特征信息包括模糊哈希信息和尺寸信息,所述识别模块具体用于:

根据所述待识别图片的模糊哈希信息与每个所述第二网络产品对应的基准图片的模糊哈希信息,确定所述第一网络产品与每个所述第二网络产品之间的第一相似性;

根据所述待识别图片的尺寸信息与每个所述第二网络产品对应的基准图片的尺寸信息,确定所述第一网络产品与每个所述第二网络产品之间的第二相似性;

根据所述第一相似性和所述第二相似性,确定所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度。

可选的,所述基准数据集合还用于存储每个所述第二网络产品的模糊哈希信息对应的第一权重和尺寸信息对应的第二权重;所述识别模块具体用于:

根据所述第一相似性、所述第二相似性、所述第一权重和所述第二权重,确定所述第一特征信息与每个所述第二特征信息的相似度;

在所述第一特征信息和所述第二特征信息的相似度大于等于容忍度阈值时,确定所述第一特征信息与所述第二特征信息相匹配。

可选的,所述基准数据集合还用于存储各所述第二网络产品的基准图片的地址信息:所述第一获取模块具体用于:

遍历所述基准数据集合中的每个第二网络产品,得到每个所述第二网络产品对应的基准图片的地址信息;

将所述第一网络产品的地址信息与每个所述第二网络产品对应的基准图片的地址信息进行拼接,得到所述网络地址。

第三方面,本发明实施例提供一种网络产品的信息识别设备,包括:至少一个处理器和存储器;

所述存储器存储计算机执行指令;

所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的方法。

第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的方法。

本发明实施例提供的网络产品的信息识别方法、装置及设备,该方法包括:获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息;访问所述网络地址,获取与所述第一网络产品对应的待识别图片;将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配;在所述第一特征信息与所述第二特征信息相匹配的情况下,将所述第二网络产品的属性信息作为所述第一网络产品的待识别信息;本实施例中,由于网络产品在升级过程中,图片的变化通常是轻微的,通过将待识别图片的第一特征信息与基准数据集合中存储的各第二网络产品的基准图片的第二特征信息进行匹配,得到第一网络产品的厂商信息和类型信息,与现有技术中基于正则表达式进行匹配相比,能够提高识别准确率,同时,还避免了编写正则表达式导致人力成本高的问题。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的应用场景示意图一;

图2为本发明实施例的应用场景示意图二;

图3为本发明实施例提供的网络产品的信息识别方法的流程示意图一;

图4为本发明实施例提供的网络产品的信息识别方法的流程示意图二;

图5为本发明实施例提供的获取网络地址的流程示意图;

图6为本发明实施例提供的网络产品的信息识别方法的流程示意图三;

图7为本发明实施例提供的网络产品的信息识别装置的结构示意图;

图8为本发明实施例提供的网络产品的信息识别设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

首先结合图1和图2介绍本发明实施例可能的应用场景。

图1为本发明实施例的应用场景示意图一,如图1所示,一种可能的应用场景中,网络中存在多个网络产品,例如:网络产品1至网络产品9。在新的网络漏洞或僵尸网络爆发的时候,当确定某个网络地址对应的网络产品(比如网络产品5)被病毒感染后,可以通过识别得到网络产品5的厂商信息以及类型信息,进而根据厂商信息和类型信息评估网络中受到影响的网络产品的数量以及影响范围。

图2为本发明实施例的应用场景示意图二,如图2所示,另一种可能的应用场景中,网络中包括多个网络产品,例如:网络产品1至网络产品9。基于统计分析或者安全分析的需要,可能需要统计识别出属于同一厂商的网络产品,或者属于同类型的网络产品。因此,可以通过识别得到各网络产品的厂商信息和类型信息,进而可以对这些网络产品按照厂商进行分类,或者按照类型进行分类。

需要说明的是,本发明实施例中的网络产品是指具有万维网(worldwideweb、web)界面的产品。web是一个由许多互相链接的超文本文档组成的系统,分布在世界各地的用户能够通过internet网络对其访问,进行彼此交流和共享信息。在这个系统中,每个有用的事物,被称为一种“资源”,每个资源由一个全局统一资源标识符(uniformresourcelocator,url)标识,这些资源通过超文本传输协议传送给用户,用户通过点击链接来获得这些资源。

具体的,在浏览器中输入该网络产品的网络地址后,该网络产品能够以web界面的方式进行呈现。可以理解的,网络产品的web界面中的资源包括图片和文字。网络产品可以为软件和/或硬件的形式。

其中,网络产品的厂商信息是指生产或者研发该网络产品的商家信息,例如:可以为企业名称、企业地址、企业标识等。网络产品的产品类型是指该网络产品所属的类型,该类型可以为大类,也可以为小类。网络产品的类型的划分方式有多种,例如:可以按照用途划分,也可以按照用户群体划分,还可以按照产品功能划分,本发明实施例对此不作具体限定。一种可选的实施方式中,该网络产品的类型信息还可以为产品型号信息。

现有技术中,在对网络产品的厂商信息和类型信息进行识别时,通常采用正则表达式对网络产品的web界面中的文字信息进行匹配。例如:识别网络产品的厂商时,获取网络产品的web界面中含有厂商标识的文字信息,分别采用不同厂商对应的正则表达式对获取的文字信息进行匹配,当匹配成功时,确定该网络产品属于该正则表达式对应的厂商。

然而,由于各厂商在网络产品的web界面中展示信息的方式、位置和格式各不相同,并且随着产品定制或者升级,信息展示的方式、位置和格式还可能发生变化,使得采用正则表达式进行识别的准确率较低,并且,编写正则表达式还导致人力成本较高。

为了解决上述问题,本发明实施例提供一种网络产品的信息识别方法,与现有技术不同的是,本发明实施例利用待识别网络产品的web界面中图片的特征进行识别,能够提高信息识别的准确率,同时,降低了编写正则表达式带来的人力成本。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。

图3为本发明实施例提供的网络产品的信息识别方法的流程示意图一,本实施例的方法可以由信息识别装置执行,该装置可以为软件和/或硬件的形式。

如图3所示,本实施例的方法,包括:

s301:获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息。

s302:访问所述网络地址,获取与所述第一网络产品对应的待识别图片。

其中,第一网络产品为待识别的网络产品,本实施例的应用场景是识别第一网络产品的待识别信息。其中,待识别信息包括厂商信息和类型信息。当然,其他应用场景中,待识别信息还可以包括其他的信息,本实施例对此不作具体限定。后续仅为厂商信息和类型信息为例进行说明。

第一网络产品的地址信息是指用于确定第一网络设备在互联网中位置的逻辑地址。具体的,第一网络产品的地址信息可以为该网络产品的ip地址。

第二网络产品是已知属性信息的网络产品。具体的,第二网络产品可以是基准数据集合中的任一网络产品。基准数据集合用于存储已知属性信息的至少一个第二网络产品,具体用于存储各第二网络产品的基站图片的特征信息。

本实施例中,第二网络产品对应的基准图片的地址信息是指基准图片的url的后缀,具体的,url中位于ip地址之后的路径信息。示例性的,假设某网络产品的基准图片的url为:http://10.1.1.1/demo/test/logo.png,则该基准图片的地址信息是指:/demo/test/logo.png。需要说明的是,本实施例以及后续实施例中,如无特殊说明,涉及到基准图片的地址信息时均应理解为基准图片的url的后缀信息。

本实施例中,s301中获取的网络地址是指的待识别图片的url地址。可以根据第一网络产品的地址信息和第二网络产品的基准图片的地址信息,得到网络地址,通过访问该网络地址,获取第一网络产品对应的待识别图片。

图5为本发明实施例提供的获取网络地址的流程示意图,如图5所示,作为一种可选的实施方式,本实施例中的s301可以具体包括:

s3011:遍历所述基准数据集合中的每个第二网络产品,得到每个所述第二网络产品对应的基准图片的地址信息;

s3012:将所述第一网络产品的地址信息与每个所述第二网络产品对应的基准图片的地址信息进行拼接,得到所述网络地址。

具体实施过程中,基准数据集合中还用于存储各第二网络产品对应的基准图片的地址信息,例如:某第二网络产品对应的基准图片的地址信息为:/demo/test/logo.png。

假设第一网络产品的地址信息为:10.1.1.1,则将该地址信息与上述第二网络产品对应的基准图片的地址信息进行拼接,得到拼接地址为:10.1.1.1/demo/test/logo.png。

本实施例中,对每个拼接后的网络地址进行访问处理,具体的,利用浏览器对上述拼接后的网络地址进行访问:http://10.1.1.1/demo/test/logo.png,若该拼接后的网络地址能够访问到图片,则将访问到的图片作为第一网络产品的待识别图片。通过上述过程,可以得到一个或者多个待识别图片,若得到多个待识别图片,则针对每个待识别图片继续执行后续步骤进行进一步的匹配。

s303:将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配。

s304:在所述第一特征信息与所述第二特征信息相匹配的情况下,将所述第二网络产品的属性信息作为所述第一网络产品的待识别信息。

其中,基准数据集合还用于存储至少一个第二网络产品的基准图片的特征信息。第二网络产品为已知厂商信息和类型信息的网络产品。

可以理解的,在实际应用中,由于网络产品的定制或者升级的需求,可能定期或者不定期的对网络产品进行更新。例如:对于第一厂商的第一类型的网络产品a,在第一时间升级成为网络产品a1,在第二时间升级成为网络产品a2。进一步的,通常网络产品在升级前后的变化不会具有太大的差别,也就是说,网络产品a2与网络产品a1相比可能发生轻微的变化,例如:某个图片局部渲染、图片大小微调、文字大小调整等。

另外,网络产品的web界面中的资源可以为图片或者文字。其中,图片包括:用于标识产品商标的标识logo图片、背景图片、按钮图片等。

本实施例中,第二网络产品的基准图片可以是第二网络产品在任一时期对应的图片。例如:上述的网络产品a,其基准图片可以是网络产品a1中的logo图片,也可以是网络产品a2中的logo图片,还可以是网络产品a1中的背景图片,还可以是网络产品a2中的背景图片。

可以理解的,第一网络产品对应的待识别图片与第二网络产品的基准图片的类型是相同的。例如:若第二网络产品的基准图片为logo图片,则步骤s302中获取的待识别图片为第一网络产品的logo图片,若第二网络产品的基准图片为背景图片,则步骤s302中获取的待识别图片为第一网络产品的背景图片。

本实施例中通过将第一网络产品对应的待识别图片的第一特征信息与基准数据集合中存储的各第二网络产品的基准图片的第二特征信息进行匹配,并将匹配的第二网络产品的属性信息作为第一网络产品的待识别信息。其中,待识别信息包括厂商信息和类型信息。可以理解的,在其他应用场景中,还可以识别网络产品的其他信息。

可以理解的,由于网络产品在升级过程中,图片的变化通常是轻微的,通过将待识别图片的特征信息与基准数据集合中存储的各第二网络产品的基准图片的特征信息进行匹配,得到第一网络产品的厂商信息和类型信息,与现有技术中基于正则表达式进行匹配相比,能够提高识别准确率,同时,还避免了编写正则表达式导致人力成本高的问题。

其中,特征信息可以是用于表征图片特征的任意信息,包括但不限于图片中的尺寸特征、边缘特征、色彩特征、区域特征、角特征等,可以理解的,上述特征信息均可以通过现有的特征提取算法来获取。

一种可选的实施方式中,特征信息包括模糊哈希信息。模糊哈希信息可以通过模糊哈希算法获取,模糊哈希算法又叫基于内容分割的分片哈希算法(contexttriggeredpiecewisehashing,ctph),主要原理是:使用一个弱哈希计算文件局部内容,在特定条件下对文件进行分片,然后使用一个强哈希对文件每片计算哈希值,取这些值的一部分并连接起来,与分片条件一起构成一个模糊哈希结果。

目前,现有的基于图片特征对网络产品的信息进行识别时,一种可能的实现方式是将待识别图片的消息摘要算法(messagedigestalgorithmmd5)散列哈希信息作为特征信息。然而,由于md5散列哈希的高安全性、适合精确匹配的特点,不同图片计算得到的md5散列哈希的结果是不同的,并且即使两幅图片之间的区别极其微小,两幅图片的md5散列哈希的结果之间的差别也是很大的。因此,在将图片md5散列哈希作为特征信息时,常常出现同一厂商同类型产品由于定制或升级过程中图片发生轻微变化,导致计算出的哈希值与基准数据集合的哈希值不一致,使得匹配失败,产生大量漏报的问题。虽然通过持续收集各种轻微变种的图片的md5散列哈希值存储至基准数据集合中可以解决漏报的问题,但是,会大大增加基准数据集合的维护工作量。

本实施例中,采用模糊哈希信息作为特征信息,当两个图片之间的区别较小时,两个图片的模糊哈希信息之间的差别也较小,当两个图片之间的区别较大时,两个图片的模糊哈希信息之间的差别也较大。因此,可以根据待识别图片的模糊哈希信息和第二网络产品的基准图片的模糊哈希信息之间的相似性,来判断第一网络产品和第二网络产品的相似度,从而解决上述现有技术中的漏报的问题,提高网络产品信息识别的准确率。

具体的,遍历所述基准数据集合中每个第二网络产品,得到每个所述第二网络产品对应的基准图片的第二特征信息;确定出所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度;在所述第一特征信息和所述第二特征信息的相似度满足预设条件时,确定所述第一特征信息与所述第二特征信息相匹配;将相匹配的第二网络产品的属性信息作为所述第一网络产品的待识别信息。

一种可选的实施方式中,基准数据集合中除了存储各第二网络产品的特征信息,还存储各第二网络产品的属性信息,属性信息包括:厂商信息和类型信息。当通过上述判断,确定第一网络产品的待识别图片的第一特征信息与某个第二网络产品的基准图片的第二特征信息匹配时,从基准数据集合中获取该第二网络产品的属性信息,并将该属性信息作为第一网络产品的待识别信息。

本实施例提供的网络产品的信息识别方法,包括:获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息;访问所述网络地址,获取与所述第一网络产品对应的待识别图片;将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配;在所述第一特征信息与所述第二特征信息相匹配的情况下,将所述第二网络产品的属性信息作为所述第一网络产品的待识别信息;本实施例中,由于网络产品在升级过程中,图片的变化通常是轻微的,通过将待识别图片的第一特征信息与基准数据集合中存储的各第二网络产品的基准图片的第二特征信息进行匹配,得到第一网络产品的厂商信息和类型信息,与现有技术中基于正则表达式进行匹配相比,能够提高识别准确率,同时,还避免了编写正则表达式导致人力成本高的问题。

图4为本发明实施例提供的网络产品的信息识别方法的流程示意图二,本实施例对图3所示的实施例进行细化。如图4所示,本实施例的方法包括:

s401:获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息。

s402:访问所述网络地址,获取与所述第一网络产品对应的待识别图片。

本实施例中,s401与s402的具体实施方式与图3所示实施例类似,此处不再赘述。

s403:获取所述待识别图片的第一特征信息,所述第一特征信息包括模糊哈希信息和尺寸信息。

本实施例中,第一特征信息包括模糊哈希信息和尺寸信息,其中,尺寸信息可以具体为图片在长度和宽度方向上的像素数量。

其中,同厂商同类型的网络产品在升级过程中,图片不会完全替换,基本为图片局部细节的轻微变化,升级前后的图片的模糊哈希信息基本一致或者相近,因此,可以利用模糊哈希信息来进行匹配。另外,同厂商同类型的网络产品在升级过程中,图片的尺寸不会进行很大的修改,否则会影响用户的一致性体验,因此,可以利用尺寸信息来进行匹配。

s404:遍历所述基准数据集合中每个第二网络产品,得到每个所述第二网络产品对应的基准图片的第二特征信息。

可以理解的,本实施例中第二特征信息也包括模糊哈希信息和尺寸信息。

s405:根据所述待识别图片的模糊哈希信息与每个所述第二网络产品对应的基准图片的模糊哈希信息,确定所述第一网络产品与每个所述第二网络产品之间的第一相似性。

具体的,可以根据待识别图片的模糊哈希信息和第二网络产品对应的基准图片的模糊哈希信息之间的距离,确定第一网络产品与每个第二网络产品之间的第一相似性。其中,距离可以为欧式距离、曼哈顿距离、切比雪夫距离、马氏距离、余弦距离等。

s406:根据所述待识别图片的尺寸信息与每个所述第二网络产品对应的基准图片的尺寸信息,确定所述第一网络产品与每个所述第二网络产品之间的第二相似性。

具体的,可以根据待识别图片的尺寸信息和第二网络产品对应的基准图片的尺寸信息之间的距离,确定第一网络产品与每个第二网络产品之间的第二相似性。其中,距离可以为欧式距离、曼哈顿距离、切比雪夫距离、马氏距离、余弦距离等。

s407:根据所述第一相似性和所述第二相似性,确定所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度。

一种可选的实施方式中,将第一相似性和第二相似性的均值作为第一网络产品与第二网络产品之间的相似度。

另一种可选的实施方式中,所述基准数据集合还用于存储每个所述第二网络产品的模糊哈希信息对应的第一权重和尺寸信息对应的第二权重,因此,根据所述第一相似性、所述第二相似性、所述第一权重和所述第二权重,分别确定所述第一网络产品与所述第二网络产品之间的相似度。

具体实施过程中,可以根据公式分别确定所述第一网络产品与所述第二网络产品之间的相似度。

其中,h1为所述第一相似性,h2为所述第二相似性,w1为所述第一权重,w2为所述第二权重,th为所述第一网络产品与所述第二网络产品之间的相似度。

s408:在所述第一特征信息和所述第二特征信息的相似度大于等于容忍度阈值时,确定所述第一特征信息与所述第二特征信息相匹配,将匹配的第二网络产品的属性信息作为所述第一网络产品的待识别信息。

其中,容忍度阈值可以根据实际情况合理设置。一种可选的实施方式中,基准数据集合还用于存储该容忍度阈值。各第二网络产品对应的容忍度阈值可以相同或者不同。

可以理解的,对于同厂商同类型的网络产品,在产品升级过程中,对图片的url通常不作修改,也就是说,产品升级前后logo图片对应的url地址是相同的,产品升级前后的背景图片的url地址是相同的。因此,本实施例中,第一网络产品的网络地址与某个第二网络产品的基准图片的url进行拼接得到拼接地址后,若对该拼接地址进行访问能够访问到图片,则说明第一网络产品可能与该第二网络产品的厂商和/或产品类型相同。因此,在执行s404至s408时,也可以直接将第一网络产品的特征信息与该第二网络产品的特征信息进行匹配,而无需对各第二网络产品再次进行遍历。

图6为本发明实施例提供的网络产品的信息识别方法的流程示意图三,下面结合图6和一个具体的例子,对本发明技术方案进行描述。

假设现在网络中存在4种网络产品,表1示例的是本实施例中基准数据集合中存储的信息,如表1所示,基准数据集合中存储了这四种网络产品(第二网络产品)的基准图片的url、模糊哈希信息、尺寸信息,这四种网络产品的厂商信息和类型信息,以及第二网络产品对应识别参数,包括:模糊哈希信息对应的第一权重、尺寸信息对应的第二权重、容忍度阈值。

表1

待识别的网络产品(第一网络产品)的网络地址为10.1.1.1,该网络产品属于用户定制产品,与上述四类网络产品存在轻微差异,并不完全相同。本实施例中,根据第一网络产品的网络地址以及表1示例的基准数据集合,识别得到第一网络产品的厂商信息和类型信息。

如图6所示,本实施例的实施步骤如下:

s601:获取识别请求,所述识别请求包括第一网络产品的地址信息。

示例性的,识别请求中包括第一网络产品的ip地址10.1.1.1。

s602:遍历所述基准数据集合中的每个第二网络产品,将所述第一网络产品的地址信息与所述第二网络产品的基准图片的地址信息进行拼接,获取拼接后的网络地址。

示例性的,以网络产品1为例进行描述,假设网络产品1的基准图片的地址信息为:/demo/testa/logo.png,将待识别图片的地址信息与网络产品1的基准图片的地址信息进行拼接后,得到如下网络地址:

10.1.1.1/demo/testa/logo.png

s603:将拼接后的网络地址进行访问处理,判断是否访问到图片,若是,则执行s604,若否,则返回执行s602,进行基准数据集合中的下一个第二网络产品的遍历。

具体的,访问上述拼接后的网络地址,若能够访问到图片,说明第一网络产品与基准数据集合中的网络产品1的url路径具有相似性,因此,继续执行后续的匹配过程。若不能访问到图片,则说明第一网络产品与基准数据集合中的网络产品1的url路径不具有相似性,因此,返回遍历基准数据集合中的下一个网络产品。

s604:将访问到的图片作为所述第一网络产品的待识别图片,获取所述待识别图片的模糊哈希信息和尺寸信息。

具体的,获取待识别图片的模糊哈希的方法可以采用现有技术实现,此处不再赘述。

s605:根据所述待识别图片的模糊哈希信息与所述第二网络产品对应的基准图片的模糊哈希信息,确定所述第一网络产品与所述第二网络产品之间的第一相似性。

示例性的,以网络产品1为例,从表1所示的基准数据集合中读取网络产品1对应的基准图片的模糊哈希信息,然后将待识别图片的模糊哈希信息与网络产品1对应的基准图片的模糊哈希信息之间的欧式距离,作为第一网络产品与网络产品1之间的第一相似性。

s606:根据所述待识别图片的尺寸信息与所述第二网络产品对应的基准图片的尺寸信息,确定所述第一网络产品与所述第二网络产品之间的第二相似性。

示例性的,从表1所示的基准数据集合中读取网络产品1对应的基准图片的尺寸信息,然后将待识别图片的尺寸信息与网络产品1对应的基准图片的尺寸信息之间的欧式距离,作为第一网络产品与网络产品1之间的第二相似性。

s607:根据所述第一相似性和所述第二相似性,确定所述第一网络产品与所述第二网络产品之间的相似度。

具体的,从表1所示的基准数据集合中读取网络产品1对应的第一权重和第二权重,并根据公式确定第一网络产品与网络产品1的相似性。其中,h1为第一相似性,h2为第二相似性,w1为第一权重,w2为第二权重,th为第一网络产品与网络产品1之间的相似度。

s608:判断所述相似度是否大于等于所述第二网络产品对应的容忍度阈值,若是,则执行s609,若否,则返回执行s602。

示例性的,从表1所示的基准数据集合中读取网络产品1对应的容忍度阈值,判断s607中计算得到的相似度是否大于等于该容忍度阈值。若是,则确定网络产品1与第一网络产品匹配;若否,则确定网络产品1与第一网络产品不匹配,返回s602继续遍历下一个网络产品。

s609:获取所述第二网络产品的属性信息,将所述属性信息作为所述第一网络产品的待识别信息。

假设经过s608判断之后,确定基准数据集合中的网络产品3与第一网络产品匹配,则将网络产品3的属性信息作为第一网络产品的待识别信息,也就是说,第一网络产品的厂商信息为厂商b,类型信息为类型1。

图7为本发明实施例提供的网络产品的信息识别装置的结构示意图,如图7所示,本实施例的网络产品的信息识别装置700,包括:第一获取模块701、第二获取模块702和识别模块703。

其中,第一获取模块701,用于获取网络地址,其中,所述网络地址包括第一网络产品的地址信息和第二网络产品对应的基准图片的地址信息;

第二获取模块702,用于访问所述网络地址,获取与所述第一网络产品对应的待识别图片;

识别模块703,用于将所述待识别图片的第一特征信息与基准数据集合中的至少一个第二网络产品对应的基准图片的第二特征信息进行匹配,在所述第一特征信息与所述第二特征信息相匹配的情况下,将所述第二网络产品的属性信息作为所述第一网络产品的待识别信息。

可选的,所述识别模块703具体用于:

遍历所述基准数据集合中每个第二网络产品,得到每个所述第二网络产品对应的基准图片的第二特征信息;

确定出所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度;

在所述第一特征信息和所述第二特征信息的相似度满足预设条件时,确定所述第一特征信息与所述第二特征信息相匹配。

可选的,所述第一特征信息包括模糊哈希信息和尺寸信息,所述识别模块703具体用于:

根据所述待识别图片的模糊哈希信息与每个所述第二网络产品对应的基准图片的模糊哈希信息,确定所述第一网络产品与每个所述第二网络产品之间的第一相似性;

根据所述待识别图片的尺寸信息与每个所述第二网络产品对应的基准图片的尺寸信息,确定所述第一网络产品与每个所述第二网络产品之间的第二相似性;

根据所述第一相似性和所述第二相似性,确定所述待识别图片的第一特征信息与每个所述第二网络产品对应的基准图片的第二特征信息的相似度。

可选的,所述基准数据集合还用于存储每个所述第二网络产品的模糊哈希信息对应的第一权重和尺寸信息对应的第二权重;所述识别模块703具体用于:

根据所述第一相似性、所述第二相似性、所述第一权重和所述第二权重,确定所述第一特征信息与每个所述第二特征信息的相似度;

在所述第一特征信息和所述第二特征信息的相似度大于等于容忍度阈值时,确定所述第一特征信息与所述第二特征信息相匹配。

可选的,所述基准数据集合还用于存储各所述第二网络产品的基准图片的地址信息;所述第一获取模块701具体用于:

遍历所述基准数据集合中的每个第二网络产品,得到每个所述第二网络产品对应的基准图片的地址信息;

将所述第一网络产品的地址信息与每个所述第二网络产品对应的基准图片的地址信息进行拼接,得到所述网络地址。

本实施例的装置,可用于执行上述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

图8为本发明实施例提供的网络产品的信息识别设备的结构示意图,如图8所示,本实施例的网络产品的信息识别设备800,包括:至少一个处理器801和存储器802。其中,处理器801、存储器802通过总线803连接。

在具体实现过程中,至少一个处理器801执行所述存储器802存储的计算机执行指令,使得至少一个处理器801执行上述任一方法实施例的技术方案。

处理器801的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。

在上述的图8所示的实施例中,应理解,处理器可以是中央处理单元(英文:centralprocessingunit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digitalsignalprocessor,简称:dsp)、专用集成电路(英文:applicationspecificintegratedcircuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速ram存储器,也可能还包括非易失性存储nvm,例如至少一个磁盘存储器。

总线可以是工业标准体系结构(industrystandardarchitecture,isa)总线、外部设备互连(peripheralcomponent,pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture,eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现上述任一方法实施例的技术方案。

上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(applicationspecificintegratedcircuits,简称:asic)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1