对互联网应用场所分类的方法和装置制造方法
【专利摘要】本发明公开了一种对互联网应用场所分类的方法和装置。所述方法包括:在预设时间内,获取待检测网络设备发出的数据报文;根据所述数据报文,获取运营商类型、网络带宽、终端数量和应用层协议特征比重中的至少一个;对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议特征比重中的至少一个进行分类统计分析,得到所述待检测网络的应用场所分类结果。本发明实现了对待检测网络的应用场所的分类。
【专利说明】对互联网应用场所分类的方法和装置
【技术领域】
[0001] 本发明实施例涉及计算机网络技术,尤其涉及一种对互联网应用场所分类的方法 和装置。
【背景技术】
[0002] 随着互联网的快速发展与迅速普及,网络信息越来越丰富,众多的政府机关、企事 业单位、小区家庭、学校等应用场所都搭建了自己的网络,网络已经成为信息时代的重要资 源。网络作为信息时代产生的重要工具,同样面临着适当监控、合理使用的问题。
[0003] 因此,需要对互联网应用场所进行分类。对互联网应用场所进行分类在网络资源 利用、网络资源规划和网络安全方面将发挥越来越重要的作用,但是,现有技术中,对互联 网应用场所分类的研究才刚刚开始,还没有成熟的技术来实现对互联网应用场所的分类。
【发明内容】
[0004] 有鉴于此,本发明实施例提供一种对互联网应用场所分类的方法和装置,以实现 对互联网应用场所的分类。
[0005] 第一方面,本发明实施例提供了一种对互联网应用场所分类的方法,所述方法包 括:
[0006] 在预设时间内,获取待检测网络设备发出的数据报文;
[0007] 根据所述数据报文,获取运营商类型、网络带宽、终端数量和应用层协议特征比重 中的至少一个;
[0008] 对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议特征比重中 的至少一个进行分类统计分析,得到所述待检测网络的应用场所分类结果。
[0009] 第二方面,本发明实施例还提供了一种对互联网应用场所分类的装置,所述装置 包括:
[0010] 第一获取模块,用于在预设时间内,获取待检测网络设备发出的数据报文;
[0011] 第二获取模块,用于根据所述数据报文,获取运营商类型、网络带宽、终端数量和 应用层协议特征比重中的至少一个;
[0012] 分类模块,用于对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协 议特征比重中的至少一个进行分类统计分析,得到所述待检测网络的应用场所分类结果。
[0013] 本发明实施例提供的对互联网应用场所分类的方法和装置,通过获取预设时间内 待检测网络发出的数据报文,根据所述数据报文获取运营商类型、网络带宽、终端数量和应 用层协议特征比重中的至少一个,对预设时间内获得的运营商类型、网络带宽、终端数量和 应用层协议特征比重中的至少一个进行分类统计分析,得到所述待检测网络的应用场所分 类结果,实现了对待检测网络的应用场所的分类。
【专利附图】
【附图说明】
[0014] 图1是本发明实施例提供的对互联网应用场所分类的方法和装置适用的网络架 构图;
[0015] 图2是本发明实施例一提供的对互联网应用场所分类的方法的流程图
[0016] 图3是本发明实施例二提供的对互联网应用场所分类的装置的示意图。
【具体实施方式】
[0017] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本发明相关的部分而非全部内容。
[0018] 图1是本发明实施例提供的对互联网应用场所分类的方法和装置适用的网络架 构图。如图1所示,该网络涉及应用场所未知网络110、检测服务器120和互联网130,检测 服务器120连接在应用场所未知网络110和互联网130之间,可镜像抓取网络间交互的数 据。在应用场所未知网络即待检测网络,向互联网中的上级网络发送数据包的过程中,检测 服务器通过镜像分析数据包来检测网络中终端设备的接入情况以及应用层协议特征比重 情况,从而确定待检测网络的分类。本发明实施例提供的方法可以由检测服务器来执行,可 以由一台物理计算机作为服务器。
[0019] 实施例一
[0020] 图2是本发明实施例一提供的对互联网应用场所分类的方法的流程图,本实施例 可适用于对互联网的应用场所进行分类,该方法可以由具有通信能力及数据处理能力的设 备如计算机、服务器等等来执行,具体包括如下步骤:
[0021] 步骤210,在预设时间内,获取待检测网络设备发出的数据报文。
[0022] 在预设时间内(如在连续一周的时间周期内)的预设时间点(如每天的3点、10 点、15点、20点、23点5个时间点),检测服务器进行数据采样,通过数据镜像获取待检测网 络设备发出的数据报文。其中,数据镜像并不影响待检测网络设备向上级网络发送的数据 报文,只是通过复制数据来获取待检测网络设备发出的数据报文。
[0023] 步骤220,根据所述数据报文,获取运营商类型、网络带宽、终端数量和应用层协议 特征比重中的至少一个。
[0024] 对所述数据报文进行解码分析,以获取待检测网络所属的ISP (Internet Service Provider,互联网服务提供商)运营商类型、待检测网络的网络带宽、接入待检测网络的终 端数量和应用层协议特征比重中的至少一个。
[0025] 其中,网络带宽是指在1秒时间内,能通过的最大位数据即数据传输率;对采样 数据分别进行计算,获得的最大数据位数即为网络带宽。唯一序列号是由终端设备中安 装的客户端的软件在与互联网中的服务器进行通信,实现系统升级、软件更新查询等操作 的过程中生成,用于唯一标识一台物理终端设备;通过检测唯一序列号的数量获得接入待 检测网络的终端数量。所述应用层协议特征可以分为12个大类,包括:HTTP(Hyp er Text Transfer Protocol,超文本传输协议)个人应用(如衣饰、美食、社交、银行等网站)、HTTP 办公应用(如技术类、招聘、快递、机票、酒店等网站)、IM(Instant Messaging,即时通讯) 个人应用(如旺旺、UC、E话通、YY等聊天工具)、頂办公应用(如QQ、MSN等)、个人搜索 (搜索内容如音乐、活动、爱好、美食等)、资讯搜索(如新闻等)、办公搜索(如技术、机票 等)、下载(如FTP、电驴等)、虚拟专用网(Virtual Private Network, VPN)、远程控制、电 子邮件和音视频。应用层协议特征比重是指每一种应用层协议特征所占的比重。
[0026] 步骤230,对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议特 征比重中的至少一个进行分类统计分析,得到所述待检测网络的应用场所分类结果。
[0027] 其中,互联网应用场所类型有7种,包括:小区家庭、网吧、学校、社会企业、事业单 位、酒店和其他类。
[0028] 检测服务器对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议 特征比重中的至少一个进行大数据分类统计分析,即通过对运营商类型、网络带宽、终端数 量和应用层协议特征比重中的至少一个参数进行分析,找到与之匹配的互联网应用场所类 型模型,所述应用场所类型模型中分别设有上述四个参数的阈值,通过对上述四个参数中 的至少一个与各自的阈值进行比对,得到与待检测网络匹配的互联网应用场所类型模型, 则将所述待检测网络分类到该互联网应用场所类型中,即得到所述待检测网络的应用场所 分类结果。
[0029] 本实施例的技术方案,通过获取预设时间内待检测网络发出的数据报文,根据所 述数据报文获取运营商类型、网络带宽、终端数量和应用层协议特征比重中的至少一个,对 预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议特征比重中的至少一个 进行分类统计分析,得到所述待检测网络的应用场所分类结果,实现了对待检测网络的应 用场所的分类。
[0030] 在上述技术方案的基础上,在根据所述数据报文,获取运营商类型、网络带宽、终 端数量和应用层协议特征比重中的至少一个之后,还优选包括:将获取到的运营商类型、网 络带宽、终端数量和应用层协议特征比重保存到数据库中。检测服务器首先判断所述数据 库中是否包含所述运营商类型、网络带宽、终端数量和应用层协议特征比重的信息记录,如 果是,则根据所述运营商类型、网络带宽、终端数量和应用层协议特征比重更新数据库中的 各个参数,如果否,则在数据库中新建一个表项,存储这四种参数值,这样可以节省检测服 务器的磁盘空间,并且便于对数据进行管理。
[0031] 在上述技术方案的基础上,根据所述数据报文,获取运营商类型、网络带宽、终端 数量和应用层协议特征比重中的至少一个,包括:对所述数据报文进行解码获得源IP地 址,并根据所述源IP地址获得所述源IP地址所属的运营商类型;根据所述数据报文分析 计算网络带宽;从所述数据报文中提取唯一序列号,统计接入网络的终端数量;从所述数 据报文中提取应用层协议特征,统计应用层协议特征比重。检测服务器通过对所述数据报 文进行解码分析获得源IP地址,即待检测网络的公网IP地址,检测服务器通过搜索查询 即在数据库中搜索比对可获得该IP地址所属的运营商类型(校园网、联通、电信、移动、其 他);检测服务器统计预设时间内的预设时间点获得的数据报文中的数据包的最大数据位 数,选取各个时间点最大的最大数据位数即为网络带宽;对数据报文进行解码分析并提取 唯一序列号,统计唯一序列号的数量获得接入待检测网络的终端数量;检测服务器从所述 数据报文中解码分析,获取12类应用层协议特征信息,对协议特征进行提取并计算各协议 类session (TCP的会话连接)的数量与比例,从而获得各应用层协议特征的比重,应用层协 议特征比重可用于标识用户网络行为情况。
[0032] 在上述技术方案的基础上,该对互联网应用场所分类的方法还优选包括:将所述 源IP地址及提取所述运营商类型、网络带宽、终端数量和应用层协议特征比重的时间保存 到数据库中。检测服务器首先判断所述数据库中是否包含所述运营商类型、网络带宽、终端 数量和应用层协议特征比重的信息记录,如果是,则更新数据库中提取到这四种参数的时 间信息,如果否,则在所述数据库中新建一个表项,存储这四种参数值及各参数值相应的提 取时间。根据时间信息更新数据库中的各个参数值,确保数据库中的每个参数值都是最新 得到的,且可以节省数据库的存储空间。
[0033] 实施例二
[0034] 图3是本发明实施例二提供的对互联网应用场所分类的装置的示意图。如图3所 示,本实施例提供的对互联网应用场所分类的装置包括:第一获取模块310、第二获取模块 320和分类模块330。
[0035] 其中,第一获取模块310用于在预设时间内,获取待检测网络设备发出的数据报 文;第二获取模块320用于根据所述数据报文,获取运营商类型、网络带宽、终端数量和应 用层协议特征比重中的至少一个;分类模块330用于对预设时间内获得的运营商类型、网 络带宽、终端数量和应用层协议特征比重中的至少一个进行分类统计分析,得到所述待检 测网络的应用场所分类结果。其中,所述应用层协议特征包括:超文本传输协议HTTP个人 应用、HTTP办公应用、即时通讯頂个人应用、頂办公应用、个人搜索、资讯搜索、办公搜索、 下载、虚拟专用网、远程控制、电子邮件和音视频。
[0036] 优选的,还包括:第一存储模块,用于将获取到的运营商类型、网络带宽、终端数量 和应用层协议特征比重保存到数据库中。
[0037] 优选的,所述第二获取模块包括:获得子模块,用于对所述数据报文进行解码获得 源IP地址,并根据所述源IP地址获得所述源IP地址所属的运营商类型;计算子模块,用于 根据所述数据报文分析计算网络带宽;第一统计子模块,用于从所述数据报文中提取唯一 序列号,统计接入网络的终端数量;第二统计子模块,用于从所述数据报文中提取应用层协 议特征,统计应用层协议特征比重。
[0038] 优选的,还包括:第二存储模块,用于将所述源IP地址及提取所述运营商类型、网 络带宽、终端数量和应用层协议特征比重的时间保存到数据库中。
[0039] 上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块 和有益效果。
[0040] 注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解, 本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、 重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行 了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还 可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
【权利要求】
1. 一种对互联网应用场所分类的方法,其特征在于,所述方法包括: 在预设时间内,获取待检测网络设备发出的数据报文; 根据所述数据报文,获取运营商类型、网络带宽、终端数量和应用层协议特征比重中的 至少一个; 对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议特征比重中的至 少一个进行分类统计分析,得到所述待检测网络的应用场所分类结果。
2. 根据权利要求1所述的方法,其特征在于,在根据所述数据报文,获取运营商类型、 网络带宽、终端数量和应用层协议特征比重中的至少一个之后,还包括: 将获取到的运营商类型、网络带宽、终端数量和应用层协议特征比重保存到数据库中。
3. 根据权利要求1或2所述的方法,其特征在于,根据所述数据报文,获取运营商类型、 网络带宽、终端数量和应用层协议特征比重中的至少一个,包括: 对所述数据报文进行解码获得源IP地址,并根据所述源IP地址获得所述源IP地址所 属的运营商类型; 根据所述数据报文分析计算网络带宽; 从所述数据报文中提取唯一序列号,统计接入网络的终端数量; 从所述数据报文中提取应用层协议特征,统计应用层协议特征比重。
4. 根据权利要求3所述的方法,其特征在于,还包括: 将所述源IP地址及提取所述运营商类型、网络带宽、终端数量和应用层协议特征比重 的时间保存到数据库中。
5. 根据权利要求1或2所述的方法,其特征在于,所述应用层协议特征包括:超文本传 输协议HTTP个人应用、HTTP办公应用、即时通讯頂个人应用、頂办公应用、个人搜索、资讯 搜索、办公搜索、下载、虚拟专用网、远程控制、电子邮件和音视频。
6. -种对互联网应用场所分类的装置,其特征在于,所述装置包括: 第一获取模块,用于在预设时间内,获取待检测网络设备发出的数据报文; 第二获取模块,用于根据所述数据报文,获取运营商类型、网络带宽、终端数量和应用 层协议特征比重中的至少一个; 分类模块,用于对预设时间内获得的运营商类型、网络带宽、终端数量和应用层协议特 征比重中的至少一个进行分类统计分析,得到所述待检测网络的应用场所分类结果。
7. 根据权利要求6所述的装置,其特征在于,还包括: 第一存储模块,用于将获取到的运营商类型、网络带宽、终端数量和应用层协议特征比 重保存到数据库中。
8. 根据权利要求6或7所述的装置,其特征在于,所述第二获取模块包括: 获得子模块,用于对所述数据报文进行解码获得源IP地址,并根据所述源IP地址获得 所述源IP地址所属的运营商类型; 计算子模块,用于根据所述数据报文分析计算网络带宽; 第一统计子模块,用于从所述数据报文中提取唯一序列号,统计接入网络的终端数 量; 第二统计子模块,用于从所述数据报文中提取应用层协议特征,统计应用层协议特征 比重。
9. 根据权利要求8所述的装置,其特征在于,还包括: 第二存储模块,用于将所述源IP地址及提取所述运营商类型、网络带宽、终端数量和 应用层协议特征比重的时间保存到数据库中。
10. 根据权利要求6或7所述的装置,其特征在于,所述应用层协议特征包括:超文本 传输协议HTTP个人应用、HTTP办公应用、即时通讯IM个人应用、IM办公应用、个人搜索、资 讯搜索、办公搜索、下载、虚拟专用网、远程控制、电子邮件和音视频。
【文档编号】H04L12/24GK104125105SQ201410400633
【公开日】2014年10月29日 申请日期:2014年8月14日 优先权日:2014年8月14日
【发明者】刘锐, 张弛 申请人:北京锐安科技有限公司