一种基于移动互联网的有害信息过滤系统及其方法

文档序号：7749959阅读：215来源：国知局

专利名称：一种基于移动互联网的有害信息过滤系统及其方法
技术领域：
本发明属于移动通信领域，具体涉及一种基于移动互联网的有害信息过滤系统及其方法。
背景技术：
随着移动互联网技术的迅猛发展，特别是3G网络在我国大规模部署，满足了人们对于移动上网的需求。但是移动互联网上也存在着一些有害信息如淫秽色情信息腐蚀了人们的心灵，极大地影响了和谐社会的发展，因此需要相关的系统和方法对于移动互联网的有害信息进行过滤。传统的有害信息过滤方法是通过对重点WAP网站拨测的方式对有害信息的的WAP 网站进行监测，存在两个问题一是不易对所有WAP网站进行监控，二是即使发现某一 WAP 网站存在的有害信息，如果该WAP网站的服务器位于境外，不易进行封堵。这对于如何防止有害信息通过移动互联网进行传播提出了新的挑战。可见，传统的有害信息过滤技术存在着一定的局限性，不能完全适用于移动互联网有害信息监控的需要，需要进行改进。

发明内容
本发明的目的在于克服现有技术存在的缺点和不足，提供一种基于移动互联网的有害信息过滤系统及其方法，以解决目前移动互联网中存在淫秽色情信息的问题。实现本发明目的的技术方案是—、基于移动互联网的有害信息过滤系统(简称系统)本系统包括核心网，设置有数据采集单元、数据还原单元、存储单元、有害信息拦截单元、有害信息识别单元和有害信息展现与配置单元；其连接和交互关系是核心网、数据采集单元、数据还原单元、有害信息识别单元、存储单元和有害信息展现与配置单元前后依次连接，实现有害信息的识别、存储和展现；有害信息识别单元、有害信息拦截单元和核心网前后依次连接，实现有害信息的拦截；数据采集单元负责从核心网中采集用户上网的信令和业务数据，分析用户的身份标识，对移动互联网承载协议和应用协议进行解析，并将解析的结果发给数据还原单元；数据还原单元负责还原用户上网数据；有害信息识别单元负责对数据还原单元发来的数据进行分析识别，包括有害文字识别、有害图像识别、有害视频识别、有害音频识别，并将有害信息写入到存储单元；存储单元负责存储有害信息相关数据和有害系统的识别规则；有害信息展现与配置单元负责展现系统分析到的移动互联网的有害信息的总体
4情况和具体记录，并可以根据需要设置有害系统的识别规则；有害信息拦截单元负责接收有害信息识别单元的指令，采用一定的策略，向核心网发送拦截包来阻断用户访问移动互联网有害信息。二移动互联网的有害信息过滤方法(简称方法)本方法包括以下步骤①数据采集单元从核心网中采集用户上网的信令和业务数据，分析用户的身份标识，对移动互联网承载协议和应用协议进行解析，并将解析数据发送给数据还原单元；②数据还原单元接收数据采集单元发来的用户数据，进行还原，并将还原后的数据发送给有害信息识别单元；③有害信息识别单元对还原后的用户上网数据进行分析识别，并将分析出的有害信息数据保存到存储单元；④有害信息拦截单元接收有害信息识别单元的指令，采用一定的策略，向核心网发送拦截包来阻断用户访问移动互联网有害信息；⑤用户通过有害信息展现与配置单元浏览移动互联网有害信息的总体情况和具体记录，并可以根据需要设置有害系统的识别规则。本发明具有下列优点和积极效果①通过在移动互联网的核心网中分析出用户上网数据，通过高效算法识别出有害信息，并向移动互联网的核心网发送拦截包来阻断用户访问移动互联网中的有害信息；②提高了分析移动互联网有害信息的精确度，并设计出了一种有害信息的阻断方法。总之，本发明能够对所有移动互联网用户的有害信息进行实时分析，并提供了相应的拦截功能，提高了移动互联网的有害信息过滤系统的自动化程度和精确度，可以作为电信运营商建设移动互联网淫秽色情信息发现和过滤的重要手段。

图1是本系统的结构方框图；图2是数据采集单元的工作流程图；图3是有害信息识别单元和有害信息拦截单元的工作流程图。其中000-核心网；100-数据采集单元；200-数据还原单元；300-存储单元；400-有害信息拦截单元；500-有害信息识别单元；600-有害展现与配置单元。
具体实施例方式以下结合附图和实施例详细说明
一、系统如图1，本系统包括核心网000，设置有数据采集单元100、数据还原单元200、存储单元300、有害信息拦截单元 400、有害信息识别单元500和有害信息展现与配置单元600 ；其连接和交互关系是核心网000、数据采集单元100、数据还原单元200、有害信息识别单元500、存储单元300和有害信息展现与配置单元600前后依次连接，实现有害信息的识别，存储和展现；有害信息识别单元500、有害信息拦截单元400、和核心网000前后依次连接，实现有害信息的拦截。二、方法1、数据采集单元100的工作流程如图2，数据采集单元100的工作流程包括下列步骤①10，截获网络包，通过抓包的方式截获核心网中SGSN(GPRS服务支持节点)与 GGSN(GPRS网关支持节点)之间的Gn接口的网络包；②11，判断网络包中GTP (GPRS隧道协议)消息的类型，如果类型字段为Oxff则为 GTP数据包，跳转到步骤⑦16 ；否则为GTP信令包，跳转到步骤③12 ；③12，判断信令包类型，如果类型字段为0x10，则为创建PDP(分组数据协议)上下文请求包，跳转到步骤 ④13 ；如果类型字段为0x11，则为创建PDP上下文响应包，跳转到步骤⑤(14)；如果类型为其他数值，则为其他信令包，跳转到步骤⑥(15)；④13，当信令包为创建PDP上下文请求包时，分析出用户的IMSI (国际移动用户识别码)，下行的TEID-C (控制面隧道终点标识)，下行的TEID-U (数据面隧道终点标识)，并将这三项保存在该用户的上下文中，其中IMSI为用户的身份标识；⑤14，当信令包为创建PDP上下文响应包，取出包中的下行的TEID-C，与用户上下文中的下行TEID-C比对，找到该用户的上下文；将包中分析出的上行的TEID-C，上行的 TEID-U也保存在用户上下文中；⑥15，当信令包为其他类型时，如果是上行包，取出包中上行的TEID-C，与用户上下文中的上行TEID-C比对，找到该用户的上下文；如果是下行包，取出包中下行的TEID-C，与用户上下文中的下行TEID-C比对，找到该用户的上下文；⑦16，判断GTP数据包的类型，如果是上行包，则跳转到步骤⑧17;如果是下行包，则跳转到步骤⑨18 ；⑧17，当数据包为上行包时，取出包中上行的TEID-U，与用户上下文中上行的 TEID-U比对，找到该用户上下文，再转到步骤⑩19 ；⑨18，当数据包为下行包时，取出包中下行的TEID-U，与用户上下文中下行的 TEID-U比对，找到该用户上下文，再转到步骤⑩19 ；⑩19，解析GTP数据包中上层IP包的内容，分析WAP，HTTP，MMS等协议，将用户上网应用包和用户身份标识IMSI发送给还原单元。2、有害信息识别单元500和有害信息拦截单元400的工作流程
如图3，有害信息识别单元和有害信息拦截单元的工作流程包括下列步骤①20，有害信息识别单元接收数据还原单元发送的用户上网数据包；②21，有害信息识别单元判断用户访问的页面是否包含有害信息，无则结束，有则跳转到步骤③22 ；③22，有害信息识别单元判断该有害应用是否为网页，是则跳转到步骤④23，否则跳转到步骤⑤24 ；④23，有害信息识别单元将该页面网址保存到有害信息过滤规则中；⑤24，有害信息识别单元判断该应用是否是基于TCP协议的，如果是则跳转到步骤⑥25，否则跳转到步骤⑦26 ；⑥25，有害信息识别单元通知有害信息拦截单元，有害信息拦截单元发送TCP的 RESET包给用户，以便阻止用户进一步访问有害信息；⑦26，有害信息识别单元判断该应用是否是基于WAP1。X的，是则跳转到步骤 ⑧27，否则跳转到步骤⑨28;⑧27，有害信息识别单元通知有害信息拦截单元，有害信息拦截单元发送WTP的 ABORT包给用户，以便阻止用户进一步访问有害信息；⑨28，有害信息识别单元通知有害信息拦截单元，有害信息拦截单元发送ICMP不可达包给用户，以便阻止用户进一步访问有害信息。
权利要求
一种基于移动互联网的有害信息过滤系统，其特征在于包括核心网(000)，设置有数据采集单元(100)、数据还原单元(200)、存储单元(300)、有害信息拦截单元(400)、有害信息识别单元(500)和有害信息展现与配置单元(600)；其连接和交互关系是核心网(000)、数据采集单元(100)、数据还原单元(200)、有害信息识别单元(500)、存储单元(300)和有害信息展现与配置单元(600)前后依次连接，实现有害信息的识别存储和展现；有害信息识别单元(500)、有害信息拦截单元(400)和核心网(000)前后依次连接，实现有害信息的拦截；数据采集单元(100)负责从核心网000中采集用户上网的信令和业务数据，分析用户的身份标识，对移动互联网承载协议和应用协议进行解析，并将解析的结果发给数据还原单元(200)；数据还原单元(200)负责还原用户上网数据；有害信息识别单元(500)负责对数据还原单元(200)发来的数据进行分析识别，包括有害文字识别、有害图像识别、有害视频识别、有害音频识别，并将有害信息写入到存储单元(300)；存储单元(300)负责存储有害信息相关数据和有害系统的识别规则；有害信息展现与配置单元(600)负责展现系统分析到的移动互联网的有害信息的总体情况和具体记录，并可以根据需要设置有害系统的识别规则；有害信息拦截单元(400)负责接收有害信息识别单元500的指令，采用一定的策略，向核心网(000)发送拦截包来阻断用户访问移动互联网有害信息。
2.根据权利要求1所述系统的有害信息过滤的方法，其特征在于包括以下步骤①数据采集单元从核心网中采集用户上网的信令和业务数据，分析用户的身份标识，对移动互联网承载协议和应用协议进行解析，并将解析数据发送给数据还原单元；②数据还原单元接收数据采集单元发来的用户数据，进行还原，并将还原后的数据发送给有害信息识别单元；③有害信息识别单元对还原后的用户上网数据进行分析识别，并将分析出的有害信息数据保存到存储单元；④有害信息拦截单元接收有害信息识别单元的指令，采用一定的策略，向核心网发送拦截包来阻断用户访问移动互联网有害信息；⑤用户通过有害信息展现与配置单元浏览移动互联网有害信息的总体情况和具体记录，并可以根据需要设置有害系统的识别规则。
3.根据权利要求2所述的方法，其特征在数据采集单元的工作流程包括下列步骤①(10)，截获网络包，通过抓包的方式截获核心网中SGSN与GGSN之间的Gn接口的网络包；②(11)，判断网络包中GTP消息的类型，如果类型字段为Oxff则为GTP数据包，跳转到步骤⑦16 ；否则为GTP信令包，跳转到步骤③12 ；③(12)，判断信令包类型，如果类型字段为0x10，则为创建PDP上下文请求包，跳转到步骤④(13)；如果类型字段为0x11，则为创建PDP上下文响应包，跳转到步骤⑤(14)；如果类型为其他数值，则为其他信令包，跳转到步骤⑥(15)；④(13)，当信令包为创建PDP上下文请求包时，分析出用户的IMSI，下行的TEID-C，下行的TEID-U，并将这三项保存在该用户的上下文中，其中IMSI为用户的身份标识；⑤(14)，当信令包为创建PDP上下文响应包，取出包中的下行的TEID-C，与用户上下文中的下行TEID-C比对，找到该用户的上下文；将包中分析出的上行的TEID-C，上行的 TEID-U也保存在用户上下文中；⑥(15)，当信令包为其他类型时，如果是上行包，取出包中上行的TEID-C，与用户上下文中的上行TEID-C比对，找到该用户的上下文；如果是下行包，取出包中下行的TEID-C，与用户上下文中的下行TEID-C比对，找到该用户的上下文；⑦(16)，判断GTP数据包的类型，如果是上行包，则跳转到步骤⑧17；如果是下行包，则跳转到步骤⑨18 ；⑧(17)，当数据包为上行包时，取出包中上行的TEID-U，与用户上下文中上行的 TEID-U比对，找到该用户上下文，再转到步骤⑩19 ；⑨(18)，当数据包为下行包时，取出包中下行的TEID-U，与用户上下文中下行的 TEID-U比对，找到该用户上下文，再转到步骤⑩19 ；⑩(19)，解析GTP数据包中上层IP包的内容，分析WAP，HTTP，匪S等协议，将用户上网应用包和用户身份标识IMSI发送给还原单元。
4.根据权利要求2所述的方法，其特征在于有害信息识别单元和有害信息拦截单元的工作流程包括下列步骤①(20)，有害信息识别单元接收数据还原单元发送的用户上网数据包；②(21)，有害信息识别单元判断用户访问的页面是否包含有害信息，无则结束，有则跳转到步骤③22 ；③(22)，有害信息识别单元判断该有害应用是否为网页，是则跳转到步骤④23，否则跳转到步骤⑤24 ；④(23)，有害信息识别单元将该页面网址保存到有害信息过滤规则中；⑤(24)，有害信息识别单元判断该应用是否是基于TCP协议的，如果是则跳转到步骤 ⑥25，否则跳转到步骤⑦26;⑥(25)，有害信息识别单元通知有害信息拦截单元，有害信息拦截单元发送TCP的 RESET包给用户，以便阻止用户进一步访问有害信息；⑦(26)，有害信息识别单元判断该应用是否是基于WAP1.X的，是则跳转到步骤⑧27，否则跳转到步骤⑨28 ；⑧(27)，有害信息识别单元通知有害信息拦截单元，有害信息拦截单元发送WTP的 ABORT包给用户，以便阻止用户进一步访问有害信息；⑨(28)，有害信息识别单元通知有害信息拦截单元，有害信息拦截单元发送ICMP不可达包给用户，以便阻止用户进一步访问有害信息。
全文摘要
本发明公开了一种基于移动互联网的有害信息过滤系统及其方法，属于移动通信领域。本系统包括核心网，设置有数据采集单元、数据还原单元、存储单元、有害信息拦截单元、有害信息识别单元和有害信息展现与配置单元；核心网、数据采集单元、数据还原单元、有害信息识别单元、存储单元和有害信息展现与配置单元前后依次连接；有害信息识别单元、有害信息拦截单元和核心网前后依次连接。本发明能够对所有移动互联网用户的有害信息进行实时分析，并提供了相应的拦截功能，提高了移动互联网的有害信息过滤系统的自动化程度和精确度，可以作为电信运营商建设移动互联网淫秽色情信息发现和过滤的重要手段。
文档编号H04L29/06GK101867932SQ201010184968
公开日2010年10月20日申请日期2010年5月21日优先权日2010年5月21日
发明者胡凯申请人:武汉虹旭信息技术有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡凯
技术所有人：武汉虹旭信息技术有限责任公司
我是此专利的发明人

上一篇：一种基于带宽需求的多径路由方法
上一篇：网络切换方法、系统及接入设备、认证服务器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。