一种针对网间短信业务的实时感控系统的制作方法
【专利摘要】本发明公开了一种针对网间短信业务的实时感控系统,相比现有技术具有如下优点:本发明针对移动通信网间的短信业务,能准确、实时的匹配存储样本,达到检测的实时性,感控的准确性,主要研究内容包括:多模式浮动关键词联动识控技术:不仅支持浮动关键词,而且支持达5个浮动关键词的联动识控,实现灵活的业务“感控”功能;“三维”关键词的联动识控方法:支持固定关键、浮动关键词和范围关键词的“三维”关键词策略的交叉联动“感控”;并行的TCAM表项搜索引擎技术:基于TCAM高效匹配引擎,采用并行和流水线查表技术,实现线速关键词匹配。
【专利说明】一种针对网间短信业务的实时感控系统
【技术领域】
[0001]本发明涉及一种针对网间短信业务的实时感控系统。H04电通信技术H04W无线通信网络04W4/00专门适用于无线通信网络的业务或设施H04W4/12消息传送。
【背景技术】
[0002]在信息越来越发达的今天,某些信息则成为垃圾,比如广告甚至色情信息都是手机用户不希望收到的东西。以往,我们对此毫无办法,只能被动的接收掉,以至一些不法分子将手机短信作为其不法宣传的工具,甚至用此方法传播“邪教功”。因此急需对移动通信网间的各类短信进行过滤。
[0003]目前针对短信息过滤主要有两种方式:
[0004]短信服务中心的过滤方式。在对实时接收的短信息进行存储转发的时候,对有害信息实施监控,这种监控大多根据短信内容识别和状态监测相结合的监管模式。
[0005]手机终端的过滤方式。这种方式是在手机中预先设定包含手机或短信服务商号码的黑名单,在接收信息时根据黑名单来识别是否对信息拦截和过滤,即“短信防火墙”。
[0006]第一种方式对短信检测的实时性较差,特别是针对网间信令数据量大,实时性高的要求,其识别与拦截的实时性、准确性难以保证。
[0007]第二种方式也同样存在局限性,由于是采用预先设定的黑名单在对有害信息进行拦截时存在不足,因为有害信息发送者经常变换手机号码致使黑名单失效,不能从根本上杜绝非法短信在网间的传递和泛滥。
【发明内容】
[0008]本发明针对以上问题的提出,而研制的一种针对网间短信业务的实时感控系统,具有:筛选过滤单元、检测拦截单元和策略控制单元;
[0009]筛选过滤单元按照预置模板快速筛选短信相关信令,将检测出的嫌疑信令传送给所述的检测拦截单元,所述的检测拦截检测单元基于所述策略控制单元配置的规则,判别所述短信的发送、接收方和短信内容,检出非法短信,按所配置的策略进行分类处理;
[0010]所述的筛选过滤单元具有一检测浮动关键词的TCAM存储模块和处理模块:该模块针对一个浮动关键字,在模块内部的多个TCAMEntry中存储有所述浮动关键字的副本,每个副本在其所在的多个TCAMEntry中依次向右偏移Ibyte ;每次从IP包载荷中提取的W字节进行浮动关键词匹配,遍历一次TCAM存储模块即可得到查询结果。
[0011]所述的策略P的关键词部分长度为L字节,TCAM的Entry宽度为W字节,则每条浮动关键词复制后占用TCAMW-L+1条Entry。
[0012]所述的筛选过滤单元还具有存放关键字的FPGA池和存放查表结果的SRAM:
[0013]当短信分组到达时,由FPGA池提取查表关键字,通过TCAM的DBUS总线传输送给TCAM,进行查表;TCAM搜索到与该关键字匹配的表项时,表项的结果地址由TCAM的RBUS送出;将输出TCAM查询得到的结果地址总线RBUS总线与SRAM的地址总线通过FPGA连接起来,FPGA读取该地址下SRAM的表项即得到本次查表结果。
[0014]所述的处理模块具有多线程机制,每个线程为短信分析的一个步骤;短信分析步骤至少包括:报文解析、报头提取、查表、结果处理步骤,至少具有四个线程。
[0015]如果前级操作时间大于后级的操作时间,则需要对前级的输出数据适当缓存才能汇入到后级输入端;
[0016]如果前级操作时间恰好小于后级操作时间,则必须通过复制逻辑,将数据流分流,或者在前级对数据采用先存储、后处理的方式,否则会造成后级数据溢出。
[0017]由于采用了上述技术方案,本发明提供的一种针对网间短信业务的实时感控系统,相比现有技术具有如下优点:本发明针对移动通信网间的短信业务,能准确、实时的匹配存储样本,达到检测的实时性,感控的准确性,主要研究内容包括:多模式浮动关键词联动识控技术:不仅支持浮动关键词,而且支持达5个浮动关键词的联动识控,实现灵活的业务“感控”功能;“三维”关键词的联动识控方法:支持固定关键、浮动关键词和范围关键词的“三维”关键词策略的交叉联动“感控”;并行的TCAM表项搜索引擎技术:基于TCAM高效匹配引擎,采用并行和流水线查表技术,实现线速关键词匹配。
【专利附图】
【附图说明】
[0018]为了更清楚的说明本发明的实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本发明网间非法短信识别拦截系统;
[0020]图2为本发明单浮动关键词策略匹配过程;
[0021]图3为本发明“三维”策略过滤方法;
[0022]图4为本发明流水线设计时序;
[0023]图5为本发明查表流水线过程。
【具体实施方式】
[0024]为使本发明的实施例的目的、技术方案和优点更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚完整的描述:
[0025]如图1所示:一种针对网间短信业务的实时感控系统,主要包括:筛选过滤单元、检测拦截单元和策略控制单元。
[0026]在工作状态下,筛选过滤单元按照预置模板快速筛选短信相关信令,将检测出的嫌疑信令传送给所述的检测拦截单元,所述的检测拦截检测单元基于所述策略控制单元配置的规则,判别所述短信的发送、接收方和短信内容,检出非法短信,按所配置的策略进行分类处理;
[0027]基于浮动关键词的业务识别技术属于模式匹配问题。指对短信分组的整个载荷区进行遍历式“扫描”,将数据域中包含特定关键词特征码的信令筛选出来,包括文字、图片、视频等业务项,并根据相应策略动作进行控制。本发明方案支持多达5个浮动关键词的多浮动关键词联动匹配模型。[0028]该模型的基本原理是以TCAM的存储空间为代价,通过关键词的并行查找,换取算法的处理性能。详细描述如下:
[0029]在对浮动关键词进行预处理时,对每条浮动关键词策略的关键词部分进行拆分,并分别存储在多条TCAMEntry中,各条Entry依次向右偏移lbyte。图2给出了关键词0x1234和0x567在TCAM中的存储结构。
[0030]假设策略P的关键词部分长度为L字节,TCAM的Entry宽度为W字节,则每条浮动关键词拆分后占用TCAMW-L+1条Entry。这样,每次从IP包载荷中提取W字节数据与TCAM中条目匹配,一次TCAM遍历就可以知道这W字节数据是否与策略P匹配。
[0031]本发明支持“ ‘三维’关键词联动识控”实现业务“感控”概念图。“ ‘三维’关键词的联动识控”对移动通信网间短信业务“感控”具有强大的灵活性。
[0032]固定关键词用于识别短信特征码消息头部的各个字段和载荷域特定位置的字符串;
[0033]浮动关键词用于短信特征码在数据载荷区中位置不固定的特点用于识别载荷域字符串;
[0034]范围关键词用于短信特征码出现在数据载荷的某一范围内,对数据载荷的信息字段进行模糊匹配。
[0035]通过实现人工制定识别策略实现对短信数据流中关键词即业务和内容的感知,从而实现对业务和内容级三维信息管控目的。
[0036]目前FPGA可以稳定工作的时钟频率为125Mhz,对于IOGbps速率,最短的64字节分组的数据处理至少需要6个周期52ns的处理时间。在这6个周期中要完成报文解析、报头提取、查表、结果处理等一系列处理,必须采用新的设计思路。
[0037]本发明提出了采用“FPGA池+TCAM+SRAM”流水线的设计思路:将适当划分的η个操作步骤单流向串联起来,流水线设计时序如图4所示。
[0038]如果前级操作时间恰好等于后级的操作时间,设计最为简单,前级的输出直接汇入后级的输入即可;
[0039]如果前级操作时间大于后级的操作时间,则需要对前级的输出数据适当缓存才能汇入到后级输入端;
[0040]如果前级操作时间恰好小于后级操作时间,则必须通过复制逻辑,将数据流分流,或者在前级对数据采用先存储、后处理的方式,否则会造成后级数据溢出。
[0041]传统TCAM查表方案中,查表过程由TCAM “查”表项和TCAM “读”表项两个操作串行进行,无法流水操作,因而整个查表过程需要的时间为两操作之和,通常这个过程需要十几个时钟周期。
[0042]为此,本发明采用了由FPGA池、TCAM和SRAM共同完成的查表流水线结构。如图5所示,在TCAM中存放关键字,SRAM中存放查表结果,从而将关键词查表的过程分为“表项搜索”和“读取结果”两个子过程,分别由TCAM和SRAM完成,这样便可引入流水机制,从而缩短路由查表时间,提高转发引擎的转发处理效率。当短信分组到达时,由FPGA池提取查表关键字,送给TCAM查表;TCAM搜索到与该关键字匹配的表项时,表项的结果地址由RBUS送出;将TCAM的结果总线RBUS与SRAM的地址总线通过FPGA连接起来,读取该地址下SRAM的表项即得到本次查表结果,即策略的“动作”部分,该结果由SRAM的数据总线送到FPGA。这样就实现了快速检索,高效匹配。
[0043]可见,采用的流水线设计方案后,查表流水线和原来没有采用流水线情况下相比大大缩短了查表时间,是实现移动通信网间短信业务低时延实时检测处理的关键。
[0044]本发明所述短信业务实时感控方法,通过多模式浮动关键词联动识控技术、“三维”关键词的联动识控方法和“FPGA池+TCAM+SRAM”硬件流水线处理技术的结合,使网间非法短信识别拦截系统中的短信异常识别单元能准确的对各类短信实时感控和检测,从而为网间非法短信识别拦截系统对大数据量的移动通信网间短信业务的实时准确感控、过滤和拦截,提供可靠技术保障。
[0045]以上所述,仅为本发明较佳的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本【技术领域】的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
【权利要求】
1.一种针对网间短信业务的实时感控系统,具有:筛选过滤单元、检测拦截单元和策略控制单元; 筛选过滤单元按照预置模板快速筛选短信相关信令,将检测出的嫌疑信令传送给所述的检测拦截单元,所述的检测拦截检测单元基于所述策略控制单元配置的规则,判别所述短信的发送、接收方和短信内容,检出非法短信,按所配置的策略进行分类处理; 所述的筛选过滤单元具有一检测浮动关键词的TCAM存储模块:该模块针对一个浮动关键字,在模块内部的多个TCAMEntry中存储有所述浮动关键字的副本,每个副本在其所在的多个TCAMEntry中依次向右偏移Ibyte ;每次从IP包载荷中提取的W字节进行浮动关键词匹配,遍历一次TCAM存储模块即可得到查询结果。
2.根据权利要求1所述的一种针对网间短信业务的实时感控系统,其特征还在于:所述的策略P的关键词部分长度为L字节,TCAM的Entry宽度为W字节,则每条浮动关键词复制后占用TCAMW-L+1条Entry。
3.根据权利要求2所述的一种针对网间短信业务的实时感控系统,其特征还在于:所述的筛选过滤单元还具有存放关键字的FPGA池和存放查表结果的SRAM: 当短信分组到达时,由FPGA池提取查表关键字,通过TCAM的DBUS总线传输送给TCAM,进行查表;TCAM搜索到与该关键字匹配的表项时,表项的结果地址由TCAM的RBUS送出;将输出TCAM查询得到的结果地址总线RBUS总线与SRAM的地址总线通过FPGA连接起来,FPGA读取该地址下SRAM的表项即得到本次查表结果。
4.根据权利要求3所述的一种针对网间短信业务的实时感控系统,其特征还在于:所述的处理模块具有多线程机制,每个线程为短信分析的一个步骤;短信分析步骤至少包括:报文解析、报头提取、查表、结果处理步骤,至少具有四个线程。
5.根据权利要求4所述的一种针对网间短信业务的实时感控系统,其特征还在于:如果前级操作时间大于后级的操作时间,则需要对前级的输出数据适当缓存才能汇入到后级输入端; 如果前级操作时间恰好小于后级操作时间,则必须通过复制逻辑,将数据流分流,或者在前级对数据采用先存储、后处理的方式,否则会造成后级数据溢出。
【文档编号】H04W12/12GK103702301SQ201310752562
【公开日】2014年4月2日 申请日期:2013年12月31日 优先权日:2013年12月31日
【发明者】袁林, 邸学锋, 马洪彬, 张醒, 刘军政 申请人:大连环宇移动科技有限公司