基于主叫号码位置和发送内容的垃圾短消息识别系统及方法

文档序号:7695720阅读:115来源:国知局
专利名称:基于主叫号码位置和发送内容的垃圾短消息识别系统及方法
技术领域
本发明涉及垃圾短消息,尤其涉及基于主叫号码位置和发送内容的垃圾短 消息识别系统及方法。
背景技术
近年来,垃圾短消息泛滥的情况愈演愈烈,几乎每个手机用户都受到过垃 圾短消息的侵扰。根据中国互联网协会发布的调査结果显示,我国手机用户平均每周收到8.29条垃圾短消息。垃圾短消息按照其发送的方式可以分为两种模式,一种是利用移动运营商 的短消息网关进行发送,用户收到短消息时,其显示的发送号码为短消息的接 入号,而不是普通用户的手机号码。此种方法发送的垃圾短消息具有速度快、 操作简单、需要运营商许可等特点,短消息类型以商品广告、服务类居多。另一种是将手机卡插入群发器,通过串口连接线连接到计算机的串口上, 然后利用计算机上的群发软件进行发送(以下简称该方式为群发器发送)。使 用者或是购买大量无需注册的手机卡(如动感地带、神州行等)来进行透支, 要么就抓住优惠套餐的软肋来狂发短消息。这类群发器可以同时连接16-20个 以上端口,能在很短的时间内群发上万条的短消息,因此运营商往往来不及计 费就被恶意透支话费。用户收到短消息时,其显示的发送号码为普通的手机号 码。此方法发送的垃圾短消息具有号码多、速度快、不需运营商许可等特点。 此外,在群发期间,垃圾短消息流量规模巨大,势必占用较多无线资源,为保 证吞吐率,垃圾短消息发送者通常会选择多个位于不同基站的发送点并行发 送。随着公众媒体和社会舆论对垃圾短消息的关注度不断地提高,移动运营商 加大了对利用短消息网关发送垃圾短消息的整治力度,实施了一些简单、有效 的措施,如加强对短消息发送端口的内容监控,在短消息内容中加入公司真实 签名,提高利用端口发送短消息资费,对投诉比较大的端口给予关闭等。上述措施实施以后,通过短消息网关发送垃圾短消息的现象明显减少。但 对于不法分子利用群发器发送垃圾短消息的现象目前仍然无有效的过滤手段。针对不法分子利用群发器发送垃圾短消息的手段,运营商目前的实现方法 主要有如下两种1、 关键字匹配过滤短消息中心维护人员一旦接到用户的垃圾短消息投诉后,就取出该垃圾短 消息中的相关关键字,把它加入到短消息中心的关键字过滤列表中,以后短消 息中心只要接收到包含该关键字的短消息,将对该短消息加以拦截和过滤,禁 止它的下发。该方法的优点是系统实现简单。缺点是很容易造成误判,导致正 常的用户短消息被拦截和过滤,引起用户的投诉。同时,垃圾短消息发送者很 容易通过变更关键字、关键字间加入分隔符、使用同音字等手段而绕过过滤。2、 监控同一号码单位时间内发送短消息数量的方法由于垃圾短消息发送者利用电脑连接手机模块进行垃圾短消息的群发,因 此同一号码单位时间内发送短消息的数量会比正常用户的手机发送短消息的 数量大。因此,短消息中心的维护人员会对同一号码的单位时间内的短消息发送数量进行设定,通常是设为每小时不超过300条, 一旦同一号码一小时内短消息的发送数量超过这个阈值,短消息中心就将这个号码加入黑名单,加入黑 名单的号码不再能发送短消息(包括正常的短消息)。通常为了防止用户的投 诉,黑名单中的号码具有时效性,经过一段时间后,会从黑名单中移去该号码, 恢复它的短消息正常发送功能。该方法的优点在于系统容易实现,但有两个缺点(1)同一号码单位时间内发送短消息数的阈值很难界定,如果设的太大, 达不到拦截和过滤的效果;设的太小,又容易把正常用户的正常短消息给拦截 过滤(随着智能手机的普及, 一些手机可支持短消息批量群发);(2)阈值参数很容易被垃圾短消息发送者试验出来, 一旦发现后,他们就可以通过调整 速度来逃避被监控和拦截。发明内容为了解决上述的技术问题,本发明提供了一种基于主叫号码位置和发送内 容的垃圾短消息识别系统及方法,其目的在于,提高垃圾短消息的识别率,实 时地过滤利用群发器发送的垃圾短消息。本发明提供了基于主叫号码位置和发送内容的垃圾短消息识别方法,包括步骤1,判断已发送的具有相同内容的短消息的数量是否达到第一阈值, 如果是,执行步骤2;步骤2 ,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出 现次数进行统计如果具有所述相同内容的短消息的后续所有主叫号码的位置 信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意 一个位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短 消息;步骤3,将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心 过滤垃圾短消息。 步骤1包括步骤21,依据短消息内容计算散列值;步骤22,计算已发送的散列值相同的短消息的数量,并判断该数量是否 达到第一阈值,如果是,执行步骤2。步骤21中,只对短消息内容的长度大于预设值的短消息计算其短消息内 容的散列值。步骤22中,还将散列值相同的短消息归为一短消息类,并将短消息数量 超过第一阈值的短消息类标记为可疑短消息类。步骤3中,短消息中心还将垃圾短消息的主叫号码加入短消息禁发黑名单。步骤21之前还包括步骤20:设置散列表,用于依据散列值记录短消息所 属的短消息类以及标记可疑短消息类,并记录后续发送属于可疑短消息类的短 消息的主叫号码的位置信息出现次数。所述主叫号码的位置信息为主叫号码所在地的经纬度信息。步骤2包括步骤61,接收后续发送的短消息;步骤62,通过定位平台获取发送属于可疑短消息类的短消息的主叫号码 所在地的经纬度信息,并在散列表中记录该经纬度信息的出现次数;步骤63,如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消 息为垃圾短消息。还包括步骤4,定期清除散列表中的非可疑短消息类。本发明提供了基于主叫号码位置和发送内容的垃圾短消息识别系统,包括短消息聚类模块,用于判断已发送的具有相同内容的短消息的数量是否达 到第一阈值;垃圾短消息识别模±央,用于在已发送的具有相同内容的短消息的数量达到第一阈值时,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计如果具有所述相同内容的短消息的所有主叫号码的位置信息 出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个 位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消 息;还用于将垃圾短消息的主叫号码发送至主叫号码发送模块;主叫号码发送模块,用于将垃圾短消息的主叫号码发送至短消息中心,用 于供短消息中心过滤垃圾短消息。短消息聚类模块,还用于依据短消息内容计算散列值,计算已发送的散列 值相同的短消息的数量,并判断该数量是否达到第一阈值。短消息聚类模块,只对短消息内容的长度大于预设值的短消息内容计算散 列值。短消息聚类模块,还用于将散列值相同的短消息归为一短消息类,并将短 消息的数量超过第一阈值的短消息类标记为可疑短消息类。短消息聚类模块,还用于设置散列表,以依据散列值记录短消息所属的短 消息类,并记录后续发送属于可疑短消息类的短消息的主叫号码的位置信息出 现次数。所述主叫号码的位置信息为主叫号码所在地的经纬度信息。 垃圾短消息识别模块,还用于利用定位平台获取发送属于可疑短消息类的 短消息的主叫号码所在地的经纬度信息,并在散列表中记录该经纬度信息的出 现次数;如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经 纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消息为垃 圾短消息。还包括管理模块,用于定期清除散列表中的非可疑短消息类。 本发明提供了一种移动网络,包括短消息中心和定位平台,还包括上述的基于主叫号码位置和发送内容的垃圾短消息识别系统;垃圾短消息识别系统分 别与短消息中心和定位平台连接;垃圾短消息识别系统,通过定位平台获取主 叫号码的位置信息。本发明可保证短消息中心收到的大量短消息被实时高效地过滤、分类和处 理,并实现对垃圾短消息的实时拦截。本发明首先根据群发垃圾短消息大量重 复的特征,设计有效的散列算法保存短消息内容,并在此基础上对短消息流量 进行内容聚分类,使得在线识别垃圾短消息成为可能。本发明进一步使用主叫 号码的地理位置信息,从而有效识别群发器产生的垃圾短消息,且对合某个体 用户批量发送的短消息不会产生误报。


图1为本发明提供的垃圾短消息识别系统结构图; 图2为本发明提供的垃圾短消息识别流程图; 图3为使用定位平台获取主叫号码的位置信息示意图; 图4为安装有垃圾短消息识别系统的移动网络示意图。
具体实施方式
经过对大量垃圾短消息进行统计分析,发现使用群发器发送的垃圾短消息 具有以下两个显著的特点 一是垃圾短消息内容大量重复,二是发送这些短消 息主叫号码往往位于某一个或几个固定的位置且发送总数较大。而移动终端发 送的短消息不会同时具有上述特征。基于上述结论,本发明提出了一种基于主叫号码位置和发送内容的垃圾短 消息识别方法首先使用有效的散列算法,将短消息内容转化为易于比较与维 护的散列值;其次,根据散列值间的比较结果将内容大量重复的短消息聚为一 类;再次,如果某短消息类中短消息发送数量超过事先设定的阈值力,则对后 续发送相同短消息的主叫号码位置信息及出现次数进行统计;如果后续所有主 叫号码的位置信息出现次数之和大于预先设定的阈值力或某一个位置信息出 现次数大于预先设定的阈值力,则此短消息类中所有短消息为垃圾短消息。本发明的垃圾短消息识别系统(简称识别系统)主要分为四个部分,如图l所示短消息聚类模块201、垃圾短消息识别模块202、主叫号码发送模块 203和管理模块204。短消息聚类模块201实时扫描短消息流量,将内容重复 的短消息聚成一类,并统计各类中短消息数量,如果某个类中短消息数量超过 设定阈值力(力为自然数),则将该短消息类标记为可疑短消息类,短消息数 量达不到阈值h的短消息类为非可疑短消息类;垃圾短消息识别模块202对 可疑短消息类后续短消息的主叫号码位置信息进行统计,如果内容相同的短消 息具有相同的地理位置且该地理位置出现次数达到力(力为自然数)或者所有 内容相同的短消息的地理位置出现次数达到力(力为自然数),则此短消息类 为垃圾短消息类,并将垃圾短消息的主叫号码发送至主叫号码发送模块203。 主叫号码发送模块203将当前短消息对应的主叫号码发送至短消息中心,短消 息中心将该号码加入短消息禁发黑名单,禁止它进一步发送垃圾短消息;管理 模块204将定期删除散列表中的短消息类,以保证内存的可用性。通常,管理 模块204处于闲置状态;另每隔一个周期f,管理模块204依据散列表中短消 息类属性自动清除散列表中非可疑短消息类。下面对短消息内容重复识别问题进行描述将一封短消息的正文部分(以 下简称为短消息)看成是长度为x的字节序列]VNZ^2…ZU乍为研究短消息聚类性质的一个方面,确定给定的yt封短消息,其内容是否存在重复。因此, 一种可行的方法是依次比较短消息中各字节序列是否相同,为提高 比较效率,要用数据结构T保存访问过的短消息内容。遇到一封新短消息,首 先与T中的元素比较,若不在其中,则将它加入T中,并将短消息出现的次 数计为l,否则直接将T中该短消息出现的次数加一。一种具体的实现方法是将T组织成一个链表,按照短消息到达的顺序,将 短消息内容依次写入链表。对于新到的短消息,首先査询链表中所有短消息, 如果该短消息第一次出现,则将当前短消息加在链表尾部,并将该短消息出现 次数记为l;否则更新链表中已经存在短消息的出现次数。重复此过程。为保证快速完成检索、比较、统计等操作及减少内存开销,保证算法的可 用性,另一种实现方法是将T组织成一个散列表。散列方法通常有两种, 一种是对整个短消息内容做散列, 一封短消息内容 对应着一个散列值,该方法对长度较短的散列对象有效;另一种方法是对短消息内容的若干个字节子序列做散列, 一封短消息对应着一个散列值的集合,该 方法对长度较大的散列对象比较有效。考虑到短消息内容长度较小(最大长度为140字节),为保证可读性, 一次发送中短消息内容不会随机变化,因此在 本发明中选用第一种散列方法。同时要保证散列值的值域足够大,能够唯一代 表原始短消息。即,如果两个散列值不等,则它们代表的原始短消息不同;如 果两个散列值相同,则它们所代表的原始短消息不同的概率极小。在本发明中,使用散列算法为MD5算法,散列的对象是整个短消息内容 M,散列表中保存的是对应的散列值&。其中/z尸MD5(M)。通过对垃圾和非 垃圾短消息的长度进行统计,发现垃圾短消息一般长度大于30字节,因此在 本发明中,仅对长度大于30字节的短消息进行散列运算;对长度小于30的短 消息不做任何操作。散列表中每个表项都包括基础表项和扩展表项,并对应着一个短消息类。基础表项中有三个字段,第一个字段记录归入此短消息类中短消息的总数。第二个字段记录短消息内容对应的散列值。第三个字段记录短消息类属性,如果为可疑短消息类则此字段值为1,如果为垃圾短消息类则此字段值为2,如果为非可疑短消息类则该字段值为0。扩展表项组织成一个链表,链表中每个单元由发送散列值为^的短消息的 主叫号码所在地的经纬度信息和该信息的出现次数组成。短消息聚类模块201对收到的短消息内容进行MD5的散列计算,并检査 散列表,如果散列值已经存在于表中,则增加短消息数量;否则在散列表中新 建一个短消息类,并设置类中短消息数量为1。当该类中短消息数量达到预先 设定的阈值^,则将该短消息类标记为可疑短消息类。为了提高效率,短消息 聚类模块201也可以先检査接收到的短消息内容的长度,如果小于30字节, 则不做任何操作,否则对短消息内容进行MD5的散列计算,然后进行相应处 理。本发明中,散列表存放在短消息聚类模块201中,其余模块通过与短消息 聚类模块201的接口访问散列表;当然散列表也可以独立存在,发明中各个模 块与之进行独立的通信,以访问或修改散列表中的数据。在移动通信系统中,移动用户每时每刻的位置都可能是不定的,移动网络 要为每个用户随时提供业务,就要求随时知道移动用户所在的位置,如用户所在地的LAC和CellID等信息。其中LAC (Location Area Code)为位置区域 号码,是一个2字节BCD编码;CdlID为小区识别号,代表着LAC内的一 个小区。每次移动用户变换位置时,都会主动与网络进行联系,如用户跨越位 置区时,会通过BSC向MSC/VLR报告,VLR会保存用户当前最新的LAC和 CellID。当用户跨越MSC服务区边界时,VLR会向HLR报告用户所在VLR 的位置,也即HLR总是保存所有用户所在的VLR的位置信息。在移动通信网 中,用户可以通过现有定位平台提供定位业务获取某主叫号码的位置信息。定 位平台的工作原理如下用户通过平台提供的査询接口输入待査的主叫号码, 平台根据主叫号码信息与相应的HLR、 MSC/VLR进行通信,从而获取该主叫 号码对应的无线环境信息,如LAC或邻Cell ID等值,并将这些参数转换成 主叫号码所在地的经纬度信息返回给用户。垃圾短消息识别模块202对可疑类后续短消息的主叫号码位置信息进行 统计,如果后续所有主叫号码的位置信息出现次数之和大于预先设定的阈值力 或某一个位置信息出现次数大于预先设定的阈值力(力为自然数),则此短消 息类为垃圾短消息类。如果当前短消息被分入可疑短消息类,垃圾短消息识别模块202首先利用 定位平台实时査询主叫号码的位置信息。定位平台收到査询请求后,通过与 HLR、 MSC/VLR进行通信,获取主叫号码所在地的无线环境信息,如LAC 或/和CdlID等值,并将这些参数转化为主叫号码所在地的经纬度信息,提供 给垃圾短消息识别模块202。如果查询失败,则垃圾短消息识别模块202结束 当前短消息处理流程。图3为使用定位平台获取主叫号码的位置信息示意图。垃圾短消息识别模块202获取该主叫号码的位置信息,将该散列值(即 对应的位置信息保存在散列表的扩展表项中,本发明中用V来描述可疑短消 息类中后续短消息的主叫号码的位置信息,其中V产[L;…乙],m《k。如果V,中所有主叫号码的位置信息出现次数之和大于预先设定的阈值力 或某个位置信息出现次数大于预先设定的阈值力,则将该可疑类标记为垃圾短 消息类,并将该短消息的主叫号码提交给主叫号码发送模块203。主叫号码发送模块203,将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。上述参数力取值为50,参数力取值为800,参数力取值为500, f取值为2小时。本发明中的方法如图2所示,包括如下步骤步骤301,初始化,构建存储散列值的散列表,接收一条新的短消息。步骤302,计算所接收到的新短消息的散列值。步骤303,判断散列值是否存在于散列表中,如果是,执行步骤304,否 则执行步骤311;步骤304,修改散列表,则将散列值出现的次数增加1;步骤305,判断散列值出现次数是否大于fO,如果是执行步骤306,否则 执行步骤312;步骤306,通过定位平台实时査询主叫号码的位置信息;步骤307,判断本次査询是否成功,如果是执行步骤308,否则执行步骤312;步骤308,获取主叫号码所在地的经纬度信息,如果该经纬度信息第一次 出现,则将经纬度信息写入该散列值所对应的表项中,且其出现次数记为l; 否则其出现次数增加1;步骤309,判断Vi中所有经纬度信息出现次数之和是否大于预先设定的 阈值fl或某个经纬度信息出现次数是否大于预先设定的阈值f2;如果上述条 件至少一个成立,执行步骤310,否则执行步骤312;步骤310,将发送该短消息的主叫号码加入黑名单,执行步骤312;步骤311,将散列值加入散列表,将散列值出现的次数记为1,然后再执 行步骤312;步骤312,接收下一封短消息,并按照上述流程进行处理。 图4详细描述了本发明的网络结构,发送一侧移动终端和群发工具同时存 在,通过接入网进入网络,通过短消息中心转发,经MSC选路最后到达接收 一侧。本发明中的垃圾短消息识别系统与短消息中心、定位平台连接。垃圾短 消息识别系统可从短消息中心获得短消息中心上短消息流量的镜像,不影响短 消息中心正常的处理工作;同时垃圾短消息识别系统可将垃圾短消息对应的主 叫号码制成黑名单并传递给短消息中心,进行实时过滤。垃圾短消息识别系统 可通过定位平台实时获得主叫号码的位置信息。垃圾短消息识别系统处理短消 息中心分流的镜像数据,并将处理结果写入日志。此外,短消息过滤方案具有较好的实时性能, 一旦发现垃圾短消息后,可 将该短消息对应的主叫号码制成黑名单,实时传给短消息中心,及时拦截群发 器后续发送的垃圾短消息。另外,任何经运营商许可进行群发业务的主叫号码 可设置在短消息中心的白名单列表中,且此白名单的优先级高于黑名单,因此本发明不会对合法主叫号码的群发业务产生影响。本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条 件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于 以上的说明,而是由权利要求书的范围来确定的。
权利要求
1、基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,包括步骤1,判断已发送的具有相同内容的短消息的数量是否达到第一阈值,如果是,执行步骤2;步骤2,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计如果具有所述相同内容的短消息的后续所有主叫号码的位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;步骤3,将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。
2、 如权利要求1所述的基于主叫号码位置和发送内容的垃圾短消息识别方法,其特征在于,步骤l包括-步骤21,依据短消息内容计算散列值;步骤22,计算已发送的散列值相同的短消息的数量,并判断该数量是否 达到第一阈值,如果是,执行步骤2。
3、 如权利要求2所述的基于主叫号码位置和发送内容的垃圾短消息识别 方法,其特征在于,步骤21中,只对短消息内容的长度大于预设值的短消息 计算其短消息内容的散列值。
4、 如权利要求2所述的基于主叫号码位置和发送内容的垃圾短消息识别 方法,其特征在于,步骤22中,还将散列值相同的短消息归为一短消息类, 并将短消息数量超过第一阈值的短消息类标记为可疑短消息类。
5、 如权利要求2、 3或4所述的基于主叫号码位置和发送内容的垃圾短消 息识别方法,其特征在于,步骤3中,短消息中心还将垃圾短消息的主叫号码 加入短消息禁发黑名单。
6、 如权利要求5所述的基于主叫号码位置和发送内容的垃圾短消息识别 方法,其特征在于,步骤21之前还包括步骤20:设置散列表,用于依据散列 值记录短消息所属的短消息类以及标记可疑短消息类,并记录后续发送属于可疑短消息类的短消息的主叫号码的位置信息出现次数。
7、 如权利要求5所述的基于主叫号码位置和发送内容的垃圾短消息识别 方法,其特征在于,所述主叫号码的位置信息为主叫号码所在地的经讳度信息。
8、 如权利要求7所述的基于主叫号码位置和发送内容的垃圾短消息识别 方法,其特征在于,步骤2包括步骤61,接收后续发送的短消息;步骤62,通过定位平台获取发送属于可疑短消息类的短消息的主叫号码所在地的经纬度信息,并在散列表中记录该经纬度信息的出现次数;步骤63,如果所有经纬度信息的出现次数之和达到第二阈值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短消息类的短消 息为垃圾短消息。
9、 如权利要求6、 7或8所述的基于主叫号码位置和发送内容的垃圾短消 息识别方法,其特征在于,还包括步骤4,定期清除散列表中的非可疑短消息 类。
10、 基于主叫号码位置和发送内容的垃圾短消息识别系统,其特征在于, 包括短消息聚类模块,用于判断已发送的具有相同内容的短消息的数量是否达 到第一阈值;垃圾短消息识别模块,用于在已发送的具有相同内容的短消息的数量达到 第一阈值时,对后续发送具有所述相同内容的短消息的主叫号码的位置信息出 现次数进行统计如果具有所述相同内容的短消息的所有主叫号码的位置信息 出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个 位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消 息;还用于将垃圾短消息的主叫号码发送至主叫号码发送模块;主叫号码发送模块,用于将垃圾短消息的主叫号码发送至短消息中心,用 于供短消息中心过滤垃圾短消息。
11、 如权利要求io所述的基于主叫号码位置和发送内容的垃圾短消息识别系统,其特征在于,短消息聚类模块,还用于依据短消息内容计算散列值, 计算已发送的散列值相同的短消息的数量,并判断该数量是否达到第一阈值。
12、 如权利要求11所述的基于主叫号码位置和发送内容的垃圾短消息识别系统,其特征在于,短消息聚类模块,只对短消息内容的长度大于预设值的 短消息内容计算散列值。
13、 如权利要求12所述的基于主叫号码位置和发送内容的垃圾短消息识 别系统,其特征在于,短消息聚类模块,还用于将散列值相同的短消息归为一 短消息类,并将短消息的数量超过第一阈值的短消息类标记为可疑短消息类。
14、 如权利要求IO、 11、 12或13所述的基于主叫号码位置和发送内容的垃圾短消息识别系统,其特征在于,短消息聚类模块,还用于设置散列表,以 依据散列值记录短消息所属的短消息类,并记录后续发送属于可疑短消息类的 短消息的主叫号码的位置信息出现次数。
15、 如权利要求14所述的基于主叫号码位置和发送内容的垃圾短消息识别系统,其特征在于,所述主叫号码的位置信息为主叫号码所在地的经纬度信 阜>K、 o
16、 如权利要求15所述的基于主叫号码位置和发送内容的垃圾短消息识 别系统,其特征在于,垃圾短消息识别模块,还用于通过定位平台获取发送属 于可疑短消息类的短消息的主叫号码所在地的经纬度信息,并在散列表中记录 该经纬度信息的出现次数;如果所有经纬度信息的出现次数之和达到第二阈 值,或者任意一个经纬度信息的出现次数达到第三阈值,则判断属于该可疑短 消息类的短消息为垃圾短消息。
17、 如权利要求16所述的基于主叫号码位置和发送内容的垃圾短消息识 别系统,其特征在于,还包括管理模块,用于定期清除散列表中的非可疑短消 息类。
18、 一种移动网络,包括短消息中心和定位平台,其特征在于,还包括如 权利要求IO所述的基于主叫号码位置和发送内容的垃圾短消息识别系统;垃 圾短消息识别系统分别与短消息中心和定位平台连接;垃圾短消息识别系统, 通过定位平台获取主叫号码的位置信息。
全文摘要
本发明涉及基于主叫号码位置和发送内容的垃圾短消息识别系统及方法。该方法包括判断已发送的具有相同内容的短消息的数量是否达到第一阈值,如果是,则对后续发送具有所述相同内容的短消息的主叫号码的位置信息出现次数进行统计如果具有所述相同内容的短消息的所有主叫号码位置信息出现次数之和达到第二阈值,或者如果具有所述相同内容的短消息的任意一个主叫号码位置信息出现次数达到第三阈值,则判断所述相同内容的短消息为垃圾短消息;将垃圾短消息的主叫号码发送至短消息中心,用于供短消息中心过滤垃圾短消息。本发明可保证短消息中心收到的大量短消息被实时高效地过滤、分类和处理,并实现对垃圾短消息的实时拦截。
文档编号H04Q7/22GK101335920SQ20081011668
公开日2008年12月31日 申请日期2008年7月15日 优先权日2008年7月15日
发明者德 刘, 尼 张, 岩 张, 磊 王, 欣 邹, 芳 顾, 黄文良 申请人:中国联合通信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1