本发明涉及通讯信息安全技术领域,尤其涉及一种基于诈骗短信的诈骗团伙识别系统及识别方法。
背景技术:
近年来,各种诈骗事件层出不穷,给社会造成了巨大的经济损失。其中,电信诈骗事件里,犯罪分子通过网络、电话和短信,编造虚假信息,设置骗局,对受害人实施远程诈骗,诱导受害人给诈骗分子打款或转账。
当前活跃在社会上的各种各样的电信诈骗形式多种多样,有中奖诈骗、汽车退税诈骗、冒充熟人诈骗、直接汇款诈骗、电话欠费诈骗、冒充公检法诈骗等等。
目前电信网诈骗团伙,事件发现主要依靠单维度分析,如手机号相识度进行比较;随着电信网诈骗的发展,近几年电信网诈骗更是多样化,团伙诈骗令人防不胜防,单一的分析无法准确识别诈骗事件,不能准确发现其诈骗团伙。
因此,现有针对电信诈骗的分析技术造成预警延时、治理打击电信诈骗困难的问题。
因此,提供一种基于诈骗短信的诈骗团伙识别系统及识别方法。
技术实现要素:
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于诈骗短信的诈骗团伙识别系统及识别方法,解决了单一的分析无法准确识别诈骗事件的问题。
根据本发明的一个方面,提供一种基于诈骗短信的诈骗团伙识别方法,包括:
实时识别诈骗短信、该诈骗短信的类别以及该诈骗短信的通讯时间点,并提取该诈骗短信的敏感信息;
对该诈骗短信进行通联关系分析,获取该诈骗短信在预定时间范围内所有相关通讯数据;
从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息;
根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。
进一步地,实时识别诈骗短信、该诈骗短信的类别,具体实现如下:
收集多条历史诈骗短信/语音的相关数据,并从每条历史诈骗短信/语音的相关数据提取历史诈骗短信/语音的特征向量和诈骗类别,其中,历史诈骗短信/语音的特征向量包括历史诈骗短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;新短信/语音的特征向量包括新短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;
根据历史诈骗短信/语音的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;
实时接收新短信/语音的相关数据,并从每条新短信/语音的相关数据中提取新短信/语音的特征向量,并将新短信/语音的特征向量输入诈骗短信/语音判断模型中,获取新短信/语音是否属于诈骗短信/语音以及属于哪种诈骗类别,若是,则确定新短信/语音属于诈骗短信/语音以及属于哪种诈骗类别。
进一步地,预定时间范围是以通讯时间点为中点的预定段时间。
进一步地,从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,具体实现如下:
获取诈骗短信的被叫信息;
查询以短信、电话以及网络方式向被叫信息发送敏感信息的主叫信息。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:获取新短信/语音属于该种诈骗类别的置信度,
其中,置信度的获取通过以下方式:当新短信/语音属于诈骗短信/语音时,对新短信/语音进行多维验证,每个维度的验证均附有对应的权重值,根据每个维度和对应的权重值进行置信度分析。
根据本发明的另一方面,提供一种基于诈骗短信的诈骗团伙识别系统,包括:
诈骗短信识别模块,用于实时识别诈骗短信、该诈骗短信的类别以及该诈骗短信的通讯时间点;
敏感信息提取模块,用于提取该诈骗短信的敏感信息;
通联关系分析模块,用于对该诈骗短信进行通联关系分析,获取该诈骗短信在预定时间范围内所有相关通讯数据;
主叫信息获取模块,用于从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息;
诈骗信息获取模块,用于根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。
进一步地,诈骗短信识别模块包括:
历史诈骗短信/语音特征向量提取单元,用于收集多条历史诈骗短信/语音的相关数据,并从每条历史诈骗短信/语音的相关数据提取历史诈骗短信/语音的特征向量和诈骗类别,其中,历史诈骗短信/语音的特征向量包括历史诈骗短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;新短信/语音的特征向量包括新短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;
诈骗短信模型训练单元,用于根据历史诈骗短信/语音的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;
诈骗短信识别单元,用于实时接收新短信/语音的相关数据,并从每条新短信/语音的相关数据中提取新短信/语音的特征向量,并将新短信/语音的特征向量输入诈骗短信/语音判断模型中,获取新短信/语音是否属于诈骗短信/语音以及属于哪种诈骗类别,若是,则确定新短信/语音属于诈骗短信/语音以及属于哪种诈骗类别。
进一步地,在通联关系分析模块,预定时间范围是以通讯时间点为中点的预定段时间。
进一步地,主叫信息获取模块包括:
被叫信息获取单元,用于获取诈骗短信的被叫信息;
主叫信息获取单元,用于查询以短信、电话以及网络方式向被叫信息发送敏感信息的主叫信息。
进一步地,基于诈骗短信的诈骗团伙识别系统,还包括:诈骗类别置信度获取模块,用于获取新短信/语音属于该种诈骗类别的置信度,其中,置信度的获取通过以下方式:当新短信/语音属于诈骗短信/语音时,对新短信/语音进行多维验证,每个维度的验证均附有对应的权重值,根据每个维度和对应的权重值进行置信度分析。
本发明与现有技术相比具有以下的优点:
本发明的基于诈骗短信的诈骗团伙识别方法及识别系统以识别的诈骗短信为分析点,提取诈骗短信的敏感信息,提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息,以获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
附图说明
以下结合附图和实施例对本发明作进一步说明。
图1是本发明的基于诈骗短信的诈骗团伙识别方法步骤图;
图2是本发明的基于诈骗短信的诈骗团伙识别系统框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
图1是本发明的基于诈骗短信的诈骗团伙识别方法步骤图,参见图1,本发明提供的基于诈骗短信的诈骗团伙识别方法,包括:
s1,实时识别诈骗短信、该诈骗短信的类别以及该诈骗短信的通讯时间点,并提取该诈骗短信的敏感信息。在这里,敏感信息是指诈骗短信中涉及诈骗类别的关键字等,例如,中奖。诈骗短信的类别可以为积分诈骗、航空诈骗、活动诈骗、支付诈骗、中奖诈骗、汽车退税诈骗、冒充熟人诈骗、直接汇款诈骗、电话欠费诈骗、冒充公检法诈骗中的一种或多种。
实时识别诈骗短信、该诈骗短信的类别,具体实现如下:
收集多条历史诈骗短信/语音的相关数据,并从每条历史诈骗短信/语音的相关数据提取历史诈骗短信/语音的特征向量和诈骗类别,其中,历史诈骗短信/语音的特征向量包括历史诈骗短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;新短信/语音的特征向量包括新短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;
根据历史诈骗短信/语音的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;
实时接收新短信/语音的相关数据,并从每条新短信/语音的相关数据中提取新短信/语音的特征向量,并将新短信/语音的特征向量输入诈骗短信/语音判断模型中,获取新短信/语音是否属于诈骗短信/语音以及属于哪种诈骗类别,若是,则确定新短信/语音属于诈骗短信/语音以及属于哪种诈骗类别。
s2,对该诈骗短信进行通联关系分析,获取该诈骗短信在预定时间范围内所有相关通讯数据。
其中,预定时间范围是以通讯时间点为中点的预定段时间。例如,当通讯时间点为某日上午10点时,预定时间范围可以为该日上午8点到12点。
s3,从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息。
具体实现如下:
获取诈骗短信的被叫信息;
查询以短信、电话以及网络方式向被叫信息发送敏感信息的主叫信息以及与主叫号码相似度超过阈值的主叫信息。例如,相似度阈值可以设置为两个主叫号码前9位相同。
s4,根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本等。
本发明以诈骗短信为中心,通联分析向该诈骗短信的被叫信息发送与该诈骗短信关联信息的所有主叫信息,分析所有主叫信息的信息发送时间和发送地点,有效发现新团伙或已知团伙的成员以及整个诈骗事件,因此,通过自动分析及预测,通过及时识别电信网的诈骗信息,能够对未来诈骗团伙的时间和地区分布进行预测,并做出及时准确的预警。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:获取新短信/语音属于该种诈骗类别的置信度,
其中,置信度的获取通过以下方式:当新短信/语音属于诈骗短信/语音时,对新短信/语音进行多维验证,每个维度的验证均附有对应的权重值,根据每个维度和对应的权重值进行置信度分析。
在这里,利用置信度进一步确定诈骗短信的诈骗类别,使得诈骗类别的确定更可靠。
本发明的基于诈骗短信的诈骗团伙识别方法以识别的诈骗短信为分析点,提取诈骗短信的敏感信息,提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息,以获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:根据诈骗团伙的诈骗地区和诈骗时间对该类诈骗事件进行还原,以对各个诈骗事件的受害程度、危险评分进行评估展示。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:收集并根据同一类别的诈骗团伙的诈骗地区和诈骗时间的变化进行趋势预测。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:周期性收集多条历史诈骗短信的相关数据对诈骗短信判断模型进行更新。
本发明针对诈骗团伙通讯多样化的特点,采用大数据分析收集不同类别的历史诈骗短信,通过自学习技术构建诈骗短信判断模型,周期性收集多条历史诈骗短信的相关数据对诈骗短信判断模型进行自回溯验证,对新短信进行实时验证,及时识别电信网的诈骗短信,对诈骗短信进行通联关系分析,对诈骗团伙的发现进行多维验证,使得诈骗团伙的诈骗地区和诈骗时间更准确,并对同一类别的诈骗团伙的诈骗地区和诈骗时间的变化进行趋势预测等,掌握诈骗团伙的动态信息,对整个诈骗事件进行多维跟踪识别,能够更容易掌握诈骗团伙的动向,使得对同一类别的诈骗团伙的诈骗地区和诈骗时间的变化进行趋势预测更准确,对未来诈骗团伙的时间和地区分布进行全方位的预测,做出及时准确的预警。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:用于分布式存储不同类别的多条历史诈骗短信的相关数据。
进一步地,上述基于诈骗短信的诈骗团伙识别方法,还包括:对多条历史诈骗短信的相关数据快速抓取和分发。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
图2是本发明的基于诈骗短信的诈骗团伙识别系统框图,参见图2,本发明提供的基于诈骗短信的诈骗团伙识别系统,包括:
诈骗短信识别模块,用于实时识别诈骗短信、该诈骗短信的类别以及该诈骗短信的通讯时间点;
敏感信息提取模块,用于提取该诈骗短信的敏感信息;
通联关系分析模块,用于对该诈骗短信进行通联关系分析,获取该诈骗短信在预定时间范围内所有相关通讯数据;
主叫信息获取模块,用于从所有相关通讯数据中分别提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息;
诈骗信息获取模块,用于根据所有主叫信息获取诈骗团伙的诈骗地区、诈骗时间、团伙成员、团伙剧本。
进一步地,诈骗短信识别模块包括:
历史诈骗短信/语音特征向量提取单元,用于收集多条历史诈骗短信/语音的相关数据,并从每条历史诈骗短信/语音的相关数据提取历史诈骗短信/语音的特征向量和诈骗类别,其中,历史诈骗短信/语音的特征向量包括历史诈骗短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;新短信/语音的特征向量包括新短信/语音的发送/呼叫频率分布分析、主叫诈骗号码分析、主叫特征、被叫特征、被叫关系网分析、被叫类型分析、敏感信息分析和短信/语音内容;
诈骗短信模型训练单元,用于根据历史诈骗短信/语音的特征向量和诈骗类别进行诈骗短信模型训练,获取诈骗短信判断模型;
诈骗短信识别单元,用于实时接收新短信/语音的相关数据,并从每条新短信/语音的相关数据中提取新短信/语音的特征向量,并将新短信/语音的特征向量输入诈骗短信/语音判断模型中,获取新短信/语音是否属于诈骗短信/语音以及属于哪种诈骗类别,若是,则确定新短信/语音属于诈骗短信/语音以及属于哪种诈骗类别。
进一步地,在通联关系分析模块,预定时间范围是以通讯时间点为中点的预定段时间。
进一步地,主叫信息获取模块包括:
被叫信息获取单元,用于获取诈骗短信的被叫信息;
主叫信息获取单元,用于查询以短信、电话以及网络方式向被叫信息发送敏感信息的主叫信息。
进一步地,上述基于诈骗短信的诈骗团伙识别系统,还包括:诈骗类别置信度获取模块,用于诈骗类别置信度获取模块,用于获取新短信/语音属于该种诈骗类别的置信度,
其中,置信度的获取通过以下方式:当新短信/语音属于诈骗短信/语音时,对新短信/语音进行多维验证,每个维度的验证均附有对应的权重值,根据每个维度和对应的权重值进行置信度分析。
本发明的基于诈骗短信的诈骗团伙识别方法及识别系统以识别的诈骗短信为分析点,提取诈骗短信的敏感信息,提取与敏感信息有关联的主叫信息和被叫信息,并提取与主叫号码相似度超过阈值的主叫信息以及与该主叫信息对应的被叫信息,以获取与诈骗短信同一主叫的有关语音信息进行分析,从而获取以多种方式向被叫信息发送敏感信息的所有主叫信息和主叫语音,对所有主叫信息进行整体分析,以获取诈骗团伙的诈骗地区、诈骗时间、团伙成员等,实现诈骗团伙识别的自动化。
进一步地,上述基于诈骗短信的诈骗团伙识别系统,还包括:诈骗事件还原模块,用于根据诈骗团伙的诈骗地区和诈骗时间对该类诈骗事件进行还原,以对各个诈骗事件的受害程度、危险评分进行评估展示。
进一步地,上述基于诈骗短信的诈骗团伙识别系统,还包括:趋势预测模块,用于收集并根据同一类别的诈骗团伙的诈骗地区和诈骗时间的变化进行趋势预测。
进一步地,诈骗短信模型训练单元,还用于周期性收集多条历史诈骗短信的相关数据对诈骗短信判断模型进行更新。
本发明针对诈骗团伙通讯多样化的特点,采用大数据分析收集不同类别的历史诈骗短信,通过自学习技术构建诈骗短信判断模型,周期性收集多条历史诈骗短信的相关数据对诈骗短信判断模型进行自回溯验证,对新短信进行实时验证,及时识别电信网的诈骗短信,对诈骗短信进行通联关系分析,对诈骗团伙的发现进行多维验证,使得诈骗团伙的诈骗地区和诈骗时间更准确,并对同一类别的诈骗团伙的诈骗地区和诈骗时间的变化进行趋势预测等,掌握诈骗团伙的动态信息,对整个诈骗事件进行多维跟踪识别,能够更容易掌握诈骗团伙的动向,使得对同一类别的诈骗团伙的诈骗地区和诈骗时间的变化进行趋势预测更准确,对未来诈骗团伙的时间和地区分布进行全方位的预测,做出及时准确的预警。
进一步地,上述基于诈骗短信的诈骗团伙识别系统,还包括:数据存储模块,用于分布式存储不同类别的多条历史诈骗短信的相关数据。
进一步地,上述基于诈骗短信的诈骗团伙识别系统,还包括:数据处理模块,用于对多条历史诈骗短信的相关数据快速抓取和分发。
对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。