一种基于时序语义图的欺诈监测与预警方法

文档序号：10724884阅读：526来源：国知局

一种基于时序语义图的欺诈监测与预警方法
【专利摘要】本发明涉及一种基于时序语义图的欺诈监测与预警方法，利用时序语义图判断通讯文本中是否包含某种欺诈行为的语义信息、时序和逻辑特征，从而确定是否反馈预警信息；时序语义图由三种元素组成：位置、转移操作和有向连接；位置与转移操作之间的有向连接表征了每种欺诈模式的时序和逻辑特征，转移操作可以是语义信息匹配，或者是预警信息反馈，反映着欺诈模式的核心语义特征，通过判断通讯文本中是否包含这些语义信息，来确定文本中是否包含欺诈的语义信息，这些语义信息通过位置和转移操作之间的有向连接，有序地、有逻辑性地组织起来，从而更准确地表征了欺诈的模式。本发明提供更准确的欺诈监测和预警。
【专利说明】
一种基于时序语义图的欺诈监测与预警方法
技术领域
[0001] 本发明涉及一种即时通讯欺诈行为的监测与预警方法，特别是一种基于时序语义图的欺诈行为的监测与预警方法，属于信息技术应用领域。
【背景技术】
[0002] 近年来，利用电话、短信、在线聊天工具等即时通讯手段的欺诈案件时有发生。根据公安部门公布的信息，我国的欺诈案件大概分为15种类型，包括虚假中奖，引诱汇款等。欺诈行为的监测及预警对保障个人财产安全至关重要。目前欺诈监测主要有关键词检测和欺诈规则匹配的方法。关键词检测的方法:首先收集每种欺诈行为中出现频率非常高的词汇。比如，引诱汇款的欺诈行为中高频词汇是"银行账号"、"转账"。如果通讯内容中包含某种欺诈行为的高频词汇，通讯软件就会反馈给用户欺诈预警信息。关键词检测通过对关键词匹配的方法进行欺诈预警，往往会造成较低的查准率(precision)。也就是，很多正常的行为被认定为欺诈行为而向用户反馈预警信息。错误的预警往往会产生"狼来了"的效应，让用户丧失警惕。欺诈规则匹配的方法:首先收集欺诈行为的特征元素，然后组合这些特征元素构成欺诈规则的触发条件。而欺诈行为特征元素组合可能会存在很多的交集，降低了欺诈行为识别的效率。这种方法往往需要匹配整个特征元素的组合才能触发规则，反馈预警信息。
[0003] 很多类型的欺诈都表现出特定的时序和逻辑特征，也就是欺诈过程是经过精心设计，具有一定的操作流程。而关键词检测和欺诈规则匹配的方法忽视了这些特征。即时通讯的内容一般是语音或者文本的形式。语音形式的内容通常也可以转化为文本的形式。所以，识别欺诈行为需要对即时通讯的文本进行分析。语义网络分析是一种常见的文本分析的技术。它通常将文本信息的内容表示成一些信息对象组成的网络，网络的边描述对象之间的关系。然后通过查询这一网络来获得研究问题的信息。然而时序和逻辑特征很难用语义网络表征出来。Petri网是一种最常用的流程建模语言，其常被用于商业流程管理(Business Process Management) Wetri网可以用于描述事件之间的时序和逻辑关系。然而文本的语义信息却很难在Petri网中表示出来。因此，为了更准确地识别欺诈行为，需要一种方法既能识别通讯文本中的特定的语义信息，又能描述这些语义信息之间的时序和逻辑关系。

【发明内容】

[0004] 本发明技术解决问题:克服现有技术的不足，提供一种基于时序语义图的欺诈监测与预警系统与预警方法，利用时序语义图更准确地表征了欺诈的模式，从而可以提供更准确的欺诈监测和预警。
[0005] 本发明技术解决方案:本发明提出了时序语义图的概念，以及基于时序语义图监测及预警欺诈行为的方法。每一种欺诈都有特定的模式。欺诈短信中常常有一些关键的语义信息反映某种欺诈行为。而这些关键的语义信息并不是孤立的，而是有时序、有逻辑性地组织在一起的。时序语义图既能表征文本中的语义信息，又能表征语义信息之间的时序和逻辑特征。基于时序语义图识别欺诈行为，能精确地匹配欺诈模式中的语义、时序和逻辑特征。
[0006]本发明是通过以下技术方案实现的，具体步骤如下：
[0007] (1)通过分析历史的欺诈行为数据，包括欺诈的通讯文本信息和对应的欺诈案件类型，可以提取出每一种欺诈类型的语义、时序和逻辑特征。根据这些特征，对于每一种欺诈类型，建立一个子时序语义图。这些子时序语义图"并联"起来，就是最终的用于识别欺诈行为的时序语义图。时序语义图结合了语义网络和Petri网的特点。一个子时序语义图由三种元素组成:位置、转移操作和有向连接。
[0008] ?位置描述当前在时序和逻辑过程中所处的阶段，用符号?来表示。当前位置用标记(token)·来表示。所以，位置有两种状态一被标记和没被标记。允许多个位置同时被记 D
[0009] ?转移操作有两种，用符号□来表示。一种是匹配特定的结构化的语义信息。不同的转移操作匹配不同的语义信息。另外一种是反馈给用户预警信息。转移操作有两种状态一未激活，已激活。
[0010] ?有向连接指明位置和转移操作之间的时序和逻辑关系，用符号-来表示。
[0011] 位置的标记信息、位置与其指向的转移操作之间的逻辑关系决定了转移操作是否被激活。比如，某一个转移操作有两个父位置，这两个父位置之间是"逻辑与"的关系。只有当这两个父位置都被标记时，这个转移操作才能被激活。当且仅当转移操作被激活时，才能进行相关的语义信息的匹配，或者才能向用户反馈预警信息。
[0012] 语义信息匹配是时序语义图中的转移操作。每一种欺诈行为都对应了特定的语义信息。这些语义信息通过时序语义图的位置与转移操作之间有向连接组织起来。一个转移操作只对应的一个特定结构的语义信息。比如，描述"中奖"这一语义信息，从句法的角度讲，一般是由一个动词和一个名词组成，而且这两个词在句子中是动宾关系。通讯文本中常出现的是"中了二等奖"、"抽选为幸运号"等。收集所有可能描述"中奖"这一语义信息的动词和名词，所有这些动词和名词之间分别具有"同义"的关系。因此，依据动宾关系和"同义" 关系，对于每一个语义信息，都可以建立一个特定的语义结构，用来确定某一文本是否包含该语义信息。语义信息匹配成功，表明该文本中包含对应的语义信息，标记可以转移位置。 [0013] (2)根据已建好的时序语义图，在其初始位置生成当前位置标记。初始位置指向的所有转移操作被激活。初始位置就是欺诈监测的开始，其指向的转移操作是语义信息的匹配。也就是匹配每一种欺诈模式最先出现的语义信息。读入第一条即时通讯的文本，判断该文本中是否包含已激活的转移操作对应的语义信息。如果某一个被激活的转移操作对应的语义信息存在于通讯文本中，表明可能会产生该类欺诈，因此需要继续匹配后续的该欺诈模式的语义信息。这个时候转移操作就被执行。也就是，标记从初始位置向转移操作指向的位置转移。可能存在第一条即时通讯的文本中含有多种欺诈模式的语义信息。所以，多个转移操作会被执行。这时，标记会分裂成多个，转移到相应的多个位置上。如果第一条通讯文本中没有任何欺诈模式最先出现语义信息，继续读入下一条通讯的文本，然后重复上述判断过程。
[0014] (3)当标记转移到新的位置的时候，其指向的转移操作可能被激活。判断最新激活的转移操作是继续匹配欺诈模式的语义信息，还是反馈预警信息。如果是匹配语义信息，按照步骤（1)的方法执行;如果是向用户反馈预警信息，反馈之后，标记也要进行位置的转移。判断新的位置是否是结束位置。如果是，则欺诈行为识别结束;否则继续进行语义信息的匹配。也就是，该预警可能只是提醒用户，后续更进一步的匹配会提供更多的预警信息。
[0015] 本发明与现有关键词检测、欺诈规则匹配等技术相比的优点在于：
[0016] (1)基于时序语义图的欺诈监测及预警的方法，不仅能判断通讯文本中是否包含某种欺诈模式的语义信息，而且能判断这些语义信息是否符合欺诈模式的时序和逻辑特征。每一种欺诈的语义信息之间都有特定的时序和逻辑关系。而现有的技术对欺诈行为的识别都是采用关键词检测的方法。关键词表征欺诈行为的方法忽视了这些特征。与单一的关键词表征相比，时序语义图表征的欺诈模式，提供了更丰富的信息，为更准确地识别欺诈行为奠定了基础。基于时序语义图的监测，根据欺诈模式的时序和逻辑的特征，一步一步地匹配语义信息，使欺诈行为的识别更有效更准确。
[0017] (2)时序语义图匹配的是结构化的语义信息。关键词检测利用的是独立的语义信息，而时序语义图中转移操作对应的语义信息是结构化的，充分地描述了信息概念间的语义关系。基于时序语义图的语义信息匹配，能更准确地判断文本信息的内容。
[0018] (3)基于时序语义图的欺诈预警，可以根据不同程度的匹配，反馈不同的预警信息和措施。时序语义图中不同的位置反映了语义信息的不同的匹配程度。根据具体欺诈模式特点，可以在不同的位置设置不同的预警信息，增强了预警的灵活性和效果。
【附图说明】
[0019] 图1为本发明实现流程图；
[0020] 图2为本发明中的时序语义图示例；
[0021 ]图3为本发明中的"订购服务"和"中奖"的语义结构；
[0022] 图4为本发明中的标记位置转移的两种情况。
【具体实施方式】
[0023] 本发明利用时序语义图判断通讯文本中是否包含某种欺诈行为的语义信息、时序和逻辑特征，从而确定是否反馈预警信息。时序语义图由三种元素组成:位置、转移操作和有向连接。位置与转移操作之间的有向连接表征了每种欺诈模式的时序和逻辑特征。转移操作可以是语义信息匹配，或者是预警信息反馈。而每一个语义信息匹配的转移操作，对应于一个特定的结构化的语义信息，反映着欺诈模式的核心语义特征。通过判断通讯文本中是否包含这些语义信息，来确定文本中是否包含欺诈的语义信息。这些语义信息通过位置和转移操作之间的有向连接，有序地、有逻辑性地组织起来，从而更准确地表征了欺诈的模式。标记及其位置转移操作，使语义信息匹配有序地进行。时序语义图中不同的位置反映了欺诈模式匹配的不同程度。这样可以在不同匹配程度，提供不同的预警信息，使预警反馈更灵活。本发明利用时序语义图更准确地表征了欺诈的模式，从而可以提供更准确的欺诈监测和预警。
[0024] 如图1所示，本发明具体包括以下步骤：
[0025] (1)分析欺诈文本信息，提取出每一种欺诈的模式，建立相应的子时序语义图。最后将这些子时序语义图的初始位置和结束位置分别合并，形成最终的欺诈监测及预警的时序语义图。图3显示了两种欺诈类型（"退订服务"和"虚假中奖"诈骗）的时序语义图。如图2 所示，"退订服务"诈骗涉及到两个具有时序和逻辑关系的环节。第一个环节是告知用户已订购某种服务。第二个环节是提供给用户验证码信息，并告知用户使用验证码可以退订。第二个环节涉及到两种语义信息，而且应该是用两条文本信息的形式分别提供。这两种语义信息没有时序关系，但必须都提供，所以具有逻辑"与"的关系。表1是"退订服务"诈骗的通讯文本示例。
[0026] (2)在已建好的时序语义图上的开始位置，生成一个新的当前位置标记，如图2所示。通过一步一步的语义信息匹配，标记可以从时序语义图的开始位置向结束位置转移。
[0027] (3)标记位置指向的语义信息匹配的转移操作被激活。转移操作是否被激活受其与父位置之间的逻辑关系的影响。如图2所示，根据标记位置，"订购服务"和"中奖"这两个语义信息匹配被激活。
[0028]表1. "退订服务"诈骗短信示例
[0031] (4)读入一条即时通讯文本信息，进行语义信息的匹配。也就是，判断相应的语义信息是否存在于通讯文本中。时序语义图中每一个语义信息的名称，都对应了一个特定的语义结构。比如，图2中的"订购服务"和"中奖"这两种语义信息，分别对应的是图3所示的两个语义结构。如图3所示，对于这两个语义结构，每一个语义结构都是由一个动词和一个名词组成。而这两个词之间存在着句法的动宾关系。每个词都有很多候选的词，这些词是一类 "同义"词。比如，"订购服务"的语义结构，可以产生"开通彩信"、"订购手机报"这样的动宾短语。判断某条通讯文本信息中是否包含这一语义结构表征的语义信息，可以在文本信息中查找语义结构中的所有的词。如果能同时找到一个动词和一个名词，并且这两个词在文本中是动宾关系，则认为该通讯文本信息中包含目标语义信息。否则，认为文本信息中没包含目标语义信息。动宾关系的判断，可以利用现有的自然语言处理技术中的句法分析的方法。
[0032] (5)当语义信息不存在于文本中，读入下一条通讯文本。然后重复(4)。
[0033] (6)当语义信息存在于文本信息中，标记会从该转移操作的父位置转移到子位置。标记转移有如图4的两种情况。图4中，情况1表示初始位置与其指向的转移操作之间是"与" 的关系，也就是两个转移操作都可以被激活;情况2表示初始位置与其指向的转移操作之间是"异或"的关系，也就是两个转移操作只有一个可以被激活，标记只能从其中一个转移操作的路径进行位置的转移。
[0034] (7)新标记的位置指向的转移操作被激活。判断新的转移操作是预警信息反馈还是语义信息匹配。
[0035] (8)如果语义信息匹配被激活，则回到步骤(3)。
[0036] (9)如果预警信息被激活，则输出预警信息，并且进行标记位置转移，方法如步骤 (6)所述。然后，判断新的标记是否是结束位置。如果是结束位置，则欺诈监测与预警结束；否则，回到步骤(3)。
【主权项】
1. 一种基于时序语义图的欺诈监测与预警方法，其特征在于：该方法利用时序语义图判断通讯文本中是否包含某种欺诈行为的语义信息、时序和逻辑特征，从而确定是否反馈预警信息，步骤如下：步骤（1):根据每一种欺诈类型的语义信息、时序和逻辑特征，建立相应的子时序语义图；所述子时序语义图既能表征文本中的语义信息，又能表征语义信息之间的时序和逻辑特征;子时序语义图由三种元素组成:位置、转移操作和有向连接;位置与转移操作之间的有向连接表征每种欺诈模式的时序和逻辑特征；位置描述当前在时序和逻辑过程中所处的阶段;位置有两种状态一被标记和没被标记;允许多个位置同时被标记；转移操作有两种，一种是语义信息的匹配;另外一种是反馈给用户预警信息;转移操作有两种状态:未激活和已激活；有向连接指明位置和转移操作之间的时序和逻辑关系；位置的标记信息、位置与其指向的转移操作之间的逻辑关系决定了转移操作是否被激活;仅当转移操作被激活时，才能进行相关的语义信息的匹配，或者才能向用户反馈预警信息；然后将这些子时序语义图的初始位置和结束位置合并，形成最终的欺诈监测及预警的时序语义图；步骤(2):根据已建好的时序语义图，在时序语义图初始位置生成当前位置标记;标记位置指向的语义信息匹配的转移操作被激活;读入一条即时通讯的文本，判断通讯的文本中是否包含已激活的转移操作对应的语义信息；如果对应的语义信息存在于通讯的文本中，标记从初始位置向转移操作指向的位置转移；如果该条通讯的文本中没有任何欺诈模式最先出现语义信息，继续读入下一条通讯的文本，然后重复上述判断过程；步骤(3):当标记转移到新的位置的时候，其指向的转移操作可能被激活。判断最新激活的转移操作是继续匹配欺诈模式的语义信息，还是反馈预警信息。如果是语义信息匹配，则继续匹配对应的语义信息；如果是向用户反馈预警信息，反馈之后，标记也要进行位置的转移。判断新的位置是否是结束位置。如果是，则欺诈行为识别结束；否则继续进行语义信息的匹配。也就是，该预警可能只是提醒用户，后续更进一步的匹配会提供更多的预警信息。直到反馈完所有的预警信息，标记到达结束位置时，一次欺诈行为监测并预警完成。2. 根据权利要求1所述的基于时序语义图的欺诈监测与预警方法，其特征在于:所述步骤（1)中，语义信息匹配中，不同的转移操作匹配不同的语义信息，这些语义信息通过时序语义图的位置与转移操作之间有向连接组织起来，一个转移操作只对应的一个特定结构的语义信息;对于每一个语义信息，建立一个特定的语义结构，用来确定某一文本是否包含该语义信息;语义信息匹配成功，表明该文本中包含对应的语义信息，标记可以转移位置。3. 根据权利要求1所述的基于时序语义图的欺诈监测与预警方法，其特征在于:所述步骤(2)中，可能一条即时通讯的文本中存在含有多种欺诈模式的语义信息;所以多个转移操作会被执行;这时标记会分裂成多个，转移到相应的多个位置上，也就是，可以同时进行多种潜在欺诈模式的匹配。4. 根据权利要求1所述的基于时序语义图的欺诈监测与预警方法，其特征在于:所述步骤(3)中，时序语义图根据不同程度的匹配，反馈不同层次的预警信息和措施;时序语义图中不同的位置反映了语义信息的不同的匹配程度;根据具体欺诈模式特点，可以在不同的位置设置逐步升级的预警信息。
【文档编号】H04L12/58GK106095755SQ201610407935
【公开日】2016年11月9日
【申请日】2016年6月12日
【发明人】余胜泉, 陈阳
【申请人】北京师范大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：余胜泉;陈阳;
技术所有人：北京师范大学;
我是此专利的发明人

上一篇：基于自动机的藏文拼写检查方法和装置的制造方法
上一篇：一种医学术语词库词性标注方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。