本发明涉及通信技术领域,尤其涉及一种诈骗信息识别方法及其装置、移动终端、服务器。
背景技术:
随着手机等便携式移动终端的普及和短信业务的迅速发展,人们频繁地使用短信进行通信,然而,在人们享受着快捷方便的短信通信手段的同时,伴随而来的是日趋泛滥的诈骗短信。诈骗短信是利用手机短信的方式骗取金钱或财务的短信形式,常见的诈骗短信的形式包括:银行卡积分相关内容、扣除年费相关内容、退换票相关内容、参与活动相关内容、开大额信用卡相关内容等,通过这些极具诱惑力的虚假内容骗取用户如银行卡的支付密码、网银的支付密码等重要信息,严重地损害了用户的切身利益。
目前,虽然也存在一些用于过滤诈骗短信的应用,如,手机安全卫士,这些应用的过滤识别方式一般通过获取短息中的关键词,对关键词从预设的大数据库中进行匹配来识别过滤诈骗短信,然而,由于短信中的语言和内容的不断变化,现有的关键词往往跟不上诈骗短信的日新月异,很容易被新出现的诈骗短信所规避识别不出来或者出现误判,导致短信接收人遭受经济及其他损失。
技术实现要素:
本发明实施例提供的诈骗信息识别方法及装置、移动终端、服务器,以解决现有技术中采用信息关键词这种单一的识别方式识别诈骗信息,会出现误判或者被新出现的诈骗信息所规避,导致识别效率较低,甚至无法进行识别的技术问题。
为解决上述技术问题,本发明实施例提供一种诈骗信息识别方法,包括:
获取待识别信息中的目标号码以及信息内容;
对所述信息内容进行分析处理,确定终端用户对目标号码的情感度和信息内容的可信度,根据所述目标号码计算所述目标号码在终端上的通讯频度;
根据所述情感度、可信度和通讯频度确定所述终端对所述待识别信息的置信度值;
判断所述置信度值是否小于预设的置信度阈值;
在所述置信度值小于预设的置信度阈值时,则确定所述待识别信息为诈骗信息并进行拦截处理。
本发明实施例还提供一种诈骗信息识别装置,包括:获取模块、处理模块、判断模块和拦截模块;
获取模块,用于获取待识别信息中的目标号码以及信息内容;
处理模块,用于对所述信息内容进行分析处理,确定终端用户对目标号码的情感度和信息内容的可信度,根据所述目标号码计算所述目标号码在终端上的通讯频度,根据所述情感度、可信度和通讯频度确定所述终端对所述待识别信息的置信度值;
判断模块,用于判断所述置信度值是否小于预设的置信度阈值;
拦截模块,在所述置信度值小于预设的置信度阈值时,确定所述待识别信息为诈骗信息并进行拦截处理。
本发明实施例还提供一种移动终端,包括如上所述的诈骗信息识别装置。
本发明实施例还提供一种服务器,包括如上所述的诈骗信息识别装置。
本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行前述的诈骗信息识别方法。
本发明的有益效果是:
根据本发明实施例提供的诈骗信息识别方法、装置、移动终端、服务器以及计算机存储介质,该方法主要包括确定终端用户对信息中的目标号码的情感度和信息内容的可信度,以及根据目标号码确定终端与该目标号码通讯频度,根据情感度、可信度和通讯频度确定待识别信息的置信度值,判断该置信度值是否小于预设的置信度阈值,若小于,则判断为诈骗信息,进行拦截处理,通过引入了主观因素情感度来实现对信息的智能识别,判断待识别信息的目标号码与终端用户的情感度和通讯频度,再结合判断信息内容的可信度,获得置信度值,通过置信度值这一综合的信息来判断信息是否为诈骗信息,大大提高了识别诈骗信息的准确率;由于情感度这一因素为认为的主观判断因素,因此,想要避开情感度的判断是非常难的,从而提高诈骗短信的识别率,更好的保护广大人民群众的财产安全,并提升终端的用户体验。
附图说明
图1为本发明第一实施例提供的诈骗信息识别方法的流程图;
图2为本发明第一实施例提供的确定终端用户与目标号码的情感度的流程图;
图3为本发明第二实施例提供的诈骗识别装置的结构示意图。
具体实施方式
下面通过具体实施方式结合附图对本发明实施例作进一步详细说明。
第一实施例:
为了提高终端对诈骗信息的识别效率以及准确率,本发明实施例提供了一种识别方法,该方法除了需要对信息中内容进行关键字识别,确定信息内容的可信度之外,还包括对信息的目标号码进行检测,通过信息内容确定终端用户对该目标号码的情感度以及终端与该目标号码的通讯频度,通过有机结合情感度、通讯频度、可信度三个参数确定该信息内容的置信度值,判断该置信度值大于等于预设的置信度阀值时,则确定该信息为正常短信,当置信度值小于预设的置信度阀值时,则确定该信息为诈骗短信,并给用户相应提示,进行拦截处理。
请参见图1,图1为本发明实施例提供的诈骗信息识别方法的流程图,在本实施例中,所述诈骗信息识别方法的处理步骤具体如下:
s100,获取待识别信息的目标号码以及信息内容。
s101,对信息内容进行分析处理,确定终端用户对目标号码的情感度和信息内容的可信度,以及根据目标号码计算目标号码在终端上的通讯频度。
s102,根据情感度、可信度和通讯频度确定终端对该待识别信息的置信度值。
s103,若判断置信度值小于预设的置信度阈值时,则确定所述待识别信息为诈骗信息。
s104,对该诈骗信息进行拦截处理。
在本实施例中,终端接收到信息后,启动诈骗信息识别处理,首先,确定待识别信息,并从待识别信息中提取目标号码以及信息内容,这里的目标号码指的是发送该待识别信息的电话号码,甚至可以是发送待识别信息的ip地址信息。
进一步的,在本实施例中,对步骤s100中提取的信息内容进行分析处理,该分析处理指的是将信息内容进行中文分词处理或者根据预设规则提取信息内容中的关键词,然后根据处理后的信息内容从数据库中进行匹配,得到对应的分析结果,根据分析处理得到的结果分别确定终端用户对该目标号码的情感度和信息内容的可信度。
在本实施例中,根据对信息内容的分析处理结果,确定信息内容的可信度具体是通过从获取到的信息内容中提取出该待识别信息的关键词,根据该关键词进行语义的分析,得到分析结果,这里的语义分析指的是根据待识别信息中的内容构建对应的语境,根据对应的语境分析该关键词在该语境中的所表达的意思;根据分析结果确定该信息内容的可信度。
在本实施例中,在步骤s101中的通讯频度指的是终端用户与该目标号码的通讯频率,计算该目标号码的通讯频度具体是通过该目标号码查询终端在某一时间段内与该目标号码的通讯次数,根据查询到的通讯次数计算终端与目标号码的通讯频度,优选的,根据目标号码查询终端上的通信记录,统计通讯的次数,根据该次数计算该目标号码在该时间段内的通讯频率,从而确定目标号的通讯频度。
在本实施例中,具体的,计算该目标号码的通讯频度还可以通过统计终端在当日或一周内或一个月内与该目标号码通讯的次数,这里的通讯可以包含短信消息、电话、语音视频,以及该目标号码对应的微信或qq号的通讯);然后分别计算对应时间段内该目标号码的通讯频率,最后综合上述三个次数或者通讯频率确定该目标号码的通讯频度。
通过上述的方式分别得到情感度、可信度和通讯频度后,计算对应的待识别信息的置信度值,将所述置信度值与预设的置信度阈值进行比较,若置信度值小于预设的置信度阈值时,则判定该待识别信息为诈骗信息,反之,则为正常信息,对于当判定为诈骗信息时,还包括提醒终端用户该信息有危险或者直接对该信息进行拦截处理。
在本实施例中,为了提高对诈骗信息识别的准确率,防止不法分子利用现有技术规避诈骗识别操作,本实施例引入了对待识别信息的目标号码进行情感度的分析,最后在结合多各参数来计算一个组合参数进行识别的判断。
如图2所示,为本实施例提供的确定终端用户与目标号码的情感度的处理过程,具体包括如下步骤:
s201,获取该目标号码在终端中的信息历史记录,该信息历史记录具体包括该号码与终端的电话通信记录、短信息通信记录和该目标号码对应的聊天软件的通信记录。
s202,根据中文分词算法对该信息历史记录进行中文分词处理。
在该步骤中,通过中文分词算法对输入的信息内容的文本进行分词处理,并输出分词信息,优选的,该中文分词算法具体为一些分词模板,如:卷积神经网络模型、深度学习网络模型等。运用这些预先设置好的分词模板,将获取到的信息内容输入至该分词模板中,通过该分词模板将信息内容进行处理,并输出分词信息。
在本实施例中,该中文分词处理具体为将所述信息内容进行转换处理,所述转换处理为将所述信息内容调整至统一标准的书面语言;根据预设的分词规则对所述信息内容进行中文分词处理。
具体的,该中文分词处理步骤具体为:(a)对信息内容的文本进行预处理。该预处理包括但不限于:繁简体统一、大小写统一和全半角统一,并将俚语识别并替换为书面语,例如,“辣鸡”替换为“垃圾”。(b)对预处理后的内容经命令识别,具体包括数字、地名、人名、网址、时间、日期、电话号码、金额、银行、银行账号、支付宝账号等匹配识别。
s203,对中文分词处理后的信息文本内容进行情感判断,获得对目标号码的情感度。
在本实施例中,根据中文分词处理后得到的分词信息从预设的数据库中进行分词匹配,以及对分词信息进行加权运算,从而获得所述终端用户对目标号码的情感度,这里的加权运算具体是通过使用文字对应的字向量进行加权运算,情感词典进行对应的词语匹配,得到情感度。
本发明实施例提供的诈骗信息识别方法,主要是引入了主观判断因素情感度提供终端对诈骗信息识别的准确率,具体的通过获取待识别信息中的目标号码和信息内容,根据信息内容进行分析处理,确定终端用户对目标号码的情感度和信息内容的可信度,根据目标号码计算目标号码在终端上的通讯频度,通过有机结合情感度、通讯频度和可信度确定终端对所述待识别信息的置信度值,当置信度值小于预设的置信度阈值时,则判定该待识别信息为诈骗信息;本发明提供的识别方法引入了情感度这一主观因素,并结合了通过信息内容识别的识别技术,大大地提高了对诈骗信息的识别准确率以及识别效率,更好的保护终端用户的信息安全,并提升终端的用户体验。
第二实施例:
请参考图3,图3为本发明实施例提供的诈骗识别装置的结构示意图,在本实施例中,用户通过该诈骗信息识别装置对终端接收到的信息进行识别,不仅提高了对诈骗信息的识别效率,还提高了准确率。
本实施例提供的诈骗信息识别装置3包括获取模块31、处理模块32、判断模块33和拦截模块34,其中:
获取模块31用于获取待识别信息中的目标号码以及信息内容;
处理模块32用于对信息内容进行分析处理,确定终端用户对目标号码的情感度和信息内容的可信度,根据目标号码计算目标号码在终端上的通讯频度,根据情感度、可信度和通讯频度确定终端对待识别信息的置信度值;
判断模块33用于判断置信度值是否小于预设的置信度阈值;
拦截模块34用于在置信度值小于预设的置信度阈值时,确定待识别信息为诈骗信息并进行拦截处理。
在本实施例中,终端接收到信息后,启动诈骗信息识别处理,通过获取模块31从待识别信息中提取目标号码以及信息内容,这里的目标号码指的是发送该待识别信息的电话号码,甚至可以是发送待识别信息的ip地址信息。
获取模块31将获取到的电话号码以及信息中的内容文本发送给处理模块32,处理模块32根据预设的分析规则对接收到的电话号码以及信息内容文本进行处理,具体是将信息内容进行中文分词处理或者根据预设规则提取信息内容中的关键词,然后根据处理后的信息内容从数据库中进行匹配,得到对应的分析结果,根据分析处理得到的结果分别确定终端用户对该目标号码的情感度。
对于分析信息内容的可信度,具体是处理模块32首先提取信息内容中的关键词;然后根据关键词对信息内容进行语义分析,得到分析结果;最后根据分析结果确定信息内容的可信度。
在本实施例中,处理模块32在根据目标号码计算目标号码在终端上的通讯频度时,具体是通过该目标号码查询终端在某一时间段内与该目标号码的通讯次数,根据查询到的通讯次数计算终端与目标号码的通讯频度,优选的,根据目标号码查询终端上的通信记录,统计通讯的次数,根据该次数计算该目标号码在该时间段内的通讯频率,从而确定目标号的通讯频度。
在本实施例中,对于处理模块23计算所述通讯频度还包括:获取接收该待识别信息的当日该目标号码与终端用户通讯的所有次数,具体包含短信、电话、该号码对应的微信或qq号;一周内该目标号码与终端用户通讯的所有次数;一个月内该目标号码与终端用户通讯的所有次数,然后计算对应的通讯频率,根据预设的选择策略,从多个通讯频率中选择一个符合选择策略的通讯频率,确定该目标号码对应的通讯频度。或者,根据三个不同时间段的通讯频率确定该目标号码对应的通讯频度。
在本实施例中,处理模块32确定终端用户对目标号码的情感度时,具体是通过获取目标号码在终端中的信息历史记录,根据中文分词算法对信息历史记录进行中文分词处理,对中文分词处理后的信息文本内容进行情感判断,获得对目标号码的情感度。
进一步的,通过中文分词算法对输入的信息内容的文本进行分词处理,并输出分词信息,优选的,该中文分词算法具体为一些分词模板,如:卷积神经网络模型、深度学习网络模型等。运用这些预先设置好的分词模板,将获取到的信息内容输入至该分词模板中,通过该分词模板将信息内容进行处理,并输出分词信息。
处理模块32进行中文分词的过程包括:将信息内容进行转换处理,该转换处理为将信息内容调整至统一标准的书面语言;根据预设的分词规则对信息内容进行中文分词处理。具体的,(a)对信息内容的文本进行预处理。该预处理包括但不限于:繁简体统一、大小写统一和全半角统一,并将俚语识别并替换为书面语,例如,“辣鸡”替换为“垃圾”。(b)对预处理后的内容经命令识别,具体包括数字、地名、人名、网址、时间、日期、电话号码、金额、银行、银行账号、支付宝账号等匹配识别。(c)使用文字对应的字向量进行加权运算并输入情感判断,根据从情感词典中匹配的结果和加权运算得到情感度。
最后,将得到的对应于该目标号码的情感度、通讯频度和可信度计算出待识别信息的置信度值,将该置信度值与预设的阈值进行比较,根据比较的结果判断该待识别信息是否为诈骗信息。
对应的,本发明实施例还提供了一种移动终端,该移动终端包括诈骗信息识别装置,由于在该移动终端上设有诈骗信息识别装置,因此,该移动终端也可以实现快速识别诈骗信息,提高识别准确率。
本发明实施例还提供了一种服务器,该服务器包括诈骗信息识别装置,同理,该服务器设置有诈骗信息识别装置,因此,也可以提高服务器对诈骗信息的识别率,提高了用户的体验度。
综上所述,本发明实施例提供的诈骗信息识别方法及其装置,通过确定终端用户对信息中的目标号码的情感度和信息内容的可信度,以及根据目标号码确定终端与该目标号码通讯频度,根据情感度、可信度和通讯频度确定待识别信息的置信度值,判断该置信度值是否小于预设的置信度阈值,若小于,则判断为诈骗信息,进行拦截处理;本发明通过引入了情感度这一主观因素,并结合了通过信息内容识别的识别技术,大大地提高了对诈骗信息的识别准确率以及识别效率,更好的保护终端用户的信息安全,并提升终端的用户体验。
显然,本领域的技术人员应该明白,上述本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(rom/ram、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明实施例所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。