本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及风险用户识别方法和装置。
背景技术:
随着互联网技术的发展,利用互联网进行用户间的交易(例如产品交易、服务交易等)越来越普遍。为了保障利用互联网进行交易的安全性,需要识别出风险用户(例如经营欺诈网站的广告主、经营非法产品的商家、伪造信息骗贷的用户等),并避免其参与交易。
传统的风险识别方法可以采取构建规则引擎的方式,对符合规则定义的用户行为进行特征提取并分析,从而实现用户的风险识别。然而,规则引擎所采用的规则通常需要人为地增加,可见该方法受人为主观因素的影响较大,很难客观公正地识别出风险用户。再者,传统的风险识别方法还可以采取聚类分析的方式,通过对用户行为进行分类实现对用户的风险识别。然而,聚类分析需要设置相应的聚类类别数目k值,而该方法通常很难准确地选择出合适的k值。
技术实现要素:
本申请实施例提出了风险用户识别方法和装置。
第一方面,本申请实施例提供了一种风险用户识别方法,该方法包括:根据待识别用户的操作行为获取潜在风险信息,其中,潜在风险信息包括待识别用户的用户基础信息和操作行为的行为信息;提取多个用户的风险信息,并利用遗传算法处理风险信息生成多个风险行为个体,其中,风险信息包括各用户的用户基础信息和各用户的历史操作行为的行为信息;将潜在风险信息与各风险行为个体的风险信息进行匹配,以判断待识别用户是否为风险用户。
在一些实施例中,利用遗传算法处理风险信息生成多个风险行为个体,包括:对所提取的风险信息进行编码,并将编码后的风险信息进行组合生成包括多个行为个体的初始种群;基于各用户的风险信息构造适应度函数,其中,适应度函数用于计算行为个体的适应度值;对初始种群执行遗传算法,并在遗传算法执行的次数满足预设的迭代次数时,生成多个风险行为个体。
在一些实施例中,对初始种群执行遗传算法,包括:利用适应度函数计算初始种群中各行为个体的适应度值,并根据适应度值从初始种群中选择多个行为个体构成再生种群;将再生种群中的行为个体彼此之间进行交叉运算,生成交叉种群;对交叉种群中的行为个体进行变异运算,生成变异种群。
在一些实施例中,根据适应度值从初始种群中选择多个行为个体构成再生种群,包括:采用遗传算法的选择算子,基于初始种群中的各行为个体的适应度值计算初始种群中每个行为个体的被选择概率;对初始种群中各行为个体的被选择概率累计求和,获取初始种群中每个行为个体的累计被选择概率;产生0到1之间的随机数,并将随机数与各行为个体的累计被选择概率进行比较来确定构成再生种群的各行为个体。
在一些实施例中,将再生种群中的行为个体彼此之间进行交叉运算,生成交叉种群,包括:确定交叉运算的交叉概率,并基于交叉概率从再生种群中抽取若干对行为个体对;对所抽取的各行为个体对执行交叉操作,生成包括多个行为个体的交叉种群。
在一些实施例中,对交叉种群中的行为个体进行变异运算,生成变异种群,包括:确定变异运算的变异概率,并将交叉种群中的各行为个体的编码转换为二进制编码;从交叉种群中选取用于变异的行为个体,并对所选取的每个行为个体的二进制编码中的任一编码进行取反操作,生成变异种群,其中,变异种群包括多个风险行为个体。
在一些实施例中,方法还包括:当遗传算法执行的次数满足预设的迭代次数时,响应于检测到的风险行为个体不满足预设条件,重新设置迭代次数。
在一些实施例中,将潜在风险信息与各风险行为个体的风险信息进行匹配,以判断待识别用户是否为风险用户,包括:将潜在风险信息与各风险行为个体的风险信息进行匹配,获取匹配度,并判断匹配度是否大于预设阈值;若是,则确定待识别用户为风险用户;若否,则确定待识别用户为正常用户。
第二方面,本申请实施例提供了一种风险用户识别装置,装置包括:获取单元,配置用于根据待识别用户的操作行为获取潜在风险信息,其中,潜在风险信息包括待识别用户的用户基础信息和操作行为的行为信息;生成单元,配置用于提取多个用户的风险信息,并利用遗传算法处理风险信息生成多个风险行为个体,其中,风险信息包括各用户的用户基础信息和各用户的历史操作行为的行为信息;匹配单元,配置用于将潜在风险信息与各风险行为个体的风险信息进行匹配,以判断待识别用户是否为风险用户。
在一些实施例中,生成单元包括:编码模块,配置用于对所提取的风险信息进行编码,并将编码后的风险信息进行组合生成包括多个行为个体的初始种群;构造模块,配置用于基于各用户的风险信息构造适应度函数,其中,适应度函数用于计算行为个体的适应度值;生成模块,配置用于对初始种群执行遗传算法,并在遗传算法执行的次数满足预设的迭代次数时,生成多个风险行为个体。
在一些实施例中,生成模块包括:计算子模块,配置用于利用适应度函数计算初始种群中各行为个体的适应度值,并根据适应度值从初始种群中选择多个行为个体构成再生种群;交叉子模块,配置用于将再生种群中的行为个体彼此之间进行交叉运算,生成交叉种群;变异子模块,配置用于对交叉种群中的行为个体进行变异运算,生成变异种群。
在一些实施例中,计算子模块进一步配置用于:采用遗传算法的选择算子,基于初始种群中的各行为个体的适应度值计算初始种群中每个行为个体的被选择概率;对初始种群中各行为个体的被选择概率累计求和,获取初始种群中每个行为个体的累计被选择概率;产生0到1之间的随机数,并将随机数与各行为个体的累计被选择概率进行比较来确定构成再生种群的各行为个体。
在一些实施例中,交叉子模块进一步配置用于:确定交叉运算的交叉概率,并基于交叉概率从再生种群中抽取若干对行为个体对;对所抽取的各行为个体对执行交叉操作,生成包括多个行为个体的交叉种群。
在一些实施例中,变异子模块进一步配置用于:确定变异运算的变异概率,并将交叉种群中的各行为个体的编码转换为二进制编码;从交叉种群中选取用于变异的行为个体,并对所选取的每个行为个体的二进制编码的任一编码进行取反操作,生成变异种群,其中,变异种群包括多个风险行为个体。
在一些实施例中,装置还包括:设置单元,配置用于当遗传算法执行的次数满足预设的迭代次数时,响应于检测到的风险行为个体不满足预设条件,重新设置迭代次数。
在一些实施例中,匹配单元进一步配置用于:将潜在风险信息与各风险行为个体的风险信息进行匹配,获取匹配度,并判断匹配度是否大于预设阈值;若是,则确定待识别用户为风险用户;若否,则确定待识别用户为正常用户。
本申请实施例提供的风险用户识别方法和装置,通过待识别用户的操作行为可以获取该待识别用户对应的潜在风险信息,而后提取多个用户的风险信息,利用遗传算法处理风险信息生成多个用于风险用户匹配识别的风险行为个体,最后可以将待识别用户的潜在风险信息与各风险行为个体匹配来判断待识别用户是否为风险用户,从而提高了风险用户识别的准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了本申请可以应用于其中的示例性系统架构图;
图2示出了根据本申请的风险用户识别方法的一个实施例的流程图;
图3示出了根据本申请的风险用户识别方法的又一个实施例的流程图;
图4示出了根据本申请的风险用户识别装置的一个实施例的结构示意图;
图5示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的风险用户识别方法或风险用户识别装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持用户点击、浏览等操作行为的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103接收到的点击、浏览等操作行为提供支持的后台服务器。后台服务器可以对接收到的用户的操作行为等进行分析处理,并将处理结果(例如待识别用户的风险识别结果)反馈给终端设备。
需要说明的是,本申请实施例所提供的风险用户识别方法一般由服务器105执行,相应地,风险用户识别装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的风险用户识别方法的一个实施例的流程200。该实施例中的风险用户识别方法,包括以下步骤:
步骤201,根据待识别用户的操作行为获取潜在风险信息。
在本实施例中,风险用户识别方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式获取待识别用户在终端设备上的点击、浏览等操作行为,并分析待识别用户的操作行为获取潜在风险信息。具体地,上述电子设备可以获取待识别用户的用户基础信息,该用户基础信息可以包括用户的例如ip地址、角色、昵称等;以及该电子设备可以根据上述待识别用户的点击、浏览等操作行为获取对应的行为信息,如,用户在商品网站上浏览并购买商品的过程中,用户通过终端设备浏览商品网站上的商品(即,用户执行了浏览操作)的同时,上述电子设备可以生成用户浏览操作对应的用户浏览行为信息,并获取该用户的浏览行为信息,用户支付100rmb(即,用户执行了支付操作)的同时,上述电子设备可以生成用户支付操作对应的用户交易行为信息,并获取该用户的交易行为信息。上述电子设备获取的潜在风险信息可以包括待识别用户的用户基础信息和操作行为的行为信息。需要指出的是,上述无线连接方式可以包括但不限于3g/4g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultrawideband)连接、以及其他现在已知或将来开发的无线连接方式。
步骤202,提取多个用户的风险信息,并利用遗传算法处理风险信息生成多个风险行为个体。
在本实施例中,上述电子设备可以获取多个用户的风险信息,这里的风险信息可以包括各用户的用户基础信息和各用户的历史操作行为的行为信息。具体地,上述电子设备可以首先确定多个用户,而后获取确定用户对应的用户基础信息,如用户的ip地址、角色、昵称等,同时上述电子设备还可以根据各用户的历史操作行为获取对应的行为信息,如用户的浏览行为信息、基于用户操作生成的历史订单信息等。上述电子设备所提取的风险信息可以包括各用户的用户基础信息和各用户的历史操作行为的行为信息。最后,上述电子设备可以利用遗传算法处理其所提取的风险信息,从而生成多个风险行为个体。因此,这里的风险行为个体可以相应的包括经遗传算法处理过的风险信息。
可以理解的是,上述电子设备可以首先确定待识别用户的类型和待识别用户的操作行为的类型,而后可以根据待识别用户的类型和操作行为的类型确定用于提取风险信息的用户和所提取的风险信息,即上述电子设备可以提取与潜在风险信息具有共性的风险信息。进一步地,当上述电子设备基于待识别用户的潜在风险信息判断出该待识别用户为风险用户时,该电子设备可以对待识别用户的操作进行拦截,当上述电子设备基于待识别用户的潜在风险信息判断出该待识别用户为正常用户时,该电子设备可以对待识别用户的操作正常执行。
步骤203,将潜在风险信息与各风险行为个体的风险信息进行匹配,以判断待识别用户是否为风险用户。
在本实施例中,基于步骤201获取的潜在风险信息和步骤202生成的风险行为个体,上述电子设备可以将潜在风险信息与各风险行为个体所包括的经过遗传算法处理的风险信息相匹配,并根据匹配结果确定上述待识别用户是否为风险用户。作为示例,上述电子设备将潜在风险信息与各风险行为个体的风险信息匹配后可以相应地获取潜在风险信息与各风险行为个体的风险信息的相似度,并根据相似度的值确定待识别用户是否为风险用户;或者,上述电子设备还可以在各风险行为个体的风险信息中匹配潜在风险信息,并根据在各风险行为个体的风险信息中匹配到的潜在风险信息的信息量确定该待识别用户是否为风险用户。
本申请的上述实施例所提供的风险用户识别方法,通过待识别用户的操作行为可以获取该待识别用户对应的潜在风险信息,而后提取多个用户的风险信息,并利用遗传算法处理风险信息生成多个风险行为个体,最后可以将待识别用户的潜在风险信息与各风险行为个体匹配来判断待识别用户是否为风险用户,从而提高了风险用户识别的准确率。
请继续参考图3,其示出了根据本申请的风险用户识别方法的另一实施例的流程300。该实施例中的风险用户识别方法可以包括以下步骤:
步骤301,根据待识别用户的操作行为获取潜在风险信息。
在本实施例中,风险用户识别方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式获取待识别用户在终端设备上的点击、浏览等操作行为,并分析待识别用户的操作行为获取潜在风险信息。具体地,上述电子设备可以获取待识别用户的用户基础信息,该用户基础信息可以包括用户的例如ip地址、角色、昵称等;以及该电子设备可以根据上述待识别用户的点击、浏览等操作行为获取对应的点击行为信息和浏览行为信息等。上述电子设备获取潜在风险信息可以包括待识别用户的用户基础信息和操作行为的行为信息。
步骤302,提取多个用户的风险信息,对所提取的风险信息进行编码,并将编码后的风险信息进行组合生成包括多个行为个体的初始种群。
在本实施例中,上述电子设备首先可以确定多个用户,并根据所确定的用户提取各用户的用户基础信息和各用户的历史操作行为的行为信息。而后,上述电子设备可以选取合适的编码方式对所提取的风险信息进行编码。这里,风险信息的编码方式可以包括但不限于格雷码编码、实数编码等。最后,上述电子设备可以将编码后的风险信息随机编码组合,生成初始种群f0。该初始种群f0可以包括多个行为个体,如初始种群f0可以包括n个行为个体,即f0={x1,x2,x3...xn},其中n为正整数。
步骤303,基于各用户的风险信息构造适应度函数,利用适应度函数计算初始种群中各行为个体的适应度值。
在本实施例中,上述电子设备可以基于各用户的风险信息构造适应度函数s(xi),该适应度函数s(xi)可以用于计算行为个体xi的适应度值。因此,上述电子设备可以将各行为个体的风险信息作为变量输入适应度函数s(xi),从而计算出各行为个体的适应度值。在遗传算法中,适应度值可以为描述行为个体性能的主要指标。根据适应度值的大小,可以对各行为个体进行优胜劣汰。可选地,上述电子设备还可以为遗传算法设置预设的迭代次数,从而使得遗传算法执行预设的迭代次数后可以生成多个风险行为个体。
步骤304,根据适应度值从初始种群中选择多个行为个体构成再生种群。
在本实施例中,基于步骤303计算出的各行为个体的适应度值,上述电子设备可以利用各行为个体的适应度值处理各行为个体,以便于其可以从初始种群中选择多个优秀的行为个体构成再生种群f1,该再生种群f1可以包括从初始种群f0中选择出的多个行为个体,如初始种群f1可以包括m个行为个体,即f1={x1,x2,x3...xm},其中,m为正整数。
通常,遗传操作中的选择步骤的目的是模仿自然界适者生存的方式,从当前初始种群中选择优秀的个体,对其进行复制并保留生成再生种群,以用于作为父代进行遗传。
具体地,上述电子设备首先可以选择合适的遗传算法选择算子,例如比例选择算子,利用初始种群f0中的各行为个体的适应度值计算该初始种群f0中每个行为个体的被选择概率。而后,上述电子设备可以对该初始种群f0中的每个行为个体的被选择概率累计求和,得到初始种群f0中的各行为个体的累计被选择概率。最后,上述电子设备可以产生0到1之间的随机数,并将该随机数与计算出的各行为个体的累计被选择概率进行比较,从而确定在初始种群中选择出的行为个体,并将所选择的各行为个体构成再生种群f1。
作为示例,当上述电子设备采用比例选择算子计算初始种群f0={x1,x2,x3...xn}的各行为个体的被选择概率时,被选择概率的计算公式可以如下:
其中,s(xi)为初始种群中的第i个行为个体xi的适应度值,s(xj)为初始种群中的第j个行为个体xj的适应度值,p(xi)为初始种群中的第i个行为个体xi的被选择概率,i和j为正整数。因此,上述电子设备可以利用上述被选择概率的计算公式计算出初始种群f0中各行为个体的被选择概率。而后,上述电子设备可以计算初始种群f0中各行为个体的累计被选择概率,行为个体的累计被选择概率的计算公式可以如下:
其中,p(xj)为初始种群中第i个行为个体的被选择概率,q(xi)初始种群中第i个行为个体的累计被选择概率,其中i为大于1的正整数。最后,上述电子设备在0到1之间产生随机数α,而后将该随机数α与被选择概率q(xi)相比较,若q(xi-1)<α<q(xi),则可以选择出第i个行为个体,可见上述电子设备可以利用该方法从初始种群f0中选择出多个行为个体构成再生种群f1。需要说明的是,对于初始种群f0中的各行为个体可以多次被选择,因此上述再生种群f1中可以存在相同的行为个体。
步骤305,将再生种群中的行为个体彼此之间进行交叉运算,生成交叉种群。
在本实施例中,基于步骤304构成的再生种群f1,上述电子设备可以将再生种群f1中的行为个体彼此之间进行交叉,使得再生种群f1中的行为个体的风险信息对应的编码可以进行交叉运算生成多个新的行为个体,各新的行为个体可以构成交叉种群。经过交叉步骤生成的交叉种群,其中的行为个体的风险评判效果更优。
通常,遗传操作中的交叉步骤是模拟生物两两交配产生新基因型的后代这一方法,按照交叉概率pc,将两个行为个体的染色体,在其染色体某一位置断开,相互交叉,产生带有新基因型的后代;在基因相互交叉的过程中,产生比父代具有更优适应度的子代,体现出搜索的理念;值得一提的是,采用交叉这一方法,获取的交叉种群适应度的确是朝着更优的方向移动,这是遗传算法的特色和优点。
具体地,上述电子设备可以首先确定交叉运算的交叉概率pc,而后根据所确定的交叉概率pc从再生种群中随机抽取若干对行为个体构成多个行为个体对。而后,上述电子设备可对其所抽取的各行为个体对执行交叉操作,生成包括多个行为个体的交叉种群。
作为示例,上述电子设备可以根据交叉概率pc的值从再生种群f1={x1,x2,x3...xm}中提取多个行为个体对。这里以行为个体对xixj为例,可以选取行为个体xi和xj中若干位相同的风险信息编码的位置,而后将两个行为个体彼此之间进行交叉运算。
这里,行为个体xi的风险信息编码如下所示,其中灰色表格内的编码为被选取待交叉的风险信息编码。
行为个体xj的风险信息编码如下所示,其中灰色表格内的编码为被选取待交叉的风险信息编码。
保持行为个体xi和xj中未被选取的风险信息的编码不变,交换行为个体xi和xj之间被选取的编码位置相同的风险信息编码,并保存被选择的风险信息的编码的顺序不变,从而获得交叉运算后的行为个体。因此,经过交叉运算后的行为个体xi的风险信息编码可以如下所示:
经过交叉运算后的行为个体xj的风险信息编码可以如下所示:
上述电子设备可以采用该方法完成从再生种群f1={x1,x2,x3...xm}中提取的多个行为个体对的交叉运算,并获取各行为个体对交叉运算的结果,构成交叉种群。
步骤306,对交叉种群中的行为个体进行变异运算,生成变异种群。
在本实施例中,基于步骤305生成的交叉种群,上述电子设备可以将该交叉种群中的行为个体进行变异,使得交叉种群中的行为个体的风险信息对应的编码可以通过变异运算生成多个新的行为个体,构成变异种群。
通常,遗传操作中的变异步骤是模拟生物发生会基因突变这一现象,按照变异概率pm,在个体基因的某一位发生变异;通常变异概率pm的值取得非常小(自然界中个体发生基因突变的概率也非常小);变步骤作的目的在于保持种群的多样性,同时,基因会产生变异,可以在一定程度上克服陷入局部最优的缺点。在遗传操作中变异步骤和交叉步骤通常可以相互配合。
具体地,上述电子设备首先可以确定变异运算的变异概率pm,并将上述交叉种群中的各行为个体的风险信息的编码转换为二进制编码。而后,上述电子设备可以从交叉种群中选取用于变异的行为个体,并对所选取的每个行为个体中的二进制编码的任一位置的编码进行取反操作生成新的风险行为个体构成变异种群。
在本实施例的一些可选的实现方式中,在执行变异运算后,上述电子设备可以继续判断遗传算法执行的次数是否满足了预设的迭代次数,如果没有,则重复执行步骤303-步骤306,直到遗传算法的执行满足预设的迭代次数。进一步地,当遗传算法执行的次数已经满足预设的迭代次数,上述电子设备可以检测生成的风险行为个体的数量和质量等是否满足预设条件。如果风险行为个体满足预设条件,则可以继续执行风险用户识别方法的其它步骤;如果风险行为个体不能满足预设条件,则可以重新设置遗传算法执行的迭代次数,以便于电子设备可以通过执行重新设置过的迭代次数的遗传算法生成满足预设条件的风险行为个体。
步骤307,将潜在风险信息与各风险行为个体的风险信息进行匹配,获取匹配结果,并判断匹配度是否大于预设阈值。
在本实施例中,基于步骤306获取的风险行为个体,上述电子设备可以将待识别用户的潜在风险信息与各风险行为个体的风险信息进行匹配,并获取相应的匹配度。而后上述电子设备可以判断该匹配度是否大于预设阈值,当确定该匹配结果大于预设阈值时,则可以转到步骤308,当确定该匹配结果不大于预设阈值时,则可以转到步骤309。
步骤308,确定待识别用户为风险用户。
在本实施例中,基于步骤307确定的匹配结果大于预设阈值,上述电子设备可以确定该待识别用户为风险用户。此时,上述电子设备可以对该待识别用户的操作行为进行拦截。
步骤309,确定待识别用户为正常用户。
在本实施例中,基于步骤307确定的匹配结果不大于预设阈值,上述电子设备可以确定该待识别用户为正常用户。此时,上述电子设备可以继续为待识别用户的操作行为提供支持。
从图3中可以看出,与图2对应的实施例相比,本实施例中的风险用户识别方法的流程300突出了利用遗传算法生成风险行为个体的步骤。由此,本实施例描述的方案可以引入多个客观的、符合预期的风险行为个体来匹配识别风险用户,从而提高了风险用户识别的准确率。
进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种风险用户识别装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例的风险用户识别装置400包括:获取单元401、生成单元402和匹配单元403。其中,获取单元401配置用于根据待识别用户的操作行为获取潜在风险信息,其中,潜在风险信息包括待识别用户的用户基础信息和操作行为的行为信息;生成单元402配置用于提取多个用户的风险信息,并利用遗传算法处理风险信息生成多个风险行为个体,其中,风险信息包括各用户的用户基础信息和各用户的历史操作行为的行为信息;匹配单元403配置用于将潜在风险信息与各风险行为个体的风险信息进行匹配,以判断待识别用户是否为风险用户。
在本实施例的一些可选的实现方式中,生成单元402包括:编码模块,配置用于对所提取的风险信息进行编码,并将编码后的风险信息进行组合生成包括多个行为个体的初始种群;构造模块,配置用于基于各用户的风险信息构造适应度函数,其中,适应度函数用于计算行为个体的适应度值;生成模块,配置用于对初始种群执行遗传算法,并在遗传算法执行的次数满足预设的迭代次数时,生成多个风险行为个体。
在本实施例的一些可选的实现方式中,生成模块包括:计算子模块,配置用于利用适应度函数计算初始种群中各行为个体的适应度值,并根据适应度值从初始种群中选择多个行为个体构成再生种群;交叉子模块,配置用于将再生种群中的行为个体彼此之间进行交叉运算,生成交叉种群;变异子模块,配置用于对交叉种群中的行为个体进行变异运算,生成变异种群。
在本实施例的一些可选的实现方式中,计算子模块进一步配置用于:采用遗传算法的选择算子,基于初始种群中的各行为个体的适应度值计算初始种群中每个行为个体的被选择概率;对初始种群中各行为个体的被选择概率累计求和,获取初始种群中每个行为个体的累计被选择概率;产生0到1之间的随机数,并将随机数与各行为个体的累计被选择概率进行比较来确定构成再生种群的各行为个体。
在本实施例的一些可选的实现方式中,交叉子模块进一步配置用于:确定交叉运算的交叉概率,并基于交叉概率从再生种群中抽取若干对行为个体对;对所抽取的各行为个体对执行交叉操作,生成包括多个行为个体的交叉种群。
在本实施例的一些可选的实现方式中,变异子模块进一步配置用于:确定变异运算的变异概率,并将交叉种群中的各行为个体的编码转换为二进制编码;从交叉种群中选取用于变异的行为个体,并对所选取的每个行为个体的二进制编码的任一编码进行取反操作,生成变异种群,其中,变异种群包括多个风险行为个体。
在本实施例的一些可选的实现方式中,装置400还包括:设置单元,配置用于当遗传算法执行的次数满足预设的迭代次数时,响应于检测到的风险行为个体不满足预设条件,重新设置迭代次数。
在本实施例的一些可选的实现方式中,匹配单元403进一步配置用于:将潜在风险信息与各风险行为个体的风险信息进行匹配,获取匹配度,并判断匹配度是否大于预设阈值;若是,则确定待识别用户为风险用户;若否,则确定待识别用户为正常用户。
下面参考图5,其示出了适于用来实现本申请实施例的终端设备/服务器的计算机系统500的结构示意图。图5示出的终端设备/服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(cpu)501,其可以根据存储在只读存储器(rom)502中的程序或者从存储部分508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。在ram503中,还存储有系统500操作所需的各种程序和数据。cpu501、rom502以及ram503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
以下部件连接至i/o接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至i/o接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(cpu)501执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、生成单元和匹配单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“根据待识别用户的操作行为获取潜在风险信息的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:根据待识别用户的操作行为获取潜在风险信息,其中,潜在风险信息包括待识别用户的用户基础信息和操作行为的行为信息;提取多个用户的风险信息,并利用遗传算法处理风险信息生成多个风险行为个体,其中,风险信息包括各用户的用户基础信息和各用户的历史操作行为的行为信息;将潜在风险信息与各风险行为个体的风险信息进行匹配,以判断待识别用户是否为风险用户。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。