本申请涉及电商平台数据分析领域,尤其涉及一种风险商户预测方法、系统、计算机和可读存储介质。
背景技术:
1、在金融科技领域中,从事非法网络赌博活动的不法分子,通过批量注册电商平台入驻商户(即风险商户),虚构商品网购交易和物流信息,将赌博交易包装成网购交易,获得支付通道,变相为赌客参与网络赌博提供便利。首先不法分子批量注册电商平台的“商户”和“用户”,当赌客向博彩平台发起充值申请时,赌博平台客服以“用户”身份在事先注册好的“商户”上发起赌博充值等额的虚假网购订单,并将获取到的网购订单支付链接提供赌徒支付。赌徒支付后,赌博平台客服将相应筹码转至该赌徒博彩平台账户,完成赌博充值交易。因此,亟需一种能预测商户是否可能为风险商户的方法。
技术实现思路
1、鉴于上述问题,本申请提出一种风险商户预测方法、系统、计算机和可读存储介质。
2、本申请实施例提出风险商户预测方法,包括:
3、获取商铺信息,所述商铺信息包括产品信息,所述产品信息包括产品交易数据;
4、基于所述产品交易数据,衍生预设数量的待测交易特征变量集;
5、基于预设样本集和分布式梯度增强库,筛选出一级交易特征变量集;
6、基于所述一级交易特征变量集和所述待测交易特征变量集,筛选出二级交易特征变量集;
7、基于所述二级交易特征变量集和所述分布式梯度增强库,筛选出最优分布式梯度增强库;
8、基于所述最优分布式梯度增强库和所述商铺信息,预测风险商户。
9、进一步地,在上述的风险商户预测方法中,所述预设样本集中包括正样本集和负样本集,所述基于预设样本集和分布式梯度增强库,筛选出一级交易特征变量集,包括:
10、基于预设样本集和分布式梯度增强库,得到每对正负样本组的auc值;
11、基于所述auc值和预设阈值,筛选出所述一级交易特征变量集。
12、进一步地,在上述的风险商户预测方法中,所述交易特征变量对应一个交易特征,所述基于所述一级交易特征变量集和所述待测交易特征变量集,筛选出二级交易特征变量集,包括:
13、将与所述一级交易特征变量集中的交易特征一样的待测交易特征变量集作为所述二级交易特征变量集。
14、进一步地,在上述的风险商户预测方法中,所述基于所述二级交易特征变量集和分布式梯度增强库,筛选出最优分布式梯度增强库,包括:
15、基于所述二级交易特征变量集和分布式梯度增强库,得到每个所述二级交易特征变量集的权重值;
16、将低于预设权重值对应的所述二级交易特征变量集进行删除,得到最优交易特征变量集;
17、基于所述最优交易特征变量集对所述分布式梯度增强库进行训练,得到最优分布式梯度增强库。
18、进一步地,在上述的风险商户预测方法中,所述商铺信息包括商铺注册信息,所述产品信息还包括产品图片。
19、进一步地,在上述的风险商户预测方法中,所述商铺注册信息包括商铺店名、商铺的控制人名和商铺的营业执照;所述基于最优分布式梯度增强库和所述商铺信息,预测风险商户,包括:
20、基于所述产品图片,得到每个所述产品图片的相似度;
21、基于所述商铺注册信息,得到所述商铺店名的实际含义值、与所述控制人相关联的所有其它商铺的商铺信息;
22、基于所述相似度、所述实际含义值、所述其它店铺的商铺信息,通过所述最优分布式梯度增强库预测风险商户。
23、进一步地,在上述的风险商户预测方法中,在所述筛选出二级交易特征变量集之后,且在所述筛选出最优分布式梯度增强库之前,还包括:
24、基于所述二级交易特征变量集和预设筛选规则,得到三级交易特征变量集;
25、基于所述三级交易特征变量集和分布式梯度增强库,筛选出最优分布式梯度增强库;
26、所述预设筛选规则包括:
27、将所述二级交易特征变量集中的预设交易特征变量集进行删除。
28、本申请的另一实施例还提出一种风险商铺预测系统,包括:
29、获取单元,用于获取商铺信息,所述商铺信息包括产品信息,所述产品信息包括产品交易数据;
30、衍生单元,用于基于所述产品交易数据,衍生预设数量的待测交易特征变量集;
31、第一筛选单元,用于基于预设样本集和分布式梯度增强库,筛选出一级交易特征变量集;
32、第二筛选单元,用于基于所述一级交易特征变量集和所述待测交易特征变量集,筛选出二级交易特征变量集;
33、第三筛选单元,用于基于所述二级交易特征变量集和所述分布式梯度增强库,筛选出最优分布式梯度增强库;
34、预测单元,用于基于所述最优分布式梯度增强库和所述商铺信息,预测风险商户。
35、本申请的另一实施例还提出一种计算机,包括存储单元和处理单元,所述存储单元中存储有计算机程序,所述处理单元通过调用所述存储单元中存储的所述计算机程序,执行如上述的风险商户预测方法的步骤。
36、本申请的另一实施例还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上述的风险商户预测方法的步骤。
37、本申请的实施例具有以下的有益效果:
38、本申请实施例提出一种风险商户预测方法,通过将预设样本集来获取一级交易特征变量集,再利用一级交易特征变量集和获取的商铺信息进行衍生、优化提炼,并通过模型进行层层筛选,来获得最优模型,再通过最优模型对商铺信息进行预测。不仅能随着获取的数据不断进行学习优化模型,同时还提高预测结果的正确性。
1.一种风险商户预测方法,其特征在于,包括:
2.根据权利要求1所述的风险商户预测方法,其特征在于,所述预设样本集中包括正样本集和负样本集,所述基于预设样本集和分布式梯度增强库,筛选出一级交易特征变量集,包括:
3.根据权利要求1所述的风险商户预测方法,其特征在于,所述交易特征变量对应一个交易特征,所述基于所述一级交易特征变量集和所述待测交易特征变量集,筛选出二级交易特征变量集,包括:
4.根据权利要求1所述的风险商户预测方法,其特征在于,所述基于所述二级交易特征变量集和分布式梯度增强库,筛选出最优分布式梯度增强库,包括:
5.根据权利要求1所述的风险商户预测方法,其特征在于,所述商铺信息包括商铺注册信息,所述产品信息还包括产品图片。
6.根据权利要求5所述的风险商户预测方法,其特征在于,所述商铺注册信息包括商铺店名、商铺的控制人名和商铺的营业执照;所述基于最优分布式梯度增强库和所述商铺信息,预测风险商户,包括:
7.根据权利要求1所述的风险商户预测方法,其特征在于,在所述筛选出二级交易特征变量集之后,且在所述筛选出最优分布式梯度增强库之前,还包括:
8.一种风险商铺预测系统,其特征在于,包括:
9.一种计算机,其特征在于,包括存储单元和处理单元,所述存储单元中存储有计算机程序,所述处理单元通过调用所述存储单元中存储的所述计算机程序,执行如权利要求1至7任一项所述的风险商户预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如权利要求1至7任一项所述的风险商户预测方法的步骤。