本发明属于零售信贷营销,尤其涉及基于用户行为反馈的预测方法及系统。
背景技术:
1、零售信贷是指商业银行以个人为对象发放的贷款,主要包括对消费者个人发放的,用于购买消费品或支付各种费用的消费贷款。
2、在当前的零售信贷营销领域中,基于历史营销数据的用户营销响应模型已经得到了广泛应用,在实际营销运营过程中发挥着重要作用,不过从现有技术的模型设计来看,缺乏对用户营销触达后的行为数据的挖掘和分析,而用户的行为数据往往能够真实的反应用户对产品的意愿程度,可以更深入地了解用户的偏好、需求和行为模式,因此需要以用户的行为数据为挖掘和分析的基础,精准预测用户需求。
技术实现思路
1、本发明所解决的技术问题在于提供一种基于用户行为反馈的预测方法及系统,以提高零售信贷营销领域对用户的需求的精准预测。
2、本发明提供的基础方案:基于用户行为反馈的预测方法,包括:
3、s1:创建时间窗口,获取用户在时间窗口内经零售信贷营销触达后的行为数据;
4、s2:获取数据库中的用户历史数据,构建特征数据模型,提取出数据宽表;
5、s3:对行为数据进行预处理,并根据数据宽表对预处理后的行为数据进行特征分析和差异分析,生成样本数据;
6、s4:将样本数据分为训练集、验证集和测试集,分别构建随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型,并基于测试集和验证集结合optuna模型调参框架,对随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型的参数进行局部调优;
7、s5:使用rank加权模型将调优后的随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型进行融合,生成用户行为预测模型,并通过测试集测试融合后的用户行为预测模型;
8、s6:将用户行为预测模型部署至零售信贷营销的平台中。
9、进一步,所述s1中包括:
10、s1-1:根据预设的时间段创建时间窗口;
11、s1-2:获取时间窗口内的用户的行为数据,并根据预设的标签对行为数据进行标记,所述预设的标签内容为:用户是否授信申请,若标签为1,则表示截止时间用户授信申请,若标签为0,则表示截止时间用户未授信申请;
12、s1-3:提取标签为1的用户的行为数据。
13、进一步,所述s2包括:
14、s2-1:获取数据库中的用户历史数据,所述用户历史数据包括用户的基础数据、用户的历史信贷数据和用户的历史行为数据;
15、s2-2:基于用户的基础数据、用户的历史信贷数据和用户的历史行为数据构建特征数据模型;
16、s2-3:根据特征数据模型输出特征数据,并生成数据宽表。
17、进一步,所述s3包括:
18、s3-1:将s1-3提取的行为数据进行重复值处理、缺失值处理、异常值处理和时间数据处理,生成预处理后行为数据;
19、s3-2:通过数据宽表对预处理后行为数据进行特征分析,生成数值型特征和类别特征,对数值型特征进行描述性分析,对类别特征进行唯一值排序计数分析和进行特征编码;
20、s3-3:对分析后的数值型特征和类别特征进行特征选择,生成样本数据,并对样本数据采用smote采样方法进行样本均衡。
21、进一步,所述s3-3中特征选择具体为:
22、删除缺失率超过预设缺失率阈值的特征;
23、删除与目标变量无相关关系的特征;
24、对特征进行多重共线性检验,删除特征值之间多重共线性超过预设的阈值的特征;
25、删除方差低于预设的方差阈值的特征。
26、进一步,所述s4包括:
27、s4-1:将样本数据分为训练集、验证集和测试集,并分别构建随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型;
28、s4-2:基于训练集和验证集结合optuna模型调参框架,对随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型的参数进行局部调优,以auc值、ks值、f1值和left提升度作为模型训练的效果的评估指标。
29、进一步,还包括s7:对部署在零售信贷营销的平台中的用户行为预测模型进行监控和异常处理;所述s7具体包括:
30、特征监控:对用户行为预测模型使用的特征进行取值监控、分布监控和差异监控,并对特征异常的用户行为预测模型进行调整;
31、模型性能监控:对用户行为预测模型的准确率、召回率、f1值、auc值、ks值、排序性和有效性;
32、异常监控:对用户行为预测模型的运行异常情况和数据质量进行监控。
33、基于用户行为反馈的预测系统,应用于上述的基于用户行为反馈的预测方法,包括数据获取模块、数据宽表提取模块、样本数据生成模块、模型构建模块、模型训练模块、模型融合模块以及模型部署模块,所述数据获取模块用于根据预设的时间窗口获取经零售信贷营销触达后的行为数据,所述数据宽表提取模块用于获取数据库中的用户历史数据,构建特征数据模型,提取出数据宽表;所述样本数据生成模块用于对行为数据进行预处理,并根据数据宽表对预处理后的行为数据进行特征分析和差异分析,生成样本数据;所述模型构建模块用于将样本数据分为训练集、验证集和测试集,分别构建随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型;所述模型训练模块用于基于测试集和验证集结合optuna模型调参框架,对随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型的参数进行局部调优;所述模型融合模块用于根据rank加权模型将调优后的随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型进行融合,生成用户行为预测模型,并通过测试集测试融合后的用户行为预测模型;所述模型部署模块用于将用户行为预测模型部署至零售信贷营销的平台中。
34、本发明的原理及优点在于:本技术的技术方案,在现有的用户特征维度体系中引入了对用户营销触达后的行为数据的挖掘分析,以修正用户营销响应分,提高零售信贷的营销转化率,具体的,首先进行用户在触达零售信贷的行为数据,表示用户有进行零售信贷的需求,这类行为数据作为分析的数据,才能更有效的得到用户的信贷意愿,然后构建特征数据模型,对用户的行为特征进行分析,得到的数据宽表来作为后续用户行为预测模型的特征表,将用户的行为数据进行一系列的预处理和特征处理,提高数据的泛化能力、有效性和特征的识别率,而本技术构建的用户行为预测模型,是基于随机森林模型、五折交叉验证的xgboost模型和五折交叉验证的lightgbm模型加以rank加权模型进行融合的,将多个模型的预测结果有机结合在一起,提高模型的鲁棒性和泛化能力,这种模型融合方法使模型更具竞争力,能够更准确地适应不同用户群体和市场条件;以此来达到对用户需求的精准预测。