本申请涉及计算机,特别是涉及一种模型训练方法、保费预测方法、电子设备以及计算机存储介质。
背景技术:
1、编码是机器学习特征工程中最常见且运用最普遍的类别变量特征处理方法,通过这种方法在计算的过程中,当某个特征的种类数非常多的时候对机器的计算性能和要求显著提高,往往进行特征工程要进行很长的时间消耗,这对于模型训练优化不利。
技术实现思路
1、为解决上述技术问题,本申请提出一种模型训练方法、保费预测方法、电子设备以及计算机存储介质。
2、为解决上述技术问题,本申请提出模型训练方法,所述模型训练方法包括:
3、获取客户信息,从所述客户信息提取至少一种类型的特征;
4、基于预设编码方式,对所述至少一种类型的特征中的目标特征进行编码,得到若干种类的目标数值特征;
5、获取每一种类的目标数值特征对待训练模型的预测输出的重要性;
6、获取所述重要性从高到低排序的前n个种类作为所述目标特征的预设种类,将其余种类作为所述目标特征中新的预设种类,对所述待训练模型进行训练。
7、其中,所述客户信息中提取出若干种类型的特征;
8、所述基于预设编码方式,对所述至少一种类型的特征中的目标特征进行编码,得到若干种类的目标数值特征,包括:
9、基于所述预设编码方式,对其中一种类型的目标特征进行编码,剔除其他种类型的特征,得到所述目标特征对应的若干种类目标数值特征;
10、或者,基于所述预设编码方式,对所述若干种类型的特征进行编码,得到所述若干种类型的特征对应的数值特征,从所述数值特征中筛选中一个类型的目标特征对应的若干种类目标数值特征。
11、其中,所述预设编码方式为独热编码。
12、其中,所述客户信息包括客户类型、行业类型、地区类型、时间类型、历史保险产品类型,和/或历史保险保费类型。
13、其中,所述获取所述每一种类的目标数值特征对待训练模型的预测输出的重要性,包括:
14、基于所述若干种类的目标数值特征构建学习树模型参数,其中,所述学习树模型的每一节点对应一个种类的目标数值特征;
15、利用所述学习树模型参数对所述待训练模型的预测输出的贡献值,获取所述每一种类的目标数值特征的重要性。
16、其中,所述预测输出表示为一种类别变量,包括保费分段。
17、其中,所述获取所述重要性从高到低排序的前n个种类作为所述目标特征的预设种类,将其余种类作为所述目标特征中新的预设种类,对所述待训练模型进行训练,包括:
18、获取客户信息训练集;
19、提取所述客户信息训练集中每一客户信息的若干类型的特征;
20、基于预设编码方式,对所述若干类型的特征进行编码,得到若干类型特征的预设种类的数值特征;
21、利用所述若干类型特征的预设种类的数值特征,以及真实保费对所述待训练模型进行训练。
22、为解决上述技术问题,本申请提出一种保费预测方法,所述保费预测方法包括:
23、获取客户信息;
24、将所述客户信息输入保费预测模型,获取所述保费预测模型输出的保费信息,其中,所述保费预测模型通过上述所述的模型训练方法训练所得;
25、基于所述保费信息输出保费额度和/或保险产品类型。
26、为解决上述技术问题,本申请提出一种电子设备,所述电子设备包括存储器以及与所述存储器耦接的处理器;
27、其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的模型训练方法,和/或上述所述的保费预测方法。
28、为解决上述技术问题,本申请提出一种计算机存储介质,计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现如上述的模型训练方法,和/或上述保费预测方法。
29、与现有技术相比,本申请的有益效果是:电子设备获取客户信息,从客户信息提取至少一种类型的特征;基于预设编码方式,对至少一种类型的特征中的目标特征进行编码,得到若干种类的目标数值特征;获取每一种类的目标数值特征对待训练模型的预测输出的重要性;获取重要性从高到低排序的前n个种类作为目标特征的预设种类,将其余种类作为目标特征中新的预设种类,对待训练模型进行训练。通过上述方式,在进行模型训练过程中大幅度提升特征工程计算效率,并且保留每种类型的特征中重要的种类,去除噪音种类,模型的训练效率以及模型的预测效果都将得到提升。
1.一种模型训练方法,其特征在于,所述模型训练方法包括:
2.根据权利要求1所述的模型训练方法,其特征在于,
3.根据权利要求1或2所述的模型训练方法,其特征在于,
4.根据权利要求1或2所述的模型训练方法,其特征在于,
5.根据权利要求1所述的模型训练方法,其特征在于,
6.根据权利要求1或5所述的模型训练方法,其特征在于,
7.根据权利要求1所述的模型训练方法,其特征在于,
8.一种保费预测方法,其特征在于,所述保费预测方法包括:
9.一种电子设备,其特征在于,所述电子设备包括存储器以及与所述存储器耦接的处理器;
10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被计算机执行时,用以实现如权利要求1至7任一项所述的模型训练方法,和/或权利要求8所述的保费预测方法。