本发明涉及大数据健康技术,尤其涉及一种基于大数据的健康保险风险控制方法及系统。
背景技术:
1、在保险业务的推广过程中,业务员通常只能根据经验值向客户推荐保险产品。然而,由于社会人员的个人情况各不相同,而且保险产品的种类繁多,各个保险产品之间具有不同的产品条款和适用场景,业务员很难通过自行分析确定适合客户的保险产品,业务推广的效果不佳。
2、现有在个性化的为用户推荐适合用户的保险产品时,通常由销售经理等通过与用户沟通了解用户的个人信息后,人工确定适合用户的保险产品从而进行个性化推荐。然而,由人工确定适合用户的保险产品时,受人工经验等主观因素影响较大,也难免出现决策不完善等情况,存在效率及准确性较低的问题。
技术实现思路
1、本发明实施例提供一种基于大数据的健康保险风险控制方法及系统,至少能够解决现有技术中部分问题。
2、本发明实施例的第一方面,
3、提供一种基于大数据的健康保险风险控制方法,包括:
4、获取目标对象的基本属性信息以及医疗记录信息,对所述基本属性信息和所述医疗记录信息进行数据预处理,并且提取数据预处理后所述基本属性信息对应的基本属性特征以及所述医疗记录信息对应的医疗记录特征;
5、根据所述基本属性特征以及所述医疗记录特征,通过预先构建的风险评估模型,确定所述目标对象对应的个人风险评分,基于所述个人风险评分,确定所述目标对象对应的保险风险等级,其中,所述风险评估模型基于改进的梯度提升机构建而成;
6、通过所述保险风险等级,确定与所述保险风险等级对应的平均索赔成本,结合与所述保险风险等级对应的候选保险产品的商业成本,确定所述目标对象对应的保险产品费率。
7、在一种可选的实施方式中,
8、根据所述基本属性特征以及所述医疗记录特征,通过预先构建的风险评估模型,确定所述目标对象对应的个人风险评分之前,所述方法还包括训练所述风险评估模型:
9、初始化所述风险评估模型的多个超参数,为所述多个超参数设定初始参数范围,通过随机搜索对所述多个超参数进行随机组合确定初始超参数组合;
10、通过交叉验证确定每个初始超参数组合的参数性能,将参数性能排名前20%的初始超参数组合作为热点超参数组合;
11、通过高斯函数确定所述热点超参数组合对应的先验分布,迭代调整搜索步长,根据每次搜索到的新参数加入到观测参数集合中,基于所述观测参数集合以及所述风险评估模型的风险评估目标函数,确定所述热点超参数组合对应的后验分布,重复迭代调整搜索步长,直至满足预设迭代次数,其中,所述风险评估目标函数用于指示所述风险评估模型所输出的风险评估值与风险标签值的误差。
12、在一种可选的实施方式中,
13、所述风险评估目标函数如下公式所示:
14、tar=α·acc(θ)-λ·traintime(θ)-(1-α-λ)cmp(θ);
15、其中,tar表示所述风险评估目标函数的目标值,α、λ分别表示准确率权重和训练时长权重,θ表示所述热点超参数组合,acc(θ)、traintime(θ)、cmp(θ)分别表示在给定热点超参数组合情况下验证准确率函数、训练时长函数以及复杂度函数。
16、在一种可选的实施方式中,
17、通过所述保险风险等级,确定与所述保险风险等级对应的平均索赔成本,结合与所述保险风险等级对应的候选保险产品的商业成本,确定所述目标对象对应的保险产品费率包括:
18、通过所述保险风险等级,确定与所述保险风险等级对应的平均索赔成本;
19、基于所述保险风险等级对应的索赔概率,结合所述平均索赔成本确定所述保险风险等级对应的纯风险溢价;
20、根据所述纯风险溢价,结合与所述保险风险等级对应的候选保险产品的商业成本,以及所述候选保险产品对应的预期利润比例,确定所述目标对象对应的保险产品费率。
21、在一种可选的实施方式中,
22、确定所述目标对象对应的保险产品费率如下公式所示:
23、r=(p×q×(1+c))×(1+l)×f;
24、其中,r表示保险产品费率,p、q分别表示平均索赔成本以及索赔概率,c表示运营成本比例,l表示预期利润比例,f表示候选保险产品的商业成本。
25、在一种可选的实施方式中,
26、确定所述目标对象对应的保险产品费率之后,所述方法还包括:
27、将所述目标对象对应的保险产品费率作为目标保险产品费率,确定与所述保险产品费率相匹配的多个保险产品组合,从所述多个保险产品组合中搜索与所述目标保险产品费率最接近的候选保险产品;
28、若所述候选保险产品的保费上限达到或超过了所述保险风险等级对应的目标保额,那么将其确定为符合目标保额要求的保险产品;
29、若所述候选保险产品的保费上限低于所述保险风险等级对应的目标保额,那么计算两者之间的额度差距,并在所有候选保险产品中查找一个最能弥补额度差距的次级保险产品;
30、若所述次级保险产品的保费上限等于或超过了所述额度差距,则将所述候选保险产品与所述次级保险产品进行组合,将其确定为符合目标保额要求的保险产品;
31、若所述次级保险产品的保费上限低于所述额度差距,则持续计算额度差距,并寻找最能补足额度差距的保险产品,直到保费上限满足或超过所述目标保额。
32、本发明实施例的第二方面,
33、提供一种基于大数据的健康保险风险控制系统,包括:
34、第一单元,用于获取目标对象的基本属性信息以及医疗记录信息,对所述基本属性信息和所述医疗记录信息进行数据预处理,并且提取数据预处理后所述基本属性信息对应的基本属性特征以及所述医疗记录信息对应的医疗记录特征;
35、第二单元,用于根据所述基本属性特征以及所述医疗记录特征,通过预先构建的风险评估模型,确定所述目标对象对应的个人风险评分,基于所述个人风险评分,确定所述目标对象对应的保险风险等级,其中,所述风险评估模型基于改进的梯度提升机构建而成;
36、第三单元,用于通过所述保险风险等级,确定与所述保险风险等级对应的平均索赔成本,结合与所述保险风险等级对应的候选保险产品的商业成本,确定所述目标对象对应的保险产品费率。
37、本发明实施例的第三方面,
38、提供一种电子设备,包括:
39、处理器;
40、用于存储处理器可执行指令的存储器;
41、其中,所述处理器被配置为调用所述存储器存储的指令,以执行前述所述的方法。
42、本发明实施例的第四方面,
43、提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现前述所述的方法。
44、本技术使用高斯函数确定的先验分布能够为超参数的搜索提供一个基于历史数据的合理起点。这种方法假设超参数的有效值遵循高斯分布,这有助于从可能性较高的区域开始搜索,而不是盲目地搜索整个参数空间;通过在每次迭代中调整搜索步长,可以逐渐缩小搜索范围,从而更快地聚焦于最有潜力的超参数组合。将每次搜索到的新参数加入观测参数集合中,使得模型能够动态地从新数据中学习,这样,超参数优化过程能够基于最新的信息不断调整其搜索策略,提高了找到最优解的概率。