本发明涉及人工智能,特别是一种基于人工智能的风控规则效果评价方法及系统。
背景技术:
1、随着大数据与人工智能技术的迅猛发展,保险行业面临着日益复杂的欺诈风险挑战,传统的车险理赔风控方法主要依赖人工审核和基于规则的系统,这些方法虽然直观有效,但在面对大量非结构化数据时显得力不从心,近年来,深度学习技术在处理非结构化数据方面展现出巨大潜力,尤其是在图像识别、语音分析和自然语言处理等领域取得了显著成果,目前,大多数风控系统在处理非结构化数据时缺乏有效的特征提取手段,往往忽略了一些关键信息,导致风险评估不够准确,此外,传统的风控规则大多基于专家经验设定,缺乏灵活性和自适应性,难以应对不断变化的风险环境。
技术实现思路
1、鉴于上述现有存在的问题,提出了本发明。
2、因此,本发明提供了一种基于人工智能的风控规则效果评价方法及系统解决了现有技术中车险理赔领域缺乏有效融合结构化与非结构化数据进行风控规则效果评估的问题。
3、为解决上述技术问题,本发明提供如下技术方案:
4、第一方面,本发明实施例提供了一种基于人工智能的风控规则效果评价方法,其包括,收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
5、利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
6、基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
7、利用风控特征向量和理赔关系图谱,构建图神经网络模型;
8、基于图神经网络模型的输出,设定新的风控规则;
9、将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
10、作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:所述结构化数据包括理赔记录和用户基本信息;
11、所述非结构化数据包括事故现场照片、客户电话录音和文字描述;
12、所述预处理包括数据清洗和归一化处理。
13、作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量,包括如下步骤:
14、使用resnet-50网络从事故现场照片中提取图像特征向量,表示为,
15、ximage=fresnet-50(i);
16、其中,ximage表示从resnet-50的倒数第二层提取的图像特征向量,fresnet-50表示resnet-50网络,i表示处理后的事故现场照片形成的适合网络输入的数据格式;
17、使用带有门控循环单元的循环神经网络从客户电话录音中提取语音特征向量,表示为,
18、xvoice=fgru(v);
19、其中,xvoice表示从gru的最后一个时间步提取的语音特征向量,v表示处理后的客户电话录音形成的适合网络输入的数据格式,fgru表示带有门控循环单元的循环神经网络;
20、使用word2vec模型将文字描述中的每个单词转换为文字特征向量表示,然后通过注意力机制聚合单词级别的文字特征向量,得到句子级别的文字特征向量,表示为,
21、xword,i=fword2vec(wi);
22、
23、其中,xword,i表示当前第i个单词的文字特征向量,zsentence表示通过注意力机制聚合后得到的句子级别的文字特征向量,fword2vec表示word2vec模型,m表示句子中单词的数量,wi表示文字描述中的第i个单词,αi表示当前第i个单词的注意力权重;
24、将提取图像特征向量、语音特征向量和句子级别的文字特征向量进行整合,得到风控特征向量。
25、作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:基于处理后的结构化数据和非结构化数据,构建理赔关系图谱,包括如下步骤:
26、使用基于bilstm-crf的命名实体识别模型从处理后的文字描述中识别出实体,将识别出的实体与结构化数据中的实体进行连接;
27、定义实体之间的关系类型,使用基于深度学习的关系抽取技术从结构化数据和非结构化数据中抽取实体之间的关系,并对抽取的关系进行验证;
28、使用neo4j图数据库,根据实体识别的结果创建图谱中的节点,每个节点代表一个实体,根据关系抽取的结果创建图谱中的边,每个边代表实体之间的关系,为节点和边添加属性,图谱数据以图数据库支持的格式存储,最后得到理赔关系图谱。
29、作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:利用风控特征向量和理赔关系图谱,构建图神经网络模型,包括如下步骤:
30、将风控特征向量整合到对应的理赔关系图谱节点中,对整合后的图谱进行缺失值处理、异常值检测和节点属性标准化处理;
31、选择gcn作为图神经网络模型的架构,图谱中节点之间的连接关系设定为邻接矩阵,输入包含节点特征和边信息的图谱数据为输入特征矩阵,预测每个节点的欺诈概率,训练图神经网络模型,通过图卷积操作更新节点特征,表示为,
32、
33、其中,h(l+1)表示经过第l+1层图卷积操作后得到的节点特征矩阵,h(l)表示第l层的节点特征矩阵,输入特征矩阵在第一层的节点特征矩阵中,w(l)表示第l层的权重矩阵,表示加了自环的邻接矩阵,a表示邻接矩阵,表示的度矩阵,σ表示relu函数;
34、定义损失函数和优化器;
35、利用损失函数和优化器来最小化损失并优化模型参数,最后得到构建好的图神经网络模型。
36、作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:基于图神经网络模型的输出,设定新的风控规则,包括如下步骤:
37、使用k-means聚类算法对图神经网络模型输出的欺诈概率进行聚类,以识别具有相似欺诈行为的模式;
38、根据聚类结果,设定聚类阈值;
39、当聚类结果大于等于聚类阈值时,表示存在欺诈行为;
40、当聚类结果小于聚类阈值时,表示不存在欺诈行为。
41、作为本发明所述基于人工智能的风控规则效果评价方法的一种优选方案,其中:将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告,包括如下步骤:
42、对于新的理赔案例,使用新的风控规则进行判断;
43、风控规则测试是指计算图神经网络模型的准确率、召回率、精确率、f1分数的指标来评价风控规则的效果;
44、通过汇总准确率、召回率、精确率和f1分数的分析来评价新的风控规则的综合表现,生成新的风控规则效果评价报告。
45、第二方面,本发明提供了一种基于人工智能的风控规则效果评价系统,包括,数据采集模块,负责收集车险理赔中的结构化数据和非结构化数据,并进行预处理;
46、非结构化数据深度学习分析模块,负责利用深度学习技术对处理后的非结构化数据进行分析,提取风控特征向量;
47、理赔关系图谱构建模块,负责基于处理后的结构化数据和非结构化数据,构建理赔关系图谱;
48、图神经网络模型构建模块,负责利用风控特征向量和理赔关系图谱,构建图神经网络模型;
49、风控规则设定与优化模块,负责基于图神经网络模型的输出,设定新的风控规则;
50、风控规则效果评价模块,负责将新的风控规则应用于新的理赔案例中,通过风控规则测试评价新的风控规则的效果,生成新的风控规则效果评价报告。
51、第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的基于人工智能的风控规则效果评价方法的任一步骤。
52、第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中:所述计算机程序被处理器执行时实现如本发明第一方面所述的基于人工智能的风控规则效果评价方法的任一步骤。
53、本发明有益效果为:通过数据收集与预处理,实现了车险理赔中的结构化数据和非结构化数据的有效整合与标准化,确保了后续分析过程的准确性和可靠性。通过非结构化数据特征提取,实现了从不同类型的非结构化数据中提取关键特征,为后续建立图神经网络模型提供了丰富的信息来源。通过构建理赔关系图谱,构建了全面反映理赔过程中各种实体及其关系的图谱,为风险评估提供了直观的可视化工具,提升了风控决策依据。通过构建图神经网络模型,实现了自动化的风险预测功能,提高了欺诈检测的准确性,优化了风险控制流程。通过设定新的风控规则,实现了根据模型输出制定具体的风控策略,提升了欺诈检测效率。通过风控规则测试与评估,为持续改进提供了依据。