本发明涉及图像处理,尤其涉及一种面向车险反欺诈的图像生成方法、系统、装置和介质。
背景技术:
1、随着金融保险行业信息化的发展,如何利用快速增长的数据,特别是较客观的图像数据,进行保险欺诈行为检测,对车险行业有重要意义。虽然车险行业采集的数据较多,但这些数据存在较严重的数据不均衡性。例如常见车损类型刮蹭,碰撞等占数据比例超过90%,而其他类型数据较少。这种非均衡性数据分布为标注和深度学习模型训练带来一定困难,并最终影响反欺诈系统判定效果。当前基于gan(generative adversarial network,对抗生成网络)的图像增强算法,其生成数据同样存在分布不均衡问题,会进一步加剧样本的不均衡性。其次,对样本量较少,样本多样性强的类别,gan生成图像保真度低,无法有效提升模型性能,实现数据增强的效果。需要更多的样本训练gan——无足够样本需要gan增强,这一悖论无法解决。
技术实现思路
1、本发明的目的在于针对现有技术的不足,提供一种面向车险反欺诈的图像生成方法、系统、装置和介质。
2、本发明的目的是通过以下技术方案来实现的:本发明实施例第一方面提供了一种面向车险反欺诈的图像生成方法,包括以下步骤:
3、(1)收集车险图像构建车险图像数据库,对车险图像数据库进行预处理,以构建图像数据集,根据语义分割方式,人工完成车辆的车损要素标注;
4、(2)通过车辆部件的标注结果解析和分布分析,统计不同部件不同损伤类型的概率,对概率小于设置的阈值的样本类型进行补充;
5、(3)构建所述步骤(2)中需要补充的样本类型对应的车辆部件的有损图像样本集和无损图像样本集,使用特征迁移方法将无损图像样本转换为有损图像样本,以实现车损部件特征迁移;
6、(4)车损部件拼装式图像生成:使用基于对抗网络的图像合成方法,将步骤(3)中生成的有损部件图像合成到目标车辆上,形成新的车损图像样本。
7、2、根据权利要求1所述的面向车险反欺诈的图像生成方法,其特征在于,所述步骤(1)包括以下子步骤:
8、(1.1)通过车险行业自有数据库或网络车损图像数据,收集车险图像,构建车险图像数据库;
9、(1.2)对车险图像数据库进行去重复去相似预处理,以构建图像数据集;
10、(1.3)以语义分割方式,人工对车辆图像中的车损、车辆部件信息进行标注,包括车损轮廓标注和车辆部件轮廓标注,以完成车辆的车损要素标注,并将标注的结果存储为标注数据集。
11、3、根据权利要求1所述的面向车险反欺诈的图像生成方法,其特征在于,所述步骤(2)包括以下子步骤:
12、(2.1)从标注的结果中读取损坏的车辆部件轮廓信息,其中,损坏的车辆部件轮廓信息包括损坏区域轮廓和损坏类型信息;
13、(2.2)按照损伤部件和损伤类型进行统计,计算不同损伤部件不同损伤类型的概率,人工筛选出概率小于设置的阈值的样本类型,对该类型样本进行补充,使得对应的概率大于等于设置的阈值。
14、4、根据权利要求1所述的面向车险反欺诈的图像生成方法,其特征在于,所述步骤(3)包括以下子步骤:
15、(3.1)构建所述步骤(2)中需要补充的样本类型对应的车辆部件的有损图像样本集和无损图像样本集;
16、(3.2)基于有损图像样本集和无损图像样本集,训练车损部件特征迁移模型;
17、(3.3)使用特征迁移模型将有损图像中的有损部件图像特征迁移到无损图像中的无损部件上,生成仿真的有损部件图像,以实现无损图像到有损图像的转换。
18、5、根据权利要求1所述的面向车险反欺诈的图像生成方法,其特征在于,所述步骤(4)包括以下子步骤:
19、(4.1)利用语义分割方式提取待替换的车辆部件的外接定位框和轮廓;
20、(4.2)使用特征迁移模型将待替换的无损车辆部件转换成有损车辆部件;
21、(4.3)采用引导式拼装方法或轮廓对齐方法将生成的有损车辆部件拼装到无损车辆上,生成仿真的有损车辆图像。
22、6、根据权利要求5所述的面向车险反欺诈的图像生成方法,其特征在于,所述引导式拼装方法具体为:首先,将生成的有损车辆部件缩放到原无损车辆部件的定位框区域大小;然后,将有损车辆部件的图像和无损车辆部件的图像相减,找出差异位置;最后,对于有损车辆部件的图像边缘梯度不连续的位置,沿图像边缘的垂直方向进行损伤的二阶样条插值,按设定比例将损伤扩散到被覆盖位置相邻的无损区域。
23、7、根据权利要求5所述的面向车险反欺诈的图像生成方法,其特征在于,所述轮廓对齐方法具体为:首先,对生成的有损车辆部件进行分割,找出有损车辆部件的轮廓;然后,在无损车辆图像上,分割出无损车辆部件的轮廓;最后,将有损车辆部件的轮廓与无损车辆部件的轮廓对齐,并使得有损车辆部件覆盖在无损车辆部件上,以生成有损车辆图像。
24、本发明实施例第二方面提供了一种面向车险反欺诈的图像生成系统,用于实现上述的面向车险反欺诈的图像生成方法,所述图像生成系统包括数据层、模型层和应用层;其中,
25、所述数据层包括:
26、图像集构建模块,用于收集车险维修的行业数据及网络车险图像,经过预处理建立车辆及车损图像数据库;
27、标注功能模块,用于根据语义分割方式,人工进行车辆部件标注,提取图像中的车损轮廓信息和车辆部件轮廓信息;和
28、存储模块,用于将标注结果存储为灰度图像或者json格式文件;
29、所述模型层包括:
30、图像集分析模块,用于通过车辆部件标注结果解析和分布分析,统计不同损伤部件不同损伤类型的概率,对于概率小于设置的阈值的样本类型进行补充;
31、车损部件特征迁移模块,用于构建车辆部件的有损图像样本集和对应的无损图像样本集,使用特征迁移方法将无损图像样本转换为有损图像样本;和
32、车损部件分割模块,用于根据语义分割方式提取车辆部件的外接定位框和轮廓;
33、所述应用层包括:
34、车损部件拼装图像生成模块,用于根据对抗网络的图像合成方法,将有损车辆部件合成到目标车辆上,形成新的车损图像样本。
35、本发明实施例第三方面提供了一种电子装置,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的面向车险反欺诈的图像生成方法。
36、本发明实施例第四方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,用于实现上述的面向车险反欺诈的图像生成方法。
37、本发明的有益效果是,本发明的方法首先通过分析不同车辆部件的损伤概率,以此为准进行图像生成,改善样本分布的不均衡性;其次,以车辆部件的材质为对象构建数据集训练特征迁移模型,实现将有损车辆部件的损伤特征迁移到无损车辆部件上,可以提高图像的保真度;最后,使用拼装的方法将有损车辆部件替换无损车辆部件,可使生成有损车辆图像接近真实图像,从而为反欺诈模型的图像特征提取提供图像样本扩增能力,最终提升反欺诈系统预测精度。