本发明涉及数据处理领域,尤其涉及一种风险评估模型训练方法、业务风险评估方法及其他设备。
背景技术:
随着社会经济和计算机技术的不断发展,进行业务处理的数据量越来越大,为提高业务处理效率,往往在业务处理之前进行风险评估,例如,在进行交通管制业务时,需要预先对交通拥堵情况进行风险评估,进而根据交通拥堵情况的评估结果,辅助决策。
通常进行的风险分析方法包括基于经验的专家规则分析和基于大数据的机器学习模型分析方法,但是,发明人中实现本申请的过程中,发现现有方案至少存在如下问题:通过基于经验的专家规则分析方法,设计拦截规则,对容易出现风险的业务有很好的效果,解释性也较强,但是人为设定的规则难以全面捕捉业务可能存在各种导致异常的情况,对一些风险隐蔽的业务鲜有效果;相比专家规则更进一步的是基于大数据模型的风险评估方法,包括异常检测和监督学习等方式,从大量的历史数据中依靠模型自动学习各项业务执行结果的统计规律差异,对新来的业务依据学习的复杂规则进行风险判别,这类依靠模型学习的方法相比专家规则能捕获一些隐蔽的出险规律,但也难以区分不同的业务处理结果对模型效果的影响,也未考虑到时序对业务风险评估的影响,因而,亟需一种能提高风险评估准确率的模型。
技术实现要素:
本发明实施例提供一种风险评估模型训练方法、业务风险评估方法及其他设备,以提高对业务风险评估的准确率。
为了解决上述技术问题,本申请实施例提供一种风险评估模型训练方法,包括:
在接收到第一业务数据时,将所述第一业务数据输入到预设的风险评估模型中,并通过所述预设的评估模型对所述第一业务数据进行风险评估,得到第一风险评估结果;
若所述第一风险评估结果为评估未通过,则将所述第一业务数据和所述第一风险评估结果发送给监控端;
接收所述监控端发送的修正结果,并将所述修正结果输入到强化学习模型中;
若所述第一风险评估结果为评估通过,则采用所述第一业务数据进行业务处理,并将所述第一业务数据存入到业务数据库中;
在预设周期后,将所述业务数据库中的每个所述第一业务数据和所述第一业务数据对应的业务处理结果,作为历史业务执行信息,并将所述历史业务执行信息输入到所述强化学习模型中;
通过所述强化学习模型对所述修正结果和/或所述历史业务执行信息进行打分,得到目标评分;
基于目标评分,对所述预设的风险评估模型进行参数调整,更新所述预设的风险评估模型。
可选地,所述在接收到第一业务数据时,将所述第一业务数据输入到预设的风险评估模型中包括:
对第一业务数据进行数据预处理,得到初始数据,并获取所述初始数据的所有特征维度;
通过预设的特征排序方式,对所述初始数据的特征维度进行重要性排序,得到特征序列;
从所述特征序列中依次从前往后选取预设数量的特征维度,作为目标维度,并将所述目标维度对应的特征值,作为所述初始数据的特征值;
将所述初始数据的特征值输入到所述预设的风险评估模型中。
可选地,所述预设的风险评估模型为actor网络,所述强化学习模型为critic网络。
可选地,所述强化学习模型接收到的数据为所述历史业务执行信息,所述通过所述强化学习模型对所述修正结果和/或所述历史业务执行信息进行打分,得到目标评分包括:
针对所述历史业务执行信息中任意一条第一业务数据,根据所述第一业务数据对应的业务处理结果,为所述第一业务数据打上标签,其中,所述标签包括评估正确和评估错误;
将所述历史业务执行信息中的第一业务数据,按照业务处理时间进行排序,得到排序后的序列;
将所述排序后的序列中的第一业务数据和所述业务数据对应的标签,依次分批输入到所述强化学习模型中,并通过所述强化学习模型,计算奖励信号,将所述奖励信号作为所述目标评分。
可选地,所述通过所述强化学习模型,计算奖励信号包括:
根据所述第一业务数据的标签和所述第一风险评估结果,确定乘积系数;
从所述第一业务数据中提取预设维度的特征值,作为奖励计算因子;
基于所述乘积系数和所述奖励计算因子,确定所述奖励信号。
为了解决上述技术问题,本申请实施例还提供一种业务风险评估方法,包括:
若接收到业务风险评估请求,则从所述业务风险评估请求中获取第二业务数据,并将所述第二业务数据输入到预设的风险评估模型中,其中,所述预设的风险评估模型为采用上述的风险评估模型训练方法获取的模型;
通过所述预设的风险评估模型对所述第二业务数据进行训练,得到第二风险评估结果。
为了解决上述技术问题,本申请实施例还提供一种风险评估模型训练装置,包括:
第一评估模块,用于在接收到第一业务数据时,将所述第一业务数据输入到预设的风险评估模型中,并通过所述预设的评估模型对所述第一业务数据进行风险评估,得到第一风险评估结果;
第一处理模块,用于若所述第一风险评估结果为评估未通过,则将所述第一业务数据和所述第一风险评估结果发送给监控端;
第一输入模块,用于接收所述监控端发送的修正结果,并将所述修正结果输入到强化学习模型中;
第二处理模块,用于若所述第一风险评估结果为评估通过,则采用所述第一业务数据进行业务处理,并将所述第一业务数据存入到业务数据库中;
第二输入模块,用于在预设周期后,将所述业务数据库中的每个所述第一业务数据和所述第一业务数据对应的业务处理结果,作为历史业务执行信息,并将所述历史业务执行信息输入到所述强化学习模型中;
评分模块,用于通过所述强化学习模型对所述修正结果和/或所述历史业务执行信息进行打分,得到目标评分;
参数调整模块,用于基于目标评分,对所述预设的风险评估模型进行参数调整,更新所述预设的风险评估模型。
可选地,所述第一评估模块包括:
特征维度获取单元,用于对第一业务数据进行数据预处理,得到初始数据,并获取所述初始数据的所有特征维度;
特征排序单元,用于通过预设的特征排序方式,对所述初始数据的特征维度进行重要性排序,得到特征序列;
特征值确定单元,用于从所述特征序列中依次从前往后选取预设数量的特征维度,作为目标维度,并将所述目标维度对应的特征值,作为所述初始数据的特征值;
特征值输入单元,用于将所述初始数据的特征值输入到所述预设的风险评估模型中。
可选地,所述强化学习模型接收到的数据为所述历史业务执行信息,所述评分模块包括:
标签生成单元,用于针对所述历史业务执行信息中任意一条第一业务数据,根据所述第一业务数据对应的业务处理结果,为所述第一业务数据打上标签,其中,所述标签包括评估正确和评估错误;
数据排序单元,用于将所述历史业务执行信息中的第一业务数据,按照业务处理时间进行排序,得到排序后的序列;
评分计算单元,用于将所述排序后的序列中的第一业务数据和所述业务数据对应的标签,依次分批输入到所述强化学习模型中,并通过所述强化学习模型,计算奖励信号,将所述奖励信号作为所述目标评分。
可选地,所述评分模块还包括:
系数确定子单元,用于根据所述第一业务数据的标签和所述第一风险评估结果,确定乘积系数;
奖励计算因子确定子单元,用于从所述第一业务数据中提取预设维度的特征值,作为奖励计算因子;
奖励信号计算子单元,用于基于所述乘积系数和所述奖励计算因子,确定所述奖励信号。
为了解决上述技术问题,本申请实施例还提供一种业务风险评估装置,包括:
数据获取模块,用于若接收到业务风险评估请求,则从所述业务风险评估请求中获取第二业务数据,并将所述第二业务数据输入到预设的风险评估模型中,其中,所述预设的风险评估模型为采用上述风险评估模型训练方法获取的模型;
第二风险评估模块,用于通过所述预设的风险评估模型对所述第二业务数据进行训练,得到第二风险评估结果。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述风险评估模型训练方法和上述业务风险评估方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述风险评估模型训练方法和上述业务风险评估方法的步骤。
本发明实施例提供的风险评估模型训练方法、业务风险评估方法及其他设备,一方面,在接收到第一业务数据时,将第一业务数据输入到预设的风险评估模型中,并通过预设的评估模型对第一业务数据进行风险评估,得到第一风险评估结果,若第一风险评估结果为评估未通过,则将第一业务数据和第一风险评估结果发送给监控端,接收监控端发送的修正结果,并将修正结果输入到强化学习模型中,若第一风险评估结果为评估通过,则采用第一业务数据进行业务处理,并将第一业务数据存入到业务数据库中,在预设周期后,将业务数据库中的每个第一业务数据和第一业务数据对应的业务处理结果,作为历史业务执行信息,将历史业务执行信息输入到强化学习模型中,实现根据时序提取历史业务执行信息,有利于中后续参数调整过程中,依据随时序变化的处理结果对模型进行调优,有利于提高模型准确率,进而通过强化学习模型对修正结果和/或历史业务执行信息进行打分,得到目标评分,再基于目标评分,对预设的风险评估模型进行参数调整,更新预设的风险评估模型,通过依次评分,对模型进行更新调整,提高模型的评估准确率。另一方面,通过经过更新的预设的风险评估模型,对第二业务数据进行快速风险评估,得到评估结果,提高业务风险评估的效率和准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请可以应用于其中的示例性系统架构图;
图2是本申请的风险评估模型训练方法的一个实施例的流程图;
图3是本申请的业务风险评估方法的一个实施例的流程图;
图4是根据本申请的风险评估模型训练装置的一个实施例的结构示意图;
图5是本申请的业务风险评估装置的一个实施例的流程图;
图6是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、mp3播放器(movingpicturee界面显示pertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpicturee界面显示pertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的风险评估模型训练方法和业务风险评估方法由服务器执行,相应地,风险评估模型训练装置和业务风险评估装置设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器,本申请实施例中的终端设备101、102、103具体可以对应的是实际生产中的应用系统。
请参阅图2,图2示出本发明实施例提供的一种风险评估模型训练方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
s211:在接收到第一业务数据时,将第一业务数据输入到预设的风险评估模型中,并通过预设的评估模型对第一业务数据进行风险评估,得到第一风险评估结果。
具体地,在每次接收到第一业务数据时,将第一业务数据作为训练的样本数据输入到预设的风险评估模型中,并通过预设的评估模型对第一业务数据进行风险评估,得到第一风险评估结果。
其中,预设的风险评估模型为通过预设的时间差分模型,对第一业务进行训练得到,预设的时间差分模型具体包括基于价值(value-based)和基于策略(policy-based)等,优选地,本实施例选用基于actor-critic的策略梯度强化学习模型,该策略梯度强化学习模型包括actor网络和critic网络,actor网络用于评估,critic网络用于打分,actor网络通过评分对自身的评估策略进行优化,critic网络通过评估结果对自身的打分策略进行优化。
需要说明的是,在传统的的风险评估模型训练过程中,往往直接采用历史数据进行训练,在一些领域(例如交通领域、金融领域),在不同时间,业务处理结果会存在一些区别,传统的这种方式,未考虑时序对模型训练结果的影响,而本实施例中,将每次接收到的第一业务数据作为训练样本数据,及时使用该训练样本数据对策略梯度强化学习模型进行训练,得到最终的预设的评估模型,有利于提高风险评估的准确率。
其中,第一风险评估结果包括评估未通过和评估通过,具体是根据预设的风险评估模型给出的概率值与预设概率阈值进行比较,超过预设概率阈值则为评估通过,未超过则为评估未通过,预设概率值可根据实际业务需求进行设置,例如在金融保险领域,处理业务为核保业务,预设概率值为0.65。
应理解,本实施例中的第一业务数据,具体包括但不限于金融领域的业务数据、交通领域的业务数据和气象领域的业务数据等,具体可根据实际业务需求而定,此处不作具体限定。
s212:若第一风险评估结果为评估未通过,则将第一业务数据和第一风险评估结果发送给监控端。
具体地,在第一风险评估结果为评估未通过时,也即,对该业务的评估存在风险时,将该第一业务数据和第一风险评估结果发送给监控端,通过监控端对第一业务数据进行干涉。
其中,监控端用于对第一业务数据进行进一步评估并调整,监控端具体可以是通过人工审核,也可以通过匹配专家经验模型评估,还可以是通过深度学习进行评估等,具体不作限定。
需要说明的是,发送给监控端的,具体也可以包括预设的风险评估模型进行分析的一些过程和给出的一些支撑数据,而不仅为最终预测的风险概率,此处不应理解为对其的限定。
s213:接收监控端发送的修正结果,并将修正结果输入到强化学习模型中。
具体地,监控端在接收到第一业务数据和所述第一风险评估结果后,对第一业务数据进行审核,并将审核意见和第一业务数据作为修正结果发送给服务端,服务端接收该修正结果。
值得说明的是,为提高后续强化学习模型的打分准确性,再将修正结果输入到强化学习模型后,根据审核意见的内容,对其打上标签。
其中,修正结果的标签为具体可以是对第一业务数据进行处理的一个结论,例如,在一具体实施方式中,第一业务数据为核保业务,对应的修正结果标签可以是标体承保、加费、除外、承保、拒保、延期等中的一种,修正结果的标签可以根据实际情况进行设置,并设置对应的权重等,此处不作具体限定。
其中,强化学习模型为critic网络,critic网络根据系统给出的奖励等来调整自己的打分策略(调整critic神经网络参数)。一开始actor网络随机表演,critic随机打分。随着迭代循环,critic评分越来越准。
s214:若第一风险评估结果为评估通过,则采用第一业务数据进行业务处理,并将第一业务数据存入到业务数据库中。
具体地,在第一风险评估结果为评估通过时,认为采用第一业务数据进行业务处理能达到预期要求,此时,使用第一业务数据进行业务处理,并将第一业务数据存入到业务数据库中。
其中,业务数据库是指存储有业务数据,以及对业务数据进行跟进记录的数据库。
s215:在预设周期后,将业务数据库中的每个第一业务数据和第一业务数据对应的业务处理结果,作为历史业务执行信息,并将历史业务执行信息输入到强化学习模型中。
具体地,在预设周期后,将业务数据库中的每个第一业务数据和第一业务数据对应的业务处理结果,作为历史业务执行信息,并将历史业务执行信息输入到强化学习模型中。
其中,预设周期可以根据业务需要进行设置,在本实施例中,采用预期效果发送的期限作为预设周期,例如,在核保业务中,某项保险产生理赔的时限为1年,可以将13个月作为预设周期,也即,在该核保业务受理13个月后,获取该核保业务数据,和该核保业务数据对应的处理结果,作为历史业务执行信息。
需要说明的是,步骤s212至步骤s213,与步骤s214至步骤s215之间,没有必然的先后关系,其具体也可以是并列执行的关系,此处不应理解为对其的限定。
应理解,相对于传统的模型训练,本实施例采用为动态的循环迭代,也即,可以根据实际需要,每天从业务数据库中获取达到预设周期的第一业务数据,作为训练数据,输入到强化学习模型中进行训练,使得强化学习模型的打分策略,随着时序的变化导致评估(预设的风险评估模型的预测)的变化而进行优化,提高了模型的评估准确率。
s216:通过强化学习模型对修正结果和/或历史业务执行信息进行打分,得到目标评分。
具体地,强化学习模型在接收到修正结果/或历史业务执行信息后,通过critic网络对修正结果和/或历史业务执行信息进行打分,得到目标评分。
其中,进行打分的具体过程可参考后续实施例描述,为避免重复,此处不再赘述。
s217:基于目标评分,对预设的风险评估模型进行参数调整,更新预设的风险评估模型。
具体地,在强化学习的过程中,每作出一次评估动作(action)就会得到一个相应的数值奖励(numericalreward),这个奖励表示此次评估动作的好坏,在本实施例中,将数值奖励作为目标评分,通过目标评分,强化学习主体通过试错的方式(trialanderror)来不断对行动进行调整(优化action参数),对预设的风险评估模型进行参数调整,并根据调整后的参数,更新预设的风险评估模型。
其中,对风险评估模型进行参数调整,具体方式包括但不限于:基于状态价值的更新方式、基于动作价值的actor更新方式和基于优势函数的更新方式等,具体可根据实际业务需要进行选取,这些方式均对应有具体的实施策略,考虑到这些属于现有技术,此处不再赘述。
在本实施例中,在接收到第一业务数据时,将第一业务数据输入到预设的风险评估模型中,并通过预设的评估模型对第一业务数据进行风险评估,得到第一风险评估结果,若第一风险评估结果为评估未通过,则将第一业务数据和第一风险评估结果发送给监控端,接收监控端发送的修正结果,并将修正结果输入到强化学习模型中,若第一风险评估结果为评估通过,则采用第一业务数据进行业务处理,并将第一业务数据存入到业务数据库中,在预设周期后,将业务数据库中的每个第一业务数据和第一业务数据对应的业务处理结果,作为历史业务执行信息,将历史业务执行信息输入到强化学习模型中,实现根据时序提取历史业务执行信息,有利于中后续参数调整过程中,依据随时序变化的处理结果对模型进行调优,有利于提高模型准确率,进而通过强化学习模型对修正结果和/或历史业务执行信息进行打分,得到目标评分,再基于目标评分,对预设的风险评估模型进行参数调整,更新预设的风险评估模型,通过依次评分,对模型进行更新调整,提高模型的评估准确率。
在本实施例的一些可选的实现方式中,步骤s211中,在接收到第一业务数据时,将第一业务数据输入到预设的风险评估模型中包括:
对第一业务数据进行数据预处理,得到初始数据,并获取初始数据的所有特征维度;
通过预设的特征排序方式,对初始数据的特征维度进行重要性排序,得到特征序列;
从特征序列中依次从前往后选取预设数量的特征维度,作为目标维度,并将目标维度对应的特征值,作为初始数据的特征值;
将初始数据的特征值输入到预设的风险评估模型中。
具体地,在获取到第一业务数据之后,需要对第一业务数据进行数据预处理,得到初始数据,进而根据特征维度的重要性,对初始数据进行排序,在从前往后选取预设数量的特征维度,作为目标维度,并获取目标维度的特征值,输入到预设的风险评估模型中。
其中,数据预处理具体可以包括但不限于是:数据格式检查、规范性处理、归一化和数据清洗等。
其中,预设的特征排序方式包括但不限于采用gbdt、xgboost、lightgbm、相关系数等方式中的至少一种进行特征排序。
本实施例中,对输入模型的数据进行降维,一方面减少不必要的数据量,减少计算量,提高数据处理效率,另一方面,避免冗余数据对处理结果带来的影响,提高数据处理的准确率。
在本实施例的一些可选的实现方式中,步骤s216中,可选地,强化学习模型接收到的数据为历史业务执行信息,通过强化学习模型对修正结果和/或历史业务执行信息进行打分,得到目标评分包括:
针对历史业务执行信息中任意一条第一业务数据,根据第一业务数据对应的业务处理结果,为第一业务数据打上标签,其中,标签包括评估正确和评估错误;
将历史业务执行信息中的第一业务数据,按照业务处理时间进行排序,得到排序后的序列;
将排序后的序列中的第一业务数据和业务数据对应的标签,依次分批输入到强化学习模型中,并通过强化学习模型,计算奖励信号,将奖励信号作为目标评分。
具体地,对历史业务执行信息中每条第一业务数据,按照其对应对业务处理结果打上标签,进而按时间顺序,对第一业务数据进行排序,并依次输入到强化学习模型中进行训练,得到目标评分。
例如,在一具体实施方式中,第一业务数据为核保数据,业务处理结果为发生了保险事故,已进行理赔,则为该第一业务数据打上评估错误(出险)的标签。
其中,奖励信号是指critic网络在经过强化学习后给出的奖励分值,其具体的计算方式,可参考后续实施例的描述,为避免重复,此处不再赘述。
需要说明的是,在具体业务处理中,每个标签对应有预设权值,后续根据该预设权值,参与到奖励信号的计算之中。
在本实施例中,针对历史业务执行信息,通过按照时间顺序进行依次输入到模型进行训练,使得模型按照时序进行迭代,有利于提高模型针对业务数据随时序变化的评估准确率。
在本实施例的一些可选的实现方式中,步骤s216中,通过强化学习模型,计算奖励信号包括:
根据第一业务数据的标签和第一风险评估结果,确定乘积系数;
从第一业务数据中提取预设维度的特征值,作为奖励计算因子;
基于乘积系数和奖励计算因子,确定奖励信号。
具体地,每个标签对应有一个预设权重,通过步骤s211可知,第一风险评估结果中包含评估的概率,根据第一业务数据的标签和第一风险评估结果,确定乘积系数,通过乘积系数和奖励计算因子,来计算奖励信号。
进一步地,本实施例中采用的奖励计算因子为
其中,预设维度的特征值可根据实际需求进行数据特征选取。
在本实施例中,通过第一业务数据和第一风险评估结果,确定对应的奖励信号(目标评分),有利于后续根据该目标评分对预设的风险评估模型进行调整优化,提高模型风险评估的准确率。
请参阅图3,图3示出本发明实施例提供的一种业务风险评估方法,以该方法应用在图1中的服务端为例进行说明,详述如下:
s221:若接收到业务风险评估请求,则从业务风险评估请求中获取第二业务数据,并将第二业务数据输入到预设的风险评估模型中。
具体地,在接收到业务风险评估请求时,从该业务风险评估请求中获取第二业务数据,并将该第二业务数据输入到预设的风险评估模型中。
例如,在一具体实施方式中,业务需要处理的内容为某个时段某个区域进行的一项交通管制(例如限行、增加红灯时间、设置路障等),业务数据为对应区域的各项实时的交通流量数据、天气数据和交通事故数据等,风险评估请求为针对该执行该业务导致非预期事件的风险评估的请求。
s222:通过预设的风险评估模型对第二业务数据进行训练,得到第二风险评估结果。
具体地,在提高预设的风险评估模型的评估准确率的情况下,使用该预设的风险评估模型对第二业务数据进行训练,得到第二风险评估结果,可以有效提高业务风险评估的准确率,同时,采用训练好的模型直接评估,也有利于提高业务风险评估的效率。
本实施例中,通过经过更新的预设的风险评估模型,对第二业务数据进行快速风险评估,得到评估结果,提高业务风险评估的效率和准确率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图4示出与上述实施例风险评估模型训练方法一一对应的风险评估模型训练装置的原理框图。如图4所示,该风险评估模型训练装置包括第一评估模块311、第一处理模块312、第一输入模块313、第二处理模块314、第二输入模块315、评分模块316和参数调整模块317。各功能模块详细说明如下:
第一评估模块311,用于在接收到第一业务数据时,将第一业务数据输入到预设的风险评估模型中,并通过预设的评估模型对第一业务数据进行风险评估,得到第一风险评估结果;
第一处理模块312,用于若第一风险评估结果为评估未通过,则将第一业务数据和第一风险评估结果发送给监控端;
第一输入模块313,用于接收监控端发送的修正结果,并将修正结果输入到强化学习模型中;
第二处理模块314,用于若第一风险评估结果为评估通过,则采用第一业务数据进行业务处理,并将第一业务数据存入到业务数据库中;
第二输入模块315,用于在预设周期后,将业务数据库中的每个第一业务数据和第一业务数据对应的业务处理结果,作为历史业务执行信息,并将历史业务执行信息输入到强化学习模型中;
评分模块316,用于通过强化学习模型对修正结果和/或历史业务执行信息进行打分,得到目标评分;
参数调整模块317,用于基于目标评分,对预设的风险评估模型进行参数调整,更新预设的风险评估模型。
可选地,第一评估模块311包括:
特征维度获取单元,用于对第一业务数据进行数据预处理,得到初始数据,并获取初始数据的所有特征维度;
特征排序单元,用于通过预设的特征排序方式,对初始数据的特征维度进行重要性排序,得到特征序列;
特征值确定单元,用于从特征序列中依次从前往后选取预设数量的特征维度,作为目标维度,并将目标维度对应的特征值,作为初始数据的特征值;
特征值输入单元,用于将初始数据的特征值输入到预设的风险评估模型中。
可选地,强化学习模型接收到的数据为历史业务执行信息,评分模块316包括:
标签生成单元,用于针对历史业务执行信息中任意一条第一业务数据,根据第一业务数据对应的业务处理结果,为第一业务数据打上标签,其中,标签包括评估正确和评估错误;
数据排序单元,用于将历史业务执行信息中的第一业务数据,按照业务处理时间进行排序,得到排序后的序列;
评分计算单元,用于将排序后的序列中的第一业务数据和业务数据对应的标签,依次分批输入到强化学习模型中,并通过强化学习模型,计算奖励信号,将奖励信号作为目标评分。
可选地,评分模块316还包括:
系数确定子单元,用于根据第一业务数据的标签和第一风险评估结果,确定乘积系数;
奖励计算因子确定子单元,用于从第一业务数据中提取预设维度的特征值,作为奖励计算因子;
奖励信号计算子单元,用于基于乘积系数和奖励计算因子,确定奖励信号。
关于风险评估模型训练装置的具体限定可以参见上文中对于风险评估模型训练方法的限定,在此不再赘述。
图5示出与上述实施例业务风险评估方法一一对应的业务风险评估装置的原理框图。如图5所示,该风险评估模型训练装置包括数据获取模块321和第二风险评估模块322。各功能模块详细说明如下:
数据获取模块321,用于若接收到业务风险评估请求,则从业务风险评估请求中获取第二业务数据,并将第二业务数据输入到预设的风险评估模型中;
第二风险评估模块322,用于通过预设的风险评估模型对第二业务数据进行训练,得到第二风险评估结果。
本实施例所提供的业务风险评估装置,通过经过更新的预设的风险评估模型,对第二业务数据进行快速风险评估,得到评估结果,提高业务风险评估的效率和准确率。
上述风险评估模型训练装置和业务风险评估装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6,图6为本实施例计算机设备基本结构框图。
所述计算机设备4包括通过系统总线相互通信连接存储器41、处理器42、网络接口43。需要指出的是,图中仅示出了具有组件连接存储器41、处理器42、网络接口43的计算机设备4,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程门阵列(field-programmablegatearray,fpga)、数字处理器(digitalsignalprocessor,dsp)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器41至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或d界面显示存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器41可以是所述计算机设备4的内部存储单元,例如该计算机设备4的硬盘或内存。在另一些实施例中,所述存储器41也可以是所述计算机设备4的外部存储设备,例如该计算机设备4上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,所述存储器41还可以既包括所述计算机设备4的内部存储单元也包括其外部存储设备。本实施例中,所述存储器41通常用于存储安装于所述计算机设备4的操作系统和各类应用软件,例如电子文件的控制的程序代码等。此外,所述存储器41还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器42在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器42通常用于控制所述计算机设备4的总体操作。本实施例中,所述处理器42用于运行所述存储器41中存储的程序代码或者处理数据,例如运行电子文件的控制的程序代码。
所述网络接口43可包括无线网络接口或有线网络接口,该网络接口43通常用于在所述计算机设备4与其他电子设备之间建立通信连接。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有界面显示程序,所述界面显示程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的风险评估模型训练方法的步骤和上述业务风险评估方法的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。