风控模型的构建方法、装置、存储介质及终端与流程

文档序号:20757789发布日期:2020-05-15 17:37阅读:233来源:国知局
风控模型的构建方法、装置、存储介质及终端与流程
本发明实施例涉及数据处理
技术领域
,尤其涉及风控模型的构建方法、装置、存储介质及终端。
背景技术
:在风控领域,由于宏观经济环境、公司策略等影响,导致风控模型的目标用户人群、用户特征一直处于变化,使得构建好的风控模型效果随时间逐渐降低以至无效。面对这种情况,通常是间隔一段时间便利用新的数据对原模型做微调来满足业务要求。然而,通过新数据来对原风控模型进行调整的方案会存在以下两个问题:1、对近期新数据的建模会导致新模型丢失原模型的信息,输出得分的分布一般会与原模型差异较大,使用时需要相关人员对使用策略做详细测试和调整;2、由于风控领域有监督模型一般是用3个月或6个月的逾期天数作为建模目标,这使得最新的建模数据距今需要有3个月或6个月的时间长度,而风控数据的多变性往往在这段时间内(3个月或6个月)就能发生较大变化,使得这种风控模型调整收效甚微。技术实现要素:本发明实施例提供一种风控模型的构建方法、装置、存储介质及终端,以提高风控模型的时效性。第一方面,本发明实施例提供了一种风控模型的构建方法,该方法包括:获取预设时间段内至少一个用户的历史数据;提取所述历史数据所涉及的至少一类第一特征信息;针对各类第一特征信息,按照预设排序规则对所述历史数据中的第一特征信息进行排序,生成第一特征信息序列;确定所述第一特征信息在所述第一特征信息序列中的第一排列分位数;基于所述第一排列分位数对预设机器学习模型进行训练,生成风控模型。第二方面,本发明实施例还提供了一种风控模型的构建装置,该装置包括:历史数据获取模块,用于获取预设时间段内至少一个用户的历史数据;第一特征信息提取模块,用于提取所述历史数据所涉及的至少一类第一特征信息;第一特征信息排序模块,用于针对各类第一特征信息,按照预设排序规则对所述历史数据中的第一特征信息进行排序,生成第一特征信息序列;第一排列分位数确定模块,用于确定所述第一特征信息在所述第一特征信息序列中的第一排列分位数;风控模型生成模块,用于基于所述第一排列分位数对预设机器学习模型进行训练,生成风控模型。第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例提供的风控模型的构建方法。第四方面,本发明实施例提供了一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例提供的风控模型的构建方法。本发明实施例中提供的风控模型的构建方法,获取预设时间段内至少一个用户的历史数据,并提取历史数据所涉及的至少一类第一特征信息,然后针对各类第一特征信息,按照预设排序规则对历史数据中的第一特征信息进行排序,生成第一特征信息序列,并确定第一特征信息在第一特征信息序列中的第一排列分位数,最后基于第一排列分位数对预设机器学习模型进行训练,生成风控模型。通过采用上述技术手段,优化了现有的风控模型的构建方案,以历史数据中各特征信息的排列分位数代替对应的特征信息,并基于各特征信息的排列分位数进行模型训练生成风控模型,使得构建的风控模型能够对输入数据的变化能够达到动态自适应的效果,有效降低了风控模型随时间衰减的速度,进一步保证了风控模型的时效性。附图说明图1为现有技术中风控模型的构建流程示意图;图2为本发明实施例提供的一种风控模型的构建方法的流程示意图;图3为现有技术中风控模型的更新流程示意图;图4为本发明实施例提供的另一种风控模型的构建方法的流程示意图;图5为本发明实施例提供的另一种风控模型的构建方法的流程示意图;图6为本发明实施例提供的一种风控模型的构建装置的结构框图;图7为本发明实施例提供的一种终端的结构框图。具体实施方式下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。现有技术中,主要是直接对从原始数据中筛选的特征进行学习,从而生成风控模型。图1为现有技术中风控模型的构建流程示意图。如图1所示,对历史数据进行数据清洗等一系列处理,然后在处理后的历史数据中筛选特征信息,直接对特征信息进行学习生成风控模型,最后对风控模型进行验证上线,从而投入使用;其中,数据清洗可以包括过滤掉赋值为空的一些数据,还可包括对历史数据进行脱敏处理,也即过滤掉历史数据中用户的姓名、身份证号、联系方式等隐私信息。显然,现有技术中对风控模型的构建是直接在历史数据的量纲上对特征信息进行学习生成的。当需要对某个或某些数据进行风险预测时,基于构建的风控模型直接对数据的特征进行分析,从而给出风险预测的分数值。但是,由于风控数据的多变性,输入的数据往往在数据分布上有较大的改变,而基于现有技术构建的风控模型无法对数据变化做出及时反映,因此,风控模型对数据的风险预测的准确性会越来越低,也即风控模型的时效性会越来越差。因此,降低风控模型随时间衰减的速度,提高风控模型的时效性具有重要意义。图2为本发明实施例提供的一种风控模型的构建方法的流程示意图,该方法可以由风控模型的构建装置执行,其中该装置可由软件和/或硬件实现,一般可集成在终端设备中。如图2所示,该方法包括:步骤201、获取预设时间段内至少一个用户的历史数据。在本发明实施例中,获取预设时间段内至少一个用户的历史数据,其中,历史数据可以包括已经确定为合法或非法(不合法)的业务数据。其中,本发明实施例对预设时间段的长短不做限定,可以是一个月,两个月,三个月,也可以是半年。示例性的,在反洗钱场景下,历史数据可以包括用户的账号记录;又示例性的,在直播平台上经常会存在一些虚假刷关注或者刷人气行为,在该场景下,历史数据可以包括用户登录直播平台的相关记录,如注册、登录、观看直播以及发弹幕等相关数据。需要说明的是,本发明实施例对历史数据的种类不做限定。步骤202、提取所述历史数据所涉及的至少一类第一特征信息。可选的,提取所述历史数据所述涉及的至少一个特征信息,包括:获取预先设定的至少一个特征类型;针对每个特征类型,从所述历史数据中提取与所述特征类型对应的第一特征信息。示例性的,获取预先设定的至少一个特征类型,其中,特征类型可以是根据历史数据的数据类型确定。例如,历史数据为账号记录,则预先设定的特征类型可以包括出账金额、入账金额及账户操作次数等类型;又如,历史数据为用户登录直播平台的相关数据,则预先设定的特征类型可以包括注册时间、登录时间、登录次数、观看直播时长以及发弹幕次数等类型。针对每个特征类型,从历史数据中提取与特征类型对应的第一特征信息,也即从历史数据中确定对应于该特征类型的特征信息。示例性的,从用户a的某历史数据中提取的第一特征信息包括:出账金额3万,入账金额5万,账号操作次数3次。步骤203、针对各类第一特征信息,按照预设排序规则对所述历史数据中的第一特征信息进行排序,生成第一特征信息序列。在本发明实施例中,针对各个特征类型,也即针对第一特征信息所涉及的特征类型,按照预设排序规则对历史数据中同一特征类型对应的第一特征信息进行排序,生成第一特征信息序列。示例性的,依然以历史数据为账号记录为例,从历史数据中提取的第一特征信息包括具体的出账金额,入账金额以及账号操作次数,则按照预设排序规则分别对所有历史数据中的出账金额进行排序,生成出账金额序列,对所有历史数据中的入账金额进行排序,生成入账金额序列,对所有历史数据中的账号操作次数进行排序,生成账号操作次数序列。例如,可以按照从小到大的顺序对各类第一特征信息进行排序,生成第一特征信息序列;当然,还可以按照从大到小的顺序对各类第一特征信息进行排序,生成第一特征信息序列。步骤204、确定所述第一特征信息在所述第一特征信息序列中的第一排列分位数。在本发明实施例中,确定第一特征信息在第一特征序列中的第一排列分位数,其中,第一特征信息在第一特征序列中的第一排列分位数为第一特征信息在第一特征序列中所处的排列位置(第几位)与第一特征序列包含的第一特征信息的个数的比值。示例性的,基于步骤103生成的第一特征序列为对账号操作次数按照从小到大的顺序进行排序后生成的序列,例如第一特征序列为[1,3,5,8,10],则账号操作次数1在第一特征序列中的第一排列分位数为1/5,账号操作次数3在第一特征序列中的第一排列分位数为2/5,账号操作次数5在第一特征序列中的第一排列分位数为3/5,账号操作次数8在第一特征序列中的第一排列分位数为4/5,账号操作次数10在第一特征序列中的第一排列分位数为1。步骤205、基于所述第一排列分位数对预设机器学习模型进行训练,生成风控模型。在本发明实施例中,可以以各特征类型对应的第一特征信息在第一特征信息序列中的第一排列分位数为训练样本,对预设机器学习模型进行训练,生成风控模型。可选的,还可以将步骤104中确定的第一排列分位数替换第一特征信息序列中对应的第一特征信息,生成第一排列分位数序列,例如,第一特征序列为[1,3,5,8,10]对应的第一排列分位数序列为[1/5,2/5,3/5,4/5,1]。然后基于第一排列分位数序列对预设机器学习模型进行训练,生成风控模型。其中,预设机器学习模型可以为卷积神经网络模型,但需要说明的是本发明实施例对预设机器学习模型的类型不做限定,只要是能够以序列为输入来训练模型的算法,都可以用于作为训练风控模型的预设机器学习模型。在本发明实施例中,对历史数据中的特征类型涉及的特征信息进行排序,并以特征信息在特征信息序列中的排列分位数代替对应的特征信息,对排列分位数进行训练生成风控模型,改变了输入风控模型的量纲,使得风控模型重点关注历史数据中各特征信息的排序情况,在一定程度上能够避免对历史数据的过拟合。可选的,所述方法还包括:确定所述第一特征信息序列中所述第一特征信息与所述第一排列分位数间的对应关系,生成第一对应关系列表。可选的,在生成风控模型之后,还包括:获取待进行风控的预测数据;在所述第一对应关系列表中查找所述预测数据所涉及的特征信息对应的目标排列分位数;将所述目标排列分位数输入至所述风控模型中,根据所述风控模型的输出结果确定所述预测数据是否存在风险。示例性的,根据第一排列分位数与第一特征信息序列中的第一特征信息间的对应关系,生成第一对应关系列表。例如,根据第一排列分位数(1/5,2/5,3/5,4/5,1)与第一特征序列为[1,3,5,8,10]中的第一特征信息间的对应关系生成的第一对应关系列表如下:第一特征信息135810第一排列分位数1/52/53/54/51在本发明实施例中,当需要对某个或某些数据进行风险控制时,获取待进行风控的预测数据,并提取所述预测数据所涉及的特征信息,然后在第一对应关系列表中查找预测数据所涉及的特征信息对应的排列分位数,将查找到的排列分位数作为目标排列分位数。其中,预测数据所涉及的特征信息对应的特征类型与历史数据所涉及的第一特征信息对应的特征类型相同。示例性的,从预测数据中提取的账号操作次数为3,则在第一对应关系列表中查找到目标排列分位数为2/5。最后将目标排列分位数输入至训练好的风控模型中,根据风控模型的输出结果确定该预测数据是否存在风险。其中,风控模型可以输出一个分数值,当分数值大于预设分数阈值时,可以确定该预测数据存在风险;当分数值小于预设分数阈值时,可以确定该预测数据不存在风险。本发明实施例中提供的风控模型的构建方法,获取预设时间段内至少一个用户的历史数据,并提取历史数据所涉及的至少一类第一特征信息,然后针对各类第一特征信息,按照预设排序规则对历史数据中的第一特征信息进行排序,生成第一特征信息序列,并确定第一特征信息在第一特征信息序列中的第一排列分位数,最后基于第一排列分位数对预设机器学习模型进行训练,生成风控模型。通过采用上述技术手段,优化了现有的风控模型的构建方案,以历史数据中各特征信息的排列分位数代替对应的特征信息,并基于各特征信息的排列分位数进行模型训练生成风控模型,使得构建的风控模型能够对输入数据的变化能够达到动态自适应的效果,有效降低了风控模型随时间衰减的速度,进一步保证了风控模型的时效性。为了确保风控模型进行风险预测的准确性,需要定期或不定期对风控模型进行更新。图3为现有技术中风控模型的更新流程示意图。如图3所示,现有技术中,对风控模型进行更新时,基于有标签(合法或非法)的更新数据对原来训练好的风控模型进行训练以重新建模,这种方式可以使更新后的风控模型更能够真实反应更新数据的风险情况,但缺乏对构建风控模型的原来数据的保留,而且现有技术更新风险模型时,需要获取更新数据的标签信息,这一般需要等待一段时间(如三个月),因此,用于更新风控模型的更新数据距离当前时间也有一段时间,致使不能以最新的用户数据为样本构建风控模型,总存在一定的延时。在一些实施例中,在生成风控模型之后,还包括:当检测到风控模型更新事件被触发时,获取所述风控模型的更新数据;提取所述更新数据所涉及的至少一类第二特征信息;其中,所述第二特征信息对应的特征类型与所述第一特征信息对应的特征类型相同,所述第二特征信息对应的特征类型的数量与所述第一特征信息对应的特征类型的数量相同;针对各类第二特征信息,按照所述预设排序规则对所述更新数据中的第二特征信息进行排序,生成第二特征信息序列;确定所述第二特征信息在所述第二特征信息序列中的第二排列分位数;确定所述第二特征信息序列中所述第二特征信息与所述第二排列分位数间的对应关系,生成第二对应关系列表;基于所述第二对应关系列表更新所述第一对应关系列表。示例性的,为了在合适的时机对风控模型进行更新,可以预先设置风控模型更新事件被触发的条件。可选的,为了真实确定用户对风控模型的更新需求,可在检测到当前用户主动打开风控模型的更新权限时,触发风控模型更新事件。可选的,为了使风控模型能够更准确地进行风险预测,可每隔预设时长触发风控模型更新事件,如每隔六个月对风控模型更新一次。需要说明的是,本申请实施例对风控模型更新事件被触发的具体表现形式不做限定。当检测到风控模型更新事件被触发时,获取风控模型的更新数据。其中,风控模型的更新数据的类型与历史数据的数据类型相同,例如均为账单记录,又如均为用户登录直播平台的相关数据。提取更新数据所涉及的至少一类第二特征信息,可选的,提取更新数据所涉及的至少一类第二特征信息,包括:获取预先设定的至少一个特征类型,针对每个特征类型,从更新数据中提取与特征类型对应的第二特征信息。然后,再针对第二特征信息所涉及的特征类型,按照预设排序规则对更新数据中同一特征类型对应的第二特征信息进行排序,生成第二特征信息序列。其中,对第二特征信息的排列方式与对第一特征信息的排列方式相同。确定第二特征信息在第二特征序列中的第二排列分位数,其中,第二特征信息在第二特征序列中的第二排列分位数为第二特征信息在第二特征序列中所处的排列位置(第几位)与第二特征序列包含的第二特征信息的个数的比值。根据第二排列分位数与第二特征序列中第二特征信息间的对应关系生成第二对应关系列表。示例性的,第二特征序列也为对账号操作次数按照从小到大的顺序进行排序后生成的序列,例如第二特征序列为[3,6,7,10,12],根据第二排列分位数(1/5,2/5,3/5,4/5,1)与第二特征序列为[3,6,7,10,12]中的第二特征信息间的对应关系生成的第二对应关系列表如下:第二特征信息3671012第二排列分位数1/52/53/54/51并以第二对应关系列表更新第一对应关系列表。可以理解的是,当基于风控模型对某个或某些数据进行风险预测时,直接在第二对应关系列表中查找预测数据所涉及的特征信息对应的目标排列分位数,并将目标排列分位数输入至风控模型中,根据风控模型的输出结果确定所述预测数据是否存在风险。示例性的,从预测数据中提取的账号操作次数为3,则在第二对应关系列表(也即基于第二对应关系列表更新后的第二对应关系列表)中查找到目标排列分位数为1/5,则将1/5输入至风控模型进行风险预测。又示例性的,第二特征序列也为对账号操作次数按照从小到大的顺序进行排序后生成的序列,例如第二特征序列为[1,3,5,6,8,9,10,13],根据第二排列分位数(1/8,2/8,3/8,4/8,5/8,6/8,7/8,1)与第二特征序列为[1,3,5,6,8,9,10,13]中的第二特征信息间的对应关系生成的第二对应关系列表如下:第二特征信息1356891013第二排列分位数1/82/83/84/85/86/87/81示例性的,从预测数据中提取的账号操作次数为3,则在第二对应关系列表(也即基于第二对应关系列表更新后的第二对应关系列表)中查找到目标排列分位数为2/8,则将2/8输入至风控模型进行风险预测。需要说明的是,本发明实施例对更新数据与历史数据的数据量不做限定,其中,更新数据的数据量与历史数据的数据量可以相同,也可以不同。可以理解的是,当需要对风控模型进行更新时,不需要基于更新数据对原构建好的风控模型进行训练以重新建模,可以直接以更新数据构建的第二对应关系列表更新以历史数据构建的第一对应关系列表,但保持原来构建的风控模型保持不变,从而间接实现对风控模型的更新。可以理解的是,当需要对预测数据进行风险预测时,直接在基于更新后的第一对应关系列表(也即第二对应关系列表)查找目标排列分位数,然后将目标排列分位数输入至原来构建的风控模型中。这样设置的好处在于,一方面,不仅可以保留历史数据的相关信息,而且还可以实现更新数据(新数据)和历史数据(原数据)的有效结合;另一方面,在对风控模型进行更新时,不需要等待3个月或6个月等一定时长,也不需要确定更新数据的标签(合法数据或非法数据),可以实现对风控模型的快速更新,使得风控模型进行风险预测时能够具有更好的适应性。图4为本发明实施例提供的另一种风控模型的构建方法的流程示意图,如图4所示,该方法包括如下步骤:步骤401、获取预设时间段内至少一个用户的历史数据。步骤402、获取预先设定的至少一个特征类型。步骤403、针对每个特征类型,从历史数据中提取与特征类型对应的第一特征信息。步骤404、针对各类第一特征信息,按照预设排序规则对历史数据中的第一特征信息进行排序,生成第一特征信息序列。步骤405、确定第一特征信息在第一特征信息序列中的第一排列分位数。步骤406、基于第一排列分位数对预设机器学习模型进行训练,生成风控模型。步骤407、确定第一特征信息序列中第一特征信息与第一排列分位数间的对应关系,生成第一对应关系列表。步骤408、当检测到风控事件被触发时,获取待进行风控的预测数据。步骤409、在第一对应关系列表中查找预测数据所涉及的特征信息对应的目标排列分位数。步骤410、将目标排列分位数输入至风控模型中,根据风控模型的输出结果确定预测数据是否存在风险。本发明实施例提供的风控模型的构建方法,以历史数据中各特征信息的排列分位数代替对应的特征信息,并基于各特征信息的排列分位数进行模型训练生成风控模型,使得构建的风控模型能够对输入数据的变化能够达到动态自适应的效果,有效降低了风控模型随时间衰减的速度,进一步保证了风控模型的时效性。图5为本发明实施例提供的另一种风控模型的构建方法的流程示意图,如图5所示,该方法包括如下步骤:步骤501、获取预设时间段内至少一个用户的历史数据。步骤502、获取预先设定的至少一个特征类型。步骤503、针对每个特征类型,从历史数据中提取与特征类型对应的第一特征信息。步骤504、针对各类第一特征信息,按照预设排序规则对历史数据中的第一特征信息进行排序,生成第一特征信息序列。步骤505、确定第一特征信息在第一特征信息序列中的第一排列分位数。步骤506、基于第一排列分位数对预设机器学习模型进行训练,生成风控模型。步骤507、确定第一特征信息序列中第一特征信息与第一排列分位数间的对应关系,生成第一对应关系列表。步骤508、当检测到风控模型更新事件被触发时,获取风控模型的更新数据;步骤509、提取更新数据所涉及的至少一类第二特征信息。其中,第二特征信息对应的特征类型与第一特征信息对应的特征类型相同,第二特征信息对应的特征类型的数量与第一特征信息对应的特征类型的数量相同。步骤510、针对各类第二特征信息,按照预设排序规则对更新数据中的第二特征信息进行排序,生成第二特征信息序列。步骤511、确定第二特征信息在第二特征信息序列中的第二排列分位数。步骤512、确定第二特征信息序列中第二特征信息与第二排列分位数间的对应关系,生成第二对应关系列表。步骤513、基于第二对应关系列表更新第一对应关系列表。可选的,在步骤513之后,当需要基于风控模型对某个或某些数据进行风险预测时,直接在第二对应关系列表中查找预测数据所涉及的特征信息对应的目标排列分位数,并将目标排列分位数输入至风控模型中,根据风控模型的输出结果确定所述预测数据是否存在风险。本发明实施例提供的风控模型的构建方法,以历史数据中各特征信息的排列分位数代替对应的特征信息,并基于各特征信息的排列分位数进行模型训练生成风控模型,使得构建的风控模型能够对输入数据的变化能够达到动态自适应的效果,有效降低了风控模型随时间衰减的速度,进一步保证了风控模型的时效性。当需要对风控模型进行更新时,不需要基于更新数据对原构建好的风控模型进行训练以重新建模,可以直接以更新数据构建的第二对应关系列表更新以历史数据构建的第一对应关系列表,但保持原来构建的风控模型保持不变,从而间接实现对风控模型的更新,一方面,不仅可以保留历史数据的相关信息,而且还可以实现更新数据和历史数据的有效结合;另一方面,在对风控模型进行更新时,不需要等待3个月或6个月等一定时长,也不需要确定更新数据的标签(合法数据或非法数据),可以实现对风控模型的快速更新,使得风控模型进行风险预测时能够具有更好的适应性。图6为本发明实施例提供的一种风控模型的构建装置的结构框图,该装置可由软件和/或硬件实现,一般集成在终端中,可通过执行风控模型的构建方法来进行风控模型的构建。如图6所示,该装置包括:历史数据获取模块601,用于获取预设时间段内至少一个用户的历史数据;第一特征信息提取模块602,用于提取所述历史数据所涉及的至少一类第一特征信息;第一特征信息排序模块603,用于针对各类第一特征信息,按照预设排序规则对所述历史数据中的第一特征信息进行排序,生成第一特征信息序列;第一排列分位数确定模块604,用于确定所述第一特征信息在所述第一特征信息序列中的第一排列分位数;风控模型生成模块605,用于基于所述第一排列分位数对预设机器学习模型进行训练,生成风控模型。本发明实施例中提供的风控模型的构建装置,获取预设时间段内至少一个用户的历史数据,并提取历史数据所涉及的至少一类第一特征信息,然后针对各类第一特征信息,按照预设排序规则对历史数据中的第一特征信息进行排序,生成第一特征信息序列,并确定第一特征信息在第一特征信息序列中的第一排列分位数,最后基于第一排列分位数对预设机器学习模型进行训练,生成风控模型。通过采用上述技术手段,优化了现有的风控模型的构建方案,以历史数据中各特征信息的排列分位数代替对应的特征信息,并基于各特征信息的排列分位数进行模型训练生成风控模型,使得构建的风控模型能够对输入数据的变化能够达到动态自适应的效果,有效降低了风控模型随时间衰减的速度,进一步保证了风控模型的时效性。可选的,所述第一特征信息提取模块,用于:获取预先设定的至少一个特征类型;针对每个特征类型,从所述历史数据中提取与所述特征类型对应的第一特征信息。可选的,所述装置还包括:第一对应关系列表生成模块,用于确定所述第一特征信息序列中所述第一特征信息与所述第一排列分位数间的对应关系,生成第一对应关系列表。可选的,所述装置还包括:预测数据获取模块,用于在生成风控模型之后,获取待进行风控的预测数据;排列分位数查找模块,用于在所述第一对应关系列表中查找所述预测数据所涉及的特征信息对应的目标排列分位数;风控模型预测模块,用于将所述目标排列分位数输入至所述风控模型中,根据所述风控模型的输出结果确定所述预测数据是否存在风险。可选的,所述装置还包括:更新数据获取模块,用于在生成风控模型之后,当检测到风控模型更新事件被触发时,获取所述风控模型的更新数据;第二特征信息提取模块,用于提取所述更新数据所涉及的至少一类第二特征信息;其中,所述第二特征信息对应的特征类型与所述第一特征信息对应的特征类型相同,所述第二特征信息对应的特征类型的数量与所述第一特征信息对应的特征类型的数量相同;第二特征信息序列生成模块,用于针对各类第二特征信息,按照所述预设排序规则对所述更新数据中的第二特征信息进行排序,生成第二特征信息序列;第二排列分位数确定模块,用于确定所述第二特征信息在所述第二特征信息序列中的第二排列分位数;第二对应关系列表生成模块,用于确定所述第二特征信息序列中所述第二特征信息与所述第二排列分位数间的对应关系,生成第二对应关系列表;对应关系列表更新模块,用于基于所述第二对应关系列表更新所述第一对应关系列表。本发明实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行风控模型的构建方法,该方法包括:获取预设时间段内至少一个用户的历史数据;提取所述历史数据所涉及的至少一类第一特征信息;针对各类第一特征信息,按照预设排序规则对所述历史数据中的第一特征信息进行排序,生成第一特征信息序列;确定所述第一特征信息在所述第一特征信息序列中的第一排列分位数;基于所述第一排列分位数对预设机器学习模型进行训练,生成风控模型。存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddrram、sram、edoram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的风控模型的构建操作,还可以执行本发明任意实施例所提供的风控模型的构建方法中的相关操作。本发明实施例提供了一种终端,该终端中可集成本发明实施例提供的风控模型的构建装置。图7为本发明实施例提供的一种终端的结构框图。终端700可以包括:存储器701,处理器702及存储在存储器701上并可在处理器运行的计算机程序,所述处理器702执行所述计算机程序时实现如本发明实施例所述的风控模型的构建方法。本发明实施例中提供的终端,获取预设时间段内至少一个用户的历史数据,并提取历史数据所涉及的至少一类第一特征信息,然后针对各类第一特征信息,按照预设排序规则对历史数据中的第一特征信息进行排序,生成第一特征信息序列,并确定第一特征信息在第一特征信息序列中的第一排列分位数,最后基于第一排列分位数对预设机器学习模型进行训练,生成风控模型。通过采用上述技术手段,优化了现有的风控模型的构建方案,以历史数据中各特征信息的排列分位数代替对应的特征信息,并基于各特征信息的排列分位数进行模型训练生成风控模型,使得构建的风控模型能够对输入数据的变化能够达到动态自适应的效果,有效降低了风控模型随时间衰减的速度,进一步保证了风控模型的时效性。上述实施例中提供的风控模型的构建装置、存储介质及终端可执行本发明任意实施例所提供的风控模型的构建方法,具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的风控模型的构建方法。注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1