资源数据处理的优化方法及装置、存储介质、终端与流程

文档序号:25426828发布日期:2021-06-11 21:40阅读:78来源:国知局
资源数据处理的优化方法及装置、存储介质、终端与流程

本发明涉及一种数据处理技术领域,特别是涉及一种资源数据处理的优化方法及装置、存储介质、终端。



背景技术:

金融信贷领域中,那些借款人不能按期、足额归还本息,且信贷企业无法处置的资产即为不良资产,例如包括无法处置的抵押房产等。为了减少不良资产带来的经济损失,信贷企业利用大数据方法会对不良资产数据的资产价值进行估值,以便准确地定制催收方案。

目前,现有仅仅利用深度学习算法对不良资产数据的资产价值进行预测估值,不能准确满足多样化的催收方案匹配需求,无法实现对未知人群的个性化预测,从而使得资产价值估值准确性差,因此,急需一种资源数据处理的优化方法解决上述问题。



技术实现要素:

有鉴于此,本发明提供一种资源数据处理的优化方法及装置、存储介质、终端,主要目的在于解决现有针对不良资产的资产价值无法满足资产价值估值准确需求的问题。

依据本发明一个方面,提供了一种资源数据处理的优化方法,包括:

获取待处理的不良资产的特征资源数据;

根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;

将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数。

依据本发明另一个方面,提供了一种资源数据处理的优化装置,包括:

获取模块,用于获取待处理的不良资产的特征资源数据;

处理模块,用于根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;

确定模块,用于将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数。

根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述资源数据处理的优化方法对应的操作。

根据本发明的再一方面,提供了一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述资源数据处理的优化方法对应的操作。

借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:

本发明提供了一种资源数据处理的优化方法及装置、存储介质、终端。与现有技术相比,本发明实施例通过获取待处理的不良资产的特征资源数据;根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数,增加资产价值估值的计算参数,准确满足多样化的催收方案匹配需求,并利用深度学习算法实现对未知人群的个性化还款意愿信息的预测需求,从而提高资产价值估值准确性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种资源数据处理的优化方法流程图;

图2示出了本发明实施例提供的一种资源数据处理的优化装置组成框图;

图3示出了本发明实施例提供的一种终端的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种资源数据处理的优化方法,如图1所示,该方法包括:

101、获取待处理的不良资产的特征资源数据。

本发明实施例中,特征资源数据用于表征群体或个体借款人在信贷交易中产生且与还款能力相关的信息,例如,白领人群的用户基础数据、资产数据、借款数据等。其中,为了及时对不良资产的特征资源数据进行获取,并确定还款人资产信息的保密性,当前执行端在进行资源数据处理时,将采集的数据存储在预置数据库中。另外,由于不同用户可以从至少一个信贷企业进行信贷交易,因此,为了基于还款人在不同信贷平台的处理情况确定还款意愿,在获取待处理的不良资产的特征资源数据时,获取的是具有关联的全部的信贷企业中开放的特征资源数据,例如,判断针对还款人群a,获取人群a使用的某花、某借所产生的特征资源数据,即在某花、某借上所产生的资产数据、借款数据等。

需要说明的是,不良资产为借款人不能按期、足额归还本息,且信贷企业无法处置的资产,例如包括无法处置的抵押房产等,因此,本发明实施例中,当前执行端与多个具有信贷功能的企业平台进行协议合作,以准确获取到用户群体的不良资产的特征资源数据。

102、根据已完成训练的资源预测模型对所述特征资源数据进行预测处理。

本发明实施例中,为了实现对特征资源数据的数据处理能力,从而得到准确的还款人意愿预测结果,通过完成训练的资源预测模型对特征资源数据进行处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的。其中,资源预测模型为基于机器学习算法构建的数学模型,包括但不限于神经网络模型、支持向量机模型等,通过训练数据集预先对构建的资源预测模型进行训练,当达到设定的训练精度、准确度时,确定当前次训练的资源预测模型完成训练,以便用于预测处理。

需要说明的是,本发明实施例中,训练数据集中的特征资源数据为按照特征层级进行划分后,完成特征标记的数据,且根据不同的特征标记的特征资源数据映射为不同的还款意愿信息,从而使得利用这些特征资源数据对资源预测模型进行训练后,得到还款人意愿信息的预测结果。本发明实施例中,资源预测模型优选为xgboost模型,从而进行模型训练。

103、将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数。

本发明实施例中,当经过对特征资源数据预测处理后,得到特征资源数据所对应人群的还款意愿信息,从而基于还款意愿信息确定资产价值估值,因此将预测处理得到的还款意愿信息确定为资产价值估值的影响参数,以便根据其他影响参数进行结合,对资产价值估值进行精准再计算。其中,资产价值估值为对不良资产的价值进行评估,以便根据不同的资产价值估值选取匹配的催收方案,从而提高对作为资源数据的资产价值估值的处理准确性。另外,影响参数为用于计算资产价值估值的参数,对于资产价值估计的计算,可以根据现有的资产估值计算方式,将还款意愿信息结合现有的其他影响参数进行人工估算,也可以按照深度学习算法进行预测估算等,本发明实施例不做具体限定。

在又一个实施例中,为了提高对构建资源预测模型的训练准确性,从而提高资源数据处理效率,所述获取待处理的不良资产的特征资源数据之前,所述方法还包括:获取训练数据集中的特征资源数据;按照特征层级对所述特征资源数据进行特征层级划分;对划分后的所述特征资源数据进行特征标记,得到不同特征层级标记的特征资源数据。

具体的,进一步限定特征资源数据至少包括用户基础数据、资产数据、金融属性数据、借款数据中之一,用户基础数据为用户的年龄、性别、婚姻状况、学历、工作等数据,资产数据为是否有房、是否有车、房车多少等,金融属性数据为用于表征用户参与金融交易所产生的属性内容,包括公积金、工资、理财、银行卡收支、信用卡、网贷等信贷情况以及还款情况,所述借款数据为借贷金额、借贷利息、已还金额、未还金额、逾期时间等,本发明实施例不做具体限定。训练数据集中预先存储有海量用户的特征资源数据,为了提高特征资源数据的处理效率,减少处理资源时间,按照特征层级对特征资源数据进行特征层级划分。其中,所述特征层级用于区分特征资源数据中的第一层次的特征分类,例如,按照年龄特征进行层级划分,可以得到大于或等于18岁且小于22岁(小于18岁无借款能力)、大于或等于22岁且小于27岁、大于或等于27岁且等于50岁、大于或等于50岁且小于65岁、大于或等于65岁,5个年龄层级的划分,然后对不同年龄层级的特征资源数据进行特征标记。本发明实施例中,特征标记为对特征层级进行标记标识的方法,标识可以包括分值、颜色、符号等,本发明实施例不做具体限定,以便基于不同的标识作为借款人与还款意愿信息之间的映射关系的匹配依据。

需要说明的是,由于特征资源数据可以为一个借款人的,也可以包含多个借款人的,因此,在对特征资源数据进行特征层级划分,对每个用户的特征资源数据进行一次特征层级划分,如对借款人a的用户基础数据、资产数据、金融属性数据、借款数据进行特征层级划分,在对借款人b的用户基础数据、资产数据、金融属性数据、借款数据进行特征层级划分,依次递进,完成全部借款人的层级划分,本发明实施例不做具体限定。

在又一个实施例中,为了进一步限定及说明,所述特征层级至少包括年龄层级、欠款金额层级,所述按照特征层级对所述特征资源数据进行特征层级划分包括:从所述用户基础数据中确定年龄信息,按照所述年龄信息确定所述特征资源数据处于所述年龄层级中的第一特征层级;从所述借款数据中确定还款信息,按照所述还款信息确定所述特征资源数据相对于所述第一特征层级处于所述欠款金额层级中的第二特征层级;基于所述资产数据、所述金融属性数据确定与所述第二特征层级匹配的模型属性信息。

对于本发明实施例,为了提高对特征资源数据的层级划分准确性,从而提高对资源预测模型的训练准确性,特征层级至少包括年龄层级、欠款金额层级,因此,利用特征资源数据中的用户基础数据确定年龄信息,进行第一特征层级的划分,从而根据不同年龄层级得到用户的基础生活状态,例如,大于或等于18岁且小于22岁的人学历工作尚不稳定、大于或等于22岁且小于27岁的人学历工作已基本稳定、大于或等于27岁且等于50岁的人进入婚姻子女教育阶段、大于或等于50岁且小于65岁的人子女教育因素降低、大于或等于65岁的人超出申请借贷年龄。然后,利用特征资源数据中的借款数据确定还款信息,例如,是否按时还款、是否逾期等,按照所述还款信息确定所述特征资源数据相对于所述第一特征层级处于所述欠款金额层级中的第二特征层级。具体的,第二特征层级为表征欠款金额层级的低额层、中额层、高额层,不同的年龄层级均包含3个欠款金额层级,即确定作为年龄层级的第一特征层级后,可以进一步确定出处于第一特征层级,例如22岁到27岁之间年龄层级的欠款金额层级中的低额层或者高额层等。

需要说明的是,为了提高对资源预测模型的训练优化效果,不同特征层级下对应预测模型效果也不同,因此,基于特征资源数据中的资产数据、金融属性数据确定与第二特征层级匹配的模型属性信息。其中,模型属性信息表征不同算法模型的权重配置情况,不同年龄层级、不同欠款金额层级所对应的模型属性信息不同,例如,25岁借款人第一特征层级为学历工作已基本稳定,第二特征层级为中额层,则匹配的模型属性信息为各平台主动还款意向、各平台逾期状况、工作状况的模型权重值配置较大,从而体现模型训练中注重近期各平台主动还款意向、各平台逾期状况、工作状况等,本发明实施例不做具体限定。

在又一个实施例中,为了进一步限定及说明,所述对划分后的所述特征资源数据进行特征标记,得到不同特征层级标记的特征资源数据包括:根据预设标签内容对所述特征资源数据的第一特征层级、第二特征层级、模型属性信息进行特征标记,所述预设标签内容用于限定第一特征层级、第二特征层级、模型属性信息匹配的还款意愿信息。

本发明实施例中,为了提高对特征资源数据信息特征层级划分后的还款意愿信息的确定,根据预设标签内容对特征资源数据的第一特征层级、第二特征层级、模型属性信息进行特征标记。其中,预设标签内容用于限定第一特征层级、第二特征层级、模型属性信息匹配的还款意愿信息,从而对第一特征层级、第二特征层级、模型属性信息所对应的特征资源数据确定匹配的还款意愿信息。具体的,预设标签内容为预先配置的0-1之间的标签值,表征为还款意愿的强烈程度,例如,利用对23岁低额层借款人进行特征标记为0.8,还款意愿强烈,本发明实施例中可以通过预先建立第一特征层级、第二特征层级、模型属性信息与预设标签内容之间的对应关系,从而实现有效、自动的特征标记过程,提高对资源数据的处理效率。

在又一个实施例中,为了满足对还款意愿信息的预测,以便提高根据资源数据进行处理得到对不良资产的资产价值估值的准确性,所述方法还包括:对完成特征标记的特征资源数据进行模型构建预处理,所述模型构建预处理至少包括数值化处理、特征归一化处理、异常值处理、特征筛选处理中之一;通过确定的深度学习算法构建资源预测模型,并基于所述模型属性信息、完成模型构建预处理的特征资源数据对所述资源预测模型进行训练;当模型训练参数匹配预置模型需求时,确定完成训练的且预测处理结果为还款意愿信息的资源预测模型。

具体的,为了提高构建资源预测模型的训练高效性,会预先对完成特征标记的特征资源数据进行模型构建预处理,即至少包括数值化处理、特征归一化处理、异常值处理、特征筛选处理等。其中,数值化处理为将文本等数据转换处理为数值数据,以便作为模型训练的输入进行训练操作,而在数值化之后,各特征的数值大小范围不一致,因此,通过特征归一化处理,将不同类型的特征数值大小调整为一致,可以通过线性比例变换法、0均值标准化法等进行特征归一化处理。在此过程中,为了避免出现异常数据而影响模型训练效率,还可以进行异常值处理,即筛选掉异常范围的数值,保留数值分布稳定的数据。另外,为了减少学习算法的运行时间,增加模型的可解释性,还可以进行特征筛选,包括主成分分析pca、递归特征消除等方法,本发明实施例不做具体限定。

另外,可以通过选定的深度学习算法构建资源预测模型,其中,深度学习算法可以包括卷积神经网络cnn、循环神经网络rnn等,然后利用模型属性信息确定构建资源预测模型中的权重值,并利用完成模型构建预处理的特征资源数据对资源预测模型进行训练。通过预先设定模型需求来确定是否停止训练的迭代过程,其中,预置模型需求包括预设的模型精度、模型误差,从而完成模型训练。

在又一个实施例中,为了进一步限定及说明,所述将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数包括:解析所述还款意愿信息中的还款意愿因素,所述还款意愿因素至少包括行为因素、经济因素、时间因素中之一;基于预设资产价值估值对应关系确定所述还款意愿因素匹配的资产价值估值,以根据所述资产价值估值确定还款催还方案。

本发明实施例中,为了利用得到的还款意愿信息准确地确定出资产价值估值,解析还款意愿信息中的还款意愿因素,由于还款意愿信息可以为强烈、一般、较差、极差等,因此,结合特征资源数据中的用户基础数据、资产数据、金融属性数据、借款数据解析还款意愿因素,例如,若还款意愿强烈,且根据特征资源数据中的资产数据为3套房,金融属性数据中的银行收入大于支出,借款数据中按期还款,则可以解析出还款意愿因素为经济因素,本发明实施例中预先设定有不同还款意愿信息与特征资源数据所对应的还款意愿因素的对应关系,不做具体限定。当确定出还款意愿因素后,利用预先配置的资产价值估值对应关系确定匹配的资产价值估值,此预设资产价值估值对应关系可以包括资产价值估值的计算方法,也可以为资产价值估值与还款意愿因素的匹配映射,从而基于资产价值估值对应关系确定出资产价值估值。进一步地,利用资产价值估值确定还款催还方案时,还款催还方案即为具体的催促还款人还款的催促方式、催促时间等方法,例如,若资产价值估值较大,则可以匹配的还款催还方案可以为每月两次电话催还,本发明实施例不做具体限定。

本发明实施例提供了一种资源数据处理的优化方法。与现有技术相比,本发明实施例通过获取待处理的不良资产的特征资源数据;根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数,准确满足多样化的催收方案匹配需求,并利用深度学习算法实现对未知人群的个性化还款意愿信息的预测需求,从而提高资产价值估值准确性。

进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种资源数据处理的优化装置,如图2所示,该装置包括:

获取模块21,用于获取待处理的不良资产的特征资源数据;

处理模块22,用于根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;

确定模块23,用于将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数。

进一步地,所述装置还包括:划分模块,标记模块,

所述获取模块,还用于获取训练数据集中的特征资源数据;

所述划分模块,用于按照特征层级对所述特征资源数据进行特征层级划分;

所述标记模块,用于对划分后的所述特征资源数据进行特征标记,得到不同特征层级标记的特征资源数据。

进一步地,所述特征资源数据至少包括用户基础数据、资产数据、金融属性数据、借款数据中之一。

进一步地,所述特征层级至少包括年龄层级、欠款金额层级,所述划分模块包括:

第一确定单元,用于从所述用户基础数据中确定年龄信息,按照所述年龄信息确定所述特征资源数据处于所述年龄层级中的第一特征层级;

第二确定单元,用于从所述借款数据中确定还款信息,按照所述还款信息确定所述特征资源数据相对于所述第一特征层级处于所述欠款金额层级中的第二特征层级;

第三确定单元,用于基于所述资产数据、所述金融属性数据确定与所述第二特征层级匹配的模型属性信息。

进一步地,所述标记模块,具体用于根据预设标签内容对所述特征资源数据的第一特征层级、第二特征层级、模型属性信息进行特征标记,所述预设标签内容用于限定第一特征层级、第二特征层级、模型属性信息匹配的还款意愿信息。

进一步地,所述装置还包括:构建模块,

所述处理模块,还用于对完成特征标记的特征资源数据进行模型构建预处理,所述模型构建预处理至少包括数值化处理、特征归一化处理、异常值处理、特征筛选处理中之一;

所述构建模块,用于通过确定的深度学习算法构建资源预测模型,并基于所述模型属性信息、完成模型构建预处理的特征资源数据对所述资源预测模型进行训练;

所述确定模块,用于当模型训练参数匹配预置模型需求时,确定完成训练的且预测处理结果为还款意愿信息的资源预测模型。

进一步地,所述确定模块包括:解析模块,

所述解析模块,用于解析所述还款意愿信息中的还款意愿因素,所述还款意愿因素至少包括行为因素、经济因素、时间因素中之一;

所述确定模块,用于基于预设资产价值估值对应关系确定所述还款意愿因素匹配的资产价值估值,以根据所述资产价值估值确定还款催还方案。

本发明实施例提供了一种资源数据处理的优化装置。与现有技术相比,本发明实施例通过获取待处理的不良资产的特征资源数据;根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数,准确满足多样化的催收方案匹配需求,并利用深度学习算法实现对未知人群的个性化还款意愿信息的预测需求,从而提高资产价值估值准确性。

根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的资源数据处理的优化方法。

图3示出了根据本发明一个实施例提供的一种终端的结构示意图,本发明具体实施例并不对终端的具体实现做限定。

如图3所示,该终端可以包括:处理器(processor)302、通信接口(communicationsinterface)304、存储器(memory)306、以及通信总线308。

其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。

通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。

处理器302,用于执行程序310,具体可以执行上述资源数据处理的优化方法实施例中的相关步骤。

具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。

处理器302可能是中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个cpu;也可以是不同类型的处理器,如一个或多个cpu以及一个或多个asic。

存储器306,用于存放程序310。存储器306可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

程序310具体可以用于使得处理器302执行以下操作:

获取待处理的不良资产的特征资源数据;

根据已完成训练的资源预测模型对所述特征资源数据进行预测处理,所述资源预测模型为基于特征层级对训练数据集中的特征资源数据进行特征标记后,完成模型训练得到的;

将预测处理得到的所述特征资源数据的还款意愿信息,确定为与所述特征资源数据的资产价值估值对应的影响参数。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1