本发明涉及数据处理,具体涉及一种基于神经网络的小样本数据测试方法。
背景技术:
1、大数据风控在金融领域中,有着自动化、高效化和精确化等优势和特点。确定数据有效性是实现大数据风控的前提。在数据投产使用前,一般会对数据进行有效性等方面的验证,进而对数据在审批投产时的策略调整提供基础依据。
2、在数据测试阶段,客群流量和外部数据都存在一定成本。对于持续且稳定的客群流量,如果将测试量或测试时间减少,更快印证数据的有效性,将在一定程度上节省时间和经济成本。但测试时间(或测试量)的减少,也将导致客群(或样本)的表现期不足,结果存在一定程度的随机性,进而导致难以完成相对充分的数据有效性验证。
3、基于此,急需一种基于神经网络的小样本数据测试方法,能够实现在较短时间内完成准确度较高的待测试模型有效性的预测,为模型有效性验证节省时间成本和经济成本。
技术实现思路
1、本发明意在提供一种基于神经网络的小样本数据测试方法,能够实现在较短时间内完成准确度较高的待测试模型有效性的预测,为模型有效性验证节省时间成本和经济成本。
2、为达到上述目的,本发明采用如下技术方案:一种基于神经网络的小样本数据测试方法,包括以下步骤:
3、包括以下步骤:
4、s1、获取数据库中所对应的历史真实结果,并采集一定数量的存在样本贷后表现数据的客户样本所对应的短期贷后表现数据以及对应的样本贷后表现数据;
5、s2、根据样本贷后表现数据、短期贷后表现数据以及历史真实结果,基于神经网络算法,构建对应的训练模型;
6、s3、获取待测试模型,并通过待测试模型对在线客群流量进行预测,生成对应的第一预测结果;
7、s4、在待测试模型预测的客群流量达到一定数量的客户存在短期贷后表现数据之后,将获取该批次客群流量所对应的历史真实结果以及短期贷后表现数据,并输入到训练模型中,输出对应的第二预测结果;
8、s5、根据第一预测结果与第二预测结果,对数据的有效性进行分析,判断对应的待测试模型是否有效。
9、本方案的原理及优点是:在本方案中,首先采集样本的贷后表现数据、短期贷后表现数据以及待测试模型所对应的历史真实结果,通过这些数据,基于神经网络算法,构建对应的训练模型,通过对短期贷后表现数据这一自变量来对整个训练模型进行修正,从而实现对应的训练模型的构建更加准确和科学。
10、之后在对待测试模型进行获取,并且通过这个待测试模型对在线客群流量进行预测,从而生成对应的第一预测结果,为了判断这个待测试模型的预测结果是否准确,在对应的待测试模型预测的客群流量达到一定数量,并且这些数量上的客户都能够获取到对应的短期贷后表现数据,这也是就将该批次的客群流量所对应的历史真实数据以及短期贷后表现数据作为输入,输入到对应的训练模型中,然后输出对应的第二预测结果,之后根据第一预测结果以及第二预测结果来对数据的有效性进行分析,从而对待测试模型的有效性进行判断。
11、通过神经网络算法的方式来构建训练模型,并利用该训练模型进行预测表现,之后加热短期贷后表现数据作为自变量来对模型进行修正,相比一般的模型能够更加准确的对贷后表现进行预测,同时通过训练模型得到的预测结果与待测试模型的预测结果进行同步比对分析来对待测试模型的有效性进行判断,能够以更少的时间成本对贷后表现进行准确预测,缩短预测所需要的时间的同时预测结果的准确度也比较高,即实现了在较短时间内完成准确度较高的待测试模型有效性的预测,为模型有效性验证节省时间成本和经济成本。
12、优选的,作为一种改进,所述s4包括以下步骤:
13、s40、对待测试模型预测客群流量的数量以及对应数量是否存在对应的短期贷后表现数据,若存在,则执行s41,若不存在,则执行s3;
14、s41、获取该批次的客群流量所对应的历史真实结果以及对应的短期贷后表现数据;
15、s42、将获取到的历史真实结果和短期贷后表现数据输入到对应的训练模型中,并输出对应的第一预测结果。
16、有益效果:本方案中,首先是对待测试模型预测的客群流量所对应的数量进行判断,并且同步对这些数量所对应的是否存在短期贷后表现数据进行判断,这样就能够对这些客群流量所对应的数据是否可用进行了可靠的判断,大大提高了前期数据输入的准确性,也进一步避免了后期预测结果的不准确性和不科学性,大大提高预测结果的真实度。
17、优选的,作为一种改进,所述s1中所述的短期贷后表现数据包括多种不同时期的短期贷后表现数据。
18、有益效果:在对短期贷后表现数据进行采集时可以采集不同时期的短期贷后表现数据,例如对应的时间可以是一个月的,也可以是三个月的,对应的贷后表现数据都可以为短期贷后表现数据,这样实现了短期贷后表现数据的多样化,提高了整个模型构建的合理性,使得模型的完成度更高。
19、进一步的,所述s2包括以下步骤:
20、s20、将采集到的样本贷后表现数据、短期贷后表现数据以及历史真实结果进行划分,分为不同数量所对应的数据,分别为第一部分数据和第二部分数据;
21、s21、获取第一部分数据,通过神经网络算法,构建对应的训练模型;
22、s22、获取对应的训练模型,将第二部分数据中的短期贷后表现数据以及历史真实结果输入到训练模型中,并生成对应的测试预测结果;
23、s23、将对应的测试预测结果与第二部分数据中的样本贷后表现数据进行一一比较判断,判断对应的正确度,若对应的正确度大于预设阈值,则判断该训练模型为准确模型,反之则执行s20。
24、有益效果:在本方案中,由于在对样本贷后表现数据、短期贷后表现数据以及历史真实结果进行获取时是有一定数量的,即多个样本,那么在具体使用时,会将整个样本进行划分,一部分的数据用来进行训练模型的构建,另外一部分进行训练模型的验证,这样大大提高了训练模型的真实性和准确性,为之后的对待测试模型的判断提供了更加科学的训练模型,也大大提高后续数据有效性的判断真实性。
1.一种基于神经网络的小样本数据测试方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于神经网络的小样本数据测试方法,其特征在于:所述s4包括以下步骤:
3.根据权利要求2所述的一种基于神经网络的小样本数据测试方法,其特征在于:所述s1中所述的短期贷后表现数据包括多种不同时期的短期贷后表现数据。
4.根据权利要求1所述的一种基于神经网络的小样本数据测试方法,其特征在于:所述s2包括以下步骤: