本申请涉及人工智能领域,具体而言,涉及一种数据样本的分类方法和装置、处理器及电子设备。
背景技术:
1、相关技术中,银行的监管信息报送系统采集各个上游业务系统的跨境业务数据,并按照监管部门的要求按照不同的频度要求统一向监管机构报送;但由于上游业务系统众多,涉及国际贸易收支、外汇账户结售汇、机构外币现钞存取、银行卡境外交易、银行自身资本和外债等业务,并且随着新技术的发展,各个业务系统升级改造频繁,监管报送系统对上游数据的异常波动缺少有效的监控及预测,从而导致报送到监管部门的数据存在错误缺失。
2、针对相关技术中监管报送系统对上游数据的异常波动缺少有效的监控及预测,从而导致报送到监管部门的数据存在错误缺失的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请的主要目的在于提供一种数据样本的分类方法和装置、处理器及电子设备,以解决相关技术中监管报送系统对上游数据的异常波动缺少有效的监控及预测,从而导致报送到监管部门的数据存在错误缺失的问题。
2、为了实现上述目的,根据本申请的一个方面,提供了一种数据样本的分类方法。该方法包括:按照m种数据属性对历史报送数据进行分类,得到n个第一数据样本,其中,m、n为正整数;根据所述n个第一数据样本分别建立n个数据预测模型;按照所述m种数据属性对目标报送数据进行分类,得到n个第二数据样本;分别通过所述n个数据预测模型对所述n个第二数据样本进行分类,以确定所述目标报送数据中属于第一类别的k个第三数据样本,其中,k为正整数,k小于或等于n,所述n个数据预测模型、所述n个第二数据样本均与所述n个第一数据样本一一对应。
3、可选的,按照m种数据属性对历史报送数据进行分类,得到n个第一数据样本,包括:确定所述m种数据属性中每一种数据属性包含的数据子属性的类别的第一数量,得到m个第一数量;确定出所述m种数据属性中包含的n种数据类别,其中,所述n种数据类别中的每一种数据类别包含所述m种数据属性中每一种数据属性的一种数据子属性,所述n为所述m个第一数量的乘积;根据所述n种数据类别对所述历史报送数据进行分类,得到所述n个第一数据样本。
4、可选的,根据第一数据样本建立数据预测模型,包括:对所述第一数据样本进行平稳性校验;确定步骤:在确定所述第一数据样本未通过所述平稳性校验的情况下,确定所述第一数据样本的季节性周期;运算步骤:根据所述季节性周期对所述第一数据样本进行差分运算,得到第二数据样本;循环执行所述确定步骤和所述运算步骤,直至最终得到的目标第二数据样本通过所述平稳性校验;建立所述目标第二数据样本的自相关图和偏相关图,并根据所述自相关图和所述偏相关图建立所述数据预测模型。
5、可选的,根据所述自相关图和所述偏相关图建立所述数据预测模型之后,所述方法还包括:通过预设估计方法确定所述数据预测模型的第一参数;校验步骤:根据所述第一参数对所述数据预测模型进行准确性校验;调整步骤:在所述数据预测模型未通过所述准确性校验的情况下,通过调整所述数据预测模型的阶数来重新确定所述第一参数,其中,所述数据预测模型的阶数通过所述自相关图和所述偏相关图确定;循环执行所述校验步骤和所述调整步骤,直至所述数据预测模型通过所述准确性校验。
6、可选的,分别通过所述n个数据预测模型对所述n个第二数据样本进行分类,包括:通过所述n个数据预测模型预测出n个第四数据样本,其中,所述n个第四数据样本为所述n个第二数据样本的预测值;根据所述n个第四数据样本对所述n个第二数据样本进行分类。
7、可选的,根据所述n个第四数据样本对所述n个第二数据样本进行分类,包括:根据所述n个第四数据样本计算每一个第二数据样本的波动值,得到n个波动值;获取所述n个第二数据样本的波动预警值;在波动值小于或等于波动预警值的情况下,将对应的第二数据样本分类为第二类别,其中,所述第二类别用于指示所述第二数据样本正常;在波动值大于波动预警值的情况下,将对应的第二数据样本分类为所述第一类别,其中,所述第一类别用于指示所述第二数据样本异常。
8、可选的,确定所述目标报送数据中属于第一类别的k个第三数据样本之后,所述方法还包括:将所述k个第三数据样本的数据状态修改为目标状态,并发送提示信息给第一对象,其中,所述目标状态用于指示禁止将所述第三数据样本发送给第二对象。
9、为了实现上述目的,根据本申请的另一方面,提供了一种数据样本的分类装置。该装置包括:第一分类模块,用于按照m种数据属性对历史报送数据进行分类,得到n个第一数据样本,其中,m、n为正整数;建立模块,用于根据所述n个第一数据样本分别建立n个数据预测模型;第二分类模块,用于按照所述m种数据属性对目标报送数据进行分类,得到n个第二数据样本;确定模块,用于分别通过所述n个数据预测模型对所述n个第二数据样本进行分类,以确定所述目标报送数据中属于第一类别的k个第三数据样本,其中,k为正整数,k小于或等于n,所述n个数据预测模型、所述n个第二数据样本均与所述n个第一数据样本一一对应。
10、通过本申请,采用以下步骤:先按照m种数据属性对历史报送数据进行分类,得到n个第一数据样本;然后分别根据n个第一数据样本建立n个数据预测模型;按照这m种数据属性对目标报送数据进行分类,得到n个第二数据样本;然后分别通过这n个数据预测模型对这n个第二数据样本进行分类,从而确定出目标报送数据中属于第一类别的k个第三数据样本,k小于或等于n,这n个数据预测模型、n个第二数据样本都与n个第一数据样本一一对应;采用上述方案,在报送监管数据之前先对当日采集到的数据量进行波动值检查,确定出异常数据,有效避免将异常数据报送给监管部门;解决了相关技术中监管报送系统对上游数据的异常波动缺少有效的监控及预测,从而导致报送到监管部门的数据存在错误缺失的问题。
1.一种数据样本的分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,按照m种数据属性对历史报送数据进行分类,得到n个第一数据样本,包括:
3.根据权利要求1所述的方法,其特征在于,根据第一数据样本建立数据预测模型,包括:
4.根据权利要求3所述的方法,其特征在于,根据所述自相关图和所述偏相关图建立所述数据预测模型之后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,分别通过所述n个数据预测模型对所述n个第二数据样本进行分类,包括:
6.根据权利要求5所述的方法,其特征在于,根据所述n个第四数据样本对所述n个第二数据样本进行分类,包括:
7.根据权利要求1所述的方法,其特征在于,确定所述目标报送数据中属于第一类别的k个第三数据样本之后,所述方法还包括:
8.一种数据样本的分类装置,其特征在于,包括:
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。