数据处理方法、装置、电子设备以及计算机可读存储介质与流程

文档序号:31579053发布日期:2022-09-21 00:17阅读:来源:国知局

技术特征:
1.一种数据处理方法,其特征在于,所述方法包括:获取n个待质检数据,n为正整数且大于或等于二;将所述n个待质检数据输入至质检模型进行类别预测,得到每个待质检数据对应的预测结果;基于所述每个待质检数据对应的预测结果确定所述n个待质检数据对应的预测类别分布;若所述预测类别分布不满足先验类别分布,则基于所述每个待质检数据对应的预测结果,从所述n个待质检数据中确定m个待质检数据,并对所述m个待质检数据的预测结果进行修正;其中,所述先验类别分布是基于样本数据集中各个样本数据对应的类别标签统计确定的,m为正整数,m小于或等于n。2.如权利要求1所述的方法,其特征在于,所述每个待质检数据对应的预测结果包括所述每个待质检数据属于w个类别中每个类别的概率值;所述基于所述每个待质检数据对应的预测结果确定所述n个待质检数据对应的预测类别分布,包括:将所述每个待质检数据对应的预测结果中概率值最大的类别确定为所述每个待质检数据对应的预测类别;根据所述每个待质检数据对应的预测类别,统计属于每个类别下的待质检数据的数量,得到所述n个待质检数据对应的预测类别分布。3.如权利要求1所述的方法,其特征在于,所述基于所述每个待质检数据对应的预测结果,从所述n个待质检数据中确定m个待质检数据,包括:利用所述预测类别分布和所述先验类别分布,确定出差异值;利用所述差异值和待质检数据的数量n,确定出预测结果异常的待质检数据的数量m;从所述n个待质检数据中确定m个待质检数据。4.如权利要求3所述的方法,其特征在于,所述从所述n个待质检数据中确定m个待质检数据,包括:利用所述每个待质检数据对应的预测结果中每个类别对应的概率值,确定所述每个待质检数据对应的熵;根据所述每个待质检数据对应的熵,从所述n个待质检数据中确定出m个待质检数据。5.如权利要求1所述的方法,其特征在于,所述方法还包括:对所述样本数据集进行t次数据采样处理,得到t个样本子集;统计每个样本子集中每个类别下样本数据的数量;基于每个样本子集中每个类别下样本数据的数量,确定每次数据采样处理对应的类别比例;根据每次数据采样数据处理对应的类别比例,确定先验类别分布。6.如权利要求5所述的方法,其特征在于,每个样本子集包括训练子集和测试子集,所述对所述样本数据集进行t次数据采样,得到t个样本子集,包括:确定每次数据采样处理时训练子集测试子集之间样本数据的数量比例;基于所述数量比例,对所述样本数据集进行数据采样,分别得到t个训练子集和t个测试子集。7.如权利要求5所述的方法,其特征在于,所述先验类别分布由概率区间表示,所述根
据每次数据采样数据处理对应的类别比例,确定先验类别分布,包括:根据所述每次数据采样处理对应的类别比例,统计t次数据采样处理对应的均值和方差;对所述均值和方差进行加权求差运算,并将加权求差后的运算结果作为概率区间的最小值,以及对所述均值和方差进行加权求和运算,并将加权求和后的运算结果作为概率区间的最大值。8.如权利要求1所述的方法,其特征在于,所述对所述m个待质检数据的预测结果进行修正,包括:显示修改界面,其中,所述修改界面显示所述m个待质检数据以及所述m个待质检数据的预测结果;接收对所述m个待质检数据中任意待质检数据的修正信息,利用所述修正信息对所述任意待质检数据的预测结果进行修正。9.一种数据处理装置,其特征在于,所述数据处理装置包括:获取单元,用于获取n个待质检数据,n为正整数且大于或等于二;预测单元,用于将所述n个待质检数据输入至质检模型进行类别预测,得到每个待质检数据对应的预测结果;确定单元,用于基于所述每个待质检数据对应的预测结果确定所述n个待质检数据对应的预测类别分布;以及若所述预测类别分布不满足先验类别分布,则基于所述每个待质检数据对应的预测结果,从所述n个待质检数据中确定m个待质检数据;修正单元,用于对所述m个待质检数据的预测结果进行修正;其中,所述先验类别分布是基于样本数据集中各个样本数据对应的类别标签统计确定的,m为正整数,m小于或等于n。10.一种电子设备,其特征在于,所述电子设备包括处理器以及与所述处理器耦接的计算机存储介质,所述计算机存储介质中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1-8任一项所述的方法。11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序在被处理器执行时,实现如权利要求1-8任一项所述的方法。

技术总结
本申请涉及数据处理技术领域,公开了数据处理方法、装置、电子设备以及计算机可读存储介质。该方法包括:获取N个待质检数据,N为正整数且大于或等于二;将N个待质检数据输入至质检模型进行类别预测,得到每个待质检数据对应的预测结果;基于每个待质检数据对应的预测结果确定N个待质检数据对应的预测类别分布;若预测类别分布不满足先验类别分布,则基于每个待质检数据对应的预测结果,从N个待质检数据中确定M个待质检数据,并对M个待质检数据的预测结果进行修正;其中,先验类别分布是基于样本数据集中各个样本数据对应的类别标签统计确定的,M为正整数,M小于或等于N。通过上述方式,能够提高待质检数据预测结果的准确性。能够提高待质检数据预测结果的准确性。能够提高待质检数据预测结果的准确性。


技术研发人员:曹磊 王洪斌 李长林
受保护的技术使用者:马上消费金融股份有限公司
技术研发日:2022.04.29
技术公布日:2022/9/20
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1