本发明涉及供应链管理,特别涉及一种基于大数据的供应链数据管理方法及系统。
背景技术:
1、大数据背景下,传统产业要想进行高质量发展,数字化转型是必然趋势。零售业与互联网息息相关,是实现数字化转型的先行领域。大数据的运用为零售业的发展带来了巨大的改变,一定程度上推动了零售结构的优化。但在大数据时代,由于数据的产生量巨大,其中掺杂虚假信息的可能性高且难以被发现。过多的虚假信息会极大地影响数据的准确性。
2、在零售业供应链管理中,随着企业数量的不断增加,尤其是小微商户的规模不断扩大,发生非法交易和欺诈行为的风险商户也越来越多,无疑对监管方的监管职责提出了更高的要求,而传统的供应链监管方式已经不适用于现今大数据时代的零售业供应链数据的管理,使得无法及时从海量数据中识别出异常甚至非法的交易行为,造成监管缺失,影响消费者的权益。为此,我们提出一种基于大数据的供应链数据管理方法及系统。
技术实现思路
1、本发明的主要目的在于提供一种基于大数据的供应链数据管理方法及系统,可以有效解决背景技术中的问题。
2、为实现上述目的,本发明采取的技术方案为:
3、一种基于大数据的供应链数据管理方法,包括:
4、获取待监管商户的历史交易时序数据,提取所述交易数据中的每日交易特征信息,对获取的每日交易特征信息数据进行归一化处理,其中,所述每日交易特征信息包括每日交易金额数据、每日交易笔数数据、每日交易总量数据;归一化处理公式为:
5、
6、式中,为第j项所述每日交易特征信息数据的归一化值;xj为第j项所述每日交易特征信息数据的采样值;xjmin、xjmax分别为第j项所述每日交易特征信息的的历史交易时序数据中的最小值和最大值;
7、将归一化处理后的每日交易特征信息时序数据作为lstm神经网络的输入序列,利用神经网络获取当前时刻第j项所述每日交易特征信息的第一预测值o1j;
8、利用归一化处理后的每日交易特征信息时序数据构建统计预测模型,并计算当前时刻第j项所述每日交易特征信息的第二预测值o2j,其中,统计预测模型的表达式为:
9、
10、式中,表示为第j项所述每日交易特征信息的第t个采样值的归一化值;表示为第j项所述每日交易特征信息的第t-p个的采样值的归一化值;的表示为第j项所述每日交易特征信息的第q个的采样值的归一化值;λ为常数系数,且λ∈(0,1);m、n均为正整数,且m+n=t;表示为第j项所述每日交易特征信息的第1个采样值的归一化值;
11、将获取的第一预测值o1j与第二预测值o2j进行加权处理,获取当前时刻第j项所述每日交易特征信息的加权预测值oj,计算公式为:oj=ko1j+(1-k)o2j,其中,k为预测值的权重系数,且k∈(0,1),预测值的权重系数k的确定流程包括以下步骤:
12、获取历史交易时序数据中,距离当前时刻最近,且时间长度为t的历史交易时序数据子序列;
13、以子序列中的数据作为验证样本,分别将通过lstm神经网络获取的第一预测值和通过统计预测模型获取的第二预测值与验证样本进行比较,获取验证样本的分类结果,分类原则为:
14、当验证样本为正常数据时:
15、若预测值-验证样本值≤预测允许误差为dj,则分类为tp;
16、若预测值-验证样本值>预测允许误差为dj,则分类为fp;
17、当验证样本为异常数据时:
18、若预测值-验证样本值≤预测允许误差为dj,则分类为fn;
19、若预测值-验证样本值>预测允许误差为dj,则分类为tn;
20、根据验证样本分类结果,分别计算lstm神经网络和统计预测模型的预测准确率a,计算公式为:a=(tp+tn)/(tp+fp+fn+tn);
21、以获取的准确率计算预测值的权重系数k,计算公式为:k=a1/(a1+a2),其中,a1、a2分别为以时间长度为t的历史交易时序数据子序列数据作为验证样本获取的lstm神经网络和统计预测模型的预测准确率值;
22、设置预测允许误差为dj,计算第j项所述每日交易特征信息的预测值置信区间[ojmin,ojmax],其中,ojmin、ojmax分别为第j项所述每日交易特征信息的预测值置信区间的最小值和最大值,计算公式为:ojmin=oj-dj,ojmax=oj+dj;
23、根据获取的置信区间判定当前时刻第j项所述每日交易特征信息的异常情况,其中,异常情况判定原则为:
24、若当前时刻第j项所述每日交易特征信息数据采样值在置信区间[ojmin,ojmax]内,则判定其为正常数据;否则,则判定其为异常数据。
25、一种基于大数据的供应链数据管理系统,包括数据获取模块、特征信息提取模块、数据处理模块、神经网络模块、数据统计预测模块、异常数据判定模块;
26、所述数据获取模块用于获取待监管商户的历史交易时序数据;
27、所述特征信息提取模块用于提取所述交易数据中的每日交易特征信息,其中,所述每日交易特征信息包括每日交易金额数据、每日交易笔数数据、每日交易总量数据;
28、所述数据处理模块用于对获取的每日交易特征信息数据进行归一化处理;
29、所述神经网络模块用于构建lstm神经网络,利用神经网络获取当前时刻第j项所述每日交易特征信息的第一预测值o1j,其中,所述lstm神经网络以归一化处理后的每日交易特征信息时序数据作为输入序列;
30、所述数据统计预测模块用于利用归一化处理后的每日交易特征信息时序数据构建统计预测模型,并计算当前时刻第j项所述每日交易特征信息的第二预测值o2j;
31、所述异常数据判定模块用于将获取的第一预测值o1j与第二预测值o2j进行加权处理,获取当前时刻第j项所述每日交易特征信息的加权预测值oj,计算公式为:oj=ko1j+(1-k)o2j,其中,k为预测值的权重系数,且k∈(0,1),并设置预测允许误差为dj,计算第j项所述每日交易特征信息的预测值置信区间[ojmin,ojmax],其中,ojmin、ojmax分别为第j项所述每日交易特征信息的预测值置信区间的最小值和最大值,计算公式为:ojmin=oj-dj,ojmax=oj+dj,根据获取的置信区间判定当前时刻第j项所述每日交易特征信息的异常情况,其中,判定原则为:若当前时刻第j项所述每日交易特征信息数据采样值在置信区间[ojmin,ojmax]内,则判定其为正常数据;否则,则判定其为异常数据;
32、所述系统包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。
33、本发明具有如下有益效果:
34、与现有技术相比,通过获取待监管商户的历史交易时序数据,提取所述交易数据中的每日交易特征信息,对获取的每日交易特征信息数据进行归一化处理,将归一化处理后的每日交易特征信息时序数据作为lstm神经网络的输入序列,利用神经网络获取当前时刻第j项所述每日交易特征信息的第一预测值o1j,利用归一化处理后的每日交易特征信息时序数据构建统计预测模型,并计算当前时刻第j项所述每日交易特征信息的第二预测值o2j,将获取的第一预测值o1j与第二预测值o2j进行加权处理,获取当前时刻第j项所述每日交易特征信息的加权预测值oj,设置预测允许误差为dj,计算第j项所述每日交易特征信息的预测值置信区间[ojmin,ojmax],根据获取的置信区间判定当前时刻第j项所述每日交易特征信息的异常情况,通过利用大数据技术对待监管商户的历史交易数据进行分析,从而快速筛查并定位数据中的异常点,从而及时从海量数据中识别出异常甚至非法的交易行为,有利于提高零售业供应链数据的管理效率,促进零售业供应链的良好运行。