一种基于信息粒化的烧结过程异常数据检测方法与流程

文档序号:31336596发布日期:2022-08-31 08:57阅读:132来源:国知局
一种基于信息粒化的烧结过程异常数据检测方法与流程

1.本发明涉及一种基于信息粒化的烧结过程异常数据检测方法,属于工业生产过程异常数据检测领域。


背景技术:

2.异常数据是工业生产过程异常工况的外在表现。异常工况往往会导致产品的产量低、质量差。对异常数据进行有效检测可为异常工况识别提供数据支持,为工业生产过程的参数决策提供指导。异常数据检测可让企业生产管理者和实际生产操作者能够更加直观的掌握工业过程的运行状态,及时发现生产数据的异常,将为生产过程的优化调整提供有力参考。
3.作为传统的工业过程,烧结过程一直受到学者的关注。它是一个流程复杂的耗时过程。由于参数众多,操作人员很难对运行状态做到实时调整。烧结过程异常数据检测主要是对烧结终点的时间序列数据进行分析,检验出它异于正常数据的特征,并将其作为后续异常数据检测的标准。目前,烧结终点时间序列数据异于正常数据的特征难以提取和描述,这给异常数据检测带来了巨大阻碍。因此,开发烧烧结过程异常数据检测方法具有重要的经济价值。
4.信息粒是由相似性而收集在一起的实体的集合。时间序列的信息粒化是根据数据紧密度将时间序列数据进行聚集,进而构建由粒原型和边界综合描述的信息粒。对时间序列进行信息粒化可以发现有意义和可解释的关系,形成对时间序列的整体描述,此外,可以有效提取时间序列的动态特征。因此,发明一种基于信息粒化的烧结过程异常数据检测方法是有必要的。


技术实现要素:

5.本发明公开了一种基于信息粒化的烧结过程异常数据检测方法。首先,本发明选择烧结过程烧结终点的时间序列数据作为检测对象,根据合理粒度原则,对时间序列数据进行信息粒化,得到信息粒。然后,构建检验统计量,计算检验统计量的概率密度函数和累计分布函数,并根据置信度水平,确定检验阈值。最后,检验某段烧结终点时间序列数据,若检验统计量超过检验阈值,则此段时间序列数据存在数据异常。为了实现上述技术目的,本发明下述方法。
6.1、一种基于信息粒化的烧结过程异常数据检测方法,其特征在于包括以下步骤:
7.步骤一:选择烧结过程烧结终点的时间序列数据作为检测对象;
8.步骤二:根据合理粒度原则,对时间序列数据进行信息粒化,得到信息粒;
9.步骤三:构建检验统计量,计算检验统计量的概率密度函数和累计分布函数;
10.步骤四:根据置信度水平,确定检验阈值;
11.步骤五:若某段烧结终点时间序列数据的检验统计量超过检验阈值,则此段时间序列数据存在数据异常。
12.2、根据权利要求1所述的一种基于信息粒化的烧结过程异常数据检测方法,其特征在于,步骤一选择的烧结终点为p,其时间序列数据表示为p={p1,p2,...,pn},其中n为时间序列的长度。
13.3、根据权利要求1所述的一种基于信息粒化的烧结过程异常数据检测方法,其特征在于,步骤二具体包括以下过程:
14.(3-1)求取差分时间序列。对于时间序列数据p={p1,p2,...,pn},其一阶差分时间序列为δp={δp1,δp2,...,δpn},其中δpi=p
i-p
i-1
,i=1,2,...,n(要求p0是已知的)。
15.(3-2)时间序列数据归一化。设归一化后的时间序列为q={q1,q2,...,qn}和一阶差分时间序列为δq={δq1,δq2,...,δqn},其中
[0016][0017][0018]
式中,p
min
和p
max
是时间序列p的最小值和最大值,δp
min
和δp
max
是时间序列δp的最小值和最大值。
[0019]
(3-3)根据合理粒度原则求取信息粒。设信息粒的形式为ω={(lq,l
δq
),(hq,h
δq
)},其中,hq和h
δq
表示信息粒ω在不同方向的上界,ly和l
δy
表示信息粒ω在不同方向的下界。下面定义两个函数来表示信息粒ω的合理性和特殊性。
[0020][0021]
式中,f1用于衡量信息粒的合理性,f2用于衡量信息粒的特殊性。card(
·
)表示集合中元素个数,e表示自然对数。设立下式的优化目标,
[0022]
max:f(lq,l
δq
,hq,h
δq
)=f1×
f2[0023]
式中,max:f(
·
)表示求取f(
·
)的最大值。以hq,h
δq
,ly和l
δy
为决策变量,以上式为优化目标,通过粒子群优化算法,可以得到满足上式的信息粒ω={(lq,l
δq
),(hq,h
δq
)}。
[0024]
4、根据权利要求1所述的一种基于信息粒化的烧结过程异常数据检测方法,其特征在于,步骤三具体包括以下过程:
[0025]
(4-1)构建检验统计量。设检验统计量t表示为,
[0026][0027]
其中,表示q的平均值;n
ω
=card{(qk,δqk)∣(qk,δqk)∈ω,k=1,2,...,n}也就是信息粒中包含的元素个数。
[0028]
(4-2)计算检验统计量的概率密度函数。利用m(m正整数且大于100)个时间序列样本,对它们分别进行步骤二和步骤(4-1),求得检验统计量t={t1,t2,...,tm}。利用核密度估计方法,得检验统计量t的概率密度函数为
[0029][0030]
式中,w表示窗口宽度;表示在w下,估计的概率密度函数。此外,检验统计量t的累计分布函数表示为,
[0031][0032]
式中,u为检验阈值,它的取值范围和检验统计量t一样。
[0033]
5、根据权利要求1所述的一种基于信息粒化的烧结过程异常数据检测方法,其特征在于,步骤四设置置信度水平为α(α∈[0.01,0.1]),根据步骤三求使得等于α/2和1-α/2的u值为t
α/2
和t
1-α/2
,也就是说检验阈值为t
α/2
和t
1-α/2

[0034]
6、根据权利要求1所述的一种基于信息粒化的烧结过程异常数据检测方法,其特征在于,步骤五对某段烧结终点时间序列数据样本进行步骤二和步骤(4-1),得到检验统计量t
new
。如果t
new
≤t
α/2
或者t
new
≥t
1-α/2
,则此段时间序列数据存在数据异常。
[0035]
本发明基于其技术方案所具有的有益效果在于:
[0036]
(1)本发明的一种基于信息粒化的烧结过程异常数据检测方法,采用两维信息粒化方法来对时间序列信息粒化,提取时间序列的特征信息。
[0037]
(2)本发明的一种基于信息粒化的烧结过程异常数据检测方法,利用核密度估计方法,得到异常数据的检测阈值。
附图说明
[0038]
图1是烧结终点时间序列检测统计量的概率密度函数。
[0039]
图2是烧结终点时间序列检测统计量的累计分布函数和检测阈值。
[0040]
图3是待检测烧结终点时间序列数据1。
[0041]
图4是待检测烧结终点时间序列数据2。
具体实施方式
[0042]
下面结合附图和具体实施例对本发明做进一步说明:
[0043]
实施例:
[0044]
一种基于信息粒化的烧结过程异常数据检测方法。首先,本发明选择烧结过程烧结终点的时间序列数据作为检测对象,根据合理粒度原则,对时间序列数据进行信息粒化,得到信息粒。然后,构建检验统计量,计算检验统计量的概率密度函数和累计分布函数,并根据置信度水平,确定检验阈值。最后,检验某段烧结终点时间序列数据,若检验统计量超过检验阈值,则此段时间序列数据存在数据异常。具体步骤如下:
[0045]
(1)收集烧结生产烧结终点的历史时间序列数据获得原始样本数据
[0046]
烧结生产历史数据以日报表的形式保存在操作室工控机的本地数据库中,根据日报表的数据,收集烧结终点一个月的历史时间序列数据,数据的采样间隔为30秒,组成原始样本数据。
[0047]
(2)对时间序列数据进行信息粒化
[0048]
根据专利要求2和3所述的步骤,设置每段烧结终点时间序列的长度为10分钟,也就是n=20,去5000个长度为20的烧结终点时间序列数据建立样本数据库;并对时间序列进行信息粒化,得到每个样本时间序列数据的信息粒ω={(lq,l
δq
),(hq,h
δq
)}。
[0049]
(3)构建检验统计量
[0050]
根据专利要求4所述的步骤,构建检验统计量。计算检验统计量的概率密度函数,得到如图1所示烧结终点时间序列检测统计量的概率密度函数,然后,计算累计分布函数,得到如图2所示烧结终点时间序列检测统计量的累计分布函数。
[0051]
(4)确定检验阈值
[0052]
根据专利要求5所述的步骤,设置置信度水平为α=0.05,可得到如图2所示的检验阈值t
0.025
=3.9097和t
0.975
=7.0193。
[0053]
(5)异常数据检测实验
[0054]
根据专利要求6所述的步骤,对两个待检测烧结终点时间序列数据(如图3和4所示)进行了异常数据检测实验,其中待检测烧结终点时间序列数据1的检测统计量t
new
为5.8932,因为t
0.025
≤t
new
≤t
0.975
,因此待检测烧结终点时间序列数据1不存在数据异常。待检测烧结终点时间序列数据2的检测统计量t
new
为3.6422,因为t
new
≤t
0.025
,因此待检测数据2存在数据异常。
[0055]
本实施例的结果表明本发明能有效实现烧结过程异常数据检测,具有重要的经济价值和应用价值。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1