本发明属于模式识别技术领域,尤其是涉及一种具有抗特征噪声性能的钢板表面缺陷分类方法。
背景技术:
钢板表面缺陷是困扰钢铁企业提高产品质量和市场竞争力的主要问题之一。钢铁企业一般采用钢板表面缺陷检测系统监控钢材表面的质量。在整个检测系统中,检测算法是关键技术,其中的缺陷分类又是最重要的环节。
现有的分类方法特别是以支持向量机为代表的分类技术能够很好的完成缺陷识别的基本任务。但是,对于高端钢制产品表面质量监控的要求,现有的缺陷识别精度和效率并不能与之匹配。究其原因,噪声特别是特征噪声对分类性能的影响不容忽视。从实际生产线获取的钢板表面缺陷样本集很可能会存在噪声,这些噪声特别是特征噪声会严重影响以支持向量机为代表的分类器性能。特征噪声主要由测量仪器、测量模型、样本采样等错误引起,主要分布在正常样本的外围边界区域,难以与边界区域的正常样本相互区分。在钢板表面缺陷分类领域,已经存在一些抑制噪声的方法,它们主要通过增加样本权重来抑制噪声。这类方法对于远离决策边界的标签噪声具有好的效果,但对决策边界附近的特征噪声却无能为力。
另外,针对已有的钢板表面缺陷分类方法,支持向量机分类技术最具有代表性。但是,传统的支持向量机也存在着分类精度与效率的冲突。随着技术的发展,在模式识别领域学者们提出了性能得到提升的新型支持向量机。如:孪生支持向量机、孪生超球体支持向量机等。因此,在新型支持向量机模型基础上,研究具有抗特征噪声性能的新分类模型,以适合钢板表面缺陷的高精度与高效率的多类别分类要求。
技术实现要素:
本发明的目的是提供一种具有抗特征噪声性能的钢板表面缺陷分类方法,包括针对原始的钢板表面缺陷样本集,每一类原始的缺陷样本子集建立一个支持向量数据描述子模型,其特征在于包括以下步骤:
步骤1:针对每一个支持向量数据描述子模型,构造大超球体和小超球体,并统计大超球体内部的样本数目和小超球体内部的样本数目;
步骤2:以大超球体内部的样本数目和小超球体内部的样本数目为初始条件,对惩罚参数进行比例迭代调整,并训练相应的支持向量数据描述子模型,获得具有抗特征噪声能力的最佳超球体;
步骤3:根据每一个最佳超球体,从原始的钢板表面缺陷样本集中剔除超球体内部的样本,从而获得稀疏的钢板表面缺陷样本集;
步骤4:建立新的具有抗特征噪声能力的支持向量超球体多类分类器,该分类器以孪生超球体支持向量机二类分类器为基础,引入新的抗特征噪声约束条件,并以最佳超球体的球心为辅助信息来改进目标函数;
步骤5:利用稀疏的钢板表面缺陷样本集和最佳超球体的球心对新的多类分类器模型进行训练;
步骤6:将钢板表面缺陷测试样本输入到新的多类分类器,完成缺陷的自动识别。
所述的步骤1构造大超球体和小超球体以及统计大超球体内部的样本数目和小超球体内部的样本数目,步骤如下:
步骤1-1:选择一个大惩罚参数
步骤1-2:利用原始的缺陷样本子集
步骤1-3:统计
所述的步骤2对惩罚参数进行比例迭代调整、训练支持向量数据描述子模型和获得具有抗噪声能力的最佳超球体,步骤如下:
步骤2-1:计算比例惩罚参数
式中mn*是用户给定的第n类稀疏子集的样本数目;
步骤2-2:利用原始的缺陷样本子集
步骤2-3:判断条件mn(t)∈[mn*-δmn,mn*+δmn]是否成立,δmn是实际稀疏集合的样本数目与给定稀疏集合的样本数目之间误差,如果条件不成立,进入下一步,如果条件成立,则最佳超球体
步骤2-4:如果
所述的步骤3从原始的钢板表面缺陷样本集中剔除超球体内部的样本和获得稀疏的钢板表面缺陷样本集的过程如下:
第n类原始的缺陷样本子集
所述的步骤4建立新的具有抗噪声能力的支持向量超球体多类分类器过程如下:
新的多类分类器具有n个子分类器模型,第n个子分类器依靠稀疏的缺陷样本子集
式中cn和vn是惩罚参数,tn={1,…,n-1,n+1,…,n},on和rn是ωn的球心和半径,ωn是第n个子分类器构造的分类超球体,目标函数的项
对上述模型进行推导,可求得分类超球体ωn的参数,其公式如下:
式中pn=1/(1-vn(n-1)),
所述的步骤6缺陷的自动预测识别过程如下:
新的多类分类器能够直接完成钢板表面缺陷测试样本的多类识别;对于一个未标签的样本x的预测,其预测公式如下:
本发明的优点:
(1)本发明的具有抗特征噪声性能的钢板表面缺陷分类方法,利用支持向量数据描述模型对原始的钢板表面缺陷样本集进行稀疏化处理,可降低新的多类分类器在时间上和存储空间上的开销;
(2)本发明的具有抗特征噪声性能的钢板表面缺陷分类方法,利用惩罚参数比例迭代调整方法来改进支持向量数据描述模型的稀疏化过程,可以提高稀疏化的效率;
(3)本发明的具有抗特征噪声性能的钢板表面缺陷分类方法,利用具有惩罚参数比例迭代调整的支持向量数据描述模型获得辅助信息最佳超球体,可以提高辅助信息抗特征噪声的性能;
(4)本发明的具有抗特征噪声性能的钢板表面缺陷分类方法,新的多类分类器采用新的约束条件,可以获得抗特征噪声的性能;
(5)本发明的具有抗特征噪声性能的钢板表面缺陷分类方法,新的多类分类器利用了原始的缺陷样本集的最佳超球体信息,可以在提高分类效率的基础上保证分类精度;
(6)本发明的具有抗特征噪声性能的钢板表面缺陷分类方法,新的多类分类器能直接完成钢板表面缺陷的多类识别。
附图说明
图1为本发明一种实施方式具有抗特征噪声性能的钢板表面缺陷分类方法的流程图。
图2为本发明一种实施方式构造大超球体和小超球体的步骤示意图。
图3为本发明一种实施方式具有惩罚参数比例迭代调整的支持向量数据描述子模型的训练示意图。
图4为本发明一种实施方式惩罚参数比例迭代调整的举例示意图。
图5为本发明一种实施方式新的多类分类器的训练示意图。
具体实施方式
下面结合附图进一步说明本发明的具体实施方式。
本发明实施例采用一种具有抗特征噪声性能的钢板表面缺陷分类方法对带钢的缺陷进行处理,流程如图1所示,包括针对原始的钢板表面缺陷样本集,每一类原始的缺陷样本子集建立一个支持向量数据描述子模型,本发明实施例中原始的钢板表面缺陷样本集,是由五类缺陷类型的样本子集组成,它们是:划痕、结疤、孔洞、氧化铁皮、压入脏污,并且这些集合中的样本是通过现场的带钢表面缺陷检测系统采集获得的。
定义原始的钢板表面缺陷样本集中的缺陷类型数目为n,第n(n=1,2,…,n)类原始的缺陷样本子集建立的支持向量数据描述子模型如下:
式中第n类原始的缺陷样本子集是
对上述模型进行推导,可确定超球体
式中
式中k(,)是用户给定的核函数,且满足
超球体
核函数k(,)一般采用线性函数、非线性多项式函数、非线性径向基函数等,本发明实施例中的核函数采用非线性径向基函数,其形式为:
式中
凸二次规划问题的求解方法有多种,如:有效集法、序列二次规划法、内积法等。本发明实施例采用内积法求解
本发明实施例中n取值为5,根据n=1,2,…,n和n=5,建立了五个支持向量数据描述子模型。
步骤1:如图2所示,针对每一个支持向量数据描述子模型,构造大超球体和小超球体,并统计大超球体内部的样本数目和小超球体内部的样本数目;
步骤1-1:选择一个大惩罚参数
初始值
步骤1-2:利用原始的缺陷样本子集
这里,训练指的是支持向量数据描述子模型利用
步骤1-3:统计
原始的缺陷样本子集
步骤2:如图3所示,以大超球体内部的样本数目和小超球体内部的样本数目为初始条件,对惩罚参数进行比例迭代调整,并训练相应的支持向量数据描述子模型,获得具有抗特征噪声能力的最佳超球体;
步骤2-1:计算比例惩罚参数
式中mn*是用户给定的第n类稀疏子集的样本数目;
步骤2-2:利用原始的缺陷样本子集
步骤2-3:判断条件mn(t)∈[mn*-δmn,mn*+δmn]是否成立,δmn是实际稀疏集合的样本数目与给定稀疏集合的样本数目之间误差,如果条件不成立,进入下一步,如果条件成立,则最佳超球体
当
步骤2-4:如果
图4举例展示了对惩罚参数的比例迭代调整。
本发明实施例允许实际稀疏集合的样本数目mn与给定稀疏集合的样本数目mn*之间存在误差δmn,这种误差不但不会影响分类器的分类性能,而且还会提升迭代调整的效率。样本数目的误差δmn与样本总数有关,由用户给出,本发明实施例设定δmn=10。
步骤3:根据每一个最佳超球体,从原始的钢板表面缺陷样本集中剔除超球体内部的样本,从而获得稀疏的钢板表面缺陷样本集;
第n类原始的缺陷样本子集
根据n=1,2,…,n和n=5,有五个最佳超球体,并且获得了五个稀疏的缺陷样本子集。
步骤4:建立新的具有抗特征噪声能力的支持向量超球体多类分类器,该分类器以孪生超球体支持向量机二类分类器为基础,引入新的抗特征噪声约束条件,并以最佳超球体的球心为辅助信息来改进目标函数;
新的多类分类器具有n个子分类器模型,第n个子分类器依靠稀疏的缺陷样本子集
式中cn和vn是惩罚参数,tn={1,…,n-1,n+1,…,n},on和rn是ωn的球心和半径,ωn是第n个子分类器构造的分类超球体,目标函数的项
新的多类分类器改变了孪生超球体支持向量机二类分类器依靠边界样本的策略,约束条件
对上述模型进行推导,可求得分类超球体ωn的参数,其公式如下:
式中pn=1/(1-vn(n-1)),
分类超球体ωn的参数on·on和(rn)2用核函数k(,)替换公式中的ψ(·)与ψ(·)点积项。
本发明实施例中的核函数采用非线性径向基函数,其形式为:
参数cn、vn、δn的值由用户给定,本发明实施例通过网格搜索和十折交叉验证确定最优的值。
本发明实施例采用内积法求解
根据n=1,2,…,n和n=5,新的多类分类器包含五个子分类器模型。
步骤5:如图5所示,利用稀疏的钢板表面缺陷样本集和最佳超球体的球心对新的多类分类器模型进行训练;
这里,训练指的是利用第n类稀疏的缺陷样本子集
新多类分类器利用稀疏的缺陷样本集进行训练,可以降低分类器在时间上和存储空间上的开销。而且,新的多类分类器利用了最佳超球体信息,既能降低分类器在时间上和存储空间上的开销,又能保证分类器的分类精度。
根据n=1,2,…,n和n=5,新的多类分类器训练得到五个分类超球体。
步骤6:将钢板表面缺陷测试样本输入到新的多类分类器,完成缺陷的自动预测识别。
新的多类分类器能够直接完成钢板表面缺陷测试样本的多类识别。对于一个未标签的样本x的预测,其预测公式如下:
根据n=1,2,…,n和n=5,预测公式取决于五个分类超球体,公式中的ψ(·)与ψ(·)点积项用核函数k(,)替换。
本发明实施例实现了五种钢板表面缺陷的自动分类识别,同时降低了训练样本中特征噪声对分类器性能的影响。根据自动分类的缺陷信息,工作人员对钢板生产问题做出快速的反应,及时改进钢板生产的过程和调整钢板生产的工艺,形成有效的钢板产品质量监测与控制。
虽然以上描述了本发明的具体实施方式,但是本领域内的技术人员应当理解,这些仅是举例说明,可以在不背离本发明的原理和实质的基础上对这些实施方式做出多种修改或变更。本发明的范围仅由所附权利要求书限定。