一种基于Kmeans算法的产品优劣预测方法与流程

文档序号:33378762发布日期:2023-03-08 04:57阅读:158来源:国知局
一种基于Kmeans算法的产品优劣预测方法与流程
一种基于kmeans算法的产品优劣预测方法
技术领域
1.本发明属于数据处理技术领域,特别涉及一种基于kmeans算法的产品优劣预测方法。


背景技术:

2.目前我国大部分工厂的各项工作任务中,其核心都是围绕着工厂产品的质量进行的。如何提升产品整体的质量是工厂面临的非常重要的课题。一种比较常见的方法是识别出生产产品中的优劣,通过利用优质品的工艺参数来指导和减少劣质品的产出,从而改善达到提升产品质量的目的。
3.虽然识别优劣品在工厂有着非常强烈的意愿,但由于工厂现有的产品质量管理体系缺少科学有效的数据分析手段,只能通过单一的人工统计区分出哪些属于优质品、那些属于劣质品,并且传统的质量管理系统并没有收集工艺参数以及温湿度等相关环境因素,统计出了产品的优劣,没有具体为工人改善劣质品提供可借鉴的方案,不能提升整个工厂的优质品概率。目前这一工作在工厂仍然会产生很大的人力消耗,由管理人员深入到生产车间,了解具体参数环境等影响因素,提出合理的改善计划。
4.因此,如何有效减少生产中优劣品鉴别过程中的人力消耗,并有效利用鉴别结果指导提升产品质量,是一个需要解决的问题。


技术实现要素:

5.为了克服现有技术的问题,本发明提出了一种基于kmeans算法的产品优劣预测方法,所述方法基于产品加工工艺参数和生产环境因素的综合分析,利用机器学习中的聚类方法来完成产品优劣的划分,为生产管理人员提供了改良劣质品的参考和方向。
6.本发明的目的是这样实现的:
7.一种基于kmeans算法的产品优劣预测方法,包括以下步骤:
8.步骤1,生产参数的采集和处理:
9.利用生产车间中的数据采集器,以批次生产时间为周期采集产品生产中主要设备的工艺参数数据,将获得的工艺参数数据保存到数据库,并对所述工艺参数数据进行数据预处理,得到可用的工艺参数数据;
10.步骤2,环境信息的采集和处理:
11.在进行步骤1所述生产参数采集的同时间段内,利用环境数据采集器,采集生产车间内的环境数据,并通过对采集得到的环境数据进行数据预处理,得到可用的环境信息数据;
12.步骤3,数据聚类计算:
13.基于步骤1、步骤2得到的工艺参数数据和环境信息数据,利用kmeans聚类算法对统计的产品体进行聚类算法计算,得到计算好的聚类簇,公式为:
[0014][0015]
式中,v为样本的聚类误差,代表了聚类效果的好坏,n为聚类个数,si为第i个聚类集,μi为聚类中心,xj为第j个聚类集si中所包含的样本。
[0016]
该算法在每次迭代中对数据集中剩余的每个对象,根据其与各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后,一次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,v值没有发生变化,说明算法已经收敛,算法停止,得到最后的聚类结果。
[0017]
步骤4,优质品与劣质品群体的确定:
[0018]
生产后的产品会有相应的参数限制,由质量专家组成的专家组进行人工测评,参数均符合规定的参数限制内,则为优质品,反之则判断为劣质品;从而将步骤3计算获得的2个聚类簇分别判断为优质品群体、劣质品群体,分别计算2个聚类簇内部各项指标的平均值,并对比优质品群体、劣质品群体在各工艺参数上的差值信息,从而优化生产加工过程中参数的设定。
[0019]
进一步的,步骤1和2中,所述数据预处理包括对各数据进行特征缺失值处理、标准化和归一化处理,其中标准化和归一化处理的公式分别为:
[0020]
x_scaled=(x-x.mean())/x.std()
[0021]
x_std=(x-x.min)/(x.max-x.min)
[0022]
式中,x_scaled为标准化结果,x为原始数据,x.mean()为平均值,x.std()为标准差,x_std为归一化结果,x.min为最小值,x.max为最大值。
[0023]
通过上述特征缺失值处理、归一化、标准化处理,可消除特征间单位和尺度差异的影响,对每维特征同等看待。
[0024]
进一步的,步骤1中,所述工艺参数数据包括出回潮机回潮出口温度、加料机加料入口含水量和加料出口含水量。
[0025]
进一步的,步骤2中,所述环境数据包括温度、湿度。
[0026]
进一步的,所述基于kmeans算法的产品优劣预测方法还包括以下步骤:
[0027]
步骤5,模型检验:
[0028]
通过calinski-haraba方法对聚类结果进行检验,使用聚类簇间的协方差矩阵与簇内的协方差矩阵相除,公式为:
[0029][0030]
式中,ch(k)表示当前聚类个数的评价分数越大代表着类自身越紧密,类与类之间越分散,即更优的聚类结果,m表示全部数据数目,k表示聚类类别数,trb(k)表示类间离差矩阵的迹,trw(k)表示类内离差矩阵的迹。
[0031]
本发明相比现有技术的优点和有益效果是:
[0032]
1、本发明所述的基于kmeans算法的产品优劣预测方法,通过对产品加工工艺参数和生产环境因素的综合分析,利用机器学习中的聚类方法来完成产品优劣的划分,该方法综合利用了多维度信息,同时基于优劣品工艺参数的对比,分析每个群体内部各项工艺参
数的详细特征,为生产管理人员提供了改良劣质品的参考和方向;
[0033]
2、本发明所述的基于kmeans算法的产品优劣预测方法,节省了大量打标签的时间,极大的减低了人工操作的成本,同时增加了效率与准确率。
附图说明
[0034]
下面结合附图和实施例对本发明作进一步说明。
[0035]
图1是本发明实施例所述基于kmeans算法的产品优劣预测方法的流程图;
[0036]
图2是本发明实施例初始搜集到的工艺参数数据;
[0037]
图3是本发明实施例工艺参数数据的缺失值;
[0038]
图4是本发明实施例步骤1获得的可用的工艺参数数据;
[0039]
图5是本发明实施例步骤3计算获得的聚类结果;
[0040]
图6~图9均是本发明实施例步骤5得到的检验结果图。
具体实施方式
[0041]
实施例:
[0042]
本实施例以生产香烟产品为例,提供了一种基于kmeans算法的香烟产品优劣预测方法,如图1所示,所述方法包括以下步骤:
[0043]
步骤1,生产参数的采集和处理:
[0044]
利用生产车间中的数据采集器,以天为周期、采集产品生产中主要设备的工艺参数数据。香烟产品的生产工艺包括切片回朝、加料、切丝、烘丝和加香。采集的工艺参数数据包括回潮机回潮出口温度、加料机加料入口含水量和加料出口含水量。将获得的工艺参数数据保存到数据库,搜集到的工艺参数数据如图2所示。
[0045]
而后,对所述工艺参数数据进行数据预处理:
[0046]
首先,查看数据的缺失值,如图3所示。可以发现,工艺参数数据中一次加料均为空值,这里面的空值说明是制丝工艺未经过该流程,无其他情况,所以将其缺省值删除来进行处理。
[0047]
其次,为了消除特征间(即不同工艺参数)单位和尺度差异的影响,需要对特征进行标准化和归一化,标准化和归一化处理的公式分别为:
[0048]
x_scaled=(x-x.mean())/x.std()
[0049]
x_std=(x-x.min)/(x.max-x.min)
[0050]
式中,x_scaled为标准化结果,x为原始数据,x.mean()为平均值,x.std()为标准差,x_std为归一化结果,x.min为最小值,x.max为最大值。
[0051]
处理后的工艺参数数据如图4所示,即得到可用的工艺参数数据。
[0052]
步骤2,环境信息的采集和处理:
[0053]
在进行步骤1所述生产参数采集的同时间段内,利用环境数据采集器,采集生产车间内的环境数据,包括温度和湿度;并对采集得到的环境数据进行数据预处理,得到可用的环境信息数据。
[0054]
对环境数据的预处理方式与步骤1对工艺参数数据的处理方式相同,包括特征缺失值处理、归一化、标准化处理。
[0055]
步骤3,数据聚类计算:
[0056]
基于步骤1、步骤2得到的工艺参数数据和环境信息数据,利用kmeans聚类算法对统计的产品体进行聚类算法计算,设定聚类簇的个数为2,得到计算好的聚类簇,公式为:
[0057][0058]
式中,v为目标函数,n为聚类个数,si为第i个聚类集,μi为聚类中心,xj为第j个聚类集si中所包含的样本。
[0059]
聚类计算的结果如图5所示。
[0060]
步骤4,优质品与劣质品群体的确定:
[0061]
生产后的香烟产品会有相应的参数数值范围限制,由质量专家组成的专家组进行人工测评,参数均符合规定的参数限制内,则为优质品,反之则判断此香烟产品为劣质品;从而将步骤3计算获得的2个聚类簇分别判断为优质品群体、劣质品群体,分别计算2个聚类簇内部各项指标的平均值,并对比优质品群体、劣质品群体在各工艺参数上的差值信息,从而优化生产加工过程中参数的设定。
[0062]
步骤5,模型检验:
[0063]
通过calinski-haraba方法对聚类结果进行检验,使用聚类簇间的协方差矩阵与簇内的协方差矩阵相除,公式为:
[0064][0065]
式中,ch(k)表示当前聚类个数的评价分数,越大代表着类自身越紧密,类与类之间越分散,即更优的聚类结果;m表示全部数据数目,k表示聚类类别数、trb(k)表示类间离差矩阵的迹,trw(k)表示类内离差矩阵的迹。
[0066]
计算得到的分支越大即分类越好,本实施例获得的检验结果如图6~图9所示。其中,图7示出分成2类效果图,分数为13430.23316545023;图8示出分成3类效果图,分数为8106.447746441982;图9示出分成4类效果图,分数为6302.333637079613。可以看出,分类效果极佳。
[0067]
最后应说明的是,以上仅用以说明本发明的技术方案而非限制,尽管参照较佳布置方案对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1