本发明涉及一种晶圆图不平衡数据集的缺陷模式识别方法,属于晶圆图缺陷模式识别领域。
背景技术:
晶圆图缺陷模式识别是将缺陷晶圆图进行分类的过程,同一缺陷模式的晶圆数据具有相同的分布规律,其方法主要有两种:第一种方法是使用纯数学模型和统计方法进行识别,如二项式测试、空间特征分析等,这种方法这些方法局限于只能提供缺陷模式的统计分析,缺乏识别出详细模式的能力,无法为查找制造过程中的缺陷根源提供更多有效的信息;第二种方法是使用机器学习技术进行识别,该方法提高了识别精度,但并没有考虑晶圆图数据集的不平衡性。
近年来,以对抗生成网络为代表的深度学习算法在诸多领域表现出很好的效果,并为晶圆图缺陷模式识别提供了新的方法。目前运用深度学习进行晶圆图缺陷模式识别的研究大多针对提高识别精度进行展开,都未考虑在实际的识别过程中晶圆图数据集所存在的不平衡问题,即数据集存在着某些缺陷模式的数量比例过少的情况。因此在采用深度学习方法进行晶圆图缺陷模式识别时,需要解决晶圆图数据集的不平衡性对识别精度造成的影响。
技术实现要素:
本发明的目的是:避免因晶圆图的数据维度多样性和角度多样性及晶圆图数据集的不平衡性的影响。
为了达到上述目的,本发明的技术方案是提供了一种基于对抗生成网络的晶圆图缺陷模式识别方法,其特征在于,包括以下步骤:
步骤1、确定需要进行识别的缺陷晶圆图,该缺陷晶圆图的图像数据具有数据维度多样性和角度多样性;
步骤2、构建包含已知缺陷模式晶圆与未知缺陷模式晶圆的晶圆数据集,其数据集具有不平衡性,并将晶圆数据集中的全部已知缺陷模式晶圆的晶圆图和部分未知缺陷模式晶圆的晶圆图划分为训练集,将剩余未知缺陷模式晶圆的晶圆图划为测试集;
步骤3、将训练集与测试集的晶圆图均进行两阶段的图像预处理,以解决晶圆图的数据维度多样性和角度多样性的问题;
步骤4、设计面向晶圆数据缺陷模式识别的分类对抗生成网络结构,所述分类对抗生成网络结构由两个全连接层的神经网络构成,即包括鉴别器和生成器,其中:生成器共有三层,输入层到隐含层之间采用softplus激活函数,隐含层到输出层之间不使用激活函数;鉴别器共有五层,除了最后一层用softmax激活函数外,其余层之间均用tanh激活函数;
步骤5、设计鉴别器损失函数,其有三个目标:第一个目标)确定未知缺陷模式的真实晶圆样本的缺陷模式;第二个目标)模糊来自生成器生成的仿真晶圆样本的缺陷模式;第三个目标)使鉴别器学习已知缺陷模式的真实晶圆样本的数据分布规律,具备对晶圆缺陷模式的识别能力;
步骤6、设计生成器损失函数,其有两个目标:第一个目标)确定生成器生成的仿真晶圆样本的缺陷模式;第二个目标)使生成的各类缺陷模式的仿真晶圆样本的数量大致相等;
步骤7、利用训练集与测试集中的晶圆样本,采用自适应衰减学习率,以上述生成器和鉴别器中的不同目标分别对生成器和鉴别器进行训练,并在训练过程中使用批量随机梯度下降方法,以最小化模型预测概率输出和实际缺陷模式之间的误差,其训练方式为训练五次鉴别器后训练一次生成器,进而获得最优晶圆识别模型,并利用测试集中的晶圆数据对模型识别性能进行评价。
优选地,步骤1中所述维度多样性和角度多样性定义为:在晶圆的实际生产过程中,不同晶圆片中的晶粒大小和布局方式存在差异,使得不同晶圆片所含晶粒的数量会不一样,因此二维晶圆图像数组会因晶粒的数量不一样导致其数据维度不同;由于晶圆生产中的有些工艺需要通过旋转晶圆片来完成,因而在最终形成的晶圆图内,缺陷数据会呈现出多角度的特点。
优选地,步骤2中,所述不平衡性定义为:在晶圆实际生产过程中,某些晶圆图的缺陷模式会因为背后对应的工艺或机器出现异常的次数有极大差异,导致其样本数量也会存在极大差异,因而晶圆图数据集中的各个缺陷模式数量呈现不平衡性的特点。
优选地,步骤3中,所述图像预处理的两阶段包括:
首先对晶圆图进行Radon变换处理,得到晶圆图的Radon变换图像,解决晶圆图的角度多样性;然后提取Radon变换图像的行均值与行方差,对行均值与行方差进行三次插值重采样处理,采样的样本数为20,解决晶圆图的数据维度多样性。
优选地,步骤5中,所述鉴别器损失函数的表达式由三部分组成,其中:前两项分别为未知缺陷模式的真实晶圆样本X和仿真晶圆G(z)样本的熵,其目的为步骤5中的所述第一个目标及所述第二个目标;最后一项为已知缺陷模式的真实晶圆样本XL的交叉熵,其目的为步骤5中的所述第三个目标,具体的公式如下:
式中,熵的表达式为Ex~X[H[p(y|x,D)]]:
交叉熵的表达式为CE[y,p(y|x,D)]:
上式中,LD为鉴别器的损失函数;D为鉴别器;Ex~X为未知缺陷模式的真实晶圆样本的熵的期望;H[p(y|x,D)]为未知缺陷模式的真实晶圆样本的熵;Ex~G(z)为仿真晶圆样本的熵的期望;H[p(y|G(z),D)]为仿真晶圆样本的熵;μ为加权成本;为已知缺陷模式的真实晶圆样本的熵的期望;CE[y,p(y|x,D)]为已知缺陷模式的真实晶圆样本的熵;N表示数据集中有N个数据样本;p(y=k|xi,D)为第i个样本属于各个缺陷模式的概率;K表示已知晶圆图有K个缺陷模式;是指通过softmox激活函数得到的属于各个缺陷模式的概率,Dk(x)为预测为属于k缺陷模式的概率;(xi,yi)为第i个真实晶圆样本及其缺陷模式。
优选地,步骤6中,所述生成器损失函数由两部分组成,其中第一项为仿真晶圆G(z)样本的熵,其目的为步骤6中的所述第一个目标;第二项为仿真晶圆的边际熵,其目的为步骤6中的所述第二个目标,具体的公式如下:
式中,边际熵的表达式为
上式中,zi为第i个初始噪声。
由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明采用深度学习的方法进行晶圆图的缺陷模式识别,解决了传统的晶圆图的缺陷模式识别方法中所存在的自动化程度不高以及耗时长的问题,并在识别过程中考虑了晶圆图数据集不平衡性对识别结果造成的影响,提高了识别精度。
附图说明
图1是本发明的晶圆图缺陷模式识别方法流程图;
图2是本发明的面向晶圆数据缺陷模式识别的分类对抗生成网络结构图;
图3是用于识别实验的八种晶圆图缺陷模式。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
图1是本发明的晶圆图缺陷模式识别方法流程图,如图1所示,包括以下各步骤:
首先需要获取用于缺陷模式识别的晶圆图数据集,数据集内晶圆图应包含全部缺陷模式,且部分晶圆图应有确定的缺陷模式标签,图3为八种缺陷模式的晶圆图。
将晶圆图数据集划分为训练集与测试集,其中训练集中的数据用于模型训练,测试集中的数据用于对方法的识别性能进行评价。
对训练集和测试集均进行Radon变换与特征重采样两阶段图像预处理过程,解决晶圆图的数据维度多样性和角度多样性。
设计图2所示的面向晶圆数据缺陷模式识别的分类对抗生成网络模型,该模型由两个全连接层的神经网络构成(鉴别器和生成器),其中生成器共有三层,输入层到隐含层之间采用softplus激活函数,隐含层到输出层之间不使用激活函数;鉴别器共有五层,除了最后一层用softmax激活函数外,其余层之间均用tanh激活函数。
设计鉴别器损失函数,使:第一个目标)鉴别器可以确定未知缺陷模式的真实晶圆样本的缺陷模式;第二个目标)模糊来自生成器生成的仿真晶圆样本的缺陷模式;第三个目标)使鉴别器学习已知缺陷模式的真实晶圆样本的数据分布规律,具备对晶圆缺陷模式的识别能力。
鉴别器损失函数的表达式由三部分组成,其中:前两项分别为未知缺陷模式的真实晶圆样本X和仿真晶圆G(z)样本的熵,其目的为上述第一个目标及第二个目标;最后一项为已知缺陷模式的真实晶圆样本XL的交叉熵,其目的为上述第三个目标,具体的公式如下:
式中,熵的表达式为Ex~X[H[p(y|x,D)]]:
交叉熵的表达式为CE[y,p(y|x,D)]:
上式中,LD为鉴别器的损失函数;D为鉴别器;Ex~X为未知缺陷模式的真实晶圆样本的熵的期望;H[p(y|x,D)]为未知缺陷模式的真实晶圆样本的熵;Ex~G(z)为仿真晶圆样本的熵的期望;H[p(y|G(z),D)]为仿真晶圆样本的熵;μ为加权成本;为已知缺陷模式的真实晶圆样本的熵的期望;CE[y,p(y|x,D)]为已知缺陷模式的真实晶圆样本的熵;N表示数据集中有N个数据样本;p(y=k|xi,D)为鉴别器输出样本属于各个缺陷模式的概率;K表示已知晶圆图有K个缺陷模式;是指通过softmox激活函数得到的属于各个缺陷模式的概率,Dk(x)为预测为属于k缺陷模式的概率;(xi,yi)为第i个真实晶圆样本及其缺陷模式。
设计生成器损失函数,使:第一个目标)生成器可以确定生成器生成的仿真晶圆样本的缺陷模式;第二个目标)生成的各类缺陷模式的仿真晶圆样本的数量大致相等。
生成器损失函数由两部分组成,其中第一项为仿真晶圆G(z)样本的熵,其目的为上述第一个目标;第二项为仿真晶圆的边际熵,其目的为上述第二个目标,具体的公式如下:
式中,边际熵的表达式为
上式中,zi为第i个初始噪声。
利用训练集与测试集中的晶圆样本,采用自适应衰减学习率,以上述生成器和鉴别器中的不同目标分别对生成器和鉴别器进行训练,并在训练过程中使用批量随机梯度下降方法,以最小化模型预测概率输出和实际缺陷模式之间的误差,其训练方式为训练多次鉴别器后训练一次生成器,进而获得最优晶圆识别模型,并利用测试集中的晶圆数据对模型识别性能进行评价。
不难发现,本发明首先设计图像Radon变换与特征重采样的两阶段晶圆图像预处理方法,其次设计了面向晶圆数据缺陷模式识别的分类对抗生成网络结构,最后分别设计了网络中生成器与鉴别器的损失函数。在图像预处理阶段,先通过Radon变换可以解决晶圆数据角度多样性的特点,然后先对晶圆图进行Radon变换处理,得到晶圆图的Radon变换图像,解决晶圆图的角度多样性,然后提取Radon变换图像的行均值与行方差,对行均值与行方差进行三次插值重采样处理,解决晶圆图的数据维度多样性。通过设计损失函数,使分类对抗生成网络内部两个子神经网络的相互对抗,使得两个子神经网络的功能(生成和鉴别)均得到了提高,尤其是生成器会生成一些仿真样本来弥补神经网络对样本比例少的类别识别结果较差的缺陷。本发明采用深度学习的方法进行晶圆图缺陷模式识别,解决了传统的识别方法中所存在的自动化程度不高以及耗时长的问题,并在识别过程中考虑了晶圆图数据集的不平衡性对结果造成的影响,提高了识别精度。