从使用神经网络的聚集统计的异常检测的制作方法

文档序号:34177669发布日期:2023-05-17 06:22阅读:66来源:国知局
从使用神经网络的聚集统计的异常检测的制作方法

本说明书大体而言涉及控制电子器件制造中所使用的系统(诸如,各种处理腔室)中的处理质量及产品良率。更具体而言,本说明书涉及使用自多个传感器聚集并使用神经网络分析的统计数据来监控处理质量及产品良率。


背景技术:

0、背景

1、现代材料的制造时常涉及各种沉积技术,诸如,化学气相沉积(chemical vapordeposition;cvd)或物理气相沉积(physical vapor deposition;pvd)技术,其中一或多种选定类型的原子或分子沉积在被保持在由真空处理(例如,沉积、蚀刻等)腔室所提供的低真空或高真空环境中的晶片(基板)上。以此方式制造的材料可包括单晶、半导体膜、精细涂层及用于实际应用(诸如,电子器件制造)中的诸多其他物质。此些应用中的许多取决于在处理腔室中生长的材料的纯度及规格。此些材料的质量继而取决于制造操作遵守正确的工艺规范。为了维持腔室间环境的隔离且为了使晶片暴露于环境大气及污染物最小化,使用各种传感器检测技术来监控处理腔室环境、晶片运输、产品的物理及化学性质,及类似物。提高此种监控的精度、可靠性及效率存在诸多技术挑战,成功解决这些挑战会促进电子器件制造的持续进步,并有助于满足对于半导体器件制造的产品质量不断增长的需求。


技术实现思路

1、在一个实施中,公开一种方法,所述方法包括获得代表由与执行制造操作的器件制造系统相关联的多个传感器收集的数据的多个传感器统计的简化表示。所述方法进一步包括使用多个离群值检测模型产生多个离群值得分,其中所述多个离群值得分中的每一个使用所述多个离群值检测模型中的相应离群值检测模型基于所述多个传感器统计的简化表示产生。所述方法进一步包括使用检测器神经网络处理所述多个离群值得分以产生异常得分,所述异常得分指示与制造操作相关联的异常的可能性。

2、在另一实施中,公开一种系统,所述系统包括存储器及可操作地耦合至所述存储器的处理器件,以获得多个传感器统计的简化表示,所述多个传感器统计的简化表示代表由与执行制造操作的器件制造系统相关联的多个传感器所收集的数据;及使用多个离群值检测模型产生多个离群值得分,其中所述多个离群值得分中的每一个使用所述多个离群值检测模型中的相应离群值检测模型基于所述多个传感器统计的简化表示产生。处理器件进一步使用检测器神经网络处理所述多个离群值得分以产生异常得分,所述异常得分指示与制造操作相关联的异常的可能性。

3、在另一实施中,公开一种储存指令的非暂时性计算机可读储存介质,当由处理器件执行时,所述指令导致处理器件获得多个传感器统计的简化表示,所述多个传感器统计的简化表示代表由与执行制造操作的器件制造系统相关联的多个传感器所收集的数据;及使用多个离群值检测模型产生多个离群值得分,其中所述多个离群值得分中的每一个使用所述多个离群值检测模型中的相应离群值检测模型基于所述多个传感器统计的简化表示产生。处理器件进一步使用检测器神经网络处理所述多个离群值得分以产生异常得分,所述异常得分指示与制造操作相关联的异常的可能性。

4、具体描述

5、本文中所公开的实施提供对器件制造工艺及制造良率的质量的高效自动控制。所公开实施提供对来自多个传感器的大量统计数据的通用处理,从而供应有关制造系统及在其中执行的工艺的实时数据流。举例而言,所公开实施可有助于准确地检测何时在制造工艺及/或工艺的产品中出现指示产品良率恶化的异常。

6、晶片的机器人输送及撷取以及在装载、处理及传送腔室中维持受控环境提高了器件制造的速度、效率及质量。典型器件制造工艺时常需要数十甚至数百个步骤,例如,将气体引入处理腔室中,加热腔室环境,改变气体的成分,净化腔室、泵送出气体,改变压力,将晶片自一个位置移动至另一位置,创建或调整等离子体环境,执行蚀刻或沉积步骤,等。制造技术非常复杂,需要处理来自置于制造系统内部的各种传感器的运行时数据的恒定流。此种传感器可包括温度传感器、压力传感器、化学传感器、气体流量传感器、运动传感器、位置传感器、光学传感器及其他类型的传感器。制造系统可具有遍及系统的各个部分分布的相同(或类似)类型的多个传感器。举例而言,单个处理腔室可具有多个化学传感器以检测处理腔室内的各个位置处的化学蒸汽浓度,且可类似地具有多个温度传感器以监控温度分布。所述传感器中的一些或全部可输出恒定的数据流。举例而言,温度传感器可每秒钟(或更频繁地)输出温度读数,以使得需要耗费几分钟执行的单个蚀刻步骤可自此传感器单独地产生数百个数据点。

7、每个传感器(单独地或与其他传感器相组合)可输出数据,所述数据指示环境中或制造工艺的设定中突然或逐渐有害的变化。人工操作者通常读取数据并监控制造工艺是否符合工艺规范。提供关于在多个腔室中正被处理的多个晶片的数据的大量传感器时常需要许多人工操作者。然而,此方法具有诸多缺点。第一,所述方法显著增加了制造成本。第二,所述方法为工艺监控引入了主观成分,其中相同的输出数据可能会导致不同操作者作出关于制造条件的不同决策,且因此对工艺作出不同调整。第三,当指派不同操作者来监控不同的传感器类型时(例如,指派一个操作者来控制压力、温度及光学传感器数据,而另一个操作者控制化学成分数据),可能会忽略与正常处理的一些偏差,至少在其开发的早期阶段如此。即,压力传感器读数的微不足道变化或化学成分传感器的输出的微不足道变化在各自单独发生时可能无关紧要,但在同时发生时可传达异常是否开始的信号。其中多个操作者分工负责的设定可能会错过恶化的处理的早期指示,所述指示仅可自交叉传感器相关性来揭示。第四,大多数传感器统计可具有有限信息内容。自统计提取关键特征可能需要开发异常检测的特定模型。这类模型可为特定于传感器的,因为不同类型的传感器可经由不同的关键特征指示制造工艺的异常。举例而言,虽然一些传感器类型可经由某一百分比的离群值来指示异常,但其他类型可经由方差的扩展或偏度的出现来指示异常。

8、本公开案的方面及实施解决了可用于半导体器件制造中的传感器技术的这些及其他缺点。本文中描述如下实施:其中对多个传感器统计进行预处理,降低传感器统计的维数,通过多个异常检测模型来处理统计的简化表示,归一化,及通过检测器神经网络进行处理以确定一或多个异常得分。所述(多个)异常得分可指示制造工艺的一或多个异常发生的程度。预处理可去除可能与预防性维护、制造工艺设定的预期变化、系统硬件配置的变化及类似相关联的伪影。可通过另一(例如,简化器)神经网络来执行统计表示的简化,以将统计提炼成最具代表性的特征。异常检测模型可识别存在于统计的简化表示中的各种特征。经训练的检测器神经网络可使用由异常检测模型输出(在一些实施中,经归一化)的特征并预测(若干)异常得分。所列操作中的一些可为可选的,执行所述操作是为了获得异常得分预测的额外准确度及效率。针对非均匀传感器统计的此种聚集方法可显著减少对于人员控制传感器技术的需要,并提高了异常检测的效率。

9、所公开实施涉及使用处理腔室(可包括沉积腔室、蚀刻腔室及类似物)的各种制造技术,诸如,化学气相沉积(chemical vapor deposition;cvd)技术、物理气相沉积(physical vapor deposition;pvd)、等离子体增强cvd、等离子体增强pvd、溅镀沉积、原子层cvd、燃烧cvd、催化cvd、蒸镀沉积、分子束外延技术,等等。可在使用真空沉积腔室(例如,超高真空cvd或pvd、低压力cvd,等)以及大气压沉积腔室的技术中采用所公开的实施。

10、图1绘示根据本公开案的一些实施的能够基于使用神经网络的聚集统计来支持异常检测的制造机器100的一个示例性实施。举例而言,制造机器100可为具有多个处理腔室的晶片制造器件。在一个实施中,制造机器100包括装载站102、传送腔室104及一或多个处理腔室106。(若干)处理腔室106可经由传送端口(未示出)接口连接至传送腔室104。与传送腔室104相关联的处理腔室的数目可变化(作为实例,其中在图1中指示出三个处理腔室)。另外,传送腔室104的设计及形状可变化。在所绘示实施例中,传送腔室104具有六边形形状,其中每一侧有大致相等的宽度。在其他实施例中,传送腔室104可具有四个、五个、七个、八个或更多个侧面。另外,不同侧可具有不同的宽度或长度。举例而言,传送腔室104可具有四个侧面且为矩形形状或为正方形形状。在另一实例中,传送腔室可具有五个侧面且为楔形形状。如所示出,传送腔室104的每一侧连接至单个处理腔室106。然而,在其他实施中,所述侧中的一或多个可连接至多个处理腔室。举例而言,第一侧可连接至两个处理腔室,且第二侧可连接至一个处理腔室。

11、传送腔室104可包括机器人108、机器人叶片110,及用于晶片112的准确光学检查的光学检查工具,所述晶片112在处理腔室106中的一个中的处理后由机器人叶片110运输。传送腔室104可被保持在高于(或低于)大气压(温度)的压力(温度)之下。机器人叶片110可附接至可延伸臂,所述可延伸臂足以使机器人叶片110移动至处理腔室106中以在晶片处理完成之后撷取腔室116中的晶片。

12、机器人叶片110可经由狭缝阀端口(未示出)进入(若干)处理腔室106中,而同时(若干)处理腔室106的盖保持关闭。(若干)处理腔室106可含有处理气体、等离子体及用于沉积工艺中的各种微粒。(若干)处理腔室106内部可能存在磁场。(若干)处理腔室106的内部可保持在与(若干)处理腔室106外部的温度及压力不同的温度及压力下。

13、制造机器100可包括一或多个传感器114。每一传感器114可为温度传感器、压力传感器、化学检测传感器、化学成分传感器、气体流量传感器、运动传感器、位置传感器、光学传感器,或任何及其他类型的传感器。传感器114中的一些或全部可包括光源,以产生光(或任何其他电磁辐射),将光导向靶材(诸如,机器100的部件或晶片、沉积在晶片上的薄膜,等),并检测自靶材反射的光。传感器114可位于制造机器100内部的任一处(例如,在包括装载站的腔室中的任一个内,在机器人108上,在机器人叶片110上,在腔室之间,等等),或甚至在制造机器100外部(其中传感器可测试环境温度、压力、气体浓度,等等)。

14、在一些实施中,计算器件101可控制制造机器100及其各种工具及部件的操作,包括机器人108的操作、管理处理腔室106中的工艺的操作、传感器114的操作,等等。计算器件101可与机器人108的电子模块150且与传感器114通信。在一些实施中,此种通信可以无线方式执行。计算器件101可控制机器人108的操作且亦可接收来自传感器114的感测数据,包括原始传感器数据或经历由传感器114或另一处理器件(诸如,电子模块150的微控制器或制造机器100的任何其他处理器件)的初步处理(诸如,自模拟格式至数字格式的转换)的传感器数据。在一些实施中,传感器数据中的一些由电子模块150处理,而传感器数据中的一些由计算器件101处理。计算器件101可包括传感器控制模块(sensor control module;scm)120。scm 120可启用传感器,停用传感器,将传感器置于空闲状态下,改变传感器的设定,检测传感器硬件或软件问题,等等。在一些实施中,scm 120可追踪由制造机器100执行的处理操作,并确定对于制造机器100的特定处理(或诊断、维护等)操作而言要对哪一传感器114取样。举例而言,在处理腔室106中的一个内部的化学沉积步骤期间,scm可取样位于相应处理腔室106内部的传感器114,但不启用(或取样)位于传送腔室104及/或装载站102内部的传感器114。由scm 120获得的原始数据可包括时间序列数据,其中特定传感器114在一系列时间处俘获或产生检测量的一或多个读数。举例而言,压力传感器可在时间个例t1,t2,…tn处产生n个压力读数p(ti)。在一些实施中,由scm 120获得的原始数据可包括在空间位置的预定集合处的空间地图。举例而言,光学反射率传感器可确定在膜/晶片表面上的空间位置xj,yk的集合(例如,二维集合)处,沉积在晶片表面上的膜反射率r(xj,yk)。在一些实施中,可收集时间序列及空间地图原始数据。举例而言,当膜正被沉积在晶片上时,scm 120可自膜表面上的各种位置处及在连续时间个例的集合r(ti,xj,yl)处收集反射率数据。

15、计算器件101可进一步包括传感器统计模块(ssm)122。ssm 122可处理由scm 120自传感器114获得的原始数据,并确定代表所述原始数据的统计。举例而言,对于原始传感器数据分布中的每一者或一些而言,scm 120可确定分布的一或多个参数,诸如,平均值、中值、模式、上限、下限、方差(或标准偏差)、偏度(三阶矩)、峰态(四阶矩)或数据分布的任何另外的矩或累积量。在一些实施中,scm可(例如,经由回归分析拟合)模型化具有各种模型分布(正态分布、对数正态分布、二项分布、泊松分布、伽玛分布或任何其他分布)的原始数据。在此些实施中,所述一或多个参数可包括与由scm 120确定的拟合参数一起使用的拟合分布的标识。在一些实施中,scm可使用多个分布来拟合来自一个传感器的原始数据,例如,离群值数据点的主分布及尾分布。

16、由scm 120获得的分布参数可为特定于传感器的。举例而言,对于一些传感器而言可确定少量参数(平均值、中值、方差),而对于一些传感器而言可确定更多(例如,10或20个)时刻。计算器件101亦可包括异常检测模块(anomaly detection module;adm)124,以处理、聚集及分析由ssm 112收集的统计。如以下更详细地描述,参考图3及图4,adm 124可预处理、降低传感器统计的维数、通过多个异常检测模型处理统计的简化表示、归一化,及使用检测器神经网络进行处理以确定一或多个异常得分。所列操作中的至少一些可包括机器学习。

17、图2为根据本公开案的一些实施的能够基于使用神经网络的聚集统计进行异常检测的机器学习系统200的示例性说明。如所示出,机器学习系统200可包括计算器件101、训练统计储存库280,及连接至网络260的训练服务器270。网络260可为公共网络(例如,因特网)、专用网络(例如,局域网络(local area network;lan))或广域网(wide areanetwork;wan)),或上述的组合。图2中描绘可由adm 124处理的传感器统计202(传感器统计202可由ssm 122基于由scm 120自传感器114获得的原始数据产生)的集合。adm124可包括诸多部件(以软件及硬件实施),诸如,预处理模块210、简化器神经网络220、一或多个离群值检测模型230、归一化模块240、检测器神经网络250,及未在图2中明确描绘的其他部件。

18、预处理模块210可去除可能与预防性维护、制造工艺设定的预期变化、系统硬件配置的变化及类似物相关联的伪影,以产生传感器统计的初始表示。传感器统计的初始表示可为一些或全部传感器数据的聚集统计。简化器神经网络220(本文中简称为“简化器220”)可简化由预处理210准备的统计,并将统计的初始表示转换为不同的表示(本文中称作简化表示),所述不同的表示包括统计的最具代表性特征且具有比初始表示更少的要素(例如,参数)。离群值检测模型230可识别存在于统计的简化表示中的各种(统计)特征。所识别的统计特征可以适合于神经网络处理的离群值得分的形式进行投射。归一化模块240可归一化各个检测模型的非均匀输出(离群值得分),以为神经网络处理准备输出。检测器神经网络250(本文中有时称作“检测器250”)可使用离群值检测模型230所输出的经归一化特征,并预测制造工艺的异常得分。

19、可通过训练服务器135来训练简化器220及/或检测器250。训练服务器235可为(及/或包括)框架安装服务器、路由器计算机、个人计算机、膝上型计算机、平板计算机、桌面计算机、介质中心或上述的任何组合。训练服务器270可包括训练引擎272。在一些实施中,训练引擎272可构建机器学习模型(例如,神经网络220及250)。可由训练引擎272使用包括训练输入274及对应训练(目标)输出276的训练数据来训练神经网络220及250。在一些实施中,可单独训练简化器220及检测器250。

20、训练输出276可包括训练输入274对训练输出276的正确关联性(映射)。训练引擎272可在训练数据中找到将训练输入274映像至训练输出276的模式(例如,要预测的关联性),并训练简化器220及/或检测器250以俘获此些模式。所述模式可随后由简化器220及/或检测器250用于进一步数据处理及异常检测。举例而言,在接收传感器统计202的集合之后,经训练的简化器220及/或检测器250可能能够识别出传感器统计202是否指示制造异常,诸如,制造机器100的一或多个操作或产品偏离相应的工艺配方或产品规格。

21、在各种实施中,神经网络220及250中的每一个可包括单级线性或非线性神经操作。在一些实施中,神经网络220及250可为具有多级线性或非线性操作的深度神经网络。深度神经网络的实例为包括卷积神经网络、具有一或多个隐藏层的递归神经网络(recurrentneural network;rnn)、全连接神经网络、玻尔兹曼机等的神经网络。在一些实施中,神经网络220及250可包括多个神经元,其中每个神经元可自其他神经元或自外部源接收其输入,且可通过将激活函数应用至加权输入与可训练偏差值的和来产生输出。神经网络220及250可包括按层布置的多个神经元,包括输入层、一或多个隐藏层及输出层。来自相邻层的神经元可通过加权边连接。最初,可为所有边权重指派一些起始(例如,随机)值。对于训练数据集中的每个训练输入274,训练引擎272可使神经网络220及250产生输出(一组训练传感器统计的预测异常得分)。训练引擎272可比较神经网络220及250的观察到的输出与目标训练输出276。所得误差(例如,目标训练输出与神经网络的实际输出之间的差)可经由神经网络220及250回传,且可调整神经网络中的权重及偏差以使实际输出更接近于训练输出。可重复此调整,直至特定训练输入274的输出误差满足预定条件(例如,降至低于预定值)为止。随后,可选择不同的训练输入274,产生新输出,实施新的调整序列,直至神经网络被训练至可接受的准确度为止。

22、训练输入274、训练输出276及映像数据278可作为训练统计282的一部分储存在训练统计储存库280中,所述储存库280可以由计算器件101直接地或经由网络260存取。训练统计282可为实际的,例如,制造机器100或类似类型的机器(例如,由开发者用以训练神经网络220及250的一或多个机器)的传感器114的过去统计。训练统计282可包括表示特定制造异常的发生(或不发生)的多种统计,诸如,不正确的温度、压力、化学成分方案、有缺陷(或正常)膜、晶片,或制造机器100(或类似机器)的任何其他产品。训练统计282可包括在制造工艺中存在达各种程度的异常的实例,诸如,导致低于标准良率的显著异常、可由及时且适当的对策消除的可校正异常、不太可能会影响制造输出的质量的微不足道异常,等等。在一些实施中,可通过连续的或准连续的异常得分(例如,在0.0至1.0范围、或0至100范围或任何其他范围内的值)来指示训练统计282中的异常的存在。训练统计282中的异常得分可为训练输出276的一部分。

23、训练统计储存库280可为能够储存传感器数据或传感器数据统计以及所储存数据/统计的元数据的持久储存器。训练统计储存库280可由一或多种储存器件托管,诸如,主存储器、基于磁性或光学储存的磁盘、磁带或硬盘驱动器、nas、san,等等。尽管被描绘为与计算器件101分离,但在一些实施中,训练统计储存库280可为计算器件101的一部分。在一些实施中,训练统计储存库280可为附接网络的文件服务器,而在其他实施中,训练统计储存库280可为某一其他类型的持久储存器,诸如,面向对象数据库、关系型数据库,等等,所述持久储存器可由服务器机器或经由网络260耦合至计算器件101的一或多种不同机器托管。

24、一旦神经网络220及250经训练,便可向adm 124提供经训练的神经网络以用于新传感器统计的处理。举例而言,adm 124可接收传感器统计202的新集合,将所述新集合传递经过adm 124的一些或所有部件(例如,预处理210、简化器220、一个或多个离群值检测模型230、归一化模块240及检测器网络250)以预测异常得分,所述异常得分代表传感器统计202指示制造异常的可能性。

25、本文中,“处理器件”指能够执行指令编码算术、逻辑或i/o操作的器件。在一个说明性实例中,处理器件可遵循诺依曼架构模型且可包括算术逻辑单元(arithmetic logicunit;alu)、控制单元及多个寄存器。在另一方面中,处理器件可为单核处理器,所述单核处理器通常能够一次执行一个指令(或处理指令的单个管线);或多核处理器,所述多核处理器可同时执行多个指令。在另一方面中,处理器件可被实施为单个集成电路、两个或更多个集成电路,或可为多芯片模块的部件。亦可将处理器件称作cpu。在本文中,“存储器件”指挥发性或非挥发性存储器,诸如,随机存取存储器(random-access memory;ram)、只读存储器(read-only memory;rom)、电可抹除可程序化只读存储器(electrically erasableprogrammable read-only memory;eeprom)或能够储存数据的任何其他器件。

26、图3为根据本公开案的一些实施的基于使用神经网络的聚集统计进行异常检测的简化阶段300的示例性说明。图3中描绘传感器统计202的集合,所集合述可经由一或多个中间操作自传感器114导出。举例而言,scm 120可识别可为特定(例如,正在进行的或即将开始的)制造操作的整个持续时间的时程(例如,30秒、三分钟,等),或小于(或大于)所述操作的所述整个持续时间的选定时间间隔。scm 120可进一步识别在所识别的时程的持续时间内,可启用(或取样)哪些传感器114以用于当前操作期间的异常检测。scm 120可收集m个数据集合(例如,来自m个传感器的数据),每一集合包括n个读数。读数的数目可为特定于传感器的,可通过改变数据采样率而进行控制。在一些实施中,时程亦可为特定于传感器的,以使得传感器1可在时间t1内提供n1个读数,而传感器2可在时间t2内提供n2个读数。因此,scm120可收集数据点{rj}的多个集合,其中指数j表示第j个(1≦j≦m)传感器的数据点的集合。数据点的每一集合可包括数据读数的时间序列{rj}=rj(t1),rj(t2),…rj(tn)。基于由scm 120取样的原始传感器数据,ssm 122可对所获得数据集{rj}中的每一个进行统计分析,以确定描述相应数据集的统计参数{pj}=pj(1),pj(2),…pj(s)的集合。在本公开案中,统计参数的集合称作“传感器统计”(例如,传感器统计202)。举例而言,pj(1)可为第j个数据集的平均值,pj(2)可为同一数据值的中值,pj(3)可为模式,pj(4)可为标准偏差,pj(4)可为半宽,pj(5)可为下限(最小值),pj(6)可为上限(最大值),pj(7)可为偏度,pj(8)可为峰态,等等。

27、传感器统计202(例如,参数{pj}的集合)可输入至预处理模块210中,以过滤掉或以其他方式解释传感器数据中的各种伪影。在一些实施中,来自传感器114的原始数据(例如,数据集{rj})亦可被提供至预处理模块210。传感器统计202的一些特征可代表制造工艺的异常,所述异常预期将被检测到。然而,传感器统计202的一些特征可指示各种事件,所述事件并不代表制造工艺的任何实际问题或缺陷,但若此些事件的存在并未适当考虑,则可能另外被检测为有问题。举例而言,制造机器100可能已经历了维护(预防性的、已排程的或计划外的)程序。在维护程序期间,一或多个传感器114可能已暴露于已改变的环境中。因为传感器114时常为微型器件,所以作为此种暴露的结果,传感器的设定(例如,零点)可能改变。因此,传感器数据可能实质上偏移,但此些偏移量可能并不代表任何制造工艺异常。在一些实施中,传感器统计202的偏移量可指示制造工艺的有意改变。举例而言,制造机器100的操作者(例如,使用者)可改变处理腔室106内部的一或多个条件的设定点,诸如,温度、气体流动速率、被输送至处理腔室106中的气体的化学成分或浓度的改变。在一些实施中,传感器统计202的改变可由处理腔室中的一或多个硬件器件的设定的改变触发,诸如,处理套件(例如,边缘环或其类似物)的替换。

28、在此些情形下,计算器件101可检测伪影事件(维护、工艺设定点的改变、硬件配置的改变,等)的发生并向scm 120通知所述事件。ssm 122可接收事件(例如,机器人叶片移除旧的边缘环并(在特定时间)将新的边缘环输送至处理腔室206中)的指示。ssm 122可关联在伪影事件之后的时间间隔内传感器统计202的改变,并调整统计202以去除(或补偿)由伪影事件引起的传感器统计的改变。举例而言,ssm 122可确定受影响的传感器(其可为读数在伪影事件中或伪影事件之后发生偏移的任何传感器)的分布的新平均值,并基于所述新平均值重新计算传感器统计。在一些实施中,预处理模块210可去除离群值、无效值(诸如,非数字值),或相反地,推算(添加)缺失值。以所述(或类似)方式校正的传感器统计可由预处理模块210以经调整参数{pj}的集合的形式输出,所述集合反映经校正(经调整以补偿伪影事件的影响)的传感器统计202。经调整参数{pj}可构成在本公开案中称作传感器统计的初始表示315的传感器统计表示(即使表示315可能并非由ssm 122所产生的统计的最早表示)。

29、可跨一些或所有传感器统计聚集初始表示315。因为不同的传感器统计可能与不同的数量相关,包括以不同单位(例如,温度、压力、气体流量、晶片厚度、晶片表面的反射率,等)测量的数量,所以传感器统计可在聚集之前归一化。举例而言,方差可首先以平均值平方为单位表述,而三阶矩或累积量(例如,偏度)可以平均值立方为单位表述,等等。

30、在一些实施中,初始表示315可由简化器神经网络220处理,以获得传感器统计的简化表示325。至简化器220的输入可为传感器统计的初始表示315的聚集集合。初始表示315可含有大量信息,仅其中一小部分可代表制造异常。因此,简化器220的功能可为两个方面:通过将初始表示315提炼为数据统计的最具代表性特征来提高信噪比,及将描述传感器统计的参数的数目简化至更易于管理且更便于进一步处理的集合。在一个实施中,简化器神经网络220可为自动编码器。在另一实施中,简化器神经网络220可为极限学习机器。简化器神经网络220可经训练以输出具有比初始表示低(在一些实施中,明显更低)的维度数目的简化表示325。举例而言,简化器神经网络220可使用基于主要分量分析(principalcomponent analysis;pca)的算法中的一个来识别初始表示的最重要且最具代表性(用于后续异常检测)的特征。特定言之,pca算法可找到初始表示315的坐标空间的变换,沿所述变换最大化数据点的方差(主轴),并选择某一数目(在训练期间确定并优化)的最大方差轴,例如,d。对于所述轴中的每一个而言,输出可包括针对主轴中的每一个的一或多个统计参数(平均值、方差,等),及表征与各个轴有关的统计参数之间的互相关的诸多协方差参数。使用简化器神经网络220的优势在于,它允许将传感器统计的数目自可能数千个参数减少为仅几个(例如,五个、十个、二十个,等)关键分量,所述关键分量表示传感器数据的关键变化,且同时减少了噪声。使用简化器220提高了后续异常检测算法的效率(如关于图4所描述)。在一些实施中,简化器220可同时处理传感器统计的所有或一些初始表示315。

31、图4为根据本公开案的一些实施的基于使用神经网络的聚集统计进行异常检测的检测阶段400的示例性说明。图4中描绘被输入至离群值检测模型230(例如,模型230-1、230-2…230-l)的集合的传感器统计的简化表示325。离群值检测模型230中的一些或全部可采用多种算法,诸如,k-最近邻离群值检测算法、基于群集的算法、基于混合的算法(例如,基于群集的局部离群值因子算法)、基于嵌入的算法、判定树算法、基于支持向量机的算法、基于直方图的离群值得分算法、主要分量分析算法、局部离群值因子算法、基于局部距离的离群值检测算法、局部离群值积分算法,及类似算法。

32、根据相应离群值检测模型230的准则,应用于简化表示325的离群值检测模型230中的每一个可输出相应的离群值得分420,指示传感器统计中各种异常的存在。由不同算法确定的离群值得分420可具有难以彼此直接比较的值。为了使离群值得分420更佳地适合于后续均匀处理,可通过归一化模块240来归一化离群值得分420。在一些实施中,归一化模块240可执行离群值得分420的重新缩放。举例而言,若最大离群值(例如,训练传感器统计的集合或实际运行时传感器统计的集合或上述的组合的最大值)为omax,且最小离群值为omin,则经归一化的离群值得分可确定为

33、

34、均匀归一化使所有离群值得分都在值区间[0,1]内,但不考虑离群值得分o可能在区间[omin,omax]内非均匀地分布的事实。在一些实施中,可能难以预测在实际处理中可能遇到的最小或最大离群值得分,因此可替代地使用其他方法,例如,如下所述。

35、因此,在一些实施中,可替代地使用离群值得分o的一些基础分布的假设(近似值或假设)来执行归一化。举例而言,可通过根据如下公式确定经归一化的离群值得分来执行离群值得分的高斯分布:

36、

37、其中omean为平均离群值得分,且σ为离群值得分的标准偏差(例如,训练传感器统计的集合或实际传感器统计的集合或上述组合的平均值),且erf为高斯误差函数。

38、在一些实施中,可根据如下公式使用离群值得分的伽马分布的假设来执行归一化:

39、

40、其中f(o)为伽马分布的累积分布函数,例如,

41、

42、其中γ(x)为伽马函数,且γ(x,y)为不完整的伽马函数。

43、以上非限制性实例预期仅作为说明。在各种实施中,可使用不同的基础分布,且相应的基于分布的归一化机制可不同。在一些实施中,可使用两种或更多种概率分布的混合以归一化离群值得分420。

44、自l个离群值检测模型230中的全部(或一些)获得的经归一化的离群值得分onorm-1、onorm-2、…onorm-l可用作至神经网络检测器250(“检测器”)中的输入,以确定异常得分。可使用深度学习的方法在多种训练传感器统计282上训练检测器250。检测器250可为玻尔兹曼机、卷积神经网络、递归神经网络、全连接神经网络,或一些其他类型的深度学习神经网络。检测器250的输出可为异常得分330,指示在传感器统计202的输入集合中存在异常的可能性。

45、图5为根据本公开案的一些实施的示例性神经网络500,操作为基于使用神经网络的聚集统计的异常检测的检测阶段中所使用的检测器神经网络250。图5中描绘输入至检测器250的多个输入节点(神经元)xj 510-1、510-2…510-l中的经归一化的离群值得分onorm-1、onorm-2、…onorm-l。在一些实施中,神经网络500可为受限玻尔兹曼机(restrictedboltzmann machine;rbm)。输入的经归一化的离群值得分可由具有隐藏节点(神经元)520的一或多个隐藏层处理。每一隐藏节点520可与隐藏变数相关联。rbm的相邻列之间的连接可具有由权重矩阵wlm描述的关联权重,所述权重矩阵具有对应于一个层的第l个节点与相邻层的第m个节点之间的连接的值。在图5中所描绘的实施中,输入层与隐藏层之间的权重矩阵为方阵(因为每层中的节点数目为l),但在其他实施中,每个连续层的节点数目可能与前一层中的节点数目不同。另外,每个层可与偏差b1、b2……的集合(向量、列)相关联。

46、可由以如下形式符号写成的“能量”来描述rbm

47、

48、其中表示rgb各层中的变量的向量(输入x或隐藏h),表示与对应变量(节点)相关联的偏差,且代表层之间的权重矩阵。能量根据玻尔兹曼分布确定配置{xj},的概率,

49、

50、其中z为分区函数(归一化系数)。可使用训练输入向量(离群值得分)来执行两层rbm的训练,其中(1)隐藏变量是自输入的离群值得分统计确定的,及(2)在将反向预测的输入变量与实际输入变量进行比较之前,使用隐藏变量反向地预测输入节点的值(可将此(1)+(2)程序重复默认次数),且调整rbm的偏差及权重,直到输入变量的两个集合彼此足够接近(例如,小于预定的准确度阈值)。

51、在具有多个隐藏层的深度学习rgb中,如图5中所描绘,例如,一隐藏层为至后续隐藏层中的输入。在一些实施中,rgb的隐藏层以逐层方式一次被训练一个,例如,自左向右。具体而言,自值确定隐藏变量等等。此种rgb架构可能能够分解输入变量的因素。即,随着经由rgb的传播,隐藏节点的可变得有较低的统计依赖性。数据经由rgb的传播可因此降低节点的条件依赖性,而同时保留关于输出节点y530所输出的异常得分的大部分信息。可将输出节点530视为单节点隐藏层,其权重及偏差可使用与关于隐藏节点520所述程序相同的程序来确定。

52、图6为根据本公开案的一些实施的基于使用神经网络的聚集统计的异常检测方法600的一个可能实施的流程图。使用图1至图5中所示的系统及部件或上述的任何组合来执行方法600。可使用单个处理器件或多个处理器件来执行方法600。方法600的操作中的一些可为可选的。在一些实施中,可通过计算器件101的处理器件(处理器、中央处理单元(central processing unit;cpu))(例如)响应于由异常检测模块(anomaly detectionmodule;adm)124输出的指令来执行方法600的一些操作。在一些实施中,可通过电子模块150执行方法600的操作中的一些。计算器件101可具有耦合至一或多个存储器件的一或多个cpu。可在不使制造系统(诸如,制造机器100)脱离生产工艺的情况下执行方法600。在一些实施中,当(例如)由机器人108的机器人叶片110在制造机器100的各种腔室之间运输晶片时,可实施方法600。在一些实施中,可当在处理腔室106中的一个中处理晶片的同时实施方法600。举例而言,晶片可经历化学或物理气相沉积、蚀刻、掩模、冷却、加热或任何其他制造操作。方法600可确定晶片处理是否具有可能影响制造工艺的产品质量的一些异常。可当晶片处于传送腔室104内部时或当晶片处于装载站102内部时执行异常检测。可在跨越单个制造操作(例如,蚀刻)或多个制造操作(例如,加热晶片、执行化学沉积、冷却晶片、在处理腔室之间运输晶片等)的时间段内执行异常检测。可在不延迟制造工艺的情况下执行异常检测检查。

53、方法600可涉及处理器件(例如,计算器件101的cpu)获得多个传感器(例如,传感器114)的原始传感器统计,所述传感器在经受异常检测的(若干)处理操作的持续时间期间收集数据(方块610)。可由处理器件基于(若干)处理操作的细节来选择在(若干)处理操作期间被启用(或收集数据)的传感器集合。原始传感器统计可表征与被启用(取样)传感器相关联的多个测量值。描述由传感器中的每一个或一些收集的测量值的统计可包括各种参数,诸如,中值、模式、方差、标准偏差、范围、最大值、最小值、偏度或峰态。在方块620处,方法600可继续,处理器件预处理多个传感器中的每一个或一些的原始传感器统计。预处理可涉及根据各种预防性维护事件来调整原始传感器统计,诸如,制造操作设定的改变,或器件制造系统设定的改变。预处理的输出可为传感器统计的初始表示。所述初始表示可为传感器统计的聚集表示。

54、在方块630处,方法600可继续,处理器件获得反映由传感器收集的数据的传感器统计的简化表示。在一些实施中,可通过使用简化器神经网络处理多个传感器统计的初始表示而获得传感器统计的简化表示。在一些实施中,简化器神经网络可为前馈神经网络。所述简化表示可具有比初始表示少的参数。

55、在方块640处,方法600可继续,其中处理器件产生多个离群值得分。可通过执行相应的离群值检测模型而获得多个离群值得分中的每一个。至离群值检测模型中的输入可为传感器统计的简化表示。在方块650处,处理器件可归一化离群值得分中的至少一些。

56、在方块660处,方法600可继续,其中处理器件使用检测器神经网络处理多个经归一化的离群值得分。检测器神经网络可为简化玻尔兹曼机网络。在一些实施中,简化玻尔兹曼机网络具有两个或更多个隐藏层,以产生指示与制造操作相关联的异常的可能性的异常得分。

57、在方块670处,执行方法600的处理器件可分析所产生的得分并采取(或不采取)一或多个补救动作。具体而言,若异常得分低于某一预定阈值,则处理器件可不采取补救动作,及/或视情况向用户(工程师,或制造工艺的任何其他操作者)提供异常得分。在那些情形下,当异常得分高于所述阈值时,处理器件可起始一或多个补救动作。举例而言,处理器件可警告使用者并向用户建议各种校正选项,诸如,改变制造工艺的参数、暂停制造工艺(例如,为了快速维护)、停止制造工艺(例如,为了更广泛的维修),或类似物。在一些实施中,处理器件可采取多种补救动作,例如,调整制造工艺的设定,定期维护及警告使用者。

58、图7根据本公开案的一些实施,描绘根据本公开案的一或多个方面操作且能够基于使用神经网络的聚集统计进行异常检测的示例性处理器件700的方块图。在一个实施中,处理器件700可为计算器件101或图1的电子模块150的微控制器。

59、示例性处理器件700可以lan、内部网络、商际网络及/或因特网连接至其他处理器件。处理器件700可为个人计算机(personal computer;pc)、机顶盒(set-top box;stb)、服务器、网络路由器、交换机或网桥,或能够执行一组指令(顺序的或以其他方式)的任何器件,所述指令指定了将由那个器件采取的动作。另外,虽然仅绘示出单个示例性处理器件,但术语“处理器件”亦应被认为包括单独地或共同地执行一组(或多组)指令以执行本文所述方法中的任何一或多个的处理器件(例如,计算机)的任何集合。

60、示例性处理器件700可包括处理器702(例如,cpu)、主存储器704(例如,只读存储器(read-only memory;rom)、存储器、动态随机存取存储器(dynamic random accessmemory;dram)(诸如,同步dram(sdram)等)、静态存储器706(例如,闪存、静态随机存取存储器(static random access memory;sram),等),及次要存储器(例如,数据储存器件718),可经由总线730彼此通讯。

61、处理器702表示一或多个通用处理器件,诸如微处理器、中央处理单元,或类似物。更特定而言,处理器702可为复杂指令集计算(complex instruction set computing;cisc)微处理器、精简指令集计算(reduced instruction set computing;risc)微处理器、超长指令字(very long instruction word;vliw)微处理器、实施其他指令集的处理器,或实施指令集的组合的处理器。处理器702亦可为一或多个专用处理器件,诸如,特殊应用集成电路(application specific integrated circuit;asic)、场可编程门阵列(fieldprogrammable gate array;fpga)、数字信号处理器(digital signal processor;dsp)、网络处理器,或类似物。根据本公开案的一或多个方面,处理器702可经配置以执行指令,所述指令实施基于使用神经网络的聚集统计进行异常检测的方法600。

62、示例性处理器件700可进一步包括网络接口器件708,所述网络接口器件708可以通讯方式耦合至网络720。示例性处理器件700可进一步包括视频显示器710(例如,液晶显示器(liquid crystal display;lcd)、触摸屏或阴极射线管(cathode ray tube;crt))、文数字输入器件712(例如,键盘)、输入控制器件714(例如,光标控制器件、触摸屏控制器件、鼠标),及信号产生器件716(例如,声学扬声器)。

63、数据储存器件718可包括计算机可读储存介质(或更具体地说,为非暂时性计算机可读储存介质)728,所述计算机可读储存介质上储存有可执行指令722的一或多个集合。根据本公开案的一或多个方面,可执行指令722可包括实施基于使用神经网络的聚集统计进行异常检测的方法600的可执行指令。

64、可执行指令722在可执行指令722由示例性处理器件700执行期间亦可完全地或至少部分地驻存在主存储器704内及/或处理器件702内,主存储器704及处理器702亦构成计算机可读储存介质。可执行指令722可进一步经由网络接口器件708在网络上传输或被接收。

65、虽然在图7中将计算机可读储存介质728示为单个介质,但术语“计算机可读储存介质”应被视为包括储存操作指令的一或多个集合的单个介质或多个介质(例如,集中式或分布式数据库,及/或相关联的高速缓存及服务器)。术语“计算机可读储存介质”亦应被视为包括任何介质,所述任何介质能够储存或编码指令集合以用于由机器来执行,所述指令导致机器执行本文所述方法中的任何一或多个。术语“计算机可读储存介质”亦相应地被视为包括但不限于固态存储器以及光学及磁性介质。

66、应理解,以上描述旨在为说明性的,而非限制性的。在阅读并理解以上描述之后,本领域的技术人员将显而易见许多其他实施实例。尽管本公开案描述了特定实例,但应认识到,本公开案的系统及方法并不限于本文所述实例,而可在所附权利要求书的范围内作出修改来实践。因此,应在说明性含义上而非限制性含义上来考虑说明书及图。因此,本公开案的范围应参考附属权利要求书连同此权利要求书所赋予的等效物的整个范围来确定。

67、上述方法、硬件、软件、韧体或代码的实施可经由储存在可由处理器件执行的机器可存取、机器可读、计算机可存取或计算机可读介质上的指令或代码来实施。“存储器”包括以机器(诸如,计算机或电子系统)可读的形式提供(亦即,储存及/或传输)信息的任何机制。举例而言,“存储器”包括随机存取存储器(random-access memory;ram),诸如,静态ram(sram)或动态ram(dram);rom;磁性或光学储存介质;闪存器件;电学储存器件;光学储存器件;声学储存器件;及适合于以可由机器(例如,计算机)读取的形式储存或传输电子指令或信息的任何类型的有形机器可读介质。

68、贯穿本说明书对“一个实施”或“实施”的引用意谓结合实施描述的特定特征、结构或特性被包括在本公开案的至少一个实施中。因此,贯穿本说明书在各处出现的短语“在一个实施中”或“在实施中”未必皆代表同一实施。另外,可在一或多个实施中以任何适当方式组合特定特征、结构或特性。

69、在前述说明书中,已参考特定示例性实施给出了详细描述。然而,将显而易见,可在不脱离如在附属权利要求书中所阐述的本公开案的更宽泛的精神及范围的情况下对本公开案作出各种修改及改变。因此,应在说明性含义上而非限制性含义上来考虑说明书及图。另外,对实施、实施和/或其他示例性语言的前述使用未必代表同一实施或相同实例,而可代表不同且相异的实施,以及有可能相同的实施。

70、词语“实例”或“示例性”在本文中用以意谓充当实例、示例或说明。本文中描述为“实例”或“示例性”的任何方面或设计未必被解释为较佳或比其他方面或设计有优势。实情为,对词语“实例”或“示例性”的使用旨在以具体的方式呈现概念。如本说明书中所使用,术语“或”旨在意谓包括性的“或”而不是排他性的“或”。亦即,除非另有说明或自上下文明确说明,否则“x包括a或b”旨在意谓自然包括性排列中的任一者。亦即,若x包括a;x包括b;或x包括a及b两者,则在以上情形中的任一者下皆满足“x包括a或b”。另外,如在本技术案及附属权利要求书中所使用,冠词“一(a)”及“一(an)”应大体解释为意谓“一或多个”,除非另有说明或上下文中明确指向单数形式。此外,除非如此描述,否则始终使用术语“实施”或“一个实施”或“实施”或“一个实施”并不旨在意谓同一实施或实施。又,如本文中所使用,术语“第一”、“第二”、“第三”、“第四”等意谓用以在不同器件之间进行区分的卷标,且可能未必具有按它们的数字标记的序数含义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1