本公开涉及半导体制造良率预测技术,更具体地讲,涉及一种用于基于在半导体制造工艺期间生成的数据来预测最终良率的系统和方法。
背景技术:
为了预测半导体制造良率,使用在主要工艺之后获得的测量数据。也就是说,可通过收集在主要工艺期间生成的测量数据并将该数据和过去的数据进行比较来预测良率。
然而,由于影响半导体制造良率的因素非常多样且复杂,因此存在仅根据主要工艺的测量数据而预测良率会降低精确度的问题。
因此,需要一种通过综合地使用在半导体制造工艺期间生成的各种数据来准确地预测半导体制造良率的方法。
技术实现要素:
技术问题
已经开发了本公开以解决现有技术的上述缺陷,并且本公开的目的是提供一种根据数据的类型应用不同的神经网络模型的用于基于机器学习来预测结果值的方法和系统。
技术方案
根据用于实现上述目的的本公开的实施例,一种结果预测方法包括:提取不同类型的数据;通过按类型对提取的数据进行分类并将分类的数据输入到不同的神经网络模型,来训练神经网络模型;接收不同类型的数据的输入;以及通过按类型对输入的数据进行分类并将分类的数据输入到不同的神经网络模型,来预测结果值。
此外,不同类型的数据可以是在半导体制造工艺期间生成的数据,并且结果值可以是半导体制造良率。
此外,数据可被分类为生产相关的数据、设备相关的数据、缺陷数据和测量数据中的至少两种类型的数据。
此外,缺陷数据和测量数据中的一个可以是图像化数据。
此外,输入数据的类型的数量可小于提取的数据的类型的数量。
此外,接收输入的步骤可包括:从请求结果值的预测的系统接收不同类型的数据的输入。
此外,提取的步骤可包括:周期性地提取数据,并且接收输入的步骤可包括:实时接收数据的输入。
此外,根据本公开实施例的结果预测方法还可包括:将提取的数据累积在基于存储的db中;并将输入的数据累积在基于内存的db中。训练的步骤可包括:按类型对在基于存储的db中累积的数据进行分类,并将分类的数据输入到不同的神经网络模型。预测的步骤可包括:按时间对在基于内存的db中累积的数据进行分类,并将分类的数据输入到不同的神经网络模型。
此外,预测的步骤可包括:通过对不同神经网络模型的结果值进行套袋或提升来计算预测值。
此外,根据本公开的实施例的结果预测方法还可包括:选择训练的神经网络模型的一些原因值;以及生成接收选择的原因值的输入的集成的神经网络模型。
此外,选择的步骤可包括:基于与训练的神经网络模型的结果值的相关性来选择一些原因值。
此外,根据本公开的实施例的结果预测方法还可包括:通过使用训练的神经网络模型和集成的神经网络模型中的至少一个来基于输入的数据预测结果值。
根据本公开的另一实施例,一种结果预测系统包括:提取单元,被配置为提取不同类型的数据;学习单元,被配置为通过按类型对提取的数据进行分类并将分类的数据输入到不同的神经网络模型来训练神经网络模型;以及预测单元,被配置为接收不同类型的数据的输入,并通过按类型对输入的数据进行分类并将分类的数据输入到不同神经网络模型来预测结果值。
有益效果
根据如上所述的本公开的实施例,通过由根据数据的类型应用不同的神经网络模型来确保适合于数据特性的结构的神经网络模型,可精确地预测结果值。
此外,当将本公开的实施例应用于半导体制造良率的预测时,工艺的流程可被调节以提高生产率/良率,并且缺陷可被提早检测,因此可预先采取适当的回应。
此外,当将本公开的实施例应用于半导体制造良率的预测时,被预测为不具有良好良率的产品可被特别观察/管理,并且良率预测功能可被集成到平台,并且可用于在各种制造工艺中共同使用。此外,各种反馈结果可被组合和分析,因此可在各种领域中使用。
附图说明
图1是根据本公开的实施例的半导体制造良率预测系统的框图;
图2是示出生产数据神经网络模型的结构的示例的示图;
图3是示出设备数据神经网络模型的结构的示例的示图;
图4是示出缺陷数据神经网络模型的结构的示例的示图;
图5是根据本公开的另一实施例的半导体制造良率预测系统的框图。
具体实施方式
在下文中,将参照附图更详细地描述本公开。
1、半导体制造良率预测系统
图1是根据本公开的实施例的半导体制造良率预测系统的框图。根据本公开的实施例的半导体制造良率预测系统通过使用由在半导体制造工艺期间生成的机器学习数据生成的神经网络模型,来预测半导体制造良率。
根据数据的类型对神经网络模型进行分类。也就是说,根据本公开的实施例的半导体制造良率预测系统根据数据的类型生成不同的神经网络模型,并通过综合地使用神经网络模型来预测半导体制造良率。
根据本公开的实施例的执行上述功能的半导体制造良率预测系统包括数据提取单元110、学习单元120、存储单元130和预测单元140。
数据提取单元110可从在半导体制造工艺期间生成的各种类型的数据提取和累积应由学习单元120(下面将描述)学习的数据,并且可以以数据可被容易地学习的形式处理数据。
由数据提取单元110提取的数据可被划分为:1)生产相关的数据、2)设备相关的数据、和3)质量数据。3)质量相关的数据可被划分为:31)缺陷数据和32)测量数据。下面将详细描述这些类型的数据。
用于由数据提取单元110提取、累积和处理的方法可根据数据的类型而不同,并且下面将详细描述这些方法。
学习单元120重复通过针对由数据提取单元110提取/处理的数据执行机器学习来生成神经网络模型以及根据附加数据的输入更新神经网络模型的过程。
由学习单元120生成/更新的神经网络模型被存储在存储单元130中。由于如上所述,根据数据的类型不同地生成/更新神经网络模型,因此,存储单元130可包括生产数据神经网络模型131、设备数据神经网络模型132、缺陷数据神经网络模型133和测量数据神经网络模型134。
预测单元140通过使用存储在存储单元130中的神经网络模型131、132、133、134来预测半导体制造良率。当存在来自外部系统11、12、13的用数据预测良率的请求时,半导体制造良率被预测,并且预测的结果可被返回到相应的外部系统。
2、训练数据
将描述由数据提取单元110提取、累积和处理,然后由学习单元120学习的数据。
生产相关的数据是指关于整个生产的历史数据,其中,关于从半导体的制造开始的时间到目前时间执行的过程id、设备id、设备中的工作空间、设备工作规范id等的数据按时间序列排列。
设备相关的数据是指从半导体的制造开始的时间到目前时间的过程中通过设备中的内部/外部传感器测量的数据(诸如,设备操作时间、温度、压力、振动的次数、特定材料的比率等)。也就是说,设备相关的数据可以指关于设备的操作/状态的输入数据,在该数据中,关于设备的各种物理/电气状态值按时间序列排列。
质量数据是指通过测量从半导体的制造开始的时间到目前时间的中间产品的质量而获得的数据,并且可被划分为缺陷数据和测量数据。
缺陷数据指的是指示缺陷的数量、缺陷的大小、缺陷位置、缺陷形状等的数据。缺陷数据可以是图像数据或者可使用文本数据。
测量数据指的是指示电路的线宽、厚度和未对准的数据。与缺陷数据一样,测量数据可使用文本数据以及图像数据。
3、数据的提取
数据的提取可被划分为训练数据的提取和输入数据的提取。前者用于提取将由学习单元120学习的数据,并且可通过周期性提取方法来执行。后者用于提取在预测单元140意图预测半导体良率时的目前时间生成的数据,并且可通过实时提取方法来执行。
周期性提取方法是如下的方法:数据提取单元110通过使用结构化查询语言(sql)查询存储在半导体制造系统的各种存储库(例如,关系数据库管理系统(rdbms)、数据仓库、hadoop分布式文件系统(hdfs)、文件等)中的数据,并周期性地(按月、按周、按天、按小时、按分钟或按秒)提取数据。
实时提取方法是预测单元140在数据被存储在相应的系统中(例如,在外部系统11、12、13的物理存储库中)之前,通过预关联的消息系统实时接收在半导体制造系统中生成的数据的方法。
4、训练数据的累积
由数据提取单元110提取的训练数据被累积在设置在数据提取单元110中的基于存储的存储库(例如,rdbms、数据仓库、hdfs、文件等)中。
另一方面,实时接收的用于半导体良率的预测的输入数据被累积在设置在预测单元140中的内存数据库(db)(in-memorydatabase)中。内存数据库db可按索引方法快速查询存储器块,并可获得数据。
5、数据的处理
数据由数据提取单元110和预测单元140处理以转换为适于被输入到神经网络模型的数据,并且数据处理可根据数据特性不同地执行。
具体地讲,在长时间段的时间序列数据的情况下,为了根据分析单位时间段来减小数据,可将所述数据处理为分析单位时间段的平均值。例如,一天生成的数百万设备数值可用一个平均值代替。
此外,关于类别数据,可获得针对所有类别的唯一集合,并且可组成具有与类别的数量一样多的列和与数据的数量一样多的行的0矩阵。然后,只有相应数据的行的相应列中的值可用1替换。
此外,关于数值数据,可将比例(scale)调节为范围从0到1或从-1到1的实数(浮点)值。比例调节可通过获得数据集的最小值和最大值,将最小值和最大值分别转换为0和1或-1和1,并根据比率转换其他值来实现。
6、通过学习数据生成/更新/存储神经网络模型
通过学习单元120的机器学习根据数据的类型分别地执行,并且根据结果数据的类型而生成/更新单独的神经网络模型。在下文中,将根据数据的类型描述用于生成/更新神经网络模型的方法。
6.1生产数据神经网络模型
学习单元120可通过将关于整个生产的历史数据(诸如,关于过程id、设备id、设备中的工作空间、设备工作规范id等的时间序列数据)作为原因值(x)而输入到生产数据神经网络模型131的输入节点,并通过使实际半导体制造良率值作为效果值(y)而位于生产数据神经网络模型131的输出节点处,来训练生产数据神经网络模型131。
作为用于训练生产数据神经网络模型131的神经网络处理技术,可使用能够处理时间序列数据的递归神经网络(rnn)的扩展形式(诸如,长短期记忆(lstm))。
图2示出生产数据神经网络模型131的结构的示例。
6.2设备数据神经网络模型
学习单元120可通过将由设备的内部/外部传感器测量的设备的时间序列操作/状态数据(诸如,设备操作时间、温度、压力、振动次数、特定材料的比率等)作为原因值(x)而输入到设备数据神经网络模型132的输入节点,并通过使实际半导体制造良率值作为效果值(y)而位于设备数据神经网络模型132的输出节点处,来训练设备数据神经网络模型132。
作为用于训练设备数据神经网络模型132的神经网络处理技术,可使用rnn的扩展形式(诸如,lstm)。
图3示出设备数据神经网络模型132的结构的示例。
6.3缺陷数据神经网络模型
学习单元120可通过将指示缺陷的数量、缺陷大小、缺陷位置、缺陷形状等的图像化缺陷数据作为原因值(x)而输入到缺陷数据神经网络模型133的输入节点,并通过使实际半导体制造良率值作为效果值(y)而位于缺陷数据神经网络模型133的输出节点处,来训练缺陷数据神经网络模型133。
作为用于训练缺陷数据神经网络模型133的神经网络处理技术,可使用能够处理图像数据的卷积神经网络(cnn)的扩展形式。
图4示出缺陷数据神经网络模型133的结构的示例。
6.4测量数据神经网络模型
学习单元120可通过将指示电路的线宽、厚度和未对准的图像化或时间序列测量数据作为原因值(x)而输入到测量数据神经网络模型134的输入节点,并通过使实际半导体制造良率值作为效果值(y)而位于测量数据神经网络模型134的输出节点处,来训练测量数据神经网络模型134。
作为用于训练测量数据神经网络模型134的神经网络处理技术,可使用能够处理图像数据的cnn的扩展形式,或者rnn的扩展形式(诸如,lstm)。
7、半导体制造良率的预测
外部系统11、12、13可将上述输入数据提供给半导体制造良率预测系统,并且可请求该系统预测半导体制造良率。在此,输入数据对应于输入到神经网络模型131、132、133、134的输入节点的原因值(x),并且包括生产相关的数据、设备相关的数据、质量数据和缺陷数据的全部/部分。
此外,由外部系统11、12、13提供的输入数据可仅包括每种类型数据的一部分。例如,由外部系统11、12、13提供的数据可仅包括生产相关的数据(关于过程id、设备id、设备中的工作空间、设备工作规范id等的数据)之中的关于过程id和设备id的数据。
由外部系统11、12、13提供的输入数据可累积在设置在预测单元140中的内存db中。
预测单元140输入在内存db中累积的输入数据作为神经网络模型131、132、133、134的原因值(x),并获得神经网络模型131、132、133、134的输出节点的效果值(y)。
预测单元140通过使用效果值(y)来预测半导体制造良率值。可由外部系统11、12、13提供两种或更多种类型的数据,因此可使用两个或更多个神经网络模型131、132、133、134,并且可获得两个或更多个效果值(y)。在这种情况下,预测单元140可通过将效果值进行套袋(bagging)或提升(boosting)来预测半导体制造良率值。
预测的半导体制造良率值从预测单元140返回到外部系统11、12、13。外部系统11、12、13是用于使半导体制造工艺自动化的系统,并且能够基于预测的半导体制造良率高效地实时管理该工艺。
具体地讲,由于可仅使用样本数据来预测整个制造良率,因此在半导体制造工艺中需要大量成本/时间的测量可被最少化。
8、集成的神经网络模型
图5是根据本公开的另一实施例的半导体制造良率预测系统的框图。根据本公开的实施例的半导体制造良率预测系统可包括神经网络模型集成单元150,其中,神经网络模型集成单元150用于处理/集成存储在存储单元130中的神经网络模型131、132、133、134,并生成单个集成的神经网络模型135。
神经网络模型集成单元150针对神经网络模型131、132、133、134中的每个选择与效果值(y)具有高相关性的原因值(x),并且生成通过输入节点接收选择的原因值(x)并输出效果值(y)的集成的神经网络模型135。
例如,假设以下情况:
1)生产数据神经网络模型131的原因值(x)之中的关于设备id和设备中的工作空间的值与作为效果值(y)的实际半导体制造良率值具有高相关性的情况;
2)设备数据神经网络模型132的原因值(x)之中的关于温度和压力的值与作为效果值(y)的实际半导体制造良率值具有高相关性的情况;
3)缺陷数据神经网络模型133的原因值(x)之中的关于缺陷大小和缺陷位置的值与作为效果值(y)的实际半导体制造良率值具有高相关性的情况;
4)测量数据神经网络模型134的原因值(x)之中的关于线宽和未对准的值与作为效果值(y)的实际半导体制造良率值具有高相关性的情况。
在这种情况下,神经网络模型集成单元150可生成如下的集成的神经网络模型135,并且可通过学习来更新集成的神经网络模型135,其中,所述集成的神经网络模型135通过输入节点接收关于设备id、设备中的工作空间、温度、压力、缺陷大小、缺陷位置、线宽和未对准的值作为原因值(x),并使作为半导体制造良率值的效果值(y)位于输出节点。
预测单元140可通过使用集成的神经网络模型135来预测半导体制造良率,并且还可通过综合地考虑集成的神经网络模型135和其他神经网络模型131、132、133、134,通过对来自神经网络模型131、132、133、134、135的全部/部分的效果值y进行套袋或提升来预测半导体制造良率值。
9、变化
到目前为止,已经参照优选实施例详细地描述了基于机器学习的半导体制造良率预测系统和方法。
在上述实施例中提到的数据和机器学习技术仅是示例,并且可用其他代替。
此外,半导体制造良率的预测仅是本公开的技术思想的实施例。除了半导体制造良率的预测之外,本公开的技术思想可应用于其他数据的预测。
本公开的技术思想可应用于记录用于执行根据本实施例的设备和方法的功能的计算机程序的计算机可读记录介质。此外,根据本公开的各种实施例的技术思想可以以记录在计算机可读记录介质上的计算机可读代码的形式实现。计算机可读记录介质可以是可由计算机读取并可存储数据的任何数据存储装置。例如,计算机可读记录介质可以是只读存储器(rom)、随机存取存储器(ram)、cd-rom、磁带、软盘、光盘、硬盘驱动器等。存储在计算机可读记录介质中的计算机可读代码或程序可经由连接在计算机之间的网络传输。
此外,虽然已经示出和描述了本公开的优选实施例,但是本公开不限于上述特定实施例。在不脱离权利要求中所要求保护的本公开的范围的情况下,本领域技术人员可进行各种改变,并且改变的实施例不应被理解为与本公开的技术思想或设想分离。