一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法
【技术领域】
1.本发明涉及半导体化学机械抛光工艺技术领域,具体涉及一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法。
背景技术:2.随着集成电路半导体制造工艺进入到深亚微米(通常把0.35
‑
0.8μm及其以下称为亚微米级,0.25um及其以下称为深亚微米)阶段,电路的特征尺寸进一步减小,制造过程中的工艺偏差程度日益严重,大大影响了芯片的性能与成品率。其中化学机械抛光(cmp)作为实现芯片表面的高度平坦化的关键技术,主要通过打磨抛光垫和硅片之间的机械力作用以及研磨液的化学作用来实现芯片表面形貌的平坦化。然而在平坦化过程中,由于化学机械抛光工艺下各工艺参数以及版图设计模式的不同的影响,芯片表面不同的位置的高度相互存在巨大的差异,存在碟形缺陷和侵蚀的现象,导致后续光刻过程中产生聚焦困难,造成光刻分辨率下降,影响芯片的性能以及成品率。因此需要建立一个化学机械抛光芯片表面高度预测模型来预测打磨后芯片表面的平整度,连接设计和制造的桥梁从而提高芯片的成品率。
3.现有的化学机械抛光芯片表面高度预测模型建模主要采用经验模型和物理机理模型。其中物理模型主要通过研究抛光垫,研磨液和硅片之间的相互作用来计算芯片表面高度。然而对于大规模的集成电路芯片来说,物理模型所需要耗费的时间和计算资源过于庞大,是不可接受的。因此学术界或者工业界往往采用经验模型或者半经验模型,通过抛光实验以及理论研究确定部分工艺参数的解析表达式,从而减少计算量提高计算速度。然而这类模型的经验公式忽略了部分参数,随着工艺的飞速发展,很难满足新工艺的精度要求,此外该类经验模型的开发依赖于大量的抛光实验。然而大量的抛光实验需要较长的时间周期以及极其高昂的研发成本。因此建立一个快速且精确的化学机械抛光芯片表面高度预测模型十分必要。
4.深度学习在现代工业以及自动化设计领域的大规模应用,使得深度学习与集成电路的结合越发紧密,为化学机械抛光芯片表面高度预测模型的建立带来了新的机遇与挑战。由于深度学习是一个数据驱动的过程,建立一个精确且鲁棒性高的化学机械抛光芯片表面高度预测模型需要大量的实验数据,通常需要设计一个专门的测试芯片来获取实验数据,然而设计一个与实际版图相似的测试芯片耗时耗力。此外不同电路类型的版图特征,单一的模型难以不同的电路类型版图中取得精确的预测结果。并且随着制造工艺的不断进步,化学机械抛光的工艺参数也在不断变化,迁移学习的方法能通过冻结部分参数的形式将已生成模型在新的数据集上进行在训练,能够有效利用历史数据,有效避免过拟合问题,提高预测精度,加快建模速度。
5.迁移学习是一种机器学习方法,就是把为任务a开发的模型作为初始点,重新使用在为任务b开发模型的过程中,迁移学习(transfer learning)顾名思义就是把已训练好的
模型参数迁移到新的模型来帮助新模型训练,从相关领域中迁移标注数据或者知识结构、完成或改进目标领域或任务的学习效果。迁移学习利用数据,任务或模型之间的相似性,将在旧域中学习的模型应用于新域。迁移学习中有两个基本概念:域和任务。域由两部分组成:不同的特征空间和不同的边际分布。通常我们用d表示域,用p表示概率分布。通常,如果两个域不同,则它们可能具有不同的特征空间或不同的边际分布。迁移对应于两个基本域:源域和目标域。源域是具有知识和大量数据注释的域,这是要迁移的对象。目标域是最终想要提供知识和注释的对象。从源域到目标域的传输完成了迁移任务。
6.卷积神经网络(convolutional neural networks,cnn)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。深度前馈网络(deep feedforward network,dfn),也叫作前馈神经网络(feedforward neural network)或者多层感知机(multilayer perceptron,mlp)。激活函数,英文activation function,实现神经元的输入和输出之间非线性化。激活函数用于将非线性引入模型,从而允许深度学习模型学习非线性预测边界。最常用的激活函数类型sigmoid、logistic、tanh(双曲正切)或relu(修正线性单元)。在训练模型时,可以基于梯度使用不同的优化器(optimizer,或者称为“优化算法”)来最小化损失函数。数据归一化问题是数据挖掘中特征向量表达时的重要问题,当不同的特征成列在一起的时候,由于特征本身表达方式的原因而导致在绝对数值上的小数据被大数据“吃掉”的情况,这个时候需要做的就是对抽取出来的features vector进行归一化处理,以保证每个特征被分类器平等对待。
7.本发明利用大数据和人工智能算法对化学机械抛光芯片表面高度预测模型建模方法进行了改进。
技术实现要素:8.本发明的目的是,提出一种适应工艺参数变化以及电路种类差异、通用性强的化学机械抛光芯片表面高度预测模型建模方法。
9.为实现上述目的,本发明采取的技术方案是一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,包括以下步骤:
10.s1、基于eda工具采集测试芯片化学机械抛光仿真后数据,获取样本数据集;
11.s2、对样本数据集进行数据预处理,并将其划分为训练集、验证集及测试集;
12.s3、设计基于神经网络的化学机械抛光芯片表面高度预测模型,输入训练集训练化学机械抛光芯片表面高度预测模型,输入验证集和测试集对化学机械抛光芯片表面高度预测模型进行超参数调整验证与测试;
13.s4、再次执行步骤s1
‑
s2,建立新的数据集作为目标域数据集;
14.s5、基于已训练好的化学机械抛光芯片表面高度预测模型以及目标域数据集进行迁移学习,依据迁移学习得到的化学机械抛光芯片表面高度预测模型在目标域数据集上的表现选择最佳迁移学习方案,首先冻结化学机械抛光芯片表面高度预测模型的部分层、激活化学机械抛光芯片表面高度预测模型的其他层,然后基于已训练好的模型结合目标域数据集进行超参数调整再训练,生成新的化学机械抛光芯片表面高度预测模型。
15.优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,还包括以下步骤:
16.s6、使用新的化学机械抛光芯片表面高度预测模型模型进行化学机械抛光芯片表面高度预测。
17.优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,步骤s1中:所述测试芯片是包含模拟电路、数字电路以及存储电路的混合电路芯片。
18.优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,步骤s1:首先将测试芯片版图切分为均匀大小的子版图,然后利用eda工具对切分好的子版图进行化学机械抛光仿真得到各子版图的表面高度作为参考值,并对各子版图进行图片化处理、以及密度计算,获得样本数据集。
19.优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,步骤s2所述数据预处理包括如下步骤:
20.s11、首先将样本数据集全部样本根据表面高度划分为若干个区间,计算每个区间的样本数;
21.s12、根据设定的每个区间样本数平均值进行选择性下采样,得到表面高度分布相对平衡的数据集;
22.s13、将表面高度分布相对平衡的数据集划分为训练集、验证集和测试集。
23.优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,步骤s3:所述基于神经网络的化学机械抛光芯片表面高度预测模型是基于卷积神经网络的多输入模型,所述基于卷积神经网络的多输入模型前向传递方向包括若干交替的卷积层和池化层构成的特征提取网络、以及若干全连接层构成的回归网络;所述输入训练集训练化学机械抛光芯片表面高度预测模型是指,由训练集数据x沿所述基于卷积神经网络的多输入模型前向传递得到化学机械抛光芯片表面高度预测值y
′
=g(θ,x),g函数为模型的前向传递函数;然后使用均方根误差rmse计算化学机械抛光芯片表面高度预测值y
′
与真实值y之间的误差,均方根误差rmse的计算公式为:
[0024][0025]
式中m为训练集的样本数,y
i
为训练集中第i个样本的真实值,y
i
′
表示训练集中第i个样本的预测值;最后通过梯度下降算法,逆向反馈更新化学机械抛光芯片表面高度预测模型的权重系数,直至误差收敛,梯度下降算法的计算公式为:
[0026][0027]
式中:=表示该符号右侧的值更新左侧的值,α表示学习率,j(θ)为损失函数即均方根误差rmse。
[0028]
优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,步骤s4:所述目标域数据集是包含不同的化学机械抛光工艺参数对应的目标域数据集,或者单一特定电路类型对应的目标域数据集。
[0029]
优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,所述单一特定电路类型是指模拟电路、数字电路或者存储电路。
[0030]
优选地,上述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方
法,步骤s5:根据化学机械抛光芯片表面高度预测模型在目标域数据集的训练集上的均方根误差rmse,来选择在目标域数据集表现最优的最佳迁移学习方案;所述均方根误差rmse的计算公式为:
[0031][0032]
式中m为训练集的样本数,y
i
为训练集中第i个样本的真实值,y
i
′
表示训练集中第i个样本的预测值。
[0033]
本发明一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法有如下有益效果:1、采用包含模拟电路,数字电路以及存储电路的混合电路芯片作为测试芯片生成数据集,采用选择性下采样的数据预处理方法解决数据分布不平衡的问题,能够有效提高模型的预测精度;2、提供的计算化学机械抛光后芯片表面高度的神经网络模型能够显著减少运行时间,提高预测精度;3、采用迁移学习来解决化学机械抛光工艺参数变化以及不同类型的电路特征差异造成的化学机械抛光芯片表面高度预测模型通用性问题,迁移学习可以更好地利用在源域学到的特征并迁移到目标域中,加快目标域模型的收敛速度,得到更加精确的预测值。综上,针对化学机械抛光工艺的变化以及不同电路类型的特征差异,提出一种快速且精确的可迁移的化学机械抛光芯片表面高度预测模型建模方法,进一步提高现有的化学机械抛光芯片表面高度预测模型建模方法的速度与精度,对芯片表面高度进行准确预测。
【附图说明】
[0034]
图1是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法迁移学习流程示意图。
[0035]
图2是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法数据采集流程图。
[0036]
图3是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法采用的基于神经网络的多输入化学机械抛光芯片表面高度预测模型框架图。
[0037]
图4是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法迁移学习方案示意图。
[0038]
图5是基于训练好的本发明化学机械抛光芯片表面高度预测模型进行全芯片化学机械抛光仿真流程示意图。
[0039]
图6是eda工具与基于训练好的本发明化学机械抛光芯片表面高度预测模型全芯片化学机械抛光仿真结果对比图。
【具体实施方式】
[0040]
下面结合实施例并参照附图对本发明作进一步描述。
[0041]
实施例1
[0042]
本实施例实现一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法。
[0043]
图1是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法迁移学习流程示意图。如附图1所示,本实施例一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法,其迁移学习的流程具体包括如下步骤:
[0044]
s1、数据采集:准备测试芯片,采集测试芯片化学机械抛光后的仿真数据。
[0045]
所述测试芯片在本实施例中采用了包含模拟电路,数字电路以及存储器电路的混合信号商业芯片。图2是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法数据采集流程图。如附图2所示,本实施例一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法其数据采集的具体流程,首先将测试芯片版图切分为均匀大小的子版图,然后利用商业化eda工具对切分好的子版图进行化学机械抛光仿真得到各子版图的表面高度作为参考值,并对各子版图进行图片化处理以及密度计算,获得样本数据。
[0046]
s2、数据预处理:对采集到的仿真数据进行数据预处理,建立源域数据集,并划分训练集,验证集和测试集。
[0047]
其中数据预处理主要针对测试芯片存在表面高度分布不平衡的情况,创新性地提出了选择性下采样进行数据平衡。首先将数据集全部样本根据表面高度划分为若干个区间,计算每个区间的样本数。然后根据所设定的每个区间样本数平均值进行选择性下采样,得到数据分布相对平衡的数据集。然后将平衡后的数据集划分为训练集,验证集和测试集。对于一个样值序列间隔几个样值取样一次,这样得到新序列就是原序列的下采样。
[0048]
s3、设计特定的基于神经网络的化学机械抛光芯片表面高度预测模型,输入训练集进行模型的训练、输入验证集和测试集对芯片表面高度预测模型进行验证与测试。
[0049]
图3是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法采用的基于神经网络的多输入化学机械抛光芯片表面高度预测模型框架图。如附图3所示,本实施一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法基于神经网络的化学机械抛光芯片表面高度预测模型采用了多输入的卷积神经网络,包括特征提取网络进行特征提取、以及回归网络进行回归预测。训练数据x沿多输入的卷积神经网络模型前向传递得到表面高度预测值y
′
=g(θ,x),其中g函数为模型的前向传递函数。使用均方根误差rmse计算预测值y
′
与真实值y之间的误差,均方根误差rmse的计算公式为:
[0050][0051]
式中m为训练集的样本数,y
i
为训练集中第i个样本的真实值,y
i
′
表示训练集中第i个样本的预测值。
[0052]
然后通过梯度下降算法(梯度下降法简单来说就是一种寻找目标函数最小化的方法),逆向反馈更新模型的权重系数,直至误差收敛,梯度下降算法的计算公式为:
[0053][0054]
式中:=表示该符号右侧的值更新左侧的值,α表示学习率,j(θ)为损失函数即均
方根误差rmse。
[0055]
s4、再次执行步骤s1
‑
s2,得到不同的化学机械抛光工艺参数下芯片表面高度仿真结果,建立新的数据集作为目标域数据集。
[0056]
s5、建立目标域的化学机械抛光芯片表面高度预测模型。图4是一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法迁移学习方案示意图。如附图4所示,本实施例一种基于迁移学习的不同工艺参数化学机械抛光芯片表面高度预测模型建模方法首先通过调节冻结层数来探索最佳的迁移学习方案;然后根据最佳迁移学习方案,基于源域化学机械抛光芯片表面高度预测模型结合目标域数据集进行微调层模型调参,来生成新的工艺参数下对应的新的化学机械抛光芯片表面高度预测模型。
[0057]
实施例2
[0058]
本实施例实现一种基于迁移学习的特定电路类型化学机械抛光芯片表面高度预测模型建模方法。
[0059]
t1、本实施例一种基于迁移学习的特定电路类型化学机械抛光芯片表面高度预测模型建模方法基于实施例1步骤s1
‑
s3,采用含有模拟电路、数字电路以及存储电路的混合信号商业芯片作为测试芯片建立源域数据集,通过训练集以及验证集进行模型训练及超参数调整,得到源域的化学机械抛光芯片表面高度预测模型,并用测试集对训练好的模型预测效果进行评价。
[0060]
t2、建立目标域数据集,根据实施例1中步骤s1
‑
s2,采用不同电路类型的测试芯片,分别建立模拟电路、数字电路以及存储电路的目标域数据集。
[0061]
t2、通过迁移学习建立不同电路类型所对应的化学机械抛光芯片表面高度预测模型。
[0062]
首先确定好最佳迁移学习方案,然后根据最佳学习方案进行模型冻结,基于已训练好的模型结合各电路类型的目标数据集进行再训练,根据验证集进行模型调参,生成不同电路类型对应的新的化学机械抛光芯片表面高度预测模型,最后在测试集上对模型的预测效果进行评价。
[0063]
实施例1或者实施例2所述的一种基于迁移学习的化学机械抛光芯片表面高度预测模型建模方法,包括化学机械抛光仿真数据采集,对数据进行数据预处理,建立源域数据集;利用设计的神经网络模型基于源域数据集进行模型训练,建立源域化学机械抛光芯片表面高度预测模型;然后基于不同的化学机械抛光工艺参数或者不同类型的电路建立目标域数据集,并利用迁移学习的方法,生成目标域化学机械抛光芯片表面高度预测模型。以下基于训练好的实施例1或者实施例2的化学机械抛光芯片表面高度预测模型进行全芯片仿真。
[0064]
图5是基于训练好的本发明化学机械抛光芯片表面高度预测模型进行全芯片化学机械抛光仿真流程示意图。如附图5所示,基于训练好的本发明化学机械抛光芯片表面高度预测模型进行全芯片化学机械抛光仿真流程首先进行版图切分,然后对各子版图进行二值化处理并计算版图的密度,然后将生成二值化版图图片以及密度作为输入,基于训练好的化学机械抛光芯片表面高度预测模型进行表面高度预测,得到全芯片表面高度的仿真结果。
[0065]
图6是eda工具与基于训练好的本发明化学机械抛光芯片表面高度预测模型全芯
片化学机械抛光仿真结果对比图。如附图6所示,最后对该芯片化学机械抛光芯片表面高度预测模型表面高度预测结果进行可视化,进行eda工具的仿真结果与基于训练好的本发明化学机械抛光芯片表面高度预测模型的仿真结果在一张对比图上显示,进行直观的、可视化的对比。
[0066]
本领域普通技术人员可以理解,实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read
‑
only memory,rom)或随机存储记忆体(random acess memory,ram)等。
[0067]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。