1.本发明光学与计算机结合领域,尤其涉及一种基于机器学习的光谱测量质量判定方法。
背景技术:2.光学散射测量方法,也称为ocd(optical critical dimension,光学关键尺寸)测量方法,其基本原理可以概括为:一束具有特殊偏振态的偏振光投射至待测样品表面,通过测量待测样品的衍射光,获得偏振光在反射前后偏振态的变化,进而从中提取出待测样品的结构参数,例如化学气相沉积等镀膜工艺中所获得的薄膜的厚度,以及光刻、刻蚀等工艺中所获得纳米光栅的线宽、线高、侧壁角等。
3.与扫描电子显微镜、原子力显微镜等微观形貌测量手段相比,光学散射测量技术具有速度快、成本低、无接触、非破坏等优点,因而在先进工艺在线监测领域获得了广泛应用。然而,扫描电子显微镜、原子力显微镜等测量手段可以直接获得待测样品微观形貌及结构参数,是一种“所见即所得”的测量手段;与之相反,光学散射测量技术获得的仅是一组关于入射波长或入射角度分布的光强信号及其他派生信号,如反射率、椭偏参数、穆勒矩阵等,需要通过一定的数据分析手段才能从测量信号中提取出样品待测结构参数。其主要方法有两种:
①
利用先验知识(如待测结构形貌、所用材料折射率等)针对待测结构建立对应的物理模型,通过非线性拟合等方法,调整物理模型中的参数,使得其对应的理论光谱与样品测量光谱之间的偏差最小。
②
直接使用实测的光谱数据通过神经网络或机器学习方法预测待测结构参数。第一类方法在参数拟合过程中需要反复求解物理模型,当待测结构较为复杂时,该方法的计算效率难以满足实际测量需求。与之相比,第二类方法可以直接实现从测量光谱到待测参数的映射,而不需要依赖物理模型的求解,因此在半导体结构越来越复杂化的发展趋势中,拥有越来越广阔的应用前景。
4.在第二类方法中,因其建模完全基于数学模型且一般情况下样本较少,因此其需要训练光谱与测试光谱的质量有一定保证。然而在半导体测量的实际应用过程中,其光谱质量会受到
①
测量光谱受噪声影响
②
测量结构参数存在较大差异性
③
测量样本存在缺陷点等诸多干扰因素的影响,导致其难以拟合出正确的测量结果,从而影响映射模型的训练质量与测试结果。而其为了提高计算效率,省去了物理建模过程,因此难以通过物理模型对光谱质量进行分析,从而增加了模型的不稳定性。甚至会出现低质量光谱难以拟合,从而导致其评测指标始终无法达到要求的情况。
技术实现要素:5.本发明针对现有技术中存在的技术问题,提供一种基于机器学习的光谱测量质量判定方法,将传统机器学习模型应用至光学精密测量领域,通过对数据的处理,在不需要光学模型的情况下即可对未知光谱和已知光谱的相似度进行判定,有效排除了光谱结构参数及噪声带来的异常光谱影响,从而可以对光谱测量质量进行分析。
6.根据本发明的第一方面,提供了一种基于机器学习的光谱测量质量判定方法,包括:步骤1,对光谱的特征数据进行降维处理得到降维后光谱特征数据;
7.步骤2,生成包含多个所述降维后光谱特征数据的训练集,对所述训练集中的各个数据点进行聚类模型训练,得到聚类模型及其包含的各个聚类的中心点;
8.步骤3,对待测光谱的特征数据进行降维处理,基于所述聚类模型对所述待测光谱进行分类得到分类结果,所述分类结果包括:所述待测光谱所属的聚类k、所述待测光谱到其所属聚类k的中心点的距离dk以及所述待测光谱所属聚类k的光谱的数量tk;
9.步骤4,基于所述待测光谱的分类结果对所述待测光谱的质量进行判定。
10.在上述技术方案的基础上,本发明还可以作出如下改进。
11.可选的,所述步骤1中对所述光谱进行pca降维处理。
12.可选的,所述步骤1包括:
13.步骤101,对所述光谱特征进行标准化处理,生成标准化后的光谱特征向量;
14.步骤102,计算光谱特征向量的各维特征之间的协方差矩阵c;
15.步骤103,求解所述协方差矩阵c的特征值入及对应的特征向量u,将值最大的k个所述特征值入对应的特征向量u组成特征平面;
16.步骤104,将所述光谱特征向量投影到所述特征平面,得到降维后的所述光谱特征。
17.可选的,所述步骤2中对所述训练集中各个数据点进行mean-shift聚类模型训练。
18.可选的,所述步骤2包括:
19.步骤201,估算得到所述训练集的带宽距离d;所述带宽距离d为所述训练集中任意点到临近点的距离的均值;
20.步骤202,在所述训练集中随机选择n个点作为n个聚类的起始中心点,n为远小于所述训练集中样本个数n的随机参数,所述中心点集合记为c=[c1,c2,...cn];
[0021]
步骤203,将以任意所述中心点ck为中心、半径为d的区域中出现的所有数据点,归为聚类集合mk;1≤k≤n;
[0022]
步骤204,以所述中心点ck为中心点,计算所述中心点ck到所述聚类集合mk中每个数据点的向量之和,得到偏移向量sk;
[0023]
步骤205,将所述中心点ck沿着所述偏移向量sk的方向移动,得到新的中心点c_newk=ck+sk;
[0024]
步骤206,重复步骤203-205,所述偏移向量sk小于设定阈值时判定迭代收敛;若迭代过程中两个所述中心点的距离小于半径d,则将所述两个中心点合并,并将两个中心点所属的两个所述聚类集合合并,形成新的聚类与中心点并继续迭代;
[0025]
步骤207,重复步骤206直到所有的所述聚类集合都收敛。
[0026]
可选的,所述步骤201包括:
[0027]
步骤20101,随机打乱所述训练集中各个数据点的顺序,对所述训练集中的数据点进行按比例的采样,采样数量为n;
[0028]
步骤20102,通过knn算法找到各个所述数据点最近的k临近点;
[0029]
步骤20103,记录每个数据点的k临近点中距离最远的点,并记录其距离集合d=[d1,d2,...dn];
[0030]
步骤20104,计算所述集合d的均值为带宽距离
[0031]
可选的,所述步骤4还包括:根据所述待测光谱与所述训练集中的光谱的交叉熵判断其之间的分布相似性,根据所述分布相似性判断所述待测光谱的训练结果的可信度。
[0032]
可选的,所述交叉熵的计算公式为:
[0033]
h(train,test)=-∑k(t_traink*log(t_testk)+(1-t_traink)*log(1-t_testk));
[0034]
其中,tk′
表示所述训练集中任意分类k的光谱的数量,t
train
=[t_train1,t_train2,...,t_traink]表示所述训练集的光谱中所有分类的分布;
[0035]
t
test
=[t_test1,t_test2,...,t_testk]表示所述待测光谱中所有分类的分布。
[0036]
可选的,所述步骤4中对所述待测光谱的质量进行判定的过程包括:
[0037]
计算所述待测光谱的离散距离分数其中dk为光谱距离;
[0038]
其中,
[0039]
根据所述离散距离分数判定所述待测光谱的质量。
[0040]
可选的,所述步骤4还包括:
[0041]
将所述离散距离分数s转换为0-1的分数区间。
[0042]
本发明提供的一种基于机器学习的光谱测量质量判定方法,利用聚类算法的特点,通过对光谱进行非监督学习,在高维空间中建立多个中心点与分类距离,有效完成了光谱的自适应打分。该方法对比传统物理模型方法,具有高效快速且不依赖于物理建模的特点,有效利用光谱特点完成其测量质量判定。
附图说明
[0043]
图1为本发明提供的一种基于机器学习的光谱测量质量判定方法的流程图。
具体实施方式
[0044]
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0045]
图1为本发明实施例提供的一种基于机器学习的光谱测量质量判定方法的流程图,如图1所示,该判定方法包括:
[0046]
步骤1,对光谱的特征数据进行降维处理得到降维后光谱特征数据。
[0047]
步骤2,生成包含多个降维后光谱特征数据的训练集,对训练集中的各个数据点进行聚类模型训练,得到聚类模型及其包含的各个聚类的中心点。
[0048]
步骤3,对待测光谱的特征数据进行降维处理,基于聚类模型对待测光谱进行分类得到分类结果,分类结果包括:待测光谱所属的聚类k、待测光谱到其所属聚类k的中心点的距离dk以及待测光谱所属聚类k的光谱的数量tk。
[0049]
步骤4,基于待测光谱的分类结果对待测光谱的质量进行判定。
[0050]
本发明实施例提供的一种基于机器学习的光谱测量质量判定方法,对光谱进行降维处理,利用聚类方法对训练光谱的进行建模,通过模型对测试光谱的质量进行分数评价;将传统机器学习模型应用至光学精密测量领域,通过对数据的处理,在不需要光学模型的情况下即可对未知光谱和已知光谱的相似度进行判定,有效排除了光谱结构参数及噪声带来的异常光谱影响,从而可以对光谱测量质量进行分析。
[0051]
实施例1
[0052]
本发明提供的实施例1为本发明提供的一种基于机器学习的光谱测量质量判定方法的实施例,结合图1可知,该判定方法的实施例包括:
[0053]
步骤1,对光谱的特征数据进行降维处理得到降维后光谱特征数据。
[0054]
在一种可能的实施例方式中,步骤1中对光谱进行pca(principle component analysis,主成分分析)降维处理。
[0055]
pca降维是一种常见的将高维度空间数据转化为低维度空间数据的方法。其核心思想在于通过正交变换,将一组可能存在相关性的变量转换为一组线性不相关的变量,从而消除高维数据中的冗余信息,使得在光谱在低维空间中信息损失最小。
[0056]
在一种可能的实施例方式中,步骤1包括:
[0057]
步骤101,对光谱特征进行标准化处理,生成标准化后的光谱特征向量。
[0058]
具体实施中,标准化后的光谱特征向量为
[0059]
其中,s为光谱特征。测量获得的光谱记为n*m的光谱s=[s1,s2,...,sm],其中n为光谱数量,m为每条光谱的特征个数,其在第n样本的第m维度值可表示为其中1≤n≤n,1≤m≤m。
[0060]
为每个光谱特征的平均值生成的平均向量。其中
[0061]
代表叉积。[1,1,...1]
t
为n维标准向量。
[0062]
步骤102,计算光谱特征向量的各维特征之间的协方差矩阵c。
[0063]
具体实施中,协方差矩阵c为可通过协方差矩阵定义获得:
[0064][0065]
其中为向量的m维特征。其两两之间的协方差计算公式为其中1≤j≤m,1≤i≤m。
[0066]
步骤103,求解协方差矩阵c的特征值λ及对应的特征向量u,将值最大的k个特征值λ对应的特征向量u组成特征平面。
[0067]
具体实施中,求解协方差矩阵c的特征值λ及对应的特征向量u可表示为:
[0068]
cu=λu
[0069]
其中,特征值λ数量与光谱维度m相同,每一个特征向量对应一个u值。将特征值λ从
大到小依次排列,取前k特征值及对应特征向量[(λ1,u1),(λ2,u2),...,(λk,uk)],组成特征平面uk=[u1,u2,...,uk]。
[0070]
步骤104,将光谱特征向量投影到特征平面,得到降维后的光谱特征。
[0071]
将原向量投影至特征向量平面uk上,即得到降维后的向量s_new=[s_new1,s_new2,...,s_newk],其计算公式为其中1≤k≤k,1≤n≤n。
[0072]
通过pca降维,将原光谱数据中的高维度m,降低至低维度k,同时尽量保留其原光谱中信息,即通过取特征向量中前k维度进行筛选并投影,从而完成快速高效的光谱降维过程。
[0073]
步骤2,生成包含多个降维后光谱特征数据的训练集,对训练集中的各个数据点进行聚类模型训练,得到聚类模型及其包含的各个聚类的中心点。
[0074]
在一种可能的实施例方式中,步骤2中对训练集中各个数据点进行mean-shift(均值漂移)聚类模型训练。
[0075]
mean-shift是基于密度的非参数聚类算法。其算法思想是通过更新聚类内部中心点的位置,重新对数据集进行过滤与分类,直到最终形成稳定的聚类中心及标签。
[0076]
在一种可能的实施例方式中,步骤2包括:
[0077]
步骤201,估算得到训练集的带宽距离d;带宽距离d为训练集中任意点到临近点的距离的均值。
[0078]
带宽距离d表示数据点之间的离散程度。其值越大,则表示数据点分布更为离散;其值越小,则表示数据点分布更为紧密。通过有效估计样本之间点到点的平均距离d,并以此为依据,进行mean-shift聚类模型训练。
[0079]
光谱集合为x=[x1,x2,...xn],n为样本数量,xn为pca处理后的低维度特征,其带宽距离为d。mean-shift步骤可分为:
[0080]
在一种可能的实施例方式中,步骤201包括:
[0081]
步骤20101,随机打乱训练集中各个数据点的顺序,对训练集中的数据点进行按比例的采样,记录采样数量为n。
[0082]
步骤20102,通过knn算法找到各个数据点最近的k临近点。
[0083]
步骤20103,记录每个数据点的k临近点中距离最远的点,并记录其距离集合d=[d1,d2,...dn]。
[0084]
步骤20104,计算集合d的均值为带宽距离
[0085]
步骤202,在训练集中随机选择n个点作为n个聚类的起始中心点,n为远小于训练集中样本个数n的随机参数,中心点集合记为c=[c1,c2,...cn]。
[0086]
步骤203,将以任意中心点ck为中心、半径为d的区域中出现的所有数据点,归为聚类集合mk;将在聚类集合mk中数据点的访问频率加1;1≤k≤n。
[0087]
步骤204,以中心点ck为中心点,计算中心点ck到聚类集合mk中每个数据点的向量之和,得到偏移向量sk。
[0088]
步骤205,将中心点ck沿着偏移向量sk的方向移动,得到新的中心点c_newk=ck+sk。
[0089]
步骤206,重复步骤203-205,偏移向量sk小于设定阈值时判定迭代收敛;若迭代过
程中两个中心点的距离小于半径d,则将两个中心点合并,并将两个中心点所属的两个聚类集合合并,形成新的聚类与中心点并继续迭代。
[0090]
步骤207,重复步骤206直到所有的聚类集合都收敛。
[0091]
根据mean-shift算法,训练集可被划分为k类,中心点集合为c=[c1,c2,...ck],记录其每类数量为集合t=[t1,t2,...tk]。保存数据模型作为训练结果。
[0092]
步骤3,对待测光谱的特征数据进行降维处理,基于聚类模型对待测光谱进行分类得到分类结果,分类结果包括:待测光谱所属的聚类k、待测光谱到其所属聚类k的中心点的距离dk以及待测光谱所属聚类k的光谱的数量tk。
[0093]
对于待测光谱test=[test1,test2,...,testn]中的任意一条样本testi,先通过步骤1将其转化为低维度向量test_newi=[s_test1,s_test2,...,s_testk],之后计算其与步骤2中所有中心集合c的距离d=[d1,d2,...dk],取其中最小值dk,视为其属于第k类。提取训练集中第k类的集合数量tk。
[0094]
通过该方法,对任意样本testi,均可得到其分类k,并获得其距离dk及分类数量tk。
[0095]
步骤4,基于待测光谱的分类结果对待测光谱的质量进行判定。
[0096]
根据步骤3得到的结果,作为其光谱质量分析的结果。光谱质量可从宏观和微观两个角度进行分析。
[0097]
宏观即分析训练光谱与测试光谱分布的相似性,其标准为训练光谱与测试光谱之间的分布相似度,即通过交叉熵(cross-entropy)计算其聚类后不同类别在整体光谱中的比例。交叉熵主要是用来衡量实际的输出与期望的输出的接近程度,其值h越小,表明测试光谱与训练光谱分布越接近。其值越大,表明测试光谱与训练光谱分布区别较大,其机器学习模型训练结果可能会不理想。
[0098]
微观考量即评价单个光谱与训练集结果是否接近。
[0099]
具体的,在一种可能的实施例方式中,步骤4还包括:根据待测光谱与训练集中的光谱的交叉熵判断其之间的分布相似性,根据分布相似性判断待测光谱的训练结果的可信度。
[0100]
在一种可能的实施例方式中,交叉熵的计算公式为:
[0101]
h(train,test)=-∑k(t_traink*log(t_testk)+(1-t_traink)*log(1-t_testk))。
[0102]
其中,tk′
表示训练集中任意分类k的光谱的数量,t
train
=[t_train1,t_train2,...,t_traink]表示训练集的光谱中所有分类的分布。
[0103]
t
test
=[t_test1,t_test2,...,t_testk]表示待测光谱中所有分类的分布。
[0104]
在一种可能的实施例方式中,步骤4中对待测光谱的质量进行判定的过程包括:
[0105]
计算待测光谱的离散距离分数其中dk为光谱距离。
[0106]
其中,
[0107]
根据离散距离分数判定待测光谱的质量。
[0108]
离散距离分数是为了衡量分类距离与原本距离,计算离散距离分数s的公式理论
依据为:
[0109]
以训练集的bandwidth值d为基准,在此基础上,测试距离dk越大,则认为其与训练光谱得到的中心点越远,其离散距离分数越低;bandwidth值d越大,则认为训练光谱数据本身较为稀疏,其测试距离较大也可以容忍。反之,bandwidth值d越小,则对测试距离的要求也越高。其中也越高。其中即考虑对于训练光谱分类中较少的类别,其光谱不常见,因而予以惩罚因子。因其label_factor较低,则对测试集中相应类别的光谱距离dk值,也需较低才能得到高的离散距离分数。
[0110]
在一种可能的实施例方式中,步骤4还包括:
[0111]
将离散距离分数s转换为0-1的分数区间。
[0112]
具体实施中,将离散距离分数转化为具体分数,转换公式可以为sigmod公式,以便统一评价标准,给予更清晰直观的分数对比。
[0113]
其中高于0.8分可认为高质量光谱,在0.5-0.8分之间认为中等质量光谱,在0.5分以下认为其为低质量光谱。
[0114]
本发明实施例提供的一种基于机器学习的光谱测量质量判定方法,利用聚类算法的特点,通过对光谱进行非监督学习,在高维空间中建立多个中心点与分类距离,有效完成了光谱的自适应打分。该方法对比传统物理模型方法,具有高效快速且不依赖于物理建模的特点,有效利用光谱特点完成其测量质量判定。
[0115]
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
[0116]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0117]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0118]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0119]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0120]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0121]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。