![一种基于半导体器件结构的小空间模型实时训练方法](https://img.xjishu.com/img/zl/2023/2/3/bwey4a9pm.jpg)
1.本发明属于半导体器件电学特性预测领域,尤其涉及一种基于半导体器件结构的小空间模型实时训练方法。
背景技术:2.半导体器件在家用器件、电源、照明、通信、汽车电子等领域得到广泛的应用,其电学性能的预测是器件设计重要的环节。目前,半导体器件电学性能的获取主要依赖于计算机辅助设计工具(technology computer aided design,简称tcad),其主要通过有限元/有限差分法求解半导体方程组来获取器件的电学性能,但存在仿真时间长、收敛性差等问题。近年来,机器学习算法通过学习输入结构参数与输出电学性能之间的关系建立智能的预测模型,该方法构建的模型精度高、速度快且完全不存在收敛性问题。对于机器学习模型而言,数据的质量是高精度模型构建的基础。目前的方法通常是针对该模型的建立依赖于大量的数据,有如下不足仍待改进:1、对于机器学习模型的构建过程,其通常采用所有数据进行模型训练,模型训练周期长,且模型复杂度较高。
3.2、由于数据涵盖范围过大,对于某一特定测试结构,可能存在局部测试精准度不高的问题。
技术实现要素:4.发明目的:本发明的目的在于提供一种基于半导体器件结构的小空间模型实时训练方法,该方法利用小空间数据实时构建机器学习模型,模型构建时间短且精准度更高。
5.技术方案:本发明的基于半导体器件结构的小空间模型实时训练方法,包括如下步骤:步骤1:确定目标半导体器件结构,将其输入至边缘端数据库和云端数据库,获取目标半导体器件结构每个参数的数值为;步骤2:基于相似性,根据上述目标半导体器件结构每个参数的数值x预设阈值,在云端数据库中筛选出阈值内的小空间训练样本数据集;步骤3:将小空间样本数据集传输至边缘计算设备,利用机器学习算法,建立基于小空间样本数据集的机器学习预测模型;步骤4:将步骤1中的目标半导体器件结构每个参数的数值x输入步骤3中的机器学习预测模型,进一步的,步骤1中,所述目标半导体器件的类型为nmos、pmos、场效应晶体管、高迁移率晶体管、igbt或finfet纳米器件,所述目标半导体器件结构的参数包括器件结构参数和工艺参数。
6.进一步的,所述步骤2具体包括:步骤21:通过相似性函数计算云端数据库内已存数据点与已知结构的相似度γ;
步骤22:设置相似度阈值δ以及小空间训练数据量阈值n;步骤23:当γ大于δ时,获取该阈值空间内数据总量m;步骤24:当m大于n时,由大至小选取n个数据,将该数据加入小空间训练数据集;否则将m个数据作为小空间训练样本。
7.进一步的,步骤21中,所述相似性函数为高斯核函数、欧氏距离、夹角余弦、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、马氏距离、汉明距离、杰卡德相似系数、杰卡德距离、相关系数、相关距离、兰氏距离、斜交空间距离、指数相似系数、非参数化相似度或信息熵中的一种。
8.进一步的,所述相似度阈值δ包括下阈值和上阈值,获取自动筛选空间内样本数据,当设计阈值的大小小于样本空间时,其为局部区域;当其大于样本空间时,其涵盖整个样本空间。
9.进一步的,步骤3中,所述机器学习算法包括监督算法、半监督算法和无监督学习算法。
10.进一步的,所述监督算法包括高斯过程回归、深度神经网络、支持向量机、线性回归、逻辑回归、lasso回归和cart回归树中的一种或组合。
11.进一步的,所述通过监督算法来建立基于小空间样本数据集的机器学习预测模型包括如下步骤:步骤31、确定符合目标半导体器件模型输入规范的数据集;步骤32、确定数据集中与目标相关的特征项;步骤33、通过数据预处理方法,对特征项进行数据预处理,而后构建基于特征项的模型输入标准数据集;步骤34、基于上述标准数据集,构建特征项与目标值之间的机器学习预测模型。
12.有益效果:与现有技术相比,本发明具有如下显著优点:1、本发明通过边缘计算对小范围样本数据构建机器学习预测模型,对计算资源要求低,模型训练速度快、安全性高。
13.2、本发明基于器件结构,利用器件结构阈值空间内的小样本进行实时电学性能预测模型的构建,模型构建精准度更高。
14.3、本发明提出设计阈值,通过控制阈值的数值来控制模型训练的空间,模型构建灵活度更高。
附图说明
15.图1为本发明基于半导体器件结构小空间模型实时训练方法流程图;图2为本发明实施例中绝缘衬底上的硅(silicon-on-insulator,简写soi)横向扩散金属氧化物半导体(lateral double-diffused metal oxide semiconductor,ldmos)的结构示意图。
具体实施方式
16.下面结合附图和具体实施例对本发明做进一步详细说明。对功率器件典型实例即soi ldmos小空间电学性能预测模型进行构建的结果。
17.图2给出了soi ldmos的结构示意图,1为具有第二导电类型的重掺杂区,2为具有第二导电类型的顶层硅漂移区,3为具有第一导电类型的沟道区,4为具有第二导电类型的重掺杂区,5为具有第一导电类型的重掺杂区,6为绝缘埋层,7为衬底。
18.如图1所示,本发明的基于半导体器件结构的小空间模型实时训练方法,包括如下步骤:步骤1:确定目标半导体器件结构,将其输入至云端数据库,获取目标半导体器件结构每个参数的数值为,并将x存储在边缘数据库。
19.步骤2:基于相似性,根据上述目标半导体器件结构每个参数的数值x预设阈值,在云端数据库中筛选出阈值内的小空间训练样本数据集;步骤3:将小空间样本数据集传输至边缘计算设备,利用机器学习算法,建立基于小空间样本数据集的机器学习预测模型;步骤4:将步骤1中的目标半导体器件结构每个参数的数值x输入步骤3中的机器学习预测模型,获取目标半导体器件结构的电学性能,根据预测结果误差的大小体现机器学习回归模型的好坏。
20.实施例1以预测击穿电压为例进行分析,本发明的小空间建模流程如下所示:步骤1:用户界面确定器件结构集x,其测试集结构参数范围包括漂移区浓度nd、漂移区长度l、顶层硅厚度ts、埋氧层厚度t
ox
。表1给出了两组结构参数。将该结构传输至边缘端数据库和云端数据库。
21.表1 测试器件结构参数集及其范围步骤2:在云端数据库中,基于上述器件的结构,利用高斯核函数,计算云空间已存结构参数与待仿真结构的相似度γ。同时,设置阈值δ为0.7,数量阈值n为30。当γ大于阈值δ即0.7时,获取其数据量m为28。将其由大至小进行排序和选取,且数量不超过30,故将选取的28个数据都加入小空间训练数据集。
22.步骤3:利用步骤2中的小空间训练数据,将其处理为机器学习算法可输入的csv文件,并将其传输至边缘端计算设备。
23.步骤4:针对器件击穿电压,筛选出对其有主要影响的结构参数,包括漂移区浓度、漂移区长度、顶层硅厚度、埋氧层厚度;步骤5:对上述数据进行归一化数据处理,利用高斯过程回归算法,通过边缘计算实时构建击穿电压的机器学习预测模型。
24.步骤6:将器件结构集输入到小空间的击穿电压的机器学习模型中进行测试,获取测试精度。
25.表2给出了同一测试结构下整体空间和实时小空间进行电学性能预测产生的偏差。通过表2可以看出,采用小空间数据进行模型构建,可有效降低击穿电压的预测误差。
26.表2 同一测试结构下整体空间模型和小空间模型测试偏差比较表3给出了同一测试结构情况下,采用整体空间和实时小空间进行机器学习模型构建占用内存的情况。通过表3可以看出,采用小空间数据进行模型构建,内存的使用可相对降低95%。
27.表3 同一测试结构下整体空间模型和小空间模型测试偏差比较实施例2:以预测击穿电压和导通电阻两种电学性能为例进行分析,本发明的小空间建模流程如下所示:步骤1:用户界面确定器件结构集x,其测试集结构参数范围包括漂移区浓度nd、漂移区长度l、顶层硅厚度ts、埋氧层厚度t
ox
。表4给出了每个结构参数的范围。将该结构传输至边缘端数据库和云端数据库。
28.表4 测试器件结构参数集及其范围步骤2:在云端数据库中,根据器件的结构,设置自适应空间下阈值和上阈值,从而获取自动筛选空间内样本数据,故筛选可得小空间训练样本空间,如表5所示。
29.表5 小样本空间数据及其范围步骤3:利用步骤2中的小空间训练数据,将其处理为机器学习算法可输入的csv文件,并将其传输至边缘端计算设备。
30.步骤4:针对器件击穿电压和导通电阻,筛选出对其有主要影响的结构参数,包括漂移区浓度、漂移区长度、顶层硅厚度、埋氧层厚度;步骤5:对上述数据进行归一化数据处理,利用高斯过程回归,通过边缘计算实时构建击穿电压和导通电阻的机器学习预测模型。
31.步骤6:将器件结构集输入到小空间的击穿电压和导通电阻的机器学习模型中进行测试,获取测试精度。
32.表6给出了同一测试空间器件结构的情况下,采用整体空间和实时小空间进行电
学性能预测产生的偏差。通过表6可以看出,采用小空间数据进行模型构建,无论对击穿电压还是导通电阻,模型预测的误差都的得以降低。
33.表6 同一测试空间下整体空间模型和小空间模型测试偏差比较表7给出了同一测试空间器件结构的情况下,采用整体空间和实时小空间进行机器学习模型构建占用内存的情况。通过表7可以看出,采用小空间数据进行模型构建,内存使用可相对降低95%。
34.表7 同一测试空间下整体空间模型和小空间模型测试偏差比较综上,本发明提出的基于器件结构进行边缘计算实时训练小空间模型的方法,首先根据器件结构在训练数据集中选取所设阈值空间内的小空间数据集,然后利用边缘计算实时进行机器学习模型的实时构建,可简单快速构建电学性能预测模型,小范围数据提供的参考信息更准确,避免了大量数据产生的干扰。并且,可将由于数据量的减小,使得模型训练过程中的内存需求极大减小。