本发明涉及半导体制造领域,尤其涉及一种基于图结构学习确定异常的方法。
背景技术:
1、在半导体制造过程中,同一个机台上一般会有多个传感器同时监控生产状态。同一个机台上的各个传感器之间是存在关联性的,当某种异常情况发生时,某些相互存在关联的传感器可能会同时生成异常数据,进而产生报警。
2、现有技术将这些传感器数据利用单变量时序预测分别建模,对每个传感器产生的数据单独预测,然后与真实数据进行比较,根据比较的结果判断是否报警。然而,这种方法可能会产生假报警,即在实际并未发生异常的情况下,某个传感器由于自身故障或者环境噪音影响等因素而错误地产生报警信息。这会造成整个监控系统的冗余,增加生产设备的维护成本。
技术实现思路
1、本说明书一个或多个实施例描述了一种基于图结构学习确定异常的方法,将多个传感器产生的数据利用多变量时序异常检测模型同时建模,综合所有预测数据与真实数据进行比较,以得到更好地预测结果。
2、本说明书提供了一种基于图结构学习确定异常的方法,包括:
3、获取多变量时序数据,所述时序数据为半导体制造过程中设备的多个传感器产生的数据;
4、根据图结构学习模型获取所述多个传感器对应的最终嵌入向量,所述最终嵌入向量用于表征所述多个传感器之间的关联关系;
5、将所述时序数据中时间排序在前的目标子序列与所述最终嵌入向量结合,并输入到预测模型中,得到所述多个传感器对应的预测数据;
6、根据所述预测数据与所述时序数据中接续所述目标子序列的实测数据,确定所述实测数据所对应的目标时间点是否出现异常。
7、在一种可能的实施方式中,还包括:
8、当所述目标时间点出现异常时,根据所述预测数据与所述实测数据,确定异常传感器与对应的异常类型。
9、在一种可能的实施方式中,还包括:
10、根据所述异常传感器、所述异常类型、所述设备的设备编号和所述设备正在加工的晶圆的编号,确定对应的知识点,所述知识点用于生成或更新半导体领域的知识图谱。
11、在一种可能的实施方式中,根据所述预测数据与所述时序数据中接续所述目标子序列的实测数据,确定所述实测数据所对应的目标时间点是否出现异常,包括:
12、根据所述预测数据和所述实测数据确定误差,根据所述误差与预设的第一阈值的比较结果,确定所述实测数据所对应的目标时间点是否出现异常。
13、在一种可能的实施方式中,根据所述预测数据与所述实测数据,确定异常传感器与对应的异常类型,包括:
14、根据所述多个传感器中任一目标传感器在所述预测数据和所述实测数据中所对应的数据,确定误差,根据所述误差与所述目标传感器所对应的预设阈值的比较结果,确定所述目标传感器是否出现异常以及对应的异常类型。
15、在一种可能的实施方式中,所述图结构学习模型包括图嵌入层、图结构学习层和图关系聚合层。
16、在一种可能的实施方式中,所述图结构学习模型和所述预测模型通过样本时序数据训练得到,所述训练包括:
17、将所述多个传感器的特征数据输入到所述图嵌入层,得到所述多个传感器对应的多个初始嵌入向量;
18、将所述多个初始嵌入向量输入到所述图结构学习层,得到所述多个初始嵌入向量之间的关系权重;
19、将所述多个初始嵌入向量和关系权重输入到所述图关系聚合层,得到所述多个传感器对应的最终嵌入向量;
20、将所述样本时序数据中时间排序在前的样本子序列与所述最终嵌入向量结合,并输入到预测模型中,得到所述多个传感器对应的样本预测数据;
21、通过最小化所述样本预测数据与所述样本时序数据中接续所述目标子序列的样本实测数据的误差,调整所述图嵌入层、图结构学习层、图关系聚合层和预测模型中的参数的值。
22、在一种可能的实施方式中,所述多个初始嵌入向量之间的关系权重通过余弦相似度计算得到。
23、在一种可能的实施方式中,将所述多个初始嵌入向量和关系权重输入到所述图关系聚合层,得到所述多个传感器对应的最终嵌入向量,包括:
24、对于所述多个传感器中的任一目标传感器,将其所有邻居传感器对应的嵌入向量与对应的关系权重进行加权求和之后,再与所述目标传感器对应的嵌入向量相加,得到所述目标传感器对应的最终嵌入向量;
25、其中,所述目标传感器的邻居传感器为,与所述目标传感器所对应的嵌入向量的关系权重排名前k名的嵌入向量所对应的传感器,k为一预设值。
26、在一种可能的实施方式中,所述误差的类型至少包括:均方根误差rmse、均方误差mse和平均绝对误差mae。
27、本发明提出的一种基于图结构学习确定异常的方法,将多个传感器产生的数据利用多变量时序异常检测模型同时建模,综合所有预测数据与真实数据进行比较,以得到更好地预测结果,减少假报警的情况。同时,相比于多个单变量模型的形式,使用一个多变量模型建模可以减少维护成本。
1.一种基于图结构学习确定异常的方法,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求2所述的方法,其特征在于,还包括:
4.根据权利要求1所述的方法,其特征在于,根据所述预测数据与所述时序数据中接续所述目标子序列的实测数据,确定所述实测数据所对应的目标时间点是否出现异常,包括:
5.根据权利要求2所述的方法,其特征在于,根据所述预测数据与所述实测数据,确定异常传感器与对应的异常类型,包括:
6.根据权利要求1所述的方法,其特征在于,所述图结构学习模型包括图嵌入层、图结构学习层和图关系聚合层。
7.根据权利要求6所述的方法,其特征在于,所述图结构学习模型和所述预测模型通过样本时序数据训练得到,所述训练包括:
8.根据权利要求7所述的方法,其特征在于,所述多个初始嵌入向量之间的关系权重通过余弦相似度计算得到。
9.根据权利要求7所述的方法,其特征在于,将所述多个初始嵌入向量和关系权重输入到所述图关系聚合层,得到所述多个传感器对应的最终嵌入向量,包括:
10.根据权利要求4或7所述的方法,其特征在于,所述误差的类型至少包括:均方根误差rmse、均方误差mse和平均绝对误差mae。