使用相异训练源训练分类模型及应用其的推论引擎的制作方法

文档序号：27753927发布日期：2021-12-03 21:06阅读：来源：国知局

技术特征：
1.一种用以使用多个对象的一训练数据集s产生一分类模型以将这些对象分类为多个类别的方法，包括一或多个编程的计算器：对于一索引i＝1，获取一第一训练子集st(i)，该第一训练子集包括该训练数据集中的部分的这些对象；使用该第一训练子集st(i)训练一第一模型m(i)；使用该第一模型m(i)对该训练数据集中不包括该第一训练子集st(i)的一第一评估子集se(i)进行分类，并在该第一评估子集se(i)中识别分类错误的这些对象的一错误子集er(i)；(a)递增该索引i，并获取一另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中的部分的这些对象；(b)使用该训练子集st(i)的组合训练一模型m(i)，其中i为1至i；(c)使用该模型m(i)对该训练数据集s中不包括该训练子集st(i)的一评估子集se(i)进行分类，其中i为1至i，并在该评估子集se(i)中识别分类错误的这些对象中的一错误子集er(i)；以及(d)评估该错误子集er(i)以预估该模型m(i)的一效能，以及若该效能满足一条件，则储存该模型m(i)，及若效能不满足该条件，则重复步骤(a)至(d)。2.如权利要求1所述的方法，其中该评估包括决定分类错误的这些对象的一数量，并将该数量与一门限值比较。3.如权利要求1所述的方法，其中该评估包括决定该错误子集er(i)中分类错误的这些对象的一数量，并将该数量与前一错误子集er(i-1)中分类错误的这些对象的数量比较。4.如权利要求1所述的方法，其中i＝1的该第一训练子集st(i)包括该训练数据集s中的这些对象的10％或更少。5.如权利要求1所述的方法，其中i＝1的该第一训练子集st(i)包括该训练数据集s中的这些对象的1％或更少。6.如权利要求1所述的方法，其中i＝2的该训练子集st(i)包括该错误子集er(1)中的这些物件的一半以下。7.如权利要求1所述的方法，包括将该训练数据集s分成多个区块的训练资料，且其中该第一训练子集st(1)是自这些区块中的一第一区块所获取，且该第一评估子集包括这些区块中的一第二区块的部分或全部，且不包含该第一区块。8.如权利要求7所述的方法，其中该第一区块及该第二区块的大小相同。9.如权利要求1所述的方法，包括将该训练数据集s分成多个区块的训练数据，这些区块具有相同大小，且其中i为一给定值的该训练子集st(i)与i为该给定值的该评估子集se(i)是自这些区块中的一不同的区块所获取。10.如权利要求9所述的方法，包括决定该训练数据集中的这些类别的这些对象的分布，并分区该训练数据集，以使这些区块中部分或全部的区块具有该决定的分布。11.如权利要求1所述的方法，包括：存取一数据库，该数据库包括根据这些类别分类的这些对象；以及根据这些类别对该数据库进行过滤，以产生该训练数据集s。12.如权利要求11所述的方法，其中该过滤包括设定一给定类别的对象数量的一最大
限制，以获取要包含在该训练数据集s内的这些物件。13.如权利要求12所述的方法，其中该过滤包括设定一给定类别的对象数量的一最小限制，以获取要包含在该训练数据集s内的这些物件。14.如权利要求1所述的方法，其中i＝1的该训练子集st(i)具有一数量n1的这些对象，且i＝2的该训练子集st(i)具有一数量n2的这些对象，且该数量n2为该数量n1的50％至3％之间。15.如权利要求14所述的方法，其中该数量n2为该数量n1的20％至5％之间。16.如权利要求1所述的方法，其中i为1至a-1的组合的该训练子集st(i)具有一数量na的这些对象，且i为a的组合的该训练子集st(i)具有一数量nb的这些对象，且该数量nb为该数量na的50％至3％之间。17.如权利要求16所述的方法，其中该数量nb为该数量na的20％至5％之间。18.如权利要求1所述的方法，其中获取i＞1的该另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中部份的这些对象的步骤中，包括：获取在该错误子集er(i-1)中一目标数量的这些对象，而无需考虑包含在该训练子集中的这些类别。19.如权利要求1所述的方法，其中获取i＞1的该另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中部份的这些对象的步骤中，包括：获取这些对象，以使这些类别中的每一类别的分类错误的这些对象不超过一最大数量m被包含在该训练子集中。20.如权利要求1所述的方法，其中获取i＞1的该另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中部份的这些对象的步骤中，包括：获取这些对象，以使这些类别中的每一类别的分类错误的这些对象至少一最小数量m被包含在该训练子集中。21.如权利要求1所述的方法，其中获取i＞1的该另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中部份的这些对象的步骤中，包括：对于这些类别中的一给定类别，在该错误子集中分类错误的这些对象的数量少于一最小数量m时，将i＝i-2至1的一个或多个该错误子集er(i)中的这些对象相加，以增加该训练子集中的该给定类别的这些对象的数量。22.如权利要求1所述的方法，其中获取i＞1的该另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中部份的这些对象的步骤中，包括：在不考虑这些类别的情况下，获取该错误子集er(i-1)中这些对象的一目标数量的一部分；以及获取该目标数量的一差额，以使每个类别分类错误的这些对象不超过的一最大数量m被包括在该目标数量的该差额中，且在该训练子集中包括该目标数量的该部分及该差额。23.如权利要求1所述的方法，其中该训练数据集中的这些对象包括在集成电路制造过程中的集成电路组件上的缺陷的影像，该缺陷包括多个类别的缺陷。24.如权利要求23所述的方法，包括将该储存的模型m(i)应用在一推论引擎，以侦测并分类集成电路制造过程中的缺陷。25.如权利要求1所述的方法，包括执行一用户接口以提供互动工具，以显示关于该训
练数据集s中的这些对象的类别的信息，设定参数以配置该训练数据集s，并设定参数以从该错误子集er(i)获取该训练子集st(i)。26.如权利要求25所述的方法，其中该用户接口提供互动工具，以显示关于该训练子集st(i)中的这些对象的类别的信息，及关于该错误子集er(i)中的这些物件。27.一计算器系统，包括：一或多个处理器，存取一存储器，该存储器储存如权利要求1所述的方法训练的一分类引擎。28.一计算机程序产品，包括：一非瞬时计算机可读取存储器，储存一计算机程序，该计算机程序包括一逻辑以执行一程序，该程序包括：对于一索引i＝1，获取一第一训练子集st(i)，该第一训练子集包括该训练数据集中的部分的这些对象；使用该第一训练子集st(i)训练一第一模型m(i)；使用该第一模型m(i)对该训练数据集中不包括该第一训练子集st(i)的一第一评估子集se(i)进行分类，并在该第一评估子集se(i)中识别分类错误的这些对象的一错误子集er(i)；(a)递增该索引i，并获取一另一训练子集st(i)，该另一训练子集st(i)包括该错误子集er(i-1)中的部分的这些对象；(b)使用该训练子集st(i)的组合训练一模型m(i)，其中i为1至i；(c)使用该模型m(i)对该训练数据集s中不包括该训练子集st(i)的一评估子集se(i)进行分类，其中i为1至i，并在该评估子集se(i)中识别分类错误的这些对象的一错误子集er(i)；以及(d)评估该错误子集er(i)以预估该模型m(i)的一效能，以及若该效能满足一条件，则储存该模型m(i)，及若该效能不满足该条件，则重复步骤(a)至(d)。

技术总结
本发明提出一种使用一训练数据集产生一分类模型的方法。一迭代程序，用以训练一ANN模型，其中一迭代包括从一训练数据源中选择训练数据的一小样本，使用该样本训练该模型，对训练数据的一大样本使用该模型进行推论，并检查推论结果。评估该结果以决定该模型是否满足一条件，若该模型不符合指定的标准，则重复迭代程序中的采样、训练、推论和检查结果的循环(STIR循环)，直到满足标准为止。提供如本文所述的方法所训练的一分类引擎。述的方法所训练的一分类引擎。述的方法所训练的一分类引擎。

技术研发人员：陈士弘苏资翔
受保护的技术使用者：旺宏电子股份有限公司
技术研发日：2020.08.06
技术公布日：2021/12/2

完整全部详细技术资料下载

当前第2页1 2