一种训练多图案识别和配准工具模型的半监督方法
【专利摘要】一种训练多图案识别和配准模型的系统和方法,以第一图案模型开始。该模型从多个图像中训练。复合模型可用于提高鲁棒性,或者模型化目标区域外观上的微小差异。复合模型从噪声训练图像中组合数据,显示将要构建单个模型的潜在图案的实例。产生图案识别和配准模型,其可覆盖该组训练图像中目标图案的外观的整个范围。该组图案模型可实现为图案查找模型的单独实例,或者图案多模型。潜在模型可以是标准图案查找模型或者为图案查找复合模型,或者是两者的组合。
【专利说明】一种训练多图案识别和配准工具模型的半监督方法
[0001] 相关申请
[0002] 本申请声明拥有申请号为61/841,142,申请日为6/28/2013,题目为"一种用于训 练多重图案匹配模型的半监督方法"的美国临时申请专利的权益,其整个公开内容以参考 形式并入至本文中。
【技术领域】
[0003] 本发明涉及一种机器视觉,其通过利用摄像头或者其他成像设备获取对象图像, 其中对应在被成像对象上定位图案来定位图像中的目标图案。
【背景技术】
[0004] 机器视觉系统的困难在于使其方便使用,并且可供更广泛的潜在用户使用。某些 方面,用户非常清楚的理解(例如,如何生成一组训练图像),以及情形的地面实况。然而除 此之外,机器视觉系统的训练和运行时操作的许多方面的应用更加困难。
[0005] 在机器视觉中,通过摄像机或其他成像设备获得对象图像,以及利用计算机或其 他计算设备上执行的方法,以定位成像对象上的图案。假设有一组图像,每一个图像至少包 含一个目标图案的实例,但在目标图案外观可能有差异时,识别并训练可适用于该图像组 中所有图像的图案识别和配准模型的最小组合也是困难的。该图案识别和配准程序在美国 专利6, 408, 109 ;6, 658, 145以及7, 016, 539中有更详细的描述,其公开技术以参考形式并 入,并作为有用的背景信息。如果图案被识别,则图案识别和配准程序(或工具)确定该被 观察图案其实就是该工具搜索的图案,并固定其位置、方位、大小、倾斜度以及外观。例如, 这种搜索工具为美国马萨诸塞州内蒂克康耐视公司的PatMax馨产品。该图案识别和配准程 序属于几何图案的查找方法。本文描述的方法一般应用到几何图案查找。
[0006] 例如,图案可由包含圆圈和线条的元素组成。参考图1,图案110包括圆圈112和 两条与其相交的直线114U16 ;图案120包括圆圈122和一对直线124U26 ;图案130包括 圆圈132以及一对直线134、136。在已训练图像的图像组中,该圆圈的半径以及直线的线 宽和数量存在差异。在半导体和其他在基板上具有多层结构的材料的领域尤其是这样,这 会导致每一层特征变形。也可能在整个图像组中图案的极性改变了(如图所示图案120和 130的区别)。该图像还可能含有高度噪声。
[0007] 该问题至少具有两部分。首先,该训练图像组由带噪声的图像组成,所以很难从单 个图像中训练出纯净模型。第二,在该训练组中,图案具有不同的外观,使得训练单个模型 变得困难,且易于在运行时出错。
【发明内容】
[0008] 为了克服现有技术的缺陷,本系统和方法利用图案识别和配准模型执行训练。说 明性地,图案查找模型是从多个训练图像中训练出来的单个模型。在一些实施例中,复合模 型可用于提高标准的图案识别和配准模型的鲁棒性,以及/或者对目标区域的外观上的微 小差异进行模型化。为了提高鲁棒性,复合模型结合来自带噪声(或其他干扰)的训练图 像中的数据,以构成单个鲁棒模型,其中该带噪声的训练图像显示单个潜在(underlying) 图案的实例。为了实现此目的,训练单元使用输入图像,以及已知的相对位置或姿势(由人 识别或者计算机确定),其中该训练单元为利用图案识别和配准模型的训练单元。
[0009] 考虑到目标区域在外观上的微小区别,采用训练方法来训练一组可以覆盖训练组 中目标图案外观的整个范围(或整个范围的至少一大部分)的图案识别和配准模型。该组 图案识别和配准模型可表现(manifest)为图案模型的单独实例,或者图案多模型。图案多 模型为图案识别和配准模型的集合。潜在模型可以是标准图案识别和配准模型或者为复合 图案模型,或者是两者的组合。该图案多模型的意在用于对那些外观变化明显的目标进行 模型化。该多模型可以在各种模型下运行,以利用可能的时间序列模型外观的现有技术。将 多图案模型并入到图案多模型结构可以降低前端的处理量,从而通过运行单独的图案模型 实例增加性能增益。该图案多模型还可以检查其元件模型的结果,以为重叠部分提供筛选, 例如如果两个模型的结果重叠部分大于用户指定的阈值,则该图案多模型仅返回给用户更 匹配(或更高分数)的结果。
【专利附图】
【附图说明】
[0010] 下文将参考附图对本发明进行描述,其中:
[0011] 图1,已经描述,所示为三个示例性图像,根据图案识别和配准程序,每一个图像包 括图案;
[0012] 图2所示为根据一示例性实施例,用于实现本发明思想的示例性的机器视觉系统 的系统方框图;
[0013] 图3所示为根据示例性实施例,用于训练单图案识别和配准模型的程序流程图;
[0014] 图4所示为根据示例性实施例,用于训练图案多模型,并测定当前已训练输出模 型性能的程序流程图;
[0015] 图5所示为根据示例性实施例,用于提出添加到输出模型集合的候选项,并对该 候选项排名的程序流程图;以及
[0016] 图6所示为根据示例性实施例,为用户和输出图案多模型指出最高分数的候选项 的程序流程图。
【具体实施方式】
[0017] 图2所示为根据一示例性实施例,用于实行本发明思想的机器视觉系统200的系 统方框图。该机器视觉系统200包括捕获设备205,其可生成具有一个或多个特征215的对 象210的图像。该捕获设备205可由传统的摄像机或扫描器构成。该摄像机可以是电荷耦 合元件(CCD)或者其他用于获取合适图像信息的系统,如众所周知的CMOS传感器。捕获设 备205生成的图像数据(或像素)反映图像的强度,如在捕获设备205分辨率范围内的视 场中的每个点的颜色或亮度。该捕获设备205通过通信路径220将数字图像数据传送到图 像分析系统225中。该图像分析系统225可包括传统的数字数据处理器,如在市场上,例如 康耐视公司,可以买到的视觉处理系统。图像分析系统225可包括传统的微型计算机,或者 其他示例性计算设备。可以利用其他类型的接口,包括例如掌上电脑(PDAs)等。在变型实 施例中,该捕获设备可具有执行图像分析系统功能的处理能力。在该实施例中,不需要独立 的图像分析系统。在另一变型实施例中,捕获设备可操作性地与图像分析系统互联,以达到 训练目的。一旦训练发生,合适的模型就会存储在该捕获设备,供运行时使用。
[0018] 该图像分析系统225可根据本发明的教导设计程序,在多个图像中查找到相似的 特征,以生成合适的识别和配准信息,用于训练机器识别系统。图像分析系统225可具有一 个或多个中央处理单元(处理器)230、主内存235、输入/输出系统245,以及一个或多个驱 动器或者其他形式的大型存储器240。作为说明,输入/输出系统245与位于捕获设备205 和图像分析系统225之间的通信路径220互联。根据本发明教导,系统225可以通过程序 指令配置为可执行本发明的新颖的多图像的已训练图案识别和配准。本领域技术人员可以 认识到,可以对硬件以及/或者软件配置进行变型,以实现本发明的思想。特别地,本发明 理论可以通过软件、硬件、固件以及/或者它们的组合实现。再者,与训练时间相较,在运行 时间过程中,机器视觉系统200还可以包括其他元件。例如,可以通过传送带或者其他装配 线设备等传送对象215。
[0019] 根据本发明一示例性实施例,可以利用该机器视觉系统200为运行时机器视觉系 统产生训练模型。因此,可以利用机器视觉系统200,采用相似的元件,生成可用于多种机器 视觉系统的训练模型。
[0020] 然而,应该注意本文所示和所描述的图案单元(或图案识别和配准单元),以及其 相关模型,通常位于图像分析系统225之内。然而,在一般技术中,单元和模块的位置及存 储方式非常多变。
[0021] 应该注意,虽然本发明以机器识别系统200的形式进行描述,但是本发明的思想 可以应用于多个不同的实施例中。因此,术语"机器视觉系统"应该理解为包括可替换的系 统。更一般地,本发明的原理可以在配准图像子图案的任何系统中执行。例如,一实施例涉 及一种传统机器识别系统,等等,其包括独立摄像机,并操作性地与编程以处理图像的独立 电脑互联。然而,本发明的思想可以用于其他在图像中配准子图案的设备以及/或者系统, 例如视觉传感器,如康耐视公司的Checker产品,或者其他具有照明源、图像采集能力以及 /或者处理能力的设备。这些视觉传感器可以通过独立的模块训练以及/或者配置,如康耐 视人机界面。在该实施例中,用户可以利用多个部分,而不是单个部分训练视觉传感器。用 户可以选择第一部分,将其置于传感器的前方,并指示系统该训练部分已经置位。第二(第 三等)部分以相似的方式训练。用户可以利用如图形用户界面(GUI)以及/或者按钮或者 位于训练模块/或者视觉传感器本身的其他控制面,来控制训练步骤。再者,本发明的功能 可以并入到手持设备、无线兼容设备等。因此,术语"机器视觉系统"应该宽泛地理解为包 括可应用一个或多个本发明理论的所有系统和装置。
[0022] 训练单图案识别和配准樽型
[0023] 根据描述性实施例,从多个图像训练出图案识别和配准模型。例如,参考美国专利 8, 315, 457,以引用的方式将其公开技术作为有用的背景信息,用于更详细地描述单图案识 别和配准模型的训练。复合模型可用于提高普通图案模型的鲁棒性,或者模型化目标区域 外观上的微小差异。本文执行的训练单元训练一组图案识别和配准模型,其在一组训练图 像中涵盖目标图案外观的整个外观范围。该组模型可以是单图案识别及配准模型,或者模 型的集合,这样的集合在本文称为图案"多模型"单元。该多模型单元目的是对那些外观变 化明显的目标模型化。该多模型可以在各种模型下运行,以利用可能的时间序列模型外观 的现有技术。
[0024] 此处使用的术语"训练单元"(或训练模块)指的是执行生成训练模型的步骤的 非暂时性实施例。该训练单元为非暂时性计算机程序的一部分,该非暂时性计算机程序包 含一个(或多个)用于执行特定任务的例程或函数。此处所示和所描述的每个单元(或模 块)都可以单独使用或者与机器视觉系统内的其他模块结合使用。训练单元通过训练一组 可涵盖数据库内包含的训练图像整个范围的模型来创建训练模型。此外,此处使用的术语 "图案识别和配准模型"或者"图案模型"一般表示在'457专利中公开的图案模型,除非有 其他声明。
[0025] 现参考图3,图中所示为根据示例性实施例,用于训练单图案识别和配准模型的训 练单元执行的程序流程图300。在步骤310中,初次输入计算程序(可由用户提供或者计算 机提供)的是初始训练图像以及指定受训练的图案的区域("感兴趣区域"),这同样可以由 用户提供或者计算机提供。程序300接收该输入,并且在步骤320利用325中的训练参数 训练第一(初始)图案识别和配准("PatMax")模型(PJ。接下来,在步骤330中,系统迭 代运行图案模型P〇的图像组(至少为余下训练图像的一部分或子组),该图像组为之前存 储在数据库中的由用户或电脑提供的图像组。系统可迭代处理余下所有的训练图像组或者 余下训练图像组的一部分,并且存储结果分数、位置以及匹配区域的数据。在步骤340中, 存储结果以评分排序(并且如果地面实况数据可用,以精确度排序)。该地面实况可由用 户提供或者计算机生成。在步骤350中,程序输入置顶(或首选)图片(top image) (Nc-1) (其中Nc为指定应该输入到复合模型训练的图像数量参数),并且在步骤360中,利用先前 在运行匕时生成的结果中得到的位置以及区域信息训练复合模型。
[0026] 美国专利8, 315, 457以参考的形式并入到本文中以作为有用的背景信息,其更详 细地描述到,执行多图像训练用于图案识别和配准。机器视觉系统获得多个("N")训练 图像。选择了一个图像,然后其他(N-1)个图像实质配准到选定的图像。迭代处理该选择 和配准,以使N个图像中的每一个都可作为基准图像。通过将该N个图像中的每一个作为 基准图像地对该N个图像迭代处理,该程序构建了一个对应特征的数据库,可以利用该数 据库构成在这些图像之间稳定的特征模型。将这些表示一组对应图像特征的特征添加到模 型中去。为了构建对应特征的数据库,利用边界检测工具或者其他传统的技术,每一个特征 可以得到对应,以在机器视觉系统中对应外形。作为说明地,为模型选定的这些特征,为对 出现该特征的每个图像中相对应特征之间的最大距离进行最小化的特征。这些待添加到模 型中的特征可包括出现该特征的每一个图像的特征的平均值。该过程直到每一个特征都满 足阈值要求结束。这一过程得到的模型,代表在N个训练图像中至少为阈值数量的图像中 发现的稳定特征。这一过程(在专利'457中有所描述)识别出了那些可以得到训练图像 充分支持的特征,它们是稳定特征。然后该模型可利用该组特征训练一对齐、搜索或检测工 具。
[0027] 重新参考图3,用户可提供其他复合模型训练参数355,其指定该乂个训练图像中 必须包含一特定特征的比例,以使之包含在输出模型中。作为说明的,该比例可为百分数, 如80%到90%,但在常规技术中差异性较大,根据特定应用而定。用户还可从不同训练图 像的特征中指定可被认为匹配的一邻近阈值。
[0028] 训练图案识别和配准多樽型
[0029] 现参考图4,图中所示为根据示例性实施例,用于训练图案识别和配准多模型,并 测定当前已训练输出模型性能的程序流程图400。在步骤410中,程序的初始输入(通常由 用户输入,但也可由机算机提供)为:训练图像(1〇)、指定图像内的图案范围的区域R。、 训练图像ι〇内的图案原点(〇〇)以及显示感兴趣图案的外观范围的一组训练图像ΙΛ,1 2,… ,工n}。
[0030] 在步骤420中,程序利用这些输入,并如图3所示,利用上述训练单图案识别和配 准模型的程序,根据复合模型参数422训练第一"PatMax"图案复合模型(PCM*^)。训练参 数424可用于训练输出模型(ΤΡ° υτ),并且足够严格以确保已训练模型不会在搜索整组训练 图像时产生较高分数的错误查找。如果使用图案识别和配准多模型结构,则会将PCif'添 加到输出多模型PMM° UT中。如果不使用多模型结构,则它会作为输出组的第一图案识别和 配准模型存储(为描述目的,这也称为PMM° UTQ)。
[0031] 接下来,在步骤430中,程序使用相同的输入(从410得到),并利用图3所示的 用于单图案识别和配准模型的上述计算机程序,训练不同的(第二)图案识别和配准模型 PCM0?。。在本过程中使用的图案训练参数TPGAND434还可以用于训练这样的模型,该模型专 门查找用作训练另一输出复合模型的候选项。这些训练参数434应该比用于制作输出模型 的参数的限制更放松。根本前题是PCM?^可以比采用更严格训练的PCM° UT给出更多不同范 围的训练候选项,但是用户可以拒绝任何错误的查找,或者基于已知的地面实况自动拒绝。 针对输出模型,PC# A'可以添加到图案识别多模型或者添加或储存到其他类型的 模型集合中。
[0032] 性能测定
[0033] 在步骤440中,在开始查找图案候选项以及训练被认为"最好"(最高评分或最匹 配)的候选项过程之前,系统首先必须测定当前已训练输出模型,即PMM° UT的性能。为了测 定该性能,程序运行整体测试图像组上的模型,并计算组合分数,该分数初始化为〇。如果 PMM°UT发现图像中图案的分数(分数范围为0到1)大于用户定义的置信度阈值,则将该分 数添加到组合分数中。然而,如果PMM° UT不能在图中查找到分数大于用户定义的置信度阈 值的图案,则从组合分数中减1。本领域技术人员还可执行其他类似的计分函数,并且如果 地面实况数据可用的话,可以并入对齐精度的测定。
[0034] 在性能测定之后,程序的余下步骤可以迭代地重复,并用变量"t"表示。现在参考 图5和图6,图中所示为根据示例性实施,给出候选模型的程序流程图。参考图5,程序500 用于给出和排名候选项,将其添加到输出模型集合,PMM° UT(t)。在步骤510中,迭代(t)的 输入包括候选项以及输出多模型、PMM-- (t)、PMM°UT⑴,其中
[0035] PMM°? ⑴包括{PCM-- (0),PCM°? (1),…,PCM-- ⑴}
[0036] 以及,
[0037] PMM°UT ⑴包括{PCM°UT (0),PCM°UT (1),…,PCM°UT ⑴}
[0038] 在本程序步骤520中,候选多模型PMMmd给出添加到输出模型集合PMM° UT (t)的候 选项,并对其进行排名。为了实现此目的,候选图案多模型PMM°?(t)在每个训练图像^上 运行。如果返回可接受结果(即发现模型分数高于用户定义可接受阈值的位置),则在步 骤520中,利用匹配区域氏及原点〇i训练候选图案复合模型PCM° UT(i)(如上文中所述关于 为PMM°UT(t)训练单模型)。因此,从图像Ii的候选区域Ri,以及从该候选图像区域(图像 Ii的氏)的最佳匹配的Nc-1个图像的对应区域中,训练出候选复合模型。
[0039] 在530中,程序迭代该组候选图案复合模型,对于每一个候选图案复合模型,首先 将其添加到输出集合PMM° UT(t) - PMM°UT(t)',然后以与上文性能测定中所描述的同样的方 式测定其性能。在获得了对输出多模型PMM° UT(t)'的建议扩展的分数后,将PCM°UT(i)移除 出PMM°UT(t) ' 一 PMM°UT(t)。在步骤534中,会根据分数将候选项进行分类(即PCM°UT(i))。
[0040] 在程序500的最后,在步骤540中,系统具有候选图案复合模型的集合,其可覆盖 所有的训练图像,其中PMM°?(t)可以查找到可接受的结果。程序根据每个模型为输出图案 模型集合(或多模型)PMM° UT(t)提供的覆盖改进的多少对这些模型进行排名。如果没有发 现候选项提高分数的量多于用户定义的量,则认为符合停止准则。
[0041] 现参考图6,图中所示为根据示例性实施例,用于给出候选模型和输出图案多模型 的程序600。在步骤620中,程序向用户推荐最高分数的候选项(例如,通过显示候选图像 Ii内候选项的感兴趣区域)。在步骤622,用户可以接受或拒绝候选项,或者等同地,可以向 电脑呈现最高分数的候选项,且电脑基于已知地面实况接受或拒绝该候选项。如果接受该 候选项,则在步骤630中用户有机会调整该新模型的原点,以防止ΡΜΜ°?α)输出的细微对 齐误差。如果在步骤624中拒绝候选项,则放弃置顶(或首选)(top)候选PCM° UT,系统顺序 地给出下一个候选项。
[0042] 如果接受候选项,则在步骤640中,将已接受的候选模型PCM°UT(acxepted)(aes)添加 到当前输出模型集合PMM°,T) - PMM°UT(t+l)。最佳地,该候选项查找器模型集合(或多 模型)用一类似的模型更新。在步骤650中,利用训练参数TP eAND,从图像Iaeeepted的区域 Raccepted 训练出候选模型 PCM_(accepted)。在步骤 660 中,将 PCM_(accepted)添加到 PMM_(t) PMM°?(t+l)。在步骤670中,循环(t)的输出为候选ΡΜΜ^α+Ι)以及输出多模型 PMM0UT(t+l) 〇
[0043] 该多个示例性实施例为生成图案识别和配准模型提供条件,其迭代多个训练图像 的每一个训练图像,以提供可以覆盖训练图像的整个数据库(即在整个数据库有效)的模 型。这提高了运动时系统的鲁棒性和有益性。
[0044] 上文即为本发明示例性实施例的详细描述。在不脱离本发明思想和范围的前提 下,可进行各种修改和添加。上述多个实施例中每一个实施例的特征可以与其他描述的实 施例的特征以合适的方式组合,以提供多样的具有组合特征的新的实施例。此外,虽然前文 描述了本发明装置和方法的多个独立的实施例,但本文所描述的实施例只是本发明思想应 用的示例。需要注意的是,此处所使用的术语"流程"和/或"处理器"应从广义上来理解, 包括各种基于功能和组件的电子硬件和/或软件。还有,本文应用的方向性和方位性的术 语,如"纵向"、"水平方向"、"上方"、"下方"、"低端"、"顶端"、"侧边"、"前边"、"后边"、"左边"、 "右边"等,只适用于相对情况,与固定坐标系统中的绝对方位,如重力,不同。此外,一所述 的流程或处理器能够与其他流程和/或处理器组合,或分为多个子流程或子处理器。根据 此处的实施例可对这些子流程和/或子处理器进行各种不同的组合。同样地,可以明确地 设想到,此处所述的任何功能、流程和/或处理器能够利用电子硬件、软件(包括程序指令 的非暂时计算机可读的媒介)、或硬件和软件的结合实施。再者,可以预想有些或者所有的 视觉系统处理任务可以通过主模块或者远程处理器(如服务器或PC)实现,可操作性地利 用接口模块,通过有线或无线通信(网络)链接连接到主模块。因此,该描述仅仅起示例性 的作用,而不作为限制本发明的范围。
【权利要求】
1. 一种在机器视觉系统中训练图案识别和配准模型的方法,该方法包括以下步骤: 提供一个或多个具有指定待训练图案的区域的初始训练图像,该一个或多个训练图像 由含有多个训练图像的数据库提供; 从一个或多个初始训练图像中训练第一图案模型; 在余下的图像上进行迭代,并选择得分较高的图像作为模型训练的输入;以及 输出与多个训练图像中预设数量的图像具有共同特征的已训练图案模型,该已训练图 案模型不同于第一图案模型。
2. 根据权利要求1所述的方法,其中迭代步骤包括运行第一图案模型,以对每一个图 像评分。
3. 根据权利要求1所述的方法,其中利用第一组训练参数训练第一模型,而利用第二 组训练参数训练第二图案模型。
4. 根据权利要求1所述的方法,其中用于对图像评分的度量方法包括,计算初始值为0 的组合分数,并且如果第一图案模型发现该图案为分数高于用户定义的置信度阈值的图像 时,则将该分数加到该组合分数中,而如果第一候选图案模型没有发现图像中的图案的分 数高于用户定义的置信度阈值时,则从组合分数中减1。
5. 根据权利要求1所述的方法,其中已训练的输出图案的每一个特征出现在约 80% -90%的训练图像中。
6. 根据权利要求1所述的方法,其中根据预定的地面实况给定每个图像的指示待训练 图案的区域。
7. 根据权利要求6所述的方法,其中通过运行第一图案模型获得每一个图像的预定地 面实况。
8. 根据权利要求1所述的方法,其中还包括步骤:训练具有第二组图案训练参数的第 二候选图案模型,以及在包含于数据库中的余下的训练图像上迭代第二候选图案模型并为 第二候选图像模型的分数、位置以及匹配区域数据进行评分。
9. 根据权利要求1所述的方法,其中训练第一图案模型的步骤还包括对分数、位置以 及匹配区域数据进行评分。
10. 根据权利要求1所述的方法,其中该第一候选图案模型包括复合模型。
11. 根据权利要求1所述的方法,其中该一个或多个由数据库提供的训练图像由计算 机选定。
12. 根据权利要求1所述的方法,其中使用该已训练图案模型以在机器视觉系统的运 行时操作中执行对齐、搜索或视觉检测工具。
13. 根据权利要求1所述的方法,其中除了训练图像和区域之外,还可指定图案的原点 作为训练该第一图案模型的输入。
14. 一种训练图案识别和配准多模型的方法,该方法包括以下步骤: 提供至少一个具有指示待训练图案的区域的初始训练图像,该至少一个图像由含有多 个训练图像的数据库提供; 从初始训练图像和区域中训练第一图案模型,并将其添加到输出多模型; 在余下的训练图像上进行迭代,由此对于每个图像, (i)可训练一附加图案模型; (ii)可在数据库中余下的训练图像上对第一和附加模型的组合的度量进行评分; 将得分较高的一个或多个附加图案模型添加至输出多模型。
15. 根据权利要求14所述的方法,其中该第一图案模型的训练根据第一组图案识别和 配准训练参数执行,而第二图案模型的训练根据第二组图案识别和配准训练参数执行。
16. 根据权利要求14所述的方法,其中该第一以及/或者第二候选图案模型包括复合 模型。
17. 根据权利要求14所述的方法,其中在利用第一模型训练产生候选区域时,通过放 松自由度训练出第二图案模型,然后当第二图案模型运行时收紧自由度,以确定度量标准 是否提商。
18. 根据权利要求17所述的方法,其中该度量标准包括特征实例的分数或者数量。
19. 根据权利要求17所述的方法,其中经由初始训练图像和指定区域以不同的训练参 数训练第二图案模型,以使第二图案模型更有可能查找到变形、噪声,或者以某种方式修改 的原始图案的实例; 利用第二图案模型给出候选区域,以用于训练附加图案模型。
20. 根据权利要求14所述的方法,其中图案原点作为至图案模型训练的附加输入。
21. 根据权利要求14所述的方法,其中较高分数的附加图案模型在其可能的添加到输 出多模型之前,首先提供给用户接受、拒绝或者重新评分。
22. 根据权利要求14所述的方法,其中在附加图案原点添加至输出多模型之前,用户 修改该附加图案原点。
23. 根据权利要求14或17所述的方法,其中对附加图案模型的训练过程反复迭代,从 而使该多模型扩展到包含多于2个图案模型。
24. 根据权利要求23所述的方法,其中采用停止条件;该停止条件源自度量标准的相 对提商。
25. 根据权利要求14所述的方法,其中为训练图像数据库中多个训练图像中的每一个 提供的地面实况可用于接受或拒绝以及/或者纠正用于添加到多模型的候选模型的位置。
26. -种用于生成图案识别和配准模型的系统,该系统包括: 包含多个训练图像的数据库,至少一个具有指示待训练图案的区域的图像; 训练单元,其通过在多个训练图像上迭代初始图案识别和配准模型,以及通过对分数、 位置以及匹配区域数据进行评分以提供已训练模型,来训练初始图案识别和配准模型;以 及 在多个训练图像上测定已训练模型的性能的性能测定单元。
【文档编号】G06K9/62GK104252626SQ201410301836
【公开日】2014年12月31日 申请日期:2014年6月26日 优先权日:2013年6月28日
【发明者】S·巴克, D·J·迈克尔 申请人:康耐视公司