用于视觉模板驱动的图像的迭代完善和策划的系统和方法与流程

文档序号:35933724发布日期:2023-11-05 14:04阅读:42来源:国知局
用于视觉模板驱动的图像的迭代完善和策划的系统和方法与流程

本主题总体上涉及迭代地策划(curate)包含由视觉模板指定的特定对象的图像,并且特别地,涉及可以基于预定义的视觉模板来迭代地完善和策划图像的系统。


背景技术:

1、各种图像检索技术涉及基于计算机的对象识别。基于计算机的对象识别并入了图像处理以标识图像中的对象实例,并且执行对象的标注以用于对象检测和跟踪。图像处理还可以被实现为解释图像中的对象相对于该图像中存在的其他对象的位置、取向和行为。

2、针对自主驾驶(ad)、cctv监控等领域中的应用收集了大量数据。为了针对特定用例(例如,道路标志或道路标记)在该数据上训练学习模型,图像需要被策划和加标签(以用于监督学习)。用于策划该数据的通常过程是手动的,这是成本和时间昂贵的。以自动化方式针对这种用例策划数据的能力可以大幅协助人类策划者。该问题变得具有挑战性,这是由于这些感兴趣的对象出现在未加标签的多样化场景中,例如由车辆安装式相机捕获的驾驶场景。这些场景包含来自不同类别的各种对象,例如建筑物、车辆、行人等,这使得策划变得困难。

3、现有技术us20190370384(ensemble-based data curation pipeline forefficient label propagation)公开了一种方法和架构,该方法和架构允许通过使用标签传播、聚类以及针对每个数据集的专用分类器的创建来初始化并策划加标签数据。这些专用分类器随着数据集增长被重新训练,并且确保了每个数据集被保持免于离群值和噪声。

4、另一个现有技术us10810252b2(automated image curation for machinelearning deployments)公开了用于数据策划和图像评估的技术。捕获第一图像,并且接收第一项目的第一指示。然后,基于第一指示来标识第一项目的第一标识符。此外,基于第一指示,确定第一图像描绘了第一项目。利用第一标识符给第一图像加标签,并且基于经加标签的第一图像来训练机器学习(ml)系统的ml模型。

5、现有技术us9817847b2(neural network image curation control):在本工作中,描述了神经网络图像策划技术。在一个或多个实现方式中,控制对表示图像储存库的图像的策划。由一个或多个计算设备来策划储存库的多个图像,以选择储存库的代表性图像。所述策划包括:通过由神经网络的处理,针对所述多个图像中的每一个联合地基于图像和面部美学计算得分;基于相应的所述得分对所述多个图像进行排序;以及基于所述排序、以及所述多个图像中的一个或多个图像与已经被选择为储存库的代表性图像之一的图像在视觉上不相似的确定,来选择一个或多个所述图像作为储存库的代表性图像之一。


技术实现思路



技术特征:

1.一种计算系统(100),包括:

2.如权利要求1所述的计算系统(100),其中所述新的网络模型被提供有不具有任何标签的图像片块。

3.如权利要求1所述的计算系统(100),其中所述新的网络模型代替较早在策划图像的迭代循环中的裁剪生成阶段中使用的预训练的深度神经网络(dnn)(302)。

4.如权利要求1所述的计算系统(100),其中进一步包括:完善模块(108),其被配置成从由片块生成模块(106)生成的多个图像片块中滤除假肯定。

5.如权利要求1所述的计算系统(100),其中所述视觉图像模板(102)集合包括不同的对象,以使形状和内容的范围多样化,从而表示宽泛对象级别的对象类型。

6.如权利要求1所述的计算系统(100),其中进一步包括:相似性搜索模块(116),其被配置成将特征向量(208)与对应于存储在基于dnn的特征数据库(304)中的图像列表(216)的多个特征向量(212)进行比较,以便检索邻居图像。

7.如权利要求6所述的计算系统(100),其中相似性搜索模块(116)进一步被配置成通过将特征向量(208)与存储在基于dnn的特征数据库(304)中的多个特征向量中的每一个进行比较来计算特征向量(208)与所述多个特征向量中的每一个的相似性得分。

8.一种用于策划包含由视觉模板指定的特定对象的图像的方法(200),所述方法(200)包括:


技术总结
用于视觉模板驱动的图像的迭代完善和策划的系统和方法。描述了用于策划包含由视觉模板指定的特定对象的图像的方法(200)和系统(100)。表示输入对象的视觉图像模板(102)集合被提供给预训练的深度神经网络(DNN)(302)。特征提取模块(104)被配置成提取特征向量(208)集合,其表示视觉图像模板(102)集合和存储在基于DNN的特征数据库(304)中的图像列表(216)。片块生成模块(106)被配置成从相关邻居图像(210)集合生成表示输入对象的图像片块,所述图像片块提供其中视觉图像模板(102)变得匹配的可能区域。片块生成模块(106)进一步被配置成以迭代的方式利用由片块生成模块(106)进行的图像片块生成以自我监督的方式来训练新的网络模型。

技术研发人员:A·A·卡勒,S·辛格
受保护的技术使用者:罗伯特·博世有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1