针对自动对象标识的图像处理的制作方法

文档序号：19996182发布日期：2020-02-22 02:45阅读：来源：国知局

技术特征：

1.一种设备，包括：

一个或多个存储器；以及

一个或多个处理器，被通信地耦合到所述一个或多个存储器，所述一个或多个处理器用以：

获得图像；

基于所述图像并且使用图像生成模型来生成候选图像集合以用于对象识别；

基于所述候选图像集合并且使用图像评估模型来确定：所述候选图像集合中的一个或多个候选图像在图像生成期间并且使用所述图像生成模型而被处理以改进所述图像的分辨率；

针对所述一个或多个候选图像并且基于所述图像来确定图像嵌入；

针对所述一个或多个候选图像，基于所述图像嵌入和所述图像来确定嵌入误差；

基于所述图像嵌入和所述嵌入误差来确定所述图像的特征的标识；

将所述嵌入误差反向传播到所述图像生成模型中以生成用于后续图像生成的更新的图像生成模型；

将所述图像的所述特征的所述标识反向传播到所述图像评估模型中以生成用于后续图像评估的更新的图像评估模型；以及

基于确定所述特征的所述标识来执行与所述特征的所述标识相关的动作。

2.根据权利要求1所述的设备，其中所述一个或多个处理器进一步用以：

使用所述更新的图像生成模型来基于其他图像生成候选图像的其他集合；以及

基于候选图像的所述其他集合来确定所述其他图像的其他特征的其他标识。

3.根据权利要求1所述的设备，其中所述一个或多个处理器进一步用以：

使用所述更新的图像评估模型来评估与其他图像相关的其他一个或多个候选图像；以及

基于所述其他一个或多个候选图像来确定所述其他图像的其他特征的其他标识。

4.根据权利要求1所述的设备，其中所述一个或多个处理器进一步用以：

确定所述嵌入误差不满足阈值；

基于确定所述嵌入误差不满足所述阈值，使用确定所述图像嵌入和所述嵌入误差的结果来迭代图像生成和图像评估以确定其他图像嵌入和其他嵌入误差；并且

其中所述一个或多个处理器在确定所述图像的所述特征的所述标识时，用以：

基于所述其他图像嵌入和所述其他嵌入误差来确定所述图像的所述特征的所述标识。

5.根据权利要求1所述的设备，其中所述动作与使得自动驾驶车辆受到控制相关联。

6.根据权利要求1所述的设备，其中所述一个或多个处理器在执行与所述特征的所述标识相关的所述动作时，用以：

基于所述特征的所述标识来与其他设备通信以提供与更改所述其他设备的功能相关的命令。

7.根据权利要求1所述的设备，其中所述图像的所述特征是以下中的至少一项：

生物特征，

对象，

图像分段，或者

消息。

8.根据权利要求1所述的设备，其中所述图像评估模型是深度强化学习模型。

9.根据权利要求1所述的设备，其中所述图像生成模型是生成式对抗网络(gan)模型。

10.根据权利要求1所述的设备，其中所述图像是视频记录的至少一个帧。

11.根据权利要求1所述的设备，其中所述图像包括低分辨率图像。

12.根据权利要求1所述的设备，其中所述一个或多个处理器在使用所述图像评估模型来确定所述一个或多个候选图像在图像生成期间并且使用所述图像生成模型而被处理时，用以：

接收历史上的高分辨率图像的集合；以及

将所述一个或多个候选图像与所述历史上的高分辨率图像相比较。

13.一种方法，包括：

由设备获得媒体项；

由所述设备基于所述媒体项并且使用媒体生成模型来生成候选媒体集合以用于对象识别；

由所述设备基于所述候选媒体集合并且使用媒体评估模型来确定：候选媒体所述集合中的一个或多个候选媒体在媒体生成期间并且使用所述媒体生成模型而被处理以改进所述媒体项的特征的质量；

由所述设备针对所述一个或多个候选媒体并且基于所述媒体项来确定媒体嵌入；

由所述设备针对所述一个或多个候选媒体基于所述媒体嵌入和所述媒体项来确定嵌入误差；

由所述设备基于所述媒体嵌入和所述嵌入误差来确定所述媒体项的所述特征的标识；以及

由所述设备基于确定所述特征的所述标识来与其他设备通信以提供标识所述特征的信息。

14.根据权利要求13所述的方法，其中所述媒体项是以下中的至少一项：

图像，

视频记录，

音频记录，

虚拟现实表示，或者

数据表示。

15.根据权利要求13所述的方法，其中所述特征的所述质量是以下中的至少一项：

分辨率，

清晰度，或者

对比度。

16.根据权利要求13所述的方法，其中确定所述特征的所述标识包括：

使用同步定位与地图构建(slam)对象检测过程来确定所述特征的所述标识。

17.根据权利要求13所述的方法，其中确定所述特征的所述标识包括：

标识所述媒体项中的对象。

18.根据权利要求13所述的方法，进一步包括：

基于所述特征的所述标识来对所述媒体项进行分段；以及

其中与所述其他设备通信以提供标识所述特征的信息包括：

提供与对所述媒体项进行分段相关的信息。

19.根据权利要求13所述的方法，其中获得所述媒体项包括：

请求所述媒体项的低分辨率版本，

其中相对于所述媒体项的其他版本，所述低分辨率版本与减小的文件大小相关联；以及

其中生成所述候选媒体集合包括：

基于所述低分辨率版本，生成所述媒体项的至少一个高分辨率版本，

其中与所述低分辨率版本相比，所述至少一个高分辨率版本与较高的文件大小相关联。

20.一种存储指令的非瞬态计算机可读介质，所述指令包括：

一个或多个指令，所述一个或多个指令在由一个或多个处理器执行时使得所述一个或多个处理器：

基于图像并且使用图像生成模型来生成候选图像集合以用于对象识别，

其中所述候选图像集合中的每个候选图像相对于所述图像与增加的图像分辨率相关联；

针对所述候选图像集合并且基于所述图像来确定图像嵌入；

确定针对所述图像嵌入的嵌入误差阈值被满足；

基于所述图像嵌入并且基于确定所述嵌入误差阈值被满足来确定所述图像的特征的标识；以及

基于确定所述特征的所述标识来提供标识所述图像的所述特征的信息。

21.根据权利要求20所述的非瞬态计算机可读介质，其中所述一个或多个指令在由所述一个或多个处理器执行时进一步使得所述一个或多个处理器：

使用基于增强学习的图像评估模型来评估所述候选图像集合；

基于评估所述候选图像集合来确定分辨率标准被满足；并且

其中使得所述一个或多个处理器确定所述图像嵌入的所述一个或多个指令使得所述一个或多个处理器：

基于确定所述分辨率标准被满足来确定所述图像嵌入。

22.根据权利要求20所述的非瞬态计算机可读介质，其中所述图像是视频，并且其中所述候选图像集合是所述视频的帧的集合。

完整全部详细技术资料下载

当前第2页1 2 3