一种图像检测方法、装置、智能设备及存储介质与流程

文档序号:31222389发布日期:2022-08-23 16:08阅读:47来源:国知局
一种图像检测方法、装置、智能设备及存储介质与流程

1.本技术涉及计算机技术领域,尤其涉及图像处理技术领域,具体涉及一种图像检测方法、装置、智能设备及存储介质。


背景技术:

2.随着图像处理技术的发展,可以利用图像处理方法将两张图像进行拼凑处理生成一张图像,而这种拼凑图像往往可能是低质量的图像;在这种情况下,需要对图像进行图像拼凑检测,以确定该图像是否为图像拼凑。目前主要基于噪声模型的拼接定位方法来对某一张图像进行图像拼凑检测,其大致原理为:由于图像中拼接区域和非拼接区域来自于不同的图像,因此两者的模型噪声通常是不一致的,可以通过对图像进行噪声分析判断是否存在图像拼凑。但是该图像所包括的两张拼凑图像所使用的成像设备噪声比较小时,无法利用噪声模型来判断该图像是存在图像拼凑。


技术实现要素:

3.本技术实施例提供了一种图像检测方法、装置、智能设备及存储介质,可以较好地对图像进行图像拼凑检测。
4.一方面,本技术实施例提供了一种图像检测方法,包括:
5.获取待检测图像;
6.对所述待检测图像进行语义分割得到所述待检测图像的目标图像区域,并对所述待检测图像进行图像特征提取,得到目标特征图;
7.对所述目标特征图进行梯度运算得到所述目标特征图对应的梯度特征图,并根据所述梯度特征图确定所述待检测图像的梯度变化区域;
8.根据所述梯度变化区域和所述目标图像区域对所述待检测图像进行图像拼凑检测。
9.一方面,本技术实施例提供了一种图像检测装置,包括:
10.获取单元,用于获取待检测图像;
11.处理单元,用于对所述待检测图像进行语义分割得到所述待检测图像的目标图像区域,并对所述待检测图像进行图像特征提取,得到目标特征图;
12.所述处理单元,还用于对所述目标特征图进行梯度运算得到所述目标特征图对应的梯度特征图,并根据所述梯度特征图确定所述待检测图像梯度变化区域;
13.所述处理单元,还用于根据所述梯度变化区域和所述目标图像区域对所述待检测图像进行图像拼凑检测。
14.一方面,本技术实施例提供了一种智能设备,包括处理器和存储器,所述处理器和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述所述的图像检测方法。
15.本技术实施例一方面提供了一种计算机可读存储介质,该计算机可读存储介质中
存储有程序指令,该程序指令被执行时,用于实现上述所述的图像处理方法。
16.本技术实施例一方面提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机指令被智能设备的处理器执行时,执行上述所述的图像处理方法。
17.在本技术实施例中,智能设备可以获取待检测图像,并对待检测图像进行语义分割得到待检测图像的目标图像区域;并对待检测图像进行图像特征提取,得到目标特征图,并对目标特征图进行梯度运算,得到目标特征图对应的梯度特征图,并根据梯度特征图确定待检测图像的梯度变化区域;根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测;通过对目标特征图进行梯度运算,可以增强待检测图像中拼接区域的细节特征,进而根据梯度变化区域和目标图像区域可以更准确地对图像进行图像拼凑检测。
附图说明
18.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
19.图1是本技术实施例提供的一种图像检测系统的架构示意图;
20.图2是本技术实施例提供的一种图像检测方法的流程示意图;
21.图3a是本技术实施例提供的一种得到目标图像区域的示意图;
22.图3b是本技术实施例提供的一种编解码网络的架构示意图;
23.图3c是本技术实施例提供的一种卷积层中特征图的示意图;
24.图3d是本技术实施例提供的多个特征图的示意图;
25.图3e是本技术实施例提供的一种得到梯度变化区域的示意图;
26.图4是本技术实施例提供的一种图像检测方法的流程示意图;
27.图5是本技术实施例提供的一种计算交并比的示意图;
28.图6是本技术实施例提供的一种图像检测方法的流程示意图;
29.图7是本技术实施例提供的一种图像检测装置的结构示意图;
30.图8是本技术实施例提供的一种智能设备的结构示意图。
具体实施方式
31.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
32.本技术实施例提供了一种图像检测方案,该图像检测方案的大致原理为:当需要对某个图像(即待检测图像)进行检测时,一方面可以对待检测图像进行特征提取,抽取该待检测图像的特征图,然后对该待检测图像的特征图进行梯度运算,获得待检测图像的梯度特征,该梯度特征用于指示待检测图像梯度明显变化的区域,该梯度明显变化的区域往往是拼接区域与非拼接区域造成的;另一方面,可以对待检测图像进行语义分割,得到待检
测图像的目标图像区域,然后将梯度明显变化的区域和目标图像区域进行比对,可以获取待检测图像的图像拼凑结果(或称为画面拼凑结果)。本技术所提供的图像检测方案可以利用拼接区域和非拼接区域之间像素点变化较为显著的特点计算梯度特征,并以该梯度特征来对待检测图像进行辅助判断,可以较好地对图像进行图像拼凑检测,鲁棒性较强且操作过程更简洁。
33.为了更好地实现上述图像检测方案,本技术实施例提供了一种图像检测系统,请参阅图1,图1为本技术实施例提供的一种图像检测系统的架构示意图。该图像检测系统可以包括至少一个终端设备101和一个服务器102;终端设备101上可以安装有不同类型应用程序,例如,在该终端设备101上可以安装有即时通讯应用程序、直播应用程序、会议通信应用程序等等;该终端设备101可以是为智能手机、平板电脑、笔记本电脑、台式电脑、智能车载等等。服务器102可以用于存储终端设备101的不同类型应用程序所产生的应用数据和图像数据。服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器,等等。
34.其中,上述图像检测方案由终端设备101或者服务器102执行,当该图像检测方案由终端设备101执行时,终端设备101在不同类型应用程序中所生成的待检测图像可以包括在服务器中,然后当终端设备101需要对待检测图像进行图像拼凑检测时,终端设备101可以向服务器102获取待检测图像,然后终端设备101在从服务器102中获取到了待检测图像之后,可以对待检测图像进行特征提取,得到待检测图像的特征图,并对该特征图进行梯度计算,得到待检测图像的梯度特征,并根据该梯度特征可以确定该待检测图像的梯度变化区域;终端设备101可以对待检测图像进行语义分割,得到待检测图像的目标图像区域,进而根据梯度变化区域和目标图像区域对该待检测图像进行图像拼凑检测。
35.基于上述提供的图像检测方案和图像检测系统,请参阅图2,图2为本技术实施例提供的一种图像检测方法的流程示意图。该图像检测方法可以是由智能设备来执行,该智能设备可以是上述终端设备101或服务器102。该图像检测方法可以包括以下步骤s201-s205。
36.s201、获取待检测图像。
37.其中,待检测图像可以是任一静态图片、动态图像中的任一帧图像,或者任一视频中的任一帧图像,等等,本技术实施例不作限定。待检测图像的数量可以是一个或者多个。
38.在具体实现中,智能设备可以从本地空间中所预先保存的图像资源或视频资源中获取该待检测图像。其中,从图像资源中获取待检测图像的具体实施方式可以是:若图像资源是一个静态图像,则可直接将该图像资源作为待检测图像;若图像资源是一个动态图像,则可从动态图像中的各帧图像获取任意一帧图像作为待检测图像。应理解的是,从视频资源中获取待检测图像的具体实施方式,与从动态图像中获取待检测图像的具体实施方式类似,在此不再赘述。
39.在一个实施例中,智能设备还可以从目标视频中获取待检测图像,其中,该目标视频可以实时获取到的视频。该目标视频可以是指从即时通信场景下进行视频通话过程中获取的,例如,当多人利用即时通信应用进行视频通信时,目标视频可以是包括多人通信的视
频;或者,该目标视频是从会议通信场景下进行会议通信过程中获取的,例如在进行会议通信时,目标视频可以包括多个参与会议用户的视频;或者,目标视频还可以是从直播通信场景下进行直播时获取的,例如,主播在进行直播时,该目标视频可以是与直播主播相关的视频。然后,从目标视频中获取任意一帧图像作为待检测图像。
40.在一个实施例中,当目标用户认为某张图像中可能存在拼接区域和非拼接区域时,可以提交图像检测请求;智能设备可以接收目标用户发送的图像检测请求,该图像检测请求中携带有待检测图像。其中,目标用户可以是管理待检测图像的用户,或者,目标用户可以是浏览待检测图像的用户等等。本技术实施例不作限定。
41.s202、对待检测图像进行语义分割,得到待检测图像的目标图像区域。
42.在具体实现中,智能设备可以调用语义分割模型对待检测图像进行语义分割,得到待检测图像的目标图像区域。在一个实施例中,智能设备可以调用语义分割模型对待检测图像进行语义分割,得到待检测图像的语义分割区域,并将语义分割区域进行框选处理,得到目标图像区域。将语义分割区域进行框选处理得到目标图像区域,有利于后续对待检测图像区域进行图像拼凑检测。应理解的是,语义分割其实就是为了识别得到待检测图像中是否存在拼接区域。例如,在图3a中,语义分割模型输入的待检测图像为人物图像,该人物如图3a中的31;智能设备可以对人物图像进行语义分割,可以得到如图3a的语义分割区域32;然后对语义分割区域32进行框选处理,得到人物图像的目标图像区域33。
43.在一个实施例中,该语义分割模型可以是卷积神经网络,该卷积神经网络可以是编解码网络;当语义分割模型为编解码网络时,智能设备可以调用编解码网络对待检测图像进行语义分割,得到目标图像区域。具体的,将待检测图像输入编解码网络,以使编解码网络对所述待检测图像进行语义分割;然后获得编解码网络中的解码子网络基于语义分割操作输出的目标图像区域。其中,编解码网络的结构可以采用u-net模式,该编解码网络如图3b所示,该编解码网络主要包括编码子网络301和解码子网络302;编码子网络301和解码子网络302是以卷积层和池化层交替排列。在编码子网络301中,该待检测图像的特征图通过卷积层和池化层处理后尺寸大小逐渐减少,维度逐渐增加;而在解码子网络302中则相反;在编码子网络301中可以包括池化层和卷积层,其中,在编码子网络中的池化层可以称为下采样层;下采样层可以用于对待检测图像进行编码,得到比待检测图像尺寸较小的特征图(即可理解为在编码子网络中对待检测图像进行了压缩);卷积层用于提取待检测图像中的重要特征信息,在本技术实施例中卷积层主要用于提取待检测图像中关于拼接区域的特征信息;在解码子网络302中可以包括池化层和卷积层;其中,在解码子网络中的池化层可以称为上采样层;上采样层用于将比待检测图像尺寸较小的特征图进行还原解码到与待检测图像相同尺寸的图像,根据编码子网络中使用到的卷积核参数,在解码子网络中选择与之相对应的卷积核参数,不断进行上采样过程来保证特征图尺寸相同。在编码子网络301和解码子网络302中,相同尺寸大小的特征图之间具有跨线链接,该跨线连接可以快速还原信息损失。可以理解的是,智能设备调用编解码网络对待检测图像进行语义分割之后,该编解码网络的解码子网络输出的可以是待检测图像的目标图像区域,或者该编解码网络的解码子网络输出的还可以是语义分割区域,然后将该语义分割区域进行框选处理,得到目标图像区域。
44.在一个实施例中,在调用编解码网络对待检测图像进行语义分割之前,可以先对
编解码网络进行训练。智能设备可以获取多个训练样本图像,多个训练样本图像可以包括负样本图像和正样本图像,所谓负样本图像是指存在拼接区域的图像,正样本图像是指不存在拼接区域的图像,其中,负样本图像的数量和正样本图像的数量需要满足一定的预设条件,然后利用多个训练样本图像对编解码网络进行训练。其中,预设条件可以根据需求或者经验设置;多个训练样本图像可以从pascal voc 2011语义数据集中获取得到。
45.s203、对待检测图像进行图像特征提取,得到目标特征图。
46.其中,目标特征图包括了待检测图像中的重要特征,在本技术实施例目标特征图主要包括了待检测图像的拼接区域的重要特征信息。在具体实现时,智能设备可以在对待检测图像进行语义分割的过程中,对待检测图像特征提取,得到目标特征图。
47.在一个实施例中,智能设备在调用编解码网络对待检测图像进行语义分割的过程中,可以从编码子网络中获取待检测图像对应的目标特征图。更为具体的,智能设备从编解码网络的编码子网络的目标卷积层中获得基于语义分割操作得到的目标特征图。其中,目标卷积层可以是编码子网络中的任一卷积层。
48.在一个实施例中,智能设备在调用编解码网络对待检测图像进行语义分割的过程中,可以从编码子网络的目标卷积层中获取待检测图像对应的一个或者多个特征图;由于,待检测图像中出现频次最多的信息往往出现在特征图中的同一个区域,因此,智能设备可以从一个或者多个特征图中选择任意一张特征图片作为目标特征图。例如,在图3c中,待检测图像为蝴蝶图像,智能设备在调用编解码网络对该蝴蝶图像进行语义分割的过程中,通过下采样层进行处理,然后通过下采样层处理后的蝴蝶图像进入卷积层进行处理,可以看出通过编码子网络处理之后,蝴蝶图像对应的特征图的尺寸会越来越小;然后蝴蝶图像在卷积层中的特征图如图3c;然后智能设备在卷积层对蝴蝶图像进行特征提取,得到蝴蝶图像对应的多个特征图,该多个特征图如图3d所示,其中,在图3d中,303包括的特征图0-特征图8是在图3c所示的卷积层301进行特征提取得到的,304包括的特征图0-特征图8是在图3c所示的卷积层302进行特征提取得到的;然后智能设备可以从303包括的多个特征图中选择第一张特征图作为蝴蝶图像的目标特征图;或智能设备也可以从304包括的多个特征图中选择第一张特征图作为蝴蝶图像的目标特征图。
49.s204、对目标特征图进行梯度运算得到目标特征图对应的梯度特征图,并根据梯度特征图确定待检测图像的梯度变化区域。
50.在具体实现中,上述目标特征图是由多个像素点构成;智能设备可以对目标特征图中任意相邻的两个像素点进行梯度运算,得到任意相邻像素点之间的梯度特征,然后根据任意相邻像素点之间的梯度特征可以确定目标特征图对应的梯度特征图。通过对目标特征图进行梯度运算,可以增加待检测图像的细节特征(即增加待检测图像中拼接区域的特征),而削弱待检测图像的平滑区域(即削弱待检测图像中非拼接区域的特征)。该梯度特征图可以如图3e所示的蝴蝶图像对应的梯度特征图,可以看出相较于目标特征图,在该梯度特征图中的像素点亮度更加明显,而像素点亮度更明显的原因在于通过梯度运算,增加了待检测图像中的重要特征;然后智能设备对梯度特征图进行膨胀和腐蚀处理,可以得到待检测图像的梯度变化区域。其中,该梯度变化区域是由梯度变化明显的像素点构成的,该梯度变化区域可以认为是拼接区域。该梯度变化区域可以如图3e最右边白色线条所围住的区域。
51.s205、根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测。
52.在具体实现中,智能设备可以将梯度变化区域和目标图像区域进行对比,然后根据比对结果确定待检测图像是否为图像拼凑。具体的,由于目标图像区域包括拼接区域,该梯度变化区域同样用于指示待检测图像是否包括拼接区域,因此,智能设备将梯度变化区域和目标图像区域进行对比,若梯度变化区域和目标图像区域相同,则确定待检测图像为拼凑图像;若梯度变化区域和目标图像区域不相同,则确定待检测图像为完整图像。完整图像可以理解为图像中没有任何拼接,是原始图像。
53.在一个实施例中,由于未拼接区域中存在很多语义而可能被识别为目标图像区域,因此上述目标图像区域不一定包括拼接区域;在这种情况下,智能设备可以对梯度变化区域和目标图像区域进行交并比计算,根据交并比来对待检测图像进行图像拼凑检测。
54.在本技术实施例中,智能设备可以获取待检测图像,并对待检测图像进行语义分割,得到待检测图像的目标图像区域,然后对待检测图像进行图像特征提取,得到目标特征图,并对目标特征图进行梯度运算,得到目标特征图对应的梯度特征图,并根据梯度特征图确定出梯度变化区域,根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测;通过对目标特征图进行梯度运算得到梯度变化区域,可以增强待检测图像中拼接区域的细节特征,从而结合梯度变化区域可以更准确地对图像进行图像拼凑检测。
55.基于上述提供的图像检测方案和图像检测系统,请参阅图4,图4为本技术实施例提供的一种图像检测方法的流程示意图。该图像检测方法可以是由智能设备来执行,该智能设备可以是上述终端设备101或服务器102。该图像检测方法可以包括以下步骤s401-s405:
56.s401、获取待检测图像。
57.s402、对待检测图像进行语义分割,得到待检测图像的目标图像区域。
58.s403、对待检测图像进行图像特征提取,得到目标特征图。
59.在具体实现中,智能设备可以调用编解码网络对待检测图像进行语义分割时,智能设备可以从编解码网络中编码子网络的卷积层抽取待检测图像的图像特征提取,得到待检测图像的目标特征图。
60.其中,步骤s401-s403的具体实现方式可参见上述步骤s201-s203的部分或者全部实现方式,在此不再赘述。
61.s404、调用目标卷积核对目标特征图进行梯度运算,得到目标特征图对应梯度特征图,并根据梯度特征图确定待检测图像的梯度变化区域。
62.其中,为了将梯度运算和卷积层进行统一,本技术实施例提供的目标卷积核可以包括以下一种或者两种:用于在水平方向对目标特征图进行梯度运算的卷积核和用于在垂直方向对目标特征图进行梯度运算的卷积核。用于在水平方向对目标特征图进行梯度运算的卷积核可以是3
×
3的卷积核等等;其中,该3
×
3的卷积核可以表示为:
[0063][0064]
用于在垂直方向对目标特征图进行梯度运算的卷积核可以是3
×
3的卷积核等等,
该3
×
3的卷积核可以表示为:
[0065][0066]
在实际应用过程中,通过在水平方向或垂直方向上对目标特征图进行梯度运算,可以将梯度运算操作看成一层卷积。该目标卷积核可以根据实际情况进行设置,本技术实施例对作不做限定。
[0067]
在一个实施例中,由于图像属于一种比较特殊的二维函数,其微分形式需要用偏导数来表示,在水平方向上有如下公式:
[0068][0069]
在垂直方向上有如下公式:
[0070][0071]
但是,与连续函数相比图像属于离散型二维函数,这是因为图像是由多个像素点排列而成,因此,目标特征图也是有多个像素点排列而成。在这种情况喜下,调用目标卷积核对目标特征图进行梯度运算的具体实现方式为:针对多个像素点中的目标像素点,智能设备可以调用目标卷积核对目标像素点以及与目标像素点相邻的相邻像素点进行梯度运算,得到目标像素点和相邻像素点之间的梯度特征,并根据目标像素点和相邻像素点的之间梯度特征生成目标特征图的梯度特征图。其中,目标像素点为多个像素点中的任一像素点;需要说明的是,目标像素点和相邻像素点进行梯度运算,实际上得到的是梯度值,该梯度值可以体现目标像素点和相邻像素点之间的梯度特征,梯度特征图由目标特征图中每个像素点与相邻像素点之间的梯度特征生成。由于目标卷积核只针对水平方向或垂直方向的像素点进行梯度运算,因此任意相邻两个像素点之间的差距最小值ε为1,因此,在水平方向上的梯度运算公式可以表示为:
[0072][0073]
其中,表示水平方向上目标像素点对应的梯度值,(x,y)表示目标像素点,f(x,y)表示目标像素点的像素值;(x+1,y)表示目标像素点在水平方向上的相邻像素点,f(x+1,y)表示相邻像素点的像素值。
[0074]
在垂直方向上的梯度运算公式可以表示为:
[0075]
[0076]
其中,表示垂直方向上的目标像素点对应的梯度值,(x,y)表示目标像素点,f(x,y)表示目标像素点的像素值;(x,y+1)表示目标像素点在垂直方向上的相邻像素点,f(x,y+1)表示相邻像素点的像素值。
[0077]
在得到目标特征图对应的梯度特征图之后,智能设备根据梯度特征图确定出梯度变化区域的具体实现方式为:智能设备对梯度特征图中的梯度特征进行膨胀处理,得到膨胀后的梯度特征图,然后对梯度特征图中的梯度特征进行腐蚀处理,得到腐蚀后的梯度特征图;并根据膨胀后的梯度特征图和腐蚀后的梯度特征图,确定待检测图像的梯度变化区域。其中,智能设备对梯度特征图进行膨胀处理,实际上是指将梯度特征图中满足预设阈值的梯度值对应的梯度特征进行延伸处理。通过膨胀处理之后梯度特征图的整体亮度的平均值比未膨胀的梯度特征图会提高,梯度特征图中梯度特征对应的亮度大于亮度阈值的所在区域面积会变大,从而对梯度特征实现了延伸处理,而梯度特征图中梯度特征对应的亮度小于或等于亮度阈值所在的区域面积会变小甚至消失。智能设备对梯度特征图进行腐蚀处理,实际上是指将梯度特征图中不满足预设阈值的梯度值对应的梯度特征进行腐蚀处理;通过腐蚀处理后梯度特征图的总体亮度的平均值比未腐蚀的梯度特征图会有所降低,梯度特征图中梯度特征对应的亮度大于阈值的所在区域面积会变小甚至消失,而梯度特征图中梯度特征对应的亮度小于或者等于阈值的所在区域面积会扩大。智能设备根据膨胀后的梯度特征图和腐蚀后的梯度特征图,可以确定待检测图像的梯度变化区域。其中,待检测图像的梯度变化区域可以包括梯度变化明显的像素点,该梯度变化明显的像素点一般是处于拼接区域的像素点。
[0078]
s405、根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测。
[0079]
在一个实施例中,智能设备可以确定梯度变化区域与目标图像区域的交集,以及确梯度变化区域与目标图像区域的并集;然后计算交集与并集之间的比值,并根据交集与并集之间的比值对待检测图像进行图像拼凑检测。例如,图5为对梯度变化区域和目标图像区域进行交并比计算的流程。在图5包括目标图像区域和梯度变化区域,该目标图像区域为矩形框所指示的区域;然后智能设备对目标图像区域和梯度变化区域之间计算并集,以及计算对目标图像区域和梯度变化区域之间计算交集,然后可以计算交集与并集之间的比值iou,并根据iou可以对待检测图像进行图像拼凑检测。
[0080]
在一个实施例中,根据交集与并集之间的比值对待检测图像进行图像拼凑检测的具体实现方式为:判断交集和并集之间的比值是否大于或者等于目标阈值,若智能设备确定交集和并集之间的比值大于或者等于目标阈值,则可以确定待检测图像为拼凑图像;若智能设备确定交集和并集之间的比值小于目标阈值,则可以确定待检测图像为完整图像,所谓完整图像是指:不存在拼接区域的图像,为原始图像。其中,目标阈值可以根据需求设置。
[0081]
在一个实施例中,上述目标阈值可以根据待检测图像的图像来源设置。例如,待检测图像的图像来源于图片资源,该目标阈值可以设置为0.5;又例如,待检测图像的图像来源于直播视频,该目标阈值可以设置为0.45。在另一个实施例中,上述目标阈值还可以根据待检测图像的图像类别设置。例如,待检测图像的图像类别为人物图像,该目标阈值可以设置为0.3;又例如,待检测图像的图像类别为动物图像,该目标阈值可以设置为0.6。
[0082]
在一个实施中,待检测图像的数量可以为多个,多个待检测图像是从目标视频中获取的,即理解为,需要判断某个视频是否存在多帧图像均为拼凑图像。智能设备可以从目标视频中随机获取多帧图像,并将多帧图像均作为待检测图像。然后,智能设备可以统计多个待检测图像中被确定为拼凑图像的数量,并判断该数量是否超过数量阈值,若该数量超过数量阈值,则可以认为目标视频不是真实的视频,是属于拼凑图像构成的视频;智能设备可以为目标视频添加标记信息,其中,标记信息用于指示目标视频为不可推荐。若该数量未超过数量阈值,则认为目标视频为不存在拼接的视频,则可以向用户展示目标视频。其中,数量阈值可以根据需求设置,例如该数量阈值可以是3、6等等,本技术实施例不作限定。
[0083]
在本技术实施例中,智能设备在获取到待检测图像之后,可以对待检测图像进行语义分割,得到待检测图像的目标图像区域;然后对待检测图像进行图像特征提取,得到目标特征图;并调用目标卷积核对目标特征图进行梯度运算,得到目标特征图对应梯度特征图,并根据梯度特征图确定出梯度变化区域;根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测。通过利用目标卷积核来对目标特征进行梯度运算可以较为简单快速地得到梯度特征图,根据梯度变化区域和目标图像区域来对待检测图像进行画像拼凑检测,可以更准确地对图像进行图像拼凑检测,鲁棒性较高。
[0084]
基于上述提供的图像检测方法,本技术实施例可以具体应用于各种直播场景或者各种视频录制场景。例如,请参见图6,针对直播场景来说,该图像检测方法可以包括:
[0085]
(1)智能设备截取直播场景中任意一帧图像作为待检测图像,然后将待检测图像输入到编解码网络,智能设备调用编解码网络对待检测图像进行语义分割,得到语义分割区域;然后对语义分割区域进行框选处理,得到目标图像区域。
[0086]
(2)智能设备在调用编解码网络对待检测图像进行语义分割的过程中,从编码子网络的卷积层获取待检测图像对应的目标特征图,并对该目标特征图进行梯度计算,得到梯度特征图,在梯度特征图中每个像素点的亮度明显,然后对梯度特征图进行处理,得到梯度变化区域。
[0087]
(3)将目标图像区域和梯度变化区域进行交并比计算,然后根据该交并比来对待检测图像进行图像拼接检测;在图6中,根据交并比确定出待检测图像的检测结果为图像拼凑。
[0088]
基于上述提供的图像检测方法,本技术实施例提供了一种图像检测装置的结构示意图。图像检测装置可以应用于上述图2或图4对应实施例中的智能设备;具体的,图像检测装置可以是运行于智能设备中的一个计算机程序(包括程序代码),例如图像检测装置为一个应用软件;该图像检测装置可以用于执行本技术实施例提供的方法中的相应步骤。如图7所示,图像检测装置可以具体包括获取单元701及处理单元702。
[0089]
获取单元701,用于获取待检测图像;
[0090]
处理单元702,用于对所述待检测图像进行语义分割得到所述待检测图像的目标图像区域,并对所述待检测图像进行图像特征提取得到目标特征图;
[0091]
所述处理单元702,还用于对所述目标特征图进行梯度运算,得到所述目标特征图对应的梯度特征图,并根据所述梯度特征图确定所述待检测图像的梯度变化区域;
[0092]
所述处理单元702,还用于根据所述梯度变化区域和目标图像区域对所述待检测图像进行图像拼凑检测。
[0093]
在一个实施例中,所述处理单元702在所述对所述待检测图像进行语义分割得到所述待检测图像的目标图像区域,并对所述待检测图像进行图像特征提取得到目标特征图时,可具体用于:
[0094]
将所述待检测图像输入编解码网络,以使所述编解码网络对所述待检测图像进行语义分割;
[0095]
获得所述编解码网络中的解码子网络基于语义分割操作输出的目标图像区域,并从所述编解码网络的编码子网络的目标卷积层中获得基于语义分割操作得到的目标特征图。
[0096]
在一个实施例中,所述处理单元702在对所述目标特征图进行梯度运算,得到所述目标特征图对应的梯度特征图时,可具体用于:
[0097]
调用目标卷积核对所述目标特征图进行梯度运算,得到所述目标特征图对应梯度特征图,所述目标卷积核包括以下一种或两种:用于在水平方向对所述目标特征图进行梯度运算的卷积核和用于在垂直方向对所述目标特征图进行梯度运算的卷积核。
[0098]
在一个实施例中,所述处理单元702在根据梯度特征图确定所述待检测图像的梯度变化区域时,可具体用于:
[0099]
对所述梯度特征图中的梯度特征进行膨胀处理,得到膨胀后的梯度特征图;
[0100]
对所述梯度特征图中的梯度特征进行腐蚀处理,得到腐蚀后的梯度特征图;
[0101]
根据膨胀后的梯度特征图和腐蚀后的梯度特征图,确定所述待检测图像的梯度变化区域。
[0102]
在一个实施例中,所述处理单元702在根据所述梯度变化区域和目标图像区域对所述待检测图像进行图像拼凑检测时,可具体用于:
[0103]
确定所述梯度变化区域与所述目标图像区域的交集,以及确定所述梯度变化区域与所述目标图像区域的并集;
[0104]
根据所述交集与所述并集之间的比值对所述待检测图像进行图像拼凑检测。
[0105]
在一个实施例中,所述处理单元702在根据所述交集与所述并集之间的比值对所述待检测图像进行图像拼凑检测时,可具体用于:
[0106]
若所述交集与所述并集之间的比值大于或者等于目标阈值,则确定所述待检测图像为拼凑图像;
[0107]
若所述交集与所述并集之间的比值小于所述目标阈值,则确定所述待检测图像为完整图像。
[0108]
在一个实施例中,所述待检测图像的数量为多个,多个待检测图像是从所述目标视频中获取的,所述处理单元702还用于:
[0109]
统计所述多个待检测图像中被确定为拼凑图像的数量;
[0110]
若所述数量超过数量阈值,则为所述目标视频添加标记信息,所述标记信息用于指示所述目标视频为不可推荐视频。
[0111]
在一个实施例中,所述目标视频是从即时通信场景下进行视频通话过程中获取的;或者,所述目标视频是从会议通信场景下进行会议通信过程中获取的;或者,所述目标视频是从直播通信场景下进行直播时获取的。
[0112]
可以理解的是,本实施例的图像检测装置的各单元的功能可根据上述方法实施例
中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
[0113]
在本技术实施例中,智能设备可以获取待检测图像,并对待检测图像进行语义分割,得到待检测图像的目标图像区域;然后对待检测图像进行图像特征提取,得到目标特征图,并对目标特征图进行梯度运算,得到目标特征图对应的梯度特征图,并根据梯度特征图确定出梯度变化区域;根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测;通过对目标特征图进行梯度运算,可以增强待检测图像中拼接区域的细节特征;然后根据梯度变化区域和目标图像区域可以较好地对图像进行图像拼凑检测。
[0114]
请参阅图8,图8为本技术实施例提供的一种智能设备的结构示意图。如图8所示的本实施例中的智能设备可以包括:一个或多个处理器801;一个或多个输入设备802,一个或多个输出设备803和存储器804。上述处理器801、输入设备802、输出设备803和存储器804通过总线805连接。存储器802用于存储计算机程序,所述计算机程序包括程序指令,处理器801用于执行存储器802存储的程序指令,执行以下操作:获取待检测图像;对所述待检测图像进行语义分割得到所述待检测图像的目标图像区域,并对所述待检测图像进行图像特征提取,得到目标特征图;对所述目标特征图进行梯度运算得到所述目标特征图对应的梯度特征图,并根据梯度特征图确定所述待检测图像的梯度变化区域;根据所述梯度变化区域和目标图像区域对所述待检测图像进行图像拼凑检测。
[0115]
在一个实施例中,所述处理器801在对所述待检测图像进行语义分割得到所述待检测图像的目标图像区域,并对所述待检测图像进行图像特征提取得到目标特征图时,可具体用于:
[0116]
将所述待检测图像输入编解码网络,以使所述编解码网络对所述待检测图像进行语义分割;
[0117]
获得所述编解码网络中的解码子网络基于语义分割操作输出的目标图像区域,并从所述编解码网络的编码子网络的目标卷积层中获得基于语义分割操作得到的目标特征图。
[0118]
在一个实施例中,所述处理器801在对所述目标特征图进行梯度运算,得到所述目标特征图对应的梯度特征图时,可具体用于:
[0119]
调用目标卷积核对所述目标特征图进行梯度运算,得到所述目标特征图对应梯度特征图,所述目标卷积核包括以下一种或两种:用于在水平方向对所述目标特征图进行梯度运算的卷积核和用于在垂直方向对所述目标特征图进行梯度运算的卷积核。
[0120]
在一个实施例中,所述处理器801在根据梯度特征图确定所述待检测图像的梯度变化区域时,可具体用于:
[0121]
对所述梯度特征图中的梯度特征进行膨胀处理,得到膨胀后的梯度特征图;
[0122]
对所述梯度特征图中的梯度特征进行腐蚀处理,得到腐蚀后的梯度特征图;
[0123]
根据膨胀后的梯度特征图和腐蚀后的梯度特征图,确定所述待检测图像的梯度变化区域。
[0124]
在一个实施例中,所述处理器801在根据所述梯度变化区域和目标图像区域对所述待检测图像进行图像拼凑检测时,可具体用于:
[0125]
确定所述梯度变化区域与所述目标图像区域的交集,以及确定所述梯度变化区域与所述目标图像区域的并集;
[0126]
根据所述交集与所述并集之间的比值对所述待检测图像进行图像拼凑检测。
[0127]
在一个实施例中,所述处理器801在根据所述交集与所述并集之间的比值对所述待检测图像进行图像拼凑检测时,可具体用于:
[0128]
若所述交集与所述并集之间的比值大于或者等于目标阈值,则确定所述待检测图像为拼凑图像;
[0129]
若所述交集与所述并集之间的比值小于所述目标阈值,则确定所述待检测图像为完整图像。
[0130]
在一个实施例中,所述待检测图像的数量为多个,多个待检测图像是从所述目标视频中获取的,所述处理器801,可具体用于:
[0131]
统计所述多个待检测图像中被确定为拼凑图像的数量;
[0132]
若所述数量超过数量阈值,则为所述目标视频添加标记信息,所述标记信息用于指示所述目标视频为不可推荐视频。
[0133]
在一个实施例中,所述目标视频是从即时通信场景下进行视频通话过程中获取的;或者,所述目标视频是从会议通信场景下进行会议通信过程中获取的;或者,所述目标视频是从直播通信场景下进行直播时获取的。
[0134]
应当理解,在本技术实施例中,所称处理器801可以是中央处理单元(central processing unit,cpu),该处理器801还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0135]
该存储器804可以包括只读存储器和随机存取存储器,并向处理器801提供指令和数据。存储器804的一部分还可以包括非易失性随机存取存储器。存储器804可以存储待检测图像。
[0136]
具体实现中,本技术实施例中所描述的处理器801、输入设备802、输出设备803和存储器804可执行本技术实施例提供的图像检测方法所描述的实现方式,也可执行本技术实施例所描述的智能设备的实现方式,在此不再赘述。
[0137]
在本技术实施例中,智能设备可以获取待检测图像,对待检测图像进行语义分割得到待检测图像的目标图像区域,并对待检测图像进行图像特征提取,得到目标特征图,并对目标特征图进行梯度运算得到目标特征图对应的梯度特征图,并根据梯度特征图确定待检测图像的梯度变化区域;根据梯度变化区域和目标图像区域对待检测图像进行图像拼凑检测;通过对目标特征图进行梯度运算,可以增强待检测图像中拼接区域的细节特征,进而根据梯度变化区域和目标图像区域可以较准确地对图像进行图像拼凑检测。
[0138]
本技术实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,可执行上述图像检测实施例中所执行的步骤。
[0139]
本技术实施例还提供一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令存储在计算机可读存储介质中,计算机指令被智能设备的处理器执行时,执行上述所有实施例中的方法。
[0140]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
[0141]
以上所揭露的仅为本技术一种较佳实施例而已,当然不能以此来限定本技术之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本技术权利要求所作的等同变化,仍属于发明所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1