一种获取视觉属性信息的方法、装置、介质及电子设备与流程

文档序号:32123629发布日期:2022-11-09 07:32阅读:28来源:国知局
一种获取视觉属性信息的方法、装置、介质及电子设备与流程

1.本技术涉及深度学习领域,具体而言本技术实施例涉及一种获取视觉属性信息的方法、装置、介质及电子设备。


背景技术:

2.作为一个信息化蓬勃发展的时代,信息存在的方式多种多样,主要是包括语音、文字、图像、视频等。而人员本身就包含着很多的信息,如表情、性别、种族等。人员属性(作为视觉属性信息的一类)识别在现实生活中有着重要的作用,在工厂里通过对人员属性的识别,可以为工人提供更为安全的保障措施,在商场里通过人员属性识别可以为客户提供更精准的服务。因此,对人员属性识别的研究有着重要的意义。
3.深度学习技术的发展促进了目标检测、识别、分割等技术在各个领域不断取得突破性进展。相对于传统的算法需要对数据进行复杂的预处理操作,以及针对不同的任务需要设计不同的人工特征,耗时久、普适性差,而深度学习技术采用端到端的方法对数据进行特征提取,具有更强的泛化能力以及高鲁棒性。
4.传统的目标检测方法主要是利用直方图、哈希特征等算子,整体上流程更为复杂,并且准确率较低。基于two-stage的算法,如rcnn、fast-rcnn等虽然其准确率较高,但是由于two-stage算法在特征提取环节首先需要进行候选区域生成,以及对候选区域进行相应处理,实时性较差。


技术实现要素:

5.本技术实施例的目的在于提供一种获取视觉属性信息的方法、装置、介质及电子设备,采用本技术实施例的技术方案保证模型检测速度的同时也具有较高的准确率。
6.第一方面,本技术实施例提供一种获取视觉属性信息的方法,所述方法包括:获取待识别图像;将所述待识别图像输入目标属性信息提取模型,并通过所述目标属性信息提取模型得到至少一种视觉属性信息,其中,所述目标属性信息提取模型包括:第一特征提取网络、第二特征提取网络以及输出网络,所述第一特征提取网络采用深度可分离卷积对所述待识别图像进行特征提取得到三张特征图,所述第二特征提取网络对所述三张特征图分别再次进行特征提取得到三张目标特征图,所述输出网络用于输出所述三张目标特征图。
7.本技术的一些实施例的第一特征提取网络采用深度可分离卷积代替普通卷积,使得在卷积计算中减少参数量,达到轻量化目的。
8.在一些实施例中,所述第一特征提取网络包括mobilenetv3网络,其中,所述mobilenetv3网络采用所述深度可分离卷积对所述待识别图像进行特征提取。
9.本技术的一些实施例基于mobilenetv3网络实现深度可分离卷积运算。
10.在一些实施例中,所述第一特征提取网络还包括第一池化处理模块以及第二池化处理模块,其中,所述第一池化处理模块被配置为得到固定尺寸的特征向量,所述第二池化处理模块被配置为提取不同尺寸的空间特征信息。
11.本技术的一些实施例在backbone特征提取部分(即在第一特征提取网络),使用了双spp模块(即第一池化处理模块以及第二池化处理模块),第一个spp主要是可以有效输出固定尺寸的特征向量,防止因为图像尺寸过大直接使用裁剪缩放等造成的图像失真情况,第二个spp主要是提取不同尺寸的空间特征信息,提升模型对于空间布局以及物体变性的鲁棒性。本技术的一些实施例通过spp模块操作丰富了特征图的表达能力,对所检测图像中的目标大小差异较大的情况有很大的帮助,可进一步提升检测模型的精度。
12.在一些实施例中,所述通过所述目标属性信息提取模型得到至少一种视觉属性信息,包括:将所述待识别图像输入所述第一池化处理模块得到固定尺寸的特征向量;根据所述特征向量和所述mobilenetv3网络得到一张初始特征图;根据所述初始特征图和所述第二池化处理模块得到目标特征图,其中,所述目标特征图属于所述三张特征图中的一张。
13.本技术的一些实施例通过第一池化处理模块得到固定尺寸的处理数据,之后再由第二池化处理模块得到目标特征图,提升了技术方案的通用性。
14.在一些实施例中,所述第一池化处理模块和所述第二池化处理模块均分别包括:第一池化子模块、第二池化子模块、第三池化子模块以及拼接子模块,其中,所述第一池化子模块使用第一尺寸的池化核对输入图像进行池化操作得到第一尺寸池化图,所述第二池化子模块使用第二尺寸的池化核对所述输入图像进行池化操作得到第二尺寸池化图,所述第三池化子模块使用第三尺寸的池化核对所述输入图像进行池化操作得到第三尺寸池化图,所述拼接子模块被配置为使用拼接函数对所述输入图像、所述第一尺寸池化图、所述第二尺寸池化图以及所述第三尺寸池化图进行一个通道上的融合得到所述第一池化处理模块或者所述第二池化处理模块的输出图像。
15.通过本技术实施例提供的池化处理模块的架构可进一步提升模型的检测精度以及检测速度。
16.在一些实施例中,所述第一尺寸的池化核为5*5池化核、所述第二尺寸的池化核为9*9池化核,所述第三尺寸的池化核为13*13池化核。
17.本技术的一些实施例采用三种尺寸的卷积核进行变换提升技术方案的通用性。
18.在一些实施例中,所述第一特征提取网络还包括cbam注意力机制处理模块,其中,所述cbam注意力机制处理模块接收由所述mobilenetv3网络输出的图像数据,所述cbam注意力机制处理模块的输出数据作为所述第二特征提取网络的输入数据。
19.本技术的一些实施例提供的cbam注意力机制是在senet注意力机制的基础上添加了一个基于空间的注意力模块,提升得到的预测结果的准确性。
20.在一些实施例中,所述cbam注意力机制处理模块被配置为:针对输入的特征图,在每一个特征点的通道上取平均值和最大值得到两个结果,再把所述两个结果进行堆叠并通过点卷积改变通道数,再经过一个sigmoid函数得到输入特征层每一个特征点的权重,把所述权重与所述输入的特征图相乘完成空间注意力的操作。
21.本技术的一些实施例通过cbam注意力机制处理模块完成空间注意力的操作。
22.在一些实施例中,所述mobilenetv3网络包括第一mobilenetv3网络、第二mobilenetv3网络以及第三mobilenetv3网络,所述cbam注意力机制处理模块包括第一cbam注意力机制处理模块、第二cbam注意力机制处理模块以及第三cbam注意力机制处理模块,其中,所述第一mobilenetv3网络的输出作为所述第一cbam注意力机制处理模块的输入;所
述第二mobilenetv3网络的输出作为所述第二cbam注意力机制处理模块的输入;所述第三mobilenetv3网络的输出作为所述第二池化处理模块的输入,且所述第二池化处理模块的输出作为所述第三cbam注意力机制处理模块的输入。
23.本技术的一些实施例提供一种具体的架构图。
24.在一些实施例中,所述第二特征提取网络使用panet网络。
25.在一些实施例中,在所述将所述待识别图像输入目标属性提取信息提取模型之前,所述方法还包括:使用k均值算法对数据集中的目标进行聚类,得到多个目标尺寸的先验框;根据所述先验框对属性信息提取模型进行训练得到所述目标属性信息提取模型。
26.本技术的一些实施例使用kmeans++算法进行目标框的聚类,可以避免在训练过程中出现算法收敛速度过慢的问题。
27.在一些实施例中,所述k均值算法为kmeans++算法。
28.第二方面,本技术的一些实施例提供一种获取视觉属性信息的装置,所述装置包括:获取模块,被配置为获取待识别图像;视觉属性信息获取模块,被配置为将所述待识别图像输入目标属性信息提取模型,并通过所述目标属性信息提取模型得到至少一种视觉属性信息,其中,所述目标属性信息提取模型包括:第一特征提取网络、第二特征提取网络以及输出网络,所述第一特征提取网络采用深度可分离卷积对所述待识别图像进行特征提取得到三张特征图,所述第二特征提取网络对所述三张特征图分别再次进行特征提取得到三张目标特征图,所述输出网络用于输出所述三张目标特征图。
29.第三方面,本技术的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述第一方面任意实施例所述的方法。
30.第四方面,本技术的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面任意实施例所述的方法。
附图说明
31.为了更清楚地说明本技术实施例的技术方案,下面将对本技术实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
32.图1为本技术实施例提供的训练属性信息模型得到目标属性信息提取模型的方法的流程图;
33.图2为本技术实施例提供的池化处理模块的架构图;
34.图3为本技术实施例提供的目标属性信息提取模型或者属性信息模型的架构图;
35.图4为本技术实施例提供的获取视觉属性信息的方法的流程图;
36.图5为本技术实施例提供的获取视觉属性信息的装置的组成框图;
37.图6为本技术实施例提供的电子设备组成示意图。
具体实施方式
38.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
39.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
40.传统的目标检测算法,一般是使用梯度直方图(hog)、哈希特征(haar)、特征点提取(orb)等算子进行特征提取,其普适性差,准确率低。而深度学习two-stage目标检测算法,虽然其精度较高,但是由于网络首先需要进行候选区域生成,并且针对候选区域进行分类以及位置回归得到检测的结果,导致实时性效果差,无法满足实际场景要求。本技术的一些实施例采用one-stage模型,满足真实场景实时性要求,同时针对算法准确率以及速度问题。
41.为满足实时性要求,在速度和精度方面的一个权衡,本技术的一些实施例选择基于one-stage的yolov4算法用于视觉属性信息(例如,人员属性)识别,并在此算法基础上进行改进,以提升模型的精度和检测速度。例如,本技术的一些实施例在主干网backbone(对应于第一特征提取网络)、neck部分(对应于第二特征提取网络)都做了相应的改进,以保证模型检测速度的同时也具有一定的准确率。
42.需要说明的是,本技术下述实施例的目标属性信息提取模型是对属性信息提取模型进行训练得到的,两个模型的架构相同。下面结合图1-图3示例性阐述训练过程以及模型的架构,应理解训练得到的目标属性信息提取模型的架构也可以采用图2-图3的架构。
43.请参看图1,图1为对属性信息提取模型进行训练得到目标属性信息提取模型的过程。需要说明的是,图1是以提取人员属性信息为例阐述训练过程,而本技术的一些实施例也可以用于提取非人员属性信息的其他属性信息。
44.如图1所示,训练过程包括如下步骤:
45.s1,首先使用相机获取真实场景下工作人员数据,进行数据采集时要保证一定的图像分辨率。
46.s2,得到交通路口的视频数据,对视频流进行帧处理操作得到图像数据,并且使用labeling等标注软件,对实际的图像数据进行标注,标注为工作人员相关属性的最小外接矩形框,如对眼镜、口罩的标注。
47.labeling是一个标注软件,比如对图像上人员属性标注。它会把人的口罩、眼镜、人脸、手套

这些属性用矩形框框起来,然后自动生成一个对应该图像的标注文件,该文件里会有标注的框尺寸信息、属性类别信息。
48.s3,该步骤首先对数据进行预处理,包括去除过于模糊的图像,并且按照一定划分比例,对数据集进行数据划分,得到训练所用的训练集、验证集以及测试集。
49.s4,处理好的数据送入到属性信息提取模型中对该模型进行训练,即将处理好的数据送入属性信息提取模型对该模型进行训练得到目标属性信息提取模型。
50.s5,训练好的模型(作为目标属性信息提取模型的一个示例)用于实际场景进行人员属性识别。也就是说,可以利用得到的目标属性信息提取模型来提取人员属性信息。
51.下面结合图2和图3示例性阐述属性信息提取模型或者目标属性信息提取模型的架构。
52.在本技术的一些实施例中,所述目标属性信息提取模型或者属性信息提取模型包括:第一特征提取网络、第二特征提取网络以及输出网络,所述第一特征提取网络采用深度
可分离卷积对所述待识别图像进行特征提取得到三张特征图,所述第二特征提取网络对所述三张特征图分别再次进行特征提取得到三张目标特征图,所述输出网络用于输出所述三张目标特征图。
53.例如,在本技术的一些实施例中,所述第一特征提取网络包括mobilenetv3网络,其中,所述mobilenetv3网络采用所述深度可分离卷积对所述待识别图像进行特征提取。本技术的一些实施例基于mobilenetv3网络实现深度可分离卷积运算。
54.例如,在本技术的一些实施例中,所述第一特征提取网络还包括第一池化处理模块以及第二池化处理模块,其中,所述第一池化处理模块被配置为得到固定尺寸的特征向量,所述第二池化处理模块被配置为提取不同尺寸的空间特征信息。本技术的一些实施例在backbone特征提取部分(即在第一特征提取网络),使用了双spp模块(即第一池化处理模块以及第二池化处理模块),第一个spp主要是可以有效输出固定尺寸的特征向量,防止因为图像尺寸过大直接使用裁剪缩放等造成的图像失真情况,第二个spp主要是提取不同尺寸的空间特征信息,提升模型对于空间布局以及物体变性的鲁棒性。本技术的一些实施例通过spp模块操作丰富了特征图的表达能力,对所检测图像中的目标大小差异较大的情况有很大的帮助,可进一步提升检测模型的精度。
55.例如,在本技术的一些实施例中,所述第一特征提取网络还包括cbam注意力机制处理模块,其中,所述cbam注意力机制处理模块接收由所述mobilenetv3网络输出的图像数据,所述cbam注意力机制处理模块的输出数据作为所述第二特征提取网络的输入数据。本技术的一些实施例提供的cbam注意力机制是在senet注意力机制的基础上添加了一个基于空间的注意力模块,提升得到的预测结果的准确性。
56.如图3所示,在本技术的一些实施例中,所述mobilenetv3网络包括第一mobilenetv3网络(对应图3的第一个m_bottleneck*6,其中,乘以6表征)、第二mobilenetv3网络(对应图3的第二个m_bottleneck*6)以及第三mobilenetv3网络(对应图3的m_bottleneck*3),所述cbam注意力机制处理模块包括第一cbam注意力机制处理模块(对应图3的cbam-1)、第二cbam注意力机制处理模块(对应图3的cbam-2)以及第三cbam注意力机制处理模块(对应图3的cbam-3),其中,所述第一mobilenetv3网络的输出作为所述第一cbam注意力机制处理模块的输入;所述第二mobilenetv3网络的输出作为所述第二cbam注意力机制处理模块的输入;所述第三mobilenetv3网络的输出作为所述第二池化处理模块的输入,且所述第二池化处理模块的输出作为所述第三cbam注意力机制处理模块的输入。需要说明的是,图3中*6和*3表示连续6次或者3次进行(顺序进行的)6次m_bottleneck模块进行数据的特征提取。
57.例如,如图3所示,在本技术的一些实施例中,所述第一池化处理模块(对应于图3的spp-1)和所述第二池化处理模块(对应于图3的spp-2)均分别包括:第一池化子模块、第二池化子模块、第三池化子模块以及拼接子模块,其中,所述第一池化子模块使用第一尺寸的池化核对输入图像进行池化操作得到第一尺寸池化图,所述第二池化子模块使用第二尺寸的池化核对所述输入图像进行池化操作得到第二尺寸池化图,所述第三池化子模块使用第三尺寸的池化核对所述输入图像进行池化操作得到第三尺寸池化图,所述拼接子模块被配置为使用拼接函数对所述输入图像、所述第一尺寸池化图、所述第二尺寸池化图以及所述第三尺寸池化图进行一个通道上的融合得到所述第一池化处理模块或者所述第二池化
处理模块的输出图像。例如,如图2所示,在本技术的一些实施例中,所述第一尺寸的池化核为5*5池化核、所述第二尺寸的池化核为9*9池化核,所述第三尺寸的池化核为13*13池化核。本技术的一些实施例采用三种尺寸的卷积核进行变换提升技术方案的通用性。
58.通过本技术实施例提供的池化处理模块的架构可进一步提升模型的检测精度以及检测速度。
59.例如,在本技术的一些实施例中,所述第二特征提取网络使用panet网络(对应图3的neck)。
60.需要说明的是,在本技术的一些实施例中,使用k均值算法对数据集中的目标进行聚类,得到多个目标尺寸的先验框;根据所述先验框对属性信息提取模型进行训练得到所述目标属性信息提取模型。不难理解的是,本技术的一些实施例使用kmeans++算法进行目标框的聚类,可以避免在训练过程中出现算法收敛速度过慢的问题。例如,所述k均值算法为kmeans++算法。
61.也就是说,属性信息提取模型中的backbone部分如图3所示,第一方面,在本技术的一些实施例中,为了提升目标的检测速度,使用mobilenetv3网络作为yolov4网络中的特征提取模块。作为轻量化网络中的代表之一,mobilenet网络在设计中广泛采用深度可分离卷积代替普通卷积,使得在卷积计算中减少参数量,达到轻量化目的。而mobilenetv3是综合了mobilenetv1和mobilenetv2的优点所设计出的,该网络主要结合了四个特点。分别是mobilenetv1的深度可分离卷积、mobilenetv2的具有线性瓶颈的逆残差结构、轻量级的注意力机制以及利用h-swish函数代替swish激活函数。第二方面,在本技术的一些实施例在backbone(对应于第一特征提取网络)设计中,使用了mobilenetv3、spp池化以及cbam注意力机制相结合的方法去进行特征提取。其中,所使用的spp模块如图2所示,该模块基于空间特征金字塔池化方法,可以有效输出固定尺寸的特征向量。对于输入的特征图,spp模块分别使用最大池化的5*5池化核、最大池化的9*9池化核、最大池化的13*13池化核,并且对这些不同尺度的池化结果使用concat函数进行一个通道上的融合。需要说明的是,本技术的一些实施例在backbone特征提取部分,使用了双spp模块,第一个spp(对应于图3的spp-1)主要是可以有效输出固定尺寸的特征向量,防止因为图像尺寸过大直接使用裁剪缩放等造成的图像失真情况。第二个spp(对应于图3的spp-2)主要是提取不同尺寸的空间特征信息,提升模型对于空间布局以及物体变性的鲁棒性。通过spp模块操作丰富了特征图的表达能力,对所检测图像中的目标大小差异较大的情况有很大的帮助,可进一步提升检测模型的精度。第三方面,在本技术的一些实施例中cbam注意力机制是在senet注意力机制的基础上添加了一个基于空间的注意力模块。针对cbam的通道注意力具体步骤是先对输入的特征图进行平均池化以及全局最大池化操作,之后根据池化的结果使用共享的dense层进行处理,处理的结果相加并传入一个sigmoid函数,得到每个通道的权重,把权重与原始输入特征图进行相乘操作即完成通道注意力机制环节。针对cbam的空间注意力步骤是随输入的特征图,在每一个特征点的通道上取平均值和最大值,把两个结果进行堆叠,通过点卷积改变通道数,再经过一个sigmoid函数,就获得了输入特征层每一个特征点的权重,把权重与输入特征图相乘即完成空间注意力的操作。经过backbone特征提取环节后,会输出三个有效的特征图,接下来把输入结果送入到neck(对应于第二特征提取网络)环节进行特征图加强提取。
62.如图3所示,主干特征提取网络模块(backbone)过程如下:
63.输入训练数据中不同尺寸的图像,经过第一个spp空间金字塔池化,通过对图像不同尺寸(5*5、9*9、13*13)的最大池化操作并经过一个concat函数,通过对通道数的连接把不同维度输出结果进行融合。通过该操作,可以解决输入图像尺寸不统一,有效输出固定大小的特征向量,方便进行下一步操作。
64.第一个spp的结果作为输入先进行一次普通卷积加正则化(conv+bn)操作,然后再进入mobilenetv3网络模块进行连续6次的特征提取操作,得到的输出送入cbam注意力机制模块进行通道以及空间信息权值分配。得到的输出作为输入,一方面送入neck网络进行特征信息融合提取操作,另一方面送入到下一特征提取环节。
65.第一个cbam注意力机制的输出在主干网络部分,送入到mobilenetv3特征提取模块进行6次操作,然后经过第二个cbam模块,得到的输出分别送入到neck部分和主干网络下一部分。
66.第二个cbam模块的输出经过3次mobilenetv3模块进行特征提取,然后经过第二个spp模块,通过对特征的不同尺寸(5*5、9*9、13*13)最大池化操作,进一步丰富特征空间信息,提升模型的鲁棒性。第二个spp的输出再经过第三个cbam操作,最终的输出送入到neck部分,用于neck对特征的融合提取操作。
67.为进一步减少参数量,本技术的一些实施例在yolov4的neck环节,使用深度可分离卷积替代普通卷积。该模块使用panet网络,采用自上而下以及自下而上的网络去丰富上下层的语义信息及位置信息,进一步提升模型的检测效果。
68.需要说明的是,为了更好的进行模型训练,本技术的一些实施例使用kmeans++算法对人员属性数据集进行目标anchor聚类。在目标检测领域中,anchor的合理设置对于模型的性能影响很大,若是设置不合理或者设置的尺寸与实际目标有较大差异,会导致模型有漏检以及误检现象发生。例如,在本技术的一些实施例中,在模型训练开始之前,使用kmeans++算法对数据集中的目标进行聚类,最终得到所需要的9个尺寸的先验框。使用kmeans++算法进行目标框的聚类,可以避免在训练过程中出现算法收敛速度过慢的问题。
69.应当理解的是,上述网络架构也是目标属性信息提取模型的网络架构,为避免重复,下文在叙述利用目标属性信息提取模型进行具体应用时不再过多重复上述的网络架构。
70.如图4所示,本技术实施例提供一种获取视觉属性信息的方法,该方法包括:s101,获取待识别图像;s102,将所述待识别图像输入目标属性信息提取模型,并通过所述目标属性信息提取模型得到至少一种视觉属性信息,其中,所述目标属性信息提取模型包括:第一特征提取网络、第二特征提取网络以及输出网络,所述第一特征提取网络采用深度可分离卷积对所述待识别图像进行特征提取得到三张特征图,所述第二特征提取网络对所述三张特征图分别再次进行特征提取得到三张目标特征图,所述输出网络用于输出所述三张目标特征图。
71.本技术的一些实施例的第一特征提取网络采用深度可分离卷积代替普通卷积,使得在卷积计算中减少参数量,达到轻量化目的。
72.例如,在本技术的一些实施例中,s102所述通过所述目标属性信息提取模型得到至少一种视觉属性信息的过程示例性包括:将所述待识别图像输入所述第一池化处理模块
得到固定尺寸的特征向量;根据所述特征向量和所述mobilenetv3网络得到一张初始特征图;将所述初始特征图输入所述第二池化处理模块,得到目标特征图,其中,所述目标特征图属于所述三张特征图中的一张。
73.本技术的一些实施例通过第一池化处理模块得到固定尺寸的处理数据,之后再由第二池化处理模块得到目标特征图,提升了技术方案的通用性。
74.例如,在本技术的一些实施例中,所述cbam注意力机制处理模块被配置为:针对输入的特征图,在每一个特征点的通道上取平均值和最大值得到两个结果,再把所述两个结果进行堆叠并通过点卷积改变通道数,再经过一个sigmoid函数得到输入特征层每一个特征点的权重,把所述权重与输入的特征图相乘完成空间注意力的操作。
75.本技术的一些实施例通过cbam注意力机制处理模块完成空间注意力的操作。
76.请参考图4,图4示出了本技术实施例提供一种获取视觉属性信息的装置,应理解,该装置与上述图1方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置的具体功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。装置包括至少一个能以软件或固件的形式存储于存储器中或固化在装置的操作系统中的软件功能模块,该获取视觉属性信息的装置,包括:获取模块101以及视觉属性信息获取模块102。
77.获取模块101,被配置为获取待识别图像.
78.视觉属性信息获取模块102,被配置为将所述待识别图像输入目标属性信息提取模型,并通过所述目标属性信息提取模型得到至少一种视觉属性信息,其中,所述目标属性信息提取模型包括:第一特征提取网络、第二特征提取网络以及输出网络,所述第一特征提取网络采用深度可分离卷积对所述待识别图像进行特征提取得到三张特征图,所述第二特征提取网络对所述三张特征图分别再次进行特征提取得到三张目标特征图,所述输出网络用于输出所述三张目标特征图。
79.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
80.本技术的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述获取视觉属性信息的方法包括的任意实施例所述的方法。
81.如图5所示,本技术的一些实施例提供一种电子设备500,包括存储器510、处理器520以及存储在所述存储器510上并可在所述处理器520上运行的计算机程序,其中,所述处理器520通过总线530从存储器510读取程序并执行所述程序时可实现如上述获取视觉属性信息的方法包括的任意实施例所述的方法。
82.处理器520可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器520可以是微处理器。
83.存储器510可以用于存储由处理器520执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本技术实施例描述的一个或多个模块的一些功能或者全部功能。本公开实施例的处理器520可以用于执行存储器510中的指令以实现图1中所示的方法。存储器510包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。
84.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
85.另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
86.所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
87.以上所述仅为本技术的实施例而已,并不用于限制本技术的保护范围,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
88.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
89.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1