1.本发明涉及计算机技术领域,尤其涉及一种识别图像的方法和装置。
背景技术:2.在商品的外包装中,通常包含体现商品质量、功能、环保等商品特征的认证标识,此类认证标识通常以小图的形式出现在外包装图片中,通过商品外包装的认证标识消费者可以判断商品特征;例如,随着生活水平的提高,保健品越来越受到广大消费者的青睐,但是一些商贩会将一般食品当作保健品来售卖,为了规范商家的行为,保障消费者的利益,国家颁布了保健品认证标识,并且只有经过国家认证的保健品,才可以在商品外包装中标识保健品标识;
3.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
4.目前对于商品外包装中商品认证标识的识别模型存在因为数据样本有限而导致准确率偏低的问题,往往需要依赖人工审核来进一步明确,而人工审核存在工作效率低、依赖于凭借主观判断、可能的审核作弊等问题。
技术实现要素:5.有鉴于此,本发明实施例提供一种识别图像的方法和装置,能够基于多个卷积神经网络模型构建多个识别概率模型,分别计算子图识别概率,并通过融合各个识别概率模型,利用预测分类模型获取目标子图在待识别图片中的识别概率,进一步地,根据识别概率确定图片中是否包含目标子图;该技术手段克服了在有限的数据样本下,识别目标子图准确率偏低技术的一部分问题,提高了识别图像的准确率,降低了人工审核认证标识图像的工作量。
6.为实现上述目的,根据本发明实施例的一个方面,提供了一种识别图像的方法,其特征在于,包括:基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型;利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率;根据预定义概率阈值,确定所述图片中是否包含所述目标子图。
7.可选地,所述识别图像的方法,其特征在于,
8.基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型,包括:
9.构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型。
10.可选地,所述识别图像的方法,其特征在于,
11.基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型,包括:
12.构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块和所述第二全连接模型,形成所述第二识别概率模型。
13.可选地,所述识别图像的方法,其特征在于,
14.构建所述第一全连接模型或者所述第二全连接模型,包括:
15.构建至少两个线性层,分别设置所述线性层包含的神经元的数量,利用全连接神经网络模型,对所述线性层所包含的神经元的数值进行全连接计算。
16.可选地,所述识别图像的方法,其特征在于,
17.基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型,包括:
18.构建至少两个第二线性全连接模型,分别替换相应的所述第二卷积神经网络模型的全连接层;根据所述第二卷积神经网络模型的卷积层、池化层、数据块和相应的所述第二全连接模型,分别形成所述第二识别概率模型。
19.可选地,所述识别图像的方法,其特征在于,
20.利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率,包括:
21.利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率;
22.利用一个或者多个所述第二识别概率模型,计算图片中存在所述目标子图的类别概率,分别得到第二概率;
23.利用所述第一概率、所述一个或者多个第二概率,基于分类预测模型,计算图片中存在目标子图的类别概率。
24.可选地,所述识别图像的方法,其特征在于,
25.所述分类预测模型包括:基于所述第一概率、一个或者多个所述第二概率、所述第一概率的权重值、一个或者多个所述第二概率相对应的权重值,计算图片中存在目标子图的类别概率。
26.为实现上述目的,根据本发明实施例的第二方面,提供了一种识别图像的装置,其特征在于,包括:构建识别模型模块、计算识别概率模块和识别子图模块;其中,
27.所述构建识别模型模块,用于基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型;
28.所述计算识别概率模块,用于利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率;
29.所述识别子图模块,用于根据预定义概率阈值,确定所述图片中是否包含所述目标子图。
30.可选地,所述识别图像的装置,其特征在于,
31.所述构建识别模型模块还用于构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型。
32.可选地,所述识别图像的装置,其特征在于,
33.所述构建识别模型模块还用于构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块和所述第二全连接模型,形成所述第二识别概率模型。
34.可选地,所述识别图像的装置,其特征在于,
35.所述构建识别模型模块还用于构建至少两个线性层,分别设置所述线性层包含的神经元的数量,利用全连接神经网络模型,对所述线性层所包含的神经元的数值进行全连接计算。
36.可选地,所述识别图像的装置,其特征在于,
37.所述构建识别模型模块还用于构建至少两个第二线性全连接模型,分别替换相应的所述第二卷积神经网络模型的全连接层;根据所述第二卷积神经网络模型的卷积层、池化层、数据块和相应的所述第二全连接模型,分别形成所述第二识别概率模型。
38.可选地,所述识别图像的装置,其特征在于,
39.所述计算识别概率模块还用于利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率;利用一个或者多个所述第二识别概率模型,计算图片中存在所述目标子图的类别概率,分别得到第二概率;利用所述第一概率、所述一个或者多个第二概率,基于分类预测模型,计算图片中存在目标子图的类别概率。
40.可选地,所述识别图像的装置,其特征在于,
41.所述识别子图模块还包含所述分类预测模型,所述分类预测模型包括:基于所述第一概率、一个或者多个所述第二概率、所述第一概率的权重值、一个或者多个所述第二概率相对应的权重值,计算图片中存在目标子图的类别概率。
42.为实现上述目的,根据本发明实施例的第三方面,提供了一种识别图像的电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述识别图像的方法中任一所述的方法。
43.为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如上述识别图像的方法中任一所述的方法。
44.上述发明中的一个实施例具有如下优点或有益效果,本实施例能够通过基于多个卷积神经网络模型构建多个识别概率模型,分别计算子图识别概率,并通过融合各个识别概率模型,利用预测分类模型获取目标子图在待识别图片中的识别概率,进一步地,根据识别概率确定图片中是否包含目标子图;该技术手段克服了在有限的数据样本下,识别目标子图准确率偏低技术的一部分问题,提高了识别图像的准确率,降低了人工审核认证标识图像的工作量。
45.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
46.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
47.图1是本发明第一实施例提供的一种识别图像的方法的流程示意图;
48.图2是本发明一个实施例提供的第一识别概率模型的流程示意图;
49.图3是本发明一个实施例提供的第二识别概率模型的流程示意图;
50.图4a是本发明一个实施例提供的待识别图片的示例;
51.图4b是本发明一个实施例提供的目标子图的示例;
52.图5是本发明第二实施例提供的一种识别图像的方法的流程示意图;
53.图6a是本发明一个实施例提供的第一全连接模型的示例图;
54.图6b是本发明一个实施例提供的第二全连接模型的示例图;
55.图6c是本发明一个实施例提供的另一个第二全连接模型的示例图;
56.图7是本发明一个实施例提供的一种识别图像的装置的结构示意图;
57.图8是本发明实施例可以应用于其中的示例性系统架构图;
58.图9是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
59.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
60.如图1所示,本发明实施例提供了一种识别图像的方法,该方法可以包括以下步骤:
61.步骤s101:基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型;
62.具体地,基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型,所述第一卷积神经网络模型为已知模型,例如vgg16模型;基于已经完成目标子图识别的预训练的vgg16模型,移除vgg16模型中的分类器,替换成构建的所述第一全连接模型;进一步地,利用vgg16模型包括的卷积层、池化层、全连接层的数据输出,作为所述第一全连接模型的数据输入,经过第一全连接模型的计算,输出子图在大图中的识别概率;基于vgg16模型形成第一识别概率模型的过程如图2中的步骤s201-步骤s203所示;
63.即,基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型,包括:构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型。
64.基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型,所述第二卷积神经网络模型为另一个已知模型,例如densenet模型;基于已经完成目标子图识别预训练的densenet模型,移除densenet模型中的全连接层,替换成构建的所述第二全连接模型;进一步地,利用densenet模型包括的卷积层、池化层、数据块的数据输出,在densenet中,数据块即为密集块;作为所述第二全连接模型模型的数据输入,经过第二全连接模型的计算,输出子图在大图中的识别概率;基于densenet模型形成第一识别概率模型
的过程如图3中的步骤s301-步骤s303所示;
65.即,基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型,包括:构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块和所述第二全连接模型,形成所述第二识别概率模型。
66.进一步地,构建所述第一全连接模型或者所述第二全连接模型,包括:构建至少两个线性层,分别设置所述线性层包含的神经元的数量,利用全连接神经网络模型,对所述线性层所包含的神经元的数值进行全连接计算。
67.下面结合图6a、图6b的示例说明上述步骤,如图6a所示,包括了四个用矩形框作为示意的线性层,每个线性层中包含不同数量的神经元,例如,图6a中线性层1中包含了1024个神经元,线性层中的每一个圆圈代表一个神经元的数值;类似地,线性层2包含了512个神经元,线性层中的每一个圆圈代表一个神经元的数值;线性层3包含了256个神经元,线性层中的每一个圆圈代表一个神经元的数值;线性层4包含了1个神经元,线性层中的每一个圆圈代表一个神经元的数值;进一步地,如图6a所示,线性层1的每一个神经元的数值到线性层4的每一个神经元的数值基于全连接神经网络模型进行计算,其中,线性层1为全连接神经网络模型的输入层;线性层2和线性层3为全连接网络神经模型的隐含层;线性层4为全连接神经网络模型的输出层;
68.可以理解的是,每一个神经元的数值代表了与图片相关的特征值,基于全连接神经网络模型进行计算的时候,针对线性层1的每一个神经元的数值和线性层2的每一个神经元的数值的每一个运算关系设置相对应的权重值;类似的,线性层2与线性层3之间、线性层3与线性层4之间也是如此;进一步地,经过线性层1、线性层2、线性层3、线性层4的计算和特征分类,获得子图在大图中存在的类别概率值;可以理解的是,线性层的数量和线性层所包含的神经元的数量是根据应用场景、实验数据或者经验所设置;
69.如图6a所示的第一全连接模型的示例用于基于vgg16模型,形成第一识别概率模型;类似地,如图6b所示,其中包含了线性层1、线性层2、线性层3、线性层4,分别包含的神经元数量为512、256、128、1;如图6b所示的第二全连接模型的示例为基于densenet模型,形成第二识别概率模型;类似地,如图6c所示,其中包含了线性层1、线性层2、线性层3、线性层4,分别包含的神经元数量为256、128、64、1;如图6c所示的第二全连接模型的示例为基于densenet模型,形成另一个第二识别概率模型。
70.本发明对第一全连接模型或者第二全连接模型所包含的线性层的数量和线性层所包含的神经元的数量,以及神经元的数值不做限定。
71.步骤s102:利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率。
72.具体地,基于步骤s101的描述,通过第一识别概率模型,获取待识别图片中目标子图的第一概率;通过第二识别概率模型,获取待识别图片中目标子图的第二概率;
73.进一步地,基于分类预测模型,计算图片中存在目标子图的类别概率。具体地,分类预测模型包括基于所述第一概率、一个或者多个所述第二概率、所述第一概率的权重值、一个或者多个所述第二概率相对应的权重值,计算图片中存在目标子图的类别概率。
74.例如,通过第一识别概率模型,获取待识别图片中目标子图的第一概率为0.9,通
过第二识别概率模型,获取待识别图片中目标子图的第二概率为0.8;经过如下分类预测模型,以公式(1)为例进行计算,其中,c代表类别概率,c1代表第一概率值,c2代表第二概率值,w1代表第一概率对应的权重值,w2代表第二概率对应的权重值,例如,w1为0.3,w2为0.7,则经过计算c等于0.83;
75.c=w1*c1+w2*c2
ꢀꢀꢀꢀ
(1)
76.即,利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率,包括:
77.利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率;
78.利用一个或者多个所述第二识别概率模型,计算图片中存在所述目标子图的类别概率,分别得到第二概率;
79.利用所述第一概率、所述一个或者多个第二概率,基于分类预测模型,计算图片中存在目标子图的类别概率。
80.本发明对分类预测模型的具体公式和公式中的具体内容不做限定。
81.步骤s103:根据预定义概率阈值,确定所述图片中是否包含所述目标子图。
82.具体地,根据实验数据或者经验确定所述图片中是否包含所述目标子图的预定义概率阈值,例如,设定预定义概率阈值为0.78;仍以步骤s102的计算结果为例,步骤s102获得的类别概率为0.83;0.83>0.78,则认为该图片中包含目标子图,例如认为在保健品的外包装的图片中包含了“保健食品”的目标子图,如图4a所示的保健品的外包装图片,在该图片的左上角包含如图4b示意的小图,即为目标子图;
83.即,根据预定义概率阈值,确定所述图片中是否包含所述目标子图。
84.可以理解的是,通过将待识别图片带入不同的预先训练的卷积神经网络模型,分别获得类别概率,进一步通过加权值计算待识别图片中包含目标子图的概率,提高了识别的准确度。
85.如图2所示,本发明实施例提供了第一识别概率模型的流程示意图,该方法可以包括以下步骤:
86.该实施例以vgg16模型作为第一卷积神经网络模型为例,说明第一识别概率模型的流程;
87.步骤s201:获取待识别图片,将所述图片的数据作为vgg16模型的输入数据。
88.具体地,获取待识别图片,例如,待识别的商品外包装图片;由于vgg16模型要求图片大小是224*224的,所以将图片进行预处理操作,将图片大小重新定义为224*224;进一步地,将图片的像素和颜色等数据,输入vgg16模型;
89.步骤s202:获取vgg16模型的输出数据,并将所述输出数据作为第一全连接模型的输入数据。
90.具体地,经过vgg16模型所包含的卷积层、池化层、全连接层的计算,获取输出数据,将所述输出数据作为第一全连接模型的输入数据;进一步地,利用第一全连接模型替换vgg16模型中的分类器;
91.即,基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型,包括:构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积
神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型。
92.步骤s203:获取第一全连接模型的输出数据,获得第一类别概率;
93.具体地,构建第一全连接模型包括:构建至少两个线性层,分别设置所述线性层包含的神经元的数量,利用全连接神经网络模型,对所述线性层所包含的神经元的数值进行全连接计算;
94.关于第一全连接模型的具体描述与步骤s101一致,在此不再赘述;
95.进一步地,利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率;
96.步骤s201-步骤s203以vgg16模型为例,说明了:
97.基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;
98.包括:构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型;
99.进一步地,利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率。
100.如图3所示,本发明实施例提供了第二识别概率模型的流程示意图,该方法可以包括以下步骤:
101.该实施例以densenet模型作为第二卷积神经网络模型为例,说明第二识别概率模型的流程;
102.步骤s301:获取待识别图片,将所述图片的数据作为densenet模型的输入数据。
103.具体地,获取待识别图片,例如,待识别的商品外包装图片,由于densenet模型要求图片大小是224*224的,所以将图片进行预处理操作,将图片大小重新定义为224*224;进一步地,将图片的像素和颜色等数据,输入densenet模型;
104.步骤s302:获取densenet模型的输出数据,并将所述输出数据作为第一全连接模型的输入数据。
105.具体地,经过densenet模型所包含的卷积层、池化层、密集块的计算,获取输出数据,所述密集块即为数据块,将所述输出数据作为第二全连接模型的输入数据;进一步地,利用第二全连接模型替换densenet模型中的全连接层;
106.即,基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型,包括:
107.构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块和所述第二全连接模型,形成所述第二识别概率模型。
108.步骤s303:获取第二全连接模型的输出数据,获得第二类别概率;
109.具体地,构建第二全连接模型包括:构建至少两个线性层,分别设置所述线性层包含的神经元的数量,利用全连接神经网络模型,对所述线性层所包含的神经元的数值进行全连接计算;
110.关于第二全连接模型的具体描述与步骤s101一致,在此不再赘述;
111.进一步地,利用所述第二识别概率模型,计算图片中存在所述目标子图的类别概率,得到第二概率;
112.步骤s301-步骤s303以densenet模型为例,说明了基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型的步骤,包括:构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块和所述第二全连接模型,形成所述第二识别概率模型;
113.进一步地,利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率。
114.如图5所示,本发明另一个实施例提供的一种识别图像的方法的流程示意图,该方法可以包括以下步骤:
115.步骤s501:获取待识别的图片;
116.具体地,获取待识别图片,例如,待识别的商品外包装图片;这里以卷积神经网络模型中的vgg16模型和densenet模型为例,由于vgg16模型和densenet模型要求图片大小是224*224的,所以将图片进行预处理操作,将图片大小重新定义为224*224;进一步地,将图片的像素和颜色等数据,输入vgg16模型和densenet模型;
117.步骤s502:基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;
118.具体地,构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型。
119.以vgg16模型作为第一卷积神经网络模型为例说明基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型的描述与步骤s101一致,在此不再赘述;
120.步骤s503:基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型
121.步骤s504:基于第二卷积神经网络模型,构建另一个第二全连接模型,形成另一个第二识别概率模型;
122.步骤s503-s504描述了形成多个第二识别概率模型的过程;
123.具体地,构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块和所述第二全连接模型,形成所述第二识别概率模型;
124.进一步地,构建至少两个第二线性全连接模型,分别替换相应的所述第二卷积神经网络模型的全连接层;根据所述第二卷积神经网络模型的卷积层、池化层、数据块和相应的所述第二全连接模型,分别形成所述第二识别概率模型。
125.以densenet模型作为第二卷积神经网络模型为例说明基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型的描述与步骤s101一致,在此不再赘述;
126.在本实施例中,基于第二卷积神经网络模型,以densenet模型为例,构建两个不同的第二全连接模型,因此形成两个第二识别概率模型;两个第二全连接模型的示例图如图6b和图6c所示,构建第二全连接模型的具体描述与步骤s101一致,在此不再赘述;
127.可以理解的是,可以采用至少两个不同卷积神经网络模型,分别形成多个不同的
第二识别概率模型;这有助于利用权重综合不同的卷积神经网络模型的识别概率结果,在同样的样本集下,提高识别的准确率。
128.步骤s505:基于分类预测模型进行计算识别目标子图的类别概率
129.具体地,利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率,
130.仍以步骤s501-s504的示例模型说明该步骤,例如,经过计算第一概率为0.9,第一个第二概率为0.8,第二个第二概率为0.7;经过如下分类预测模型即公式(2)进行计算,其中,c代表类别概率,c1代表第一概率值,c2代表第一个第二概率值,c3代第二个第二概率值
131.w1代表第一概率对应的权重值,w2代表第一个第二概率对应的权重值,w3代表第二个第二概率对应的权重值例如,w1为0.2,w2为0.5,w3为0.3;则经过计算c等于0.79;
132.c=w1*c1+w2*c2+w3*c3+....w
i
*c
i
ꢀꢀꢀꢀ
(2)
133.即,利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率;
134.利用一个或者多个所述第二识别概率模型,计算图片中存在所述目标子图的类别概率,分别得到第二概率;
135.利用所述第一概率、所述一个或者多个第二概率,基于分类预测模型,计算图片中存在目标子图的类别概率。
136.所述分类预测模型包括基于所述第一概率、一个或者多个所述第二概率、所述第一概率的权重值、一个或者多个所述第二概率相对应的权重值,计算图片中存在目标子图的类别概率。
137.进一步地,根据预定义概率阈值,确定所述图片中是否包含所述目标子图。具体地,根据实验数据或者经验确定所述图片中是否包含所述目标子图的预定义概率阈值,例如,设定预定义概率阈值为0.78;步骤s505的类别概率值计算所得为0.79;0.79>0.78,则认为该图片中包含目标子图,例如,在保健品的商品外包装的示例图片图4a中包含了图4b所示的“保健食品”目标子图。
138.如图7所示,本发明实施例提供了一种识别子图的装置700,包括:构建识别模型模块701、计算识别概率模块702和识别子图模块703其中,
139.所述构建识别模型模块701,用于基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型;
140.所述计算识别概率模块702,用于利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率;
141.所述识别子图模块703,用于根据预定义概率阈值,确定所述图片中是否包含所述目标子图。
142.可选地,所述构建识别模型模块701,还用于构建第一全连接模型,替换所述第一卷积神经网络模型的分类器,根据所述第一卷积神经网络模型的卷积层、池化层、全连接层和所述第一全连接模型,形成所述第一识别概率模型。
143.可选地,所述构建识别模型模块701,还用于构建第二全连接模型,替换所述第二卷积神经网络模型的全连接层,根据所述第二卷积神经网络模型的卷积层、池化层、数据块
和所述第二全连接模型,形成所述第二识别概率模型。
144.可选地,所述构建识别模型模块701,还用于构建至少两个线性层,分别设置所述线性层包含的神经元的数量,利用全连接神经网络模型,对所述线性层所包含的神经元的数值进行全连接计算。
145.可选地,所述构建识别模型模块701,还用于构建至少两个第二线性全连接模型,分别替换相应的所述第二卷积神经网络模型的全连接层;根据所述第二卷积神经网络模型的卷积层、池化层、数据块和相应的所述第二全连接模型,分别形成所述第二识别概率模型。
146.可选地,所述计算识别概率模块702,还用于利用所述第一识别概率模型,计算图片中存在所述目标子图的类别概率,得到第一概率;利用一个或者多个所述第二识别概率模型,计算图片中存在所述目标子图的类别概率,分别得到第二概率;利用所述第一概率、所述一个或者多个第二概率,基于分类预测模型,计算图片中存在目标子图的类别概率。
147.可选地,所述识别子图模块703,还用于基于所述第一概率、一个或者多个所述第二概率、所述第一概率的权重值、一个或者多个所述第二概率相对应的权重值,计算图片中存在目标子图的类别概率。
148.本发明实施例还提供了一种识别图像的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例提供的方法。
149.本发明实施例还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例提供的方法。
150.图8示出了可以应用本发明实施例的识别图像的方法或识别图像的装置的示例性系统架构800。
151.如图8所示,系统架构800可以包括终端设备801、802、803,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
152.用户可以使用终端设备801、802、803通过网络804与服务器805交互,以接收或发送消息等。终端设备801、802、803上可以安装有各种客户端应用,例如网页浏览器应用、搜索类应用、即时通信工具和邮箱客户端等。
153.终端设备801、802、803可以是具有显示屏并且支持各种客户端应用的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
154.服务器805可以是提供各种服务的服务器,例如对用户利用终端设备801、802、803所提供的待识别图片提供支持的后台管理服务器。后台管理服务器可以对接收到的待识别图片进行分析和处理,并将目标子图的识别结果反馈给终端设备。
155.需要说明的是,本发明实施例所提供的识别图像的方法一般由服务器805执行,相应地,识别图像的装置一般设置于服务器805中。
156.应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
157.下面参考图9,其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范
围带来任何限制。
158.如图9所示,计算机系统900包括中央处理单元(cpu)901,其可以根据存储在只读存储器(rom)902中的程序或者从存储部分908加载到随机访问存储器(ram)903中的程序而执行各种适当的动作和处理。在ram 903中,还存储有系统900操作所需的各种程序和数据。cpu 901、rom 902以及ram 903通过总线904彼此相连。输入/输出(i/o)接口905也连接至总线904。
159.以下部件连接至i/o接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至i/o接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
160.特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(cpu)901执行时,执行本发明的系统中限定的上述功能。
161.需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
162.附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要
注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
163.描述于本发明实施例中所涉及到的模块和/或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块和/或单元也可以设置在处理器中,例如,可以描述为:一种处理器包括:构建识别模型模块、计算识别概率模块和识别子图模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,构建识别模型模块还可以被描述为“根据卷积神经网络模型,构建全连接模型并形成识别模型的模块”。
164.作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:基于第一卷积神经网络模型,构建第一全连接模型,形成第一识别概率模型;基于第二卷积神经网络模型,构建第二全连接模型,形成第二识别概率模型;利用所述第一识别概率模型和所述第二识别概率模型,以及分类预测模型,计算图片中存在目标子图的类别概率;根据预定义概率阈值,确定所述图片中是否包含所述目标子图。
165.根据本发明实施例的技术方案,克服了在有限的数据样本下,识别目标子图准确率偏低技术的一部分问题,提高了识别图像的准确率,降低了人工审核认证标识图像的工作量。
166.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。