一种图片识别方法和装置与流程

文档序号:30995214发布日期:2022-08-03 03:02阅读:135来源:国知局
一种图片识别方法和装置与流程

1.本发明涉及计算机视觉技术领域,尤其涉及一种图片识别方法和装置。


背景技术:

2.物品展示素材包括多张图片,其中,要求首图突出呈现物品完整的整体,不能是细节图,细节图表现为图片中只展示物品的一部分,或者展示物品的侧面、背面、内里、局部等细节信息。因此,智能选图流程需要从图片池中筛选出非细节图作为首图。
3.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
4.1)智能素材流程自动生成的素材需要人工审核,如果随机选取首图而不进行图片识别,会导致素材图片的驳回率较高,降低生产效率;2)不同品类细节图表现形式不同,分类难度较大,难以识别出细节图。


技术实现要素:

5.有鉴于此,本发明实施例提供一种图片识别方法和装置,以解决素材图片的驳回率较高的技术问题。
6.为实现上述目的,根据本发明实施例的一个方面,提供了一种图片识别方法,包括:
7.将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分;其中,所述图片评分模型采用神经网络训练得到;
8.根据所述各个物品图片的首图评分,确定所述目标物品的首图;
9.参照所述目标物品的首图的图片内容,筛选出所述目标物品的副图,以使所述目标物品的首图的图片内容和所述目标物品的副图的图片内容均示意所述目标物品;
10.基于所述目标物品的首图和副图,生成所述目标物品的素材图片列表。
11.可选地,根据所述各个物品图片的首图评分,确定所述目标物品的首图,包括:
12.按照首图评分由小到大的顺序,对所述各个物品图片进行排序;
13.从所述各个物品图片中筛选出首图评分大于等于第一评分阈值的第一图片,所述第一图片的数量大于等于1;
14.从所述第一图片中筛选出首图评分最大的图片作为所述目标物品的首图。
15.可选地,参照所述目标物品的首图的图片内容,筛选出所述目标物品的副图,包括:
16.从所述各个物品图片中筛选出首图评分介于第一评分阈值和第二评分阈值之间的第二图片;其中,所述第二图片的数量大于等于1,所述第一评分阈值大于所述第二评分阈值;
17.参照所述目标物品的首图的图片内容,从所述第二图片以及剩余的第一图片中筛选出所述目标物品的副图。
18.可选地,所述属性信息包括:品类信息和标题特征信息。
19.可选地,将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分之前,还包括:
20.从图片池中筛选出各个样本物品的图片样本,所述图片样本包括首图样本、副图样本和非素材图片样本;
21.构建训练样本,其中,每个训练样本包括样本物品的任意两张图片、属性信息以及所述任意两张图片的级别;
22.采用各个训练样本训练卷积神经网络,从而得到图片评分模型。
23.可选地,所述首图样本的级别高于所述副图样本的级别,所述副图样本的级别高于所述非素材图片样本的级别。
24.可选地,采用各个训练样本训练卷积神经网络,从而得到图片评分模型,包括:
25.对于每个训练样本,以样本物品的任意两张图片和属性信息作为输入,以所述任意两张图片的级别作为输出,训练卷积神经网络,从而得到图片评分模型;
26.其中,在训练卷积神经网络的过程中,优化的损失函数为:
[0027][0028][0029][0030]
为图片i的级别高于图片j的级别的真实概率,li为图片i的级别,lj图片j的级别;p
ij
为图片i的级别高于图片j的级别的预测概率,si为图片i的首图评分,sj为图片j的首图评分。
[0031]
另外,根据本发明实施例的另一个方面,提供了一种图片识别装置,包括:
[0032]
评分模块,用于将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分;其中,所述图片评分模型采用神经网络训练得到;
[0033]
首图模块,用于根据所述各个物品图片的首图评分,确定所述目标物品的首图;
[0034]
筛选模块,用于参照所述目标物品的首图的图片内容,筛选出所述目标物品的副图,以使所述目标物品的首图的图片内容和所述目标物品的副图的图片内容均示意所述目标物品;
[0035]
列表模块,用于基于所述目标物品的首图和副图,生成所述目标物品的素材图片列表。
[0036]
可选地,所述首图模块还用于:
[0037]
按照首图评分由小到大的顺序,对所述各个物品图片进行排序;
[0038]
从所述各个物品图片中筛选出首图评分大于等于第一评分阈值的第一图片,所述第一图片的数量大于等于1;
[0039]
从所述第一图片中筛选出首图评分最大的图片作为所述目标物品的首图。
[0040]
可选地,所述筛选模块还用于:
[0041]
从所述各个物品图片中筛选出首图评分介于第一评分阈值和第二评分阈值之间
的第二图片;其中,所述第二图片的数量大于等于1,所述第一评分阈值大于所述第二评分阈值;
[0042]
参照所述目标物品的首图的图片内容,从所述第二图片以及剩余的第一图片中筛选出所述目标物品的副图。
[0043]
可选地,所述属性信息包括:品类信息和标题特征信息。
[0044]
可选地,还包括训练模块,用于:
[0045]
将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分之前,从图片池中筛选出各个样本物品的图片样本,所述图片样本包括首图样本、副图样本和非素材图片样本;
[0046]
构建训练样本,其中,每个训练样本包括样本物品的任意两张图片、属性信息以及所述任意两张图片的级别;
[0047]
采用各个训练样本训练卷积神经网络,从而得到图片评分模型。
[0048]
可选地,所述首图样本的级别高于所述副图样本的级别,所述副图样本的级别高于所述非素材图片样本的级别。
[0049]
可选地,所述训练模块还用于:
[0050]
对于每个训练样本,以样本物品的任意两张图片和属性信息作为输入,以所述任意两张图片的级别作为输出,训练卷积神经网络,从而得到图片评分模型;
[0051]
其中,在训练卷积神经网络的过程中,优化的损失函数为:
[0052][0053][0054][0055]
为图片i的级别高于图片j的级别的真实概率,li为图片i的级别,lj图片j的级别;p
ij
为图片i的级别高于图片j的级别的预测概率,si为图片i的首图评分,sj为图片j的首图评分。
[0056]
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
[0057]
一个或多个处理器;
[0058]
存储装置,用于存储一个或多个程序,
[0059]
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现上述任一实施例所述的方法。
[0060]
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
[0061]
根据本发明实施例的另一个方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
[0062]
上述发明中的一个实施例具有如下优点或有益效果:因为采用将目标物品的各个物品图片以及属性信息输入到图片评分模型中,根据图片评分模型输出的首图评分确定首图,从而参照首图筛选出副图的技术手段,所以克服了现有技术中素材图片的驳回率较高
的技术问题。本发明实施例在采用模型识别图片时融入了物品属性信息,提高了选图的准确性,显著降低了素材图片的驳回率;而且,物品属性信息中的品类和标题等其他信息可以进一步提升模型的识别效果。
[0063]
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0064]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
[0065]
图1是根据本发明实施例的图片识别方法的主要流程的示意图;
[0066]
图2是根据本发明实施例的首图和副图的示意图;
[0067]
图3是根据本发明实施例的图片样本的构成示意图;
[0068]
图4是根据本发明实施例的神经网络的结构示意图;
[0069]
图5是根据本发明一个可参考实施例的图片识别方法的主要流程的示意图;
[0070]
图6是根据本发明实施例的图片识别装置的主要模块的示意图;
[0071]
图7是本发明实施例可以应用于其中的示例性系统架构图;
[0072]
图8是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
[0073]
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0074]
图1是根据本发明实施例的图片识别方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述图片识别方法可以包括:
[0075]
步骤101,将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分。
[0076]
智能创作引擎需要自动生产符合业务场景要求的图片,要求首图不能是细节图,为了提升素材图片人工审核通过率,需要在选图流程中识别出细节图,根据图片是否是细节图确定首图和副图。
[0077]
首先,从图片池中筛选出目标物品的各个物品图片,这些物品图片中包括首图、副图和非素材图片,但是未经过识别。其中,首图和副图都属于素材图片,非素材图片既不是首图也不是副图,非素材图片可以是详情图。接着,过滤掉不符合要求的图片,保留候选图片,比如将添加了文字或者标注的图片、拼接的图片等过滤掉。然后将保留的候选图片以及该目标物品的属性信息输入到经过训练的图片评分模型中,图片评分模型输出各个物品图片的首图评分。其中,所述图片评分模型采用神经网络训练得到。
[0078]
可选地,所述属性信息包括品类信息和标题特征信息;其中,所述标题特征信息用于指示物品的数量,将目标物品的属性信息也输入到图片评分模型,有助于图片评分模型准确地计算出各个图片的首图评分。
[0079]
可选地,步骤101之前,还包括:从图片池中筛选出各个样本物品的图片样本,所述图片样本包括首图样本、副图样本和非素材图片样本;构建训练样本,其中,每个训练样本包括样本物品的任意两张图片、属性信息以及所述任意两张图片的级别;采用各个训练样本训练卷积神经网络,从而得到图片评分模型。如图2所示,三张图片从上至下分别为一张首图和两张副图,两张副图分别展示手机背面和侧面,都属于细节图。可以从图片池中筛选出各个样本物品的图片样本,包括一张首图样本、若干张副图样本和若干张非素材图样本,标记各个图片的级别,其中,首图样本的级别高于副图样本的级别,副图样本的级别高于非素材图片样本的级别。如图3所示,首图样本的级别为l2,副图样本的级别为l1,非素材图片样本的级别为l0,l2》l1》l0。构建好训练样本之后,将训练样本划分成训练集和验证集,分别用于训练模型和验证模型。
[0080]
需要指出的是,图片样本中也要过滤掉不符合要求的图片,保留候选图片,比如将添加了文字或者标注的图片、拼接的图片等过滤掉。
[0081]
可选地,图片经过必要的预处理步骤,预处理可能包括以下一项或几项:1)将输入图片转化为rgb三通道图片;2)以预设概率(如0.2)对图片进行水平或垂直翻转;3)以预设概率(如0.3)对图片亮度、对比度、饱和度、色相进行偏移。经过以上预处理,使得神经网络对图片的颜色等不敏感,而只关注图片展示的外形。
[0082]
如图4所示,本发明实施例使用神经网络来学习l2》l1》l0的等级关系。每次迭代,从每个样本物品的图片样本中随机挑选两张级别不同的图片,连同样本物品的属性信息输入到神经网络中。因此,输入神经网络的一个训练样本为某个样本物品的两张图片以及该样本物品的属性信息。
[0083]
如图4所示,两张图片经过卷积神经网络,如vgg、resnet等得到k1维度的图像特征向量。样本物品的属性信息也经过神经网络处理转化为k2维度的属性特征向量,然后与k1维度的图像特征向量进行融合。需要说明的是,k1与k2可以相同,也可以不同,本发明实施例对此不作限制。
[0084]
以一级品类为例,一级品类为离散的id信息,先经过嵌入层将id信息转化为固定维度的特征向量,再经多层感知器(mlp层)将特征向量变换到k2维度。加入了物品的品类信息,可使模型学习不同品类的物品细节图的规律。针对一些特定情况的细节图,例如一款纽扣电池标题包含“纽扣电池6粒”等字样,如果图片中只有一粒电池,判定为细节图;例如标题中包含“篮球服两件套”,如果图片中只有上衣,判定为细节图。对于上述情况,可以称为“套装”问题。这种情况下,物品标题中包含判定细节图的重要信息,需要将文本信息加入到模型输入中。例如,可以采用正则匹配的方法,匹配模式为"^.*((套餐)|(套装)|(件套)|(组合)|([\d一二三四五六七八九十]+[双件盒条瓶])).*$"来确定物品标题中是否包含套装信息,并转化为0/1的id信息,作为一个id信息输入到模型中。
[0085]
如图4所示,采用拼接等方式将图像特征向量和属性特征向量融合后,再经过几层mlp降维,最后经sigmoid函数变换为[0,1]之间的分数,该分数即为首图评分s。
[0086]
可选地,采用各个训练样本训练卷积神经网络,从而得到图片评分模型,包括:对
于每个训练样本,以样本物品的任意两张图片和属性信息作为输入,以所述任意两张图片的级别作为输出,训练卷积神经网络,从而得到图片评分模型;其中,在训练卷积神经网络的过程中,优化的损失函数为:
[0087][0088][0089][0090]
为图片i的级别高于图片j的级别的真实概率,li为图片i的级别,lj图片j的级别;p
ij
为图片i的级别高于图片j的级别的预测概率,si为图片i的首图评分,sj为图片j的首图评分。
[0091]
如果图片i的级别比图片j的级别高,即li大于lj,那么s
ij
为1,为1;如果图片i的级别比图片j的级别低,即li小于lj,那么s
ij
为-1,为0。
[0092]
训练过程中,可采用adam等优化器进行反向传播学习。最终选取在验证集上auc(area under the curve)最高的模型作为预测阶段模型,即图片评分模型。
[0093]
步骤102,根据所述各个物品图片的首图评分,确定所述目标物品的首图。
[0094]
图片评分模型输出各个物品图片的首图评分s,首图评分s在[0,1]之间,从而根据各个物品图片的首图评分s的大小筛选出目标物品的首图。
[0095]
可选地,步骤102可以包括:按照首图评分由小到大的顺序,对所述各个物品图片进行排序;从所述各个物品图片中筛选出首图评分大于等于第一评分阈值的第一图片,所述第一图片的数量大于等于1;从所述第一图片中筛选出首图评分最大的图片作为所述目标物品的首图。在本发明的实施例中,可以预先设定第一评分阈值s1,首先筛选出首图评分大于等于第一评分阈值s1的第一图片(可能是一张,也可能是多张),然后从这些第一图片中进一步筛选出首图评分s最大的图片作为目标物品的首图。
[0096]
步骤103,参照所述目标物品的首图的图片内容,筛选出所述目标物品的副图,以使所述目标物品的首图的图片内容和所述目标物品的副图的图片内容均示意所述目标物品。
[0097]
参照步骤102中筛选出的首图的图片内容,从目标物品的各个物品图片中进一步筛选出目标物品的副图,以使所述目标物品的首图的图片内容和所述目标物品的副图的图片内容均示意所述目标物品。
[0098]
可选地,步骤103可以包括:从所述各个物品图片中筛选出首图评分介于第一评分阈值和第二评分阈值之间的第二图片;其中,所述第二图片的数量大于等于1,所述第一评分阈值大于所述第二评分阈值;参照所述目标物品的首图的图片内容,从所述第二图片以及剩余的第一图片中筛选出所述目标物品的副图。为了快速且准确地筛选出副图,可以基于各个图片的首图评分进行筛选。具体地,预先设定第一评分阈值s1和第二评分阈值s2,且s1》s2,筛选出首图评分介于第一评分阈值s1和第二评分阈值s2之间第二图片(可能是一张,也可能是多张),这些第二图片以及剩余的第一图片都可以作为副图,为了提高适配性,
也可以参照目标物品的首图在这些第二图片以及剩余的第一图片中进一步筛选出目标物品的副图。
[0099]
需要指出的是,首图评分s小于第二评分阈值s2的图片一般不能作为素材图片。
[0100]
可选地,可以取一段时间的业务场景审核数据作为测试集,将其输入到图片评分模型中,根据输出的各个图片的首图评分来确定划分图片层级的两个阈值s1和s2。可选地,也可以针对不同的品类设置不同阈值,本发明实施例对此不作限制。
[0101]
步骤104,基于所述目标物品的首图和副图,生成所述目标物品的素材图片列表。
[0102]
参照首图完成副图的筛选之后,生成目标物品的素材图片列表并上传数据库待审核,该素材图片列表中包含一张首图和至少一张副图(可以是一张,两张或者三张等)。
[0103]
根据上面所述的各种实施例,可以看出本发明实施例通过将目标物品的各个物品图片以及属性信息输入到图片评分模型中,根据图片评分模型输出的首图评分确定首图,从而参照首图筛选出副图的技术手段,解决了现有技术中素材图片的驳回率较高的技术问题。本发明实施例在采用模型识别图片时融入了物品属性信息,提高了选图的准确性,显著降低了素材图片的驳回率;而且,物品属性信息中的品类和标题等其他信息可以进一步提升模型的识别效果。
[0104]
图5是根据本发明一个可参考实施例的图片识别方法的主要流程的示意图。作为本发明的又一个实施例,如图5所示,所述图片识别方法可以包括:
[0105]
步骤501,从图片池中筛选出目标物品的各个物品图片。
[0106]
从图片池中筛选出的图片包括首图、副图和非素材图片,但是未经过识别。
[0107]
步骤502,过滤掉不符合要求的图片,保留候选图片。
[0108]
比如将添加了文字或者标注的图片、拼接的图片等过滤掉。
[0109]
步骤503,将保留的候选图片以及该目标物品的属性信息输入到经过训练的图片评分模型中,以输出各个物品图片的首图评分。
[0110]
所述属性信息包括:品类信息和标题特征信息;其中,所述标题特征信息用于指示物品的数量。以一级品类为例,一级品类为离散的id信息,先经过嵌入层将id信息转化为固定维度的特征向量,再经多层感知器(mlp层)将特征向量变换到k2维度。物品标题中包含判定副图的重要信息,需要将文本信息加入到模型输入中。例如,可以采用正则匹配的方法,匹配模式为"^.*((套餐)|(套装)|(件套)|(组合)|([\d一二三四五六七八九十]+[双件盒条瓶])).*$"来确定物品标题中是否包含套装信息,并转化为0/1的id信息,作为一个id信息输入到模型中。将目标物品的属性信息也输入到图片评分模型,有助于图片评分模型准确地计算出各个图片的首图评分。
[0111]
步骤504,按照首图评分由小到大的顺序,对所述各个物品图片进行排序。
[0112]
步骤505,从所述各个物品图片中筛选出首图评分大于等于第一评分阈值的至少一张第一图片。
[0113]
步骤506,从所述至少一张第一图片中筛选出首图评分最大的图片作为所述目标物品的首图。
[0114]
步骤507,从所述各个物品图片中筛选出首图评分介于第一评分阈值和第二评分阈值之间的至少一张第二图片。
[0115]
步骤508,参照所述目标物品的首图的图片内容,从所述至少一张第二图片以及剩
余的第一图片中筛选出所述目标物品的副图。
[0116]
预先设定第一评分阈值s1和第二评分阈值s2,且s1》s2。
[0117]
首先,筛选出首图评分大于等于第一评分阈值s1的第一图片,然后从这些第一图片中进一步筛选出首图评分s最大的图片作为目标物品的首图;接着,筛选出首图评分介于第一评分阈值s1和第二评分阈值s2之间第二图片,最后参照目标物品的首图在这些第二图片以及剩余的第一图片中进一步筛选出目标物品的副图。
[0118]
步骤509,基于所述目标物品的首图和副图,生成所述目标物品的素材图片列表。
[0119]
参照首图完成副图的筛选之后,生成目标物品的素材图片列表并上传数据库待审核,该素材图片列表中包含一张首图和至少一张副图。
[0120]
另外,在本发明一个可参考实施例中图片识别方法的具体实施内容,在上面所述图片识别方法中已经详细说明了,故在此重复内容不再说明。
[0121]
图6是根据本发明实施例的图片识别装置的主要模块的示意图。如图6所示,所述图片识别装置600包括评分模块601、首图模块602、筛选模块603和列表模块604;其中,评分模块601用于将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分;其中,所述图片评分模型采用神经网络训练得到;首图模块602用于根据所述各个物品图片的首图评分,确定所述目标物品的首图;筛选模块603用于参照所述目标物品的首图的图片内容,筛选出所述目标物品的副图,以使所述目标物品的首图的图片内容和所述目标物品的副图的图片内容均示意所述目标物品;列表模块604用于基于所述目标物品的首图和副图,生成所述目标物品的素材图片列表。
[0122]
可选地,所述首图模块602还用于:
[0123]
按照首图评分由小到大的顺序,对所述各个物品图片进行排序;
[0124]
从所述各个物品图片中筛选出首图评分大于等于第一评分阈值的第一图片,所述第一图片的数量大于等于1;
[0125]
从所述第一图片中筛选出首图评分最大的图片作为所述目标物品的首图。
[0126]
可选地,所述筛选模块603还用于:
[0127]
从所述各个物品图片中筛选出首图评分介于第一评分阈值和第二评分阈值之间的第二图片;其中,所述第二图片的数量大于等于1所述第一评分阈值大于所述第二评分阈值;
[0128]
参照所述目标物品的首图的图片内容,从所述第二图片以及剩余的第一图片中筛选出所述目标物品的副图。
[0129]
可选地,所述属性信息包括:品类信息和标题特征信息。
[0130]
可选地,还包括训练模块,用于:
[0131]
将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分之前,从图片池中筛选出各个样本物品的图片样本,所述图片样本包括首图样本、副图样本和非素材图片样本;
[0132]
构建训练样本,其中,每个训练样本包括样本物品的任意两张图片、属性信息以及所述任意两张图片的级别;
[0133]
采用各个训练样本训练卷积神经网络,从而得到图片评分模型。
[0134]
可选地,所述首图样本的级别高于所述副图样本的级别,所述副图样本的级别高
于所述非素材图片样本的级别。
[0135]
可选地,所述训练模块还用于:
[0136]
对于每个训练样本,以样本物品的任意两张图片和属性信息作为输入,以所述任意两张图片的级别作为输出,训练卷积神经网络,从而得到图片评分模型;
[0137]
其中,在训练卷积神经网络的过程中,优化的损失函数为:
[0138][0139][0140][0141]
为图片i的级别高于图片j的级别的真实概率,li为图片i的级别,lj图片j的级别;p
ij
为图片i的级别高于图片j的级别的预测概率,si为图片i的首图评分,sj为图片j的首图评分。
[0142]
需要说明的是,在本发明所述图片识别装置的具体实施内容,在上面所述图片识别方法中已经详细说明了,故在此重复内容不再说明。
[0143]
图7示出了可以应用本发明实施例的图片识别方法或图片识别装置的示例性系统架构700。
[0144]
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0145]
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
[0146]
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0147]
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的物品信息查询请求等数据进行分析等处理,并将处理结果反馈给终端设备。
[0148]
需要说明的是,本发明实施例所提供的图片识别方法一般由服务器705执行,相应地,所述图片识别装置一般设置在服务器705中。本发明实施例所提供的图片识别方法也可以由终端设备701、702、703执行,相应地,所述图片识别装置可以设置在终端设备701、702、703中。
[0149]
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0150]
下面参考图8,其示出了适于用来实现本发明实施例的终端设备的计算机系统800的结构示意图。图8示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0151]
如图8所示,计算机系统800包括中央处理单元(cpu)801,其可以根据存储在只读
存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行各种适当的动作和处理。在ram 803中,还存储有系统800操作所需的各种程序和数据。cpu 801、rom 802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0152]
以下部件连接至i/o接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
[0153]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(cpu)801执行时,执行本发明的系统中限定的上述功能。
[0154]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0155]
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来
实现。
[0156]
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括评分模块、首图模块、筛选模块和列表模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
[0157]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,该设备实现如下方法:将目标物品的各个物品图片以及属性信息输入到图片评分模型中,以输出所述各个物品图片的首图评分;其中,所述图片评分模型采用神经网络训练得到;根据所述各个物品图片的首图评分,确定所述目标物品的首图;参照所述目标物品的首图的图片内容,筛选出所述目标物品的副图,以使所述目标物品的首图的图片内容和所述目标物品的副图的图片内容均示意所述目标物品;基于所述目标物品的首图和副图,生成所述目标物品的素材图片列表。
[0158]
作为另一方面,本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的方法。
[0159]
根据本发明实施例的技术方案,因为采用将目标物品的各个物品图片以及属性信息输入到图片评分模型中,根据图片评分模型输出的首图评分确定首图,从而参照首图筛选出副图的技术手段,所以克服了现有技术中素材图片的驳回率较高的技术问题。本发明实施例在采用模型识别图片时融入了物品属性信息,提高了选图的准确性,显著降低了素材图片的驳回率;而且,物品属性信息中的品类和标题等其他信息可以进一步提升模型的识别效果。
[0160]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1