一种图像相似度确定方法、装置、电子设备及存储介质与流程

文档序号:30298720发布日期:2022-06-04 20:40阅读:57来源:国知局
一种图像相似度确定方法、装置、电子设备及存储介质与流程

1.本发明涉及图像处理技术领域,特别是涉及一种图像相似度确定方法、装置、电子设备及存储介质。


背景技术:

2.随着信息技术和人工智能的不断发展,目前,图像识别得到广泛应用,比如应用于在线购物中的识别同款商品图像等。其中,目前的识别方法采用样本一致性作为模型学习的目标,这就需要在训练过程中获取大量的一致的样本图像来进行训练。
3.但是实际上通常难以收集足量的一致的样本图像,即用于模型训练的样本图像不足,导致训练得到的模型在预测图像相似度时的准确度低。


技术实现要素:

4.本发明实施例的目的在于提供一种图像相似度确定方法、装置、电子设备及可读存储介质,能够提升预测图像相似度的准确度。具体技术方案如下:
5.在本发明实施的第一方面,首先提供了一种图像相似度确定方法,包括:
6.获取待检测图像和多个候选图像;
7.将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率;相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值;
8.基于映射函数对预测分布进行映射,确定多个目标相似度,映射函数根据训练样本的预测分布和相似度值拟合得到。
9.在本发明实施的第二方面,还提供了一种图像相似度确定装置,包括:
10.获取模块,用于获取待检测图像和多个候选图像;
11.输入模块,用于将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率;相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值;
12.确定模块,用于基于映射函数对预测分布进行映射,确定多个目标相似度,映射函数根据训练样本的预测分布和相似度值拟合得到。
13.在本发明实施的又一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一所述的数据转发方法。
14.在本发明实施的又一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的图像相似度确定方法。
15.本发明实施例提供的图像相似度确定方法,通过获取满足预设相似条件的待检测
图像和多个候选图像,将每组待检测图像和候选图像依次输入至预先训练的相似度分布模型中,输出用于反映待检测图像和候选图像的相似度的分布概率的预测分布,其中,由于相似度分布模型是根据多个训练样本训练得到的,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值,这样训练得到的相似度分布模型能够准确预测待检测图像和每个候选图像之间的相似度分布,即输出的预测分布。最后,基于根据样本图像的预测分布和相似度值拟合得到的映射函数对预测分布进行映射,能够将预测分布分别转化为每个候选图像对应的目标相似度,由此快速准确地确定不同候选图像与待检测图像的相似程度。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
17.图1是本发明实施例提供的一种图像相似度确定方法的流程图;
18.图2是本发明实施例提供的一种相似度分布模型的训练方法的流程图;
19.图3是本发明实施例提供的一种相似度分布模型的训练过程和应用过程的示意图;
20.图4是本发明实施例提供的一种图像相似度确定装置结构示意图;
21.图5是本发明实施例提供的一种相似度分布模型的训练装置结构示意图;
22.图6是本发明实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
23.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
24.本发明实施例提供的图像相似度确定方法至少可以应用于下述应用场景中,下面进行说明。
25.目前,在视频场景下,通常难以准确定位到视频中人物穿着服饰的准确款式,由于难以收集到同款商品图像,导致视频场景下出现的大量服饰图像无法应用于模型训练,即模型训练的样本不足,进而导致训练得到的模型对于预测待检测图像的同类图像的性能差的问题。
26.基于上述应用场景,下面对本发明实施例提供的图像相似度确定方法进行详细说明。
27.下面对本发明实施例提供的图像相似度确定方法进行说明。
28.图1为本发明实施例提供的一种图像相似度确定方法的流程图。
29.如图1所示,该图像相似度确定方法可以包括步骤110-步骤130,该方法应用于图像相似度确定装置,具体如下所示:
30.步骤110,获取待检测图像和多个候选图像。
31.步骤120,将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率;相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值。
32.步骤130,基于映射函数对预测分布进行映射,确定多个目标相似度,映射函数根据训练样本的预测分布和相似度值拟合得到。
33.在本公开实施例中,通过获取满足预设相似条件的待检测图像和多个候选图像,多个候选图像可以根据待检测图像的图像特征从预设图像库中检索得到,将每组待检测图像和候选图像依次输入至预先训练的相似度分布模型中,输出用于反映待检测图像和候选图像的相似度的分布概率的预测分布。其中,由于相似度分布模型是根据多个训练样本训练得到的,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值,相似度分布模型的训练过程中,根据由第一样本图像和第二样本图像确定的样本预测分布,以及由多个相似度值确定的样本目标分布确定的损失函数训练预设维度的神经网络,在损失函数满足预设训练条件的情况下,即不断缩小样本预测分布与样本目标分布之间的差异,得到相似度分布模型。由此,训练的相似度分布模型可以快速准确地输出一组待检测图像和候选图像之间的相似度分布。这样训练得到的相似度分布模型能够准确预测待检测图像和每个候选图像之间的相似度分布,即输出的预测分布。最后,基于根据样本图像的预测分布和相似度值拟合得到的映射函数对预测分布进行映射,能够将预测分布分别转化为每个候选图像对应的目标相似度,由此快速准确地确定不同候选图像与待检测图像的相似程度。
34.下面介绍上述各个步骤的具体实现方式。
35.涉及步骤110。
36.获取待检测图像和多个候选图像;
37.获取待检测图像和多个候选图像,待检测图像和候选图像满足预设相似条件。其中,具体可以获取待检测图像,提取待检测图像的图像特征,根据待检测图像的图像特征从预设图像库中检索得到多个候选图像,预设相似度条件可以是相似度大于预设阈值。
38.涉及步骤120。
39.将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率;相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值。
40.将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率。
41.其中,相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值。比如第一样本图像是a,第二样本图像可以为b1、b2、b3,
……
。相似度值为a和b1的相似度、b2的相似度、b3的相似度。
42.涉及步骤130。
43.基于映射函数对预测分布进行映射,确定多个目标相似度,映射函数根据训练样本的预测分布和相似度值拟合得到。
44.示例性地,将待检测图像为a,候选图像为:b1、b2、b3
……
。分别将a和b1、a和b2、a和b3输入至预先训练的相似度分布模型中,输出每组图像的预测分布,基于映射函数对预测分布进行映射,确定每组图像的目标相似度,并且可以根据目标相似度给多个候选图像
进行排序。
45.由此,在可以基于映射函数对上述确定的多个待检测图像对应的预测分布进行映射,快速准确地确定多个目标相似度,通过目标相似度给多个候选图像进行排序。
46.在一种可能的实施例中,在步骤130之前,还可以包括以下步骤:
47.建立拟合函数;
48.根据多组相似度值和样本预测分布的数据对,求解得到拟合函数的参数;
49.将参数代入拟合函数,得到映射函数。
50.对相似度值和样本预测分布,进行函数拟合,用于将样本预测分布转换为相应的相似度值,用于基于映射函数对预测分布进行映射,输出两张图像(待检测图像和候选图像)之间的目标相似度。
51.具体地,采用线性回归将样本预测分布q映射为相似度值y,y=w*q+b,这样通过多组相似度值和样本预测分布的数据对,对映射函数的参数(w,b)进行拟合,求解得到拟合函数的参数(w,b),并将求解得到的参数代入拟合函数,得到映射函数。
52.由此,通过建立的拟合函数和多组相似度值和样本预测分布的数据对,得到映射函数,能够便于将输出的预测分布快速准确地转换为相对应的目标相似度。
53.在一种可能的实施例中,将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出每个候选图像的目标相似度,相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值。其中,相似度分布模型可以包括分布预测结构和打分预测结构,其中,分布预测结构是根据多个训练样本训练得到的,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值,相似度分布模型的训练过程中,根据由第一样本图像和第二样本图像确定的样本预测分布,以及由多个相似度值确定的样本目标分布确定的损失函数训练预设维度的神经网络,在损失函数满足预设训练条件的情况下,即不断缩小样本预测分布与样本目标分布之间的差异,得到分布预测结构。由此,训练的相似度分布模型可以快速准确地输出一组待检测图像和候选图像之间的相似度分布。在打分预测结构中,对相似度值和样本预测分布,进行函数拟合,用于将样本预测分布转换为相应的相似度值,用于基于映射函数对预测分布进行映射,输出两张图像(待检测图像和候选图像)之间的目标相似度。由此,相似度分布模型中,可以快速准确地输出将待检测图像和每个候选图像之间的目标相似度。
54.综上,在本发明实施例中,通过获取满足预设相似条件的待检测图像和多个候选图像,将每组待检测图像和候选图像依次输入至预先训练的相似度分布模型中,输出用于反映待检测图像和候选图像的相似度的分布概率的预测分布,其中,由于相似度分布模型是根据多个训练样本训练得到的,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值,这样训练得到的相似度分布模型能够准确预测待检测图像和每个候选图像之间的相似度分布,即输出的预测分布。最后,基于根据样本图像的预测分布和相似度值拟合得到的映射函数对预测分布进行映射,能够将预测分布分别转化为每个候选图像对应的目标相似度,目标相似度用于给多个候选图像进行排序,就能快速准确地确定不同候选图像与待检测图像的相似程度。
55.下面接着对本发明实施例提供的相似度分布模型的训练过程进行说明。
56.图2是本发明实施例提供的一种相似度分布模型的训练方法的流程图;
57.如图2所示,该相似度分布模型的训练方法可以包括步骤210-步骤240,具体如下所示:
58.步骤210,获取多个训练样本。
59.步骤220,根据多个相似度值,确定样本目标分布。
60.步骤230,将第一样本图像和第二样本图像输入至预设维度的神经网络,输出样本预测分布;样本预测分布用于反映第一样本图像和第二样本图像的相似度的分布概率。
61.步骤240,根据由样本预测分布与样本目标分布确定的损失函数训练预设维度的神经网络,在损失函数满足预设训练条件的情况下,得到相似度分布模型。
62.下面介绍上述各个步骤的具体实现方式。
63.涉及步骤210。
64.获取多个训练样本,每个训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值。
65.在一种可能的实施例中,步骤210,包括:
66.获取第一样本图像和多个第二样本图像;
67.从预设维度对第一样本图像和第二样本图像进行相似度打分,得到每个预设维度的相似度值;
68.根据每个预设维度的相似度值,确定第一样本图像和每个第二样本图像之间的相似度值。
69.获取第一样本图像,以及根据第一样本图像检索获得与第一样本图像满足预设相似条件的第二样本图像。然后,对第一样本图像和第二样本图像之间的相似度进行打分,得到它们之间的相似度分数。其中,第一样本图像包括第一对象,第二样本图像包括第二对象。
70.从预设维度d对第一样本图像和第二样本图像进行相似度打分,得到每个预设维度的相似度值,d为正整数。其中,预设维度可以理解为图像特征的维度。
71.其中,如果第一对象和第二对象为服饰,相应的预设维度可以包括:服装类型、领型、颜色、材质、花纹和细节,共计6个维度。每个预设维度的相似度值的分值范围可以为[0,c_d],其中,相似度值为0表示完全不一致,c_d表示完全一致,对每个预设维度的相似度值求合,确定第一样本图像和每个第二样本图像之间的相似度值,即相似度值y=sum(c_d,d=1,2,

,6)。
[0072]
由此,通过从预设维度对第一样本图像和第二样本图像进行相似度打分,能够得到每个预设维度的相似度值,得到精细的每个预设维度的相似度值,然后根据每个预设维度的相似度值,确定第一样本图像和每个第二样本图像之间的相似度值,能够综合不同预设维度的相似度值,全面考虑到图像在不同预设维度的特点,得到的第一样本图像和每个第二样本图像之间的相似度值更加准确。
[0073]
其中,获取第一样本图像和多个第二样本图像,包括:
[0074]
获取样本视频,样本视频包括多个第一样本图像;
[0075]
从样本视频中截取多个第一样本图像;
[0076]
从预设图像库中,分别获取每个第一样本图像对应的第二样本图像,第一样本图
像与第二样本图像满足预设相似条件。
[0077]
从样本视频中截取多个第一样本图像,其中,第一样本图像可以为服饰区域图像,以及根据第一样本图像检索获得与第一样本图像满足预设相似条件的第二样本图像。这里,在视频场景下,从样本视频中截取多个第一样本图像,从预设图像库中,分别获取每个第一样本图像对应的第二样本图像,即每个第一样本图像都分别对应多个第二样本图像。这里的第二样本图像与第一样本图像能够满足预设相似条件即可,比如第二样本图像与第一样本图像的相似度大于预设阈值。这里,解决了由于视频场景下难以收集到视频帧中的同款商品图像,导致视频场景下出现的大量同款商品图像无法应用于模型训练的问题。
[0078]
涉及步骤220。
[0079]
根据多个相似度值,确定样本目标分布。
[0080]
将人工标注的多个相似度值映射至相似度分布,作为模型学习的样本目标分布。其中,一个第一样本图像对应一个目标分布,n个第一样本图像对应n个样本目标分布,因此可以通过n个样本目标分布进行模型训练。
[0081]
在一种可能的实施例中,第二样本图像包括:第三样本图像和第四样本图像,第一样本图像与第三样本图像的第一相似度值大于第一阈值,第一样本图像与第四样本图像的第二相似度值小于第二阈值,步骤220,包括:
[0082]
根据多个相似度值,确定样本目标分布,包括:
[0083]
对第一相似度值和第二相似度值,进行分布映射处理,得到样本目标分布。
[0084]
第二样本图像包括:与第一样本图像的第一相似度值大于第一阈值的第三样本图像,以及与第一样本图像的第二相似度值小于第二阈值的第四样本图像,第一阈值大于第二阈值。
[0085]
具体一种实施例中,即上述涉及到的获取第一样本图像和多个第二样本图像,可以包括:从预设图像库中查询与第一样本图像最相似(与第一样本图像的第一相似度值大于第一阈值)的k/2个第三样本图像及最不相似(与第一样本图像的第二相似度值小于第二阈值)的k/2个第四样本图像,其中,k为第二样本图像的数量,k为正整数。
[0086]
由此,能够收集从预设图像库中查询与第一样本图像的第一相似度值大于第一阈值的k/2个第三样本图像作为正训练样本,及与第一样本图像的第二相似度值小于第二阈值的k/2个第四样本图像作为负训练样本,能够帮助提升训练后的模型的识别准确度。
[0087]
在一种可能的实施例中,步骤220,包括:
[0088]
对多个相似度值进行离散化处理,得到多个离散区间,每个离散区间包括多个相似度值;
[0089]
确定每个相似度值相对于每个离散区间的概率值;
[0090]
根据多个概率值确定样本目标分布。
[0091]
具体地,可以采用等间隔或概率均分的方式对相似度分数区间进行离散化处理,得到m个离散化区间,m为正整数。具体离散化处理方式不做具体限制,以方案能够实现为准。
[0092]
其中,等间隔的方式,是将相似度值的值域划为分m个离散区间,令每个区间的区间长度相同。比如离散区间可以包括:[0,1],(1,2],
……

[0093]
其中,概率均分的方式;是将相似度值的值域划为分m个区间,令每个区间上的相
似度值的数量基本相同;每个区间对应一组相似度分数的范围,也就是说,对相似度值的值集中的地方划分的离散区间也比较密集。比如离散区间可以包括:[0,5],(5,7],
……
。其中[0,5]和(5,7]的离散区间长度虽然不同,每个离散区间中包括的相似度值的数量是基本相同的。
[0094]
其中,确定每个相似度值相对于每个离散区间的概率值的步骤,具体可以为:确定相似度值相对各离散区间中点cm。离散区间中点,为该离散区间的中值。其中,具体可以通过下式确定:
[0095][0096]
其中,qm是每个相似度值相对于每个离散区间的概率值;
[0097]
y是相似度值;
[0098]
exp是指数函数;
[0099]
β是加权系数,可以设为32;
[0100]cm
是第m个离散区间中点,是第m个离散区间的代表值;
[0101]
||x-y||运算是向量作差之后各分量的平方和的开根号(当x和y为标量时,为取绝对值计算);
[0102]ci
表示各个离散区间的中点,此处i和m进行区分是为了表示对ci在m个区间上进行求和运算。
[0103]
最后,求得的q=(q1,q2,...,qm)可以作为训练样本对应的样本目标分布。
[0104]
这里,y-cm可以体现第一样本图像和每个第二样本图像之间的相似度值相对于每个离散区间的代表值的相对关系,y-ci可以体现第一样本图像和每个第二样本图像之间的相似度值相对于每个离散区间的任意值的相对关系,离散区间又是代表多个相似度值的值域的,所以通过上述方式求解得到的样本预测分布可以用于反映某一个相似度值与多个相似度值之间的相对关系。
[0105]
也就是说,样本预测分布可以用于反映第一样本图像和第二样本图像的相似度的所有可能存在的分布情况,即相似度等于某个指定数值的可能性。因此,分布概率可以用于表征第一样本图像和第二样本图像的相似度等于某个值的概率。
[0106]
涉及步骤230。
[0107]
将第一样本图像和第二样本图像输入至预设维度的神经网络,输出样本预测分布;样本预测分布用于反映第一样本图像和第二样本图像的相似度的分布概率。其中,对于一个训练样本来说,目标分布是根据人工标注结果,即相似度值计算出的分布(d维的向量);预测分布是使用预设维度的神经网络推理得到的预测分布,同样是一个d维向量。
[0108]
其中,预设维度的神经网络是指输出维度为预设维度的神经网络的,具体可以采用一个输出维度为d的全连接层输出第一样本图像和第二样本图像对应的样本预测分布。
[0109]
比如,上述是从预设维度d对第一样本图像和第二样本图像进行相似度打分,得到每个预设维度的相似度值,相应的预设维度可以包括:服装类型、领型、颜色、材质、花纹和细节,共计6个维度。那么,神经网络的也是从服装类型、领型、颜色、材质、花纹和细节这6个维度来分别输出样本预测分布的,因此,通过预设维度的神经网络推理得到的预测分布,是
d维的向量。
[0110]
涉及步骤240。
[0111]
根据由样本预测分布与样本目标分布确定的损失函数训练预设维度的神经网络,在损失函数满足预设训练条件的情况下,得到相似度分布模型。
[0112]
具体地,可以采用kl(kullback-leibler divergence)散度作为损失函数,根据样本预测分布与样本目标分布确定损失函数,采用梯度下降的方式学习模型参数,具体可以采用端到端的方式对模型参数进行学习,以实现最小化模型输出的预测分布与目标分布之间的差异。
[0113]
其中,kl散度又称为kl距离,是两个随机分布间距离的度量。度量(metric),亦称距离函数,数学概念,是度量空间中满足特定条件的特殊函数,一般用d表示。度量函数是神经网络学习里的一个常用说法,也可以认为是损失函数。
[0114]
综上,本发明实施例提供的相似度分布模型的训练方法,通过获取多个包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值的训练样本,根据多个相似度值,确定样本目标分布。将第一样本图像和第二样本图像输入至预设维度的神经网络,输出用于反映第一样本图像和第二样本图像的相似度的分布概率的样本预测分布;根据由样本预测分布与样本目标分布确定的损失函数训练预设维度的神经网络,能够不断缩小样本预测分布与样本目标分布之间的差异,在损失函数满足预设训练条件的情况下,得到相似度分布模型。由此,训练的相似度分布模型可以快速准确地输出一组待检测图像和候选图像之间的相似度分布。
[0115]
下面对本发明实施例提供的相似度分布模型结构进行整体说明。
[0116]
图3是本发明实施例提供的一种相似度分布模型的训练过程和应用过程的示意图,如图3所示,分为训练过程310和应用过程320。
[0117]
在训练过程310中,通过获取多个包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值的训练样本,根据多个相似度值,确定样本目标分布314。将每组样本图像311(第一样本图像和第二样本图像)分别输入至预设维度的神经网络312,输出用于反映第一样本图像和第二样本图像的相似度的分布概率的样本预测分布313。
[0118]
根据由样本预测分布313与样本目标分布314确定的损失函数315训练预设维度的神经网络,能够不断缩小样本预测分布与样本目标分布之间的差异,在损失函数315满足预设训练条件的情况下,得到相似度分布模型322。由此,训练的相似度分布模型可以快速准确地输出一组待检测图像和候选图像之间的相似度分布。
[0119]
在应用过程320中,通过获取满足预设相似条件的待检测图像和多个候选图像,将每组待检测图像和候选图像321依次输入至预先训练的相似度分布模型322中,输出用于反映待检测图像和候选图像的相似度的分布概率的预测分布323,其中,由于相似度分布模型是根据多个训练样本训练得到的,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值,这样训练得到的相似度分布模型能够准确预测待检测图像和每个候选图像之间的相似度分布,即输出的预测分布323。
[0120]
最后,基于根据样本图像的预测分布323和相似度值拟合得到的映射函数对预测分布进行映射,能够将预测分布323分别转化为每个候选图像对应的目标相似度324,目标
相似度324可以用于给多个候选图像进行排序,就能快速准确地确定不同候选图像与待检测图像的相似程度。
[0121]
基于上述图1所示的图像相似度确定方法,本发明实施例还提供一种图像相似度确定装置,如图4所示,该图像相似度确定装置400可以包括:
[0122]
获取模块410,用于获取待检测图像和多个候选图像。
[0123]
输入模块420,用于将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率;相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值。
[0124]
确定模块430,基于映射函数对预测分布进行映射,确定多个目标相似度,映射函数根据训练样本的预测分布和相似度值拟合得到。
[0125]
在一种可能的实施例中,该图像相似度确定装置400还可以包括:拟合模块,具体用于:
[0126]
建立拟合函数;
[0127]
根据多组相似度值和样本预测分布的数据对,求解得到拟合函数的参数;
[0128]
将参数代入拟合函数,得到映射函数。
[0129]
综上,在本发明实施例中,通过获取满足预设相似条件的待检测图像和多个候选图像,将每组待检测图像和候选图像依次输入至预先训练的相似度分布模型中,输出用于反映待检测图像和候选图像的相似度的分布概率的预测分布,其中,由于相似度分布模型是根据多个训练样本训练得到的,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值,这样训练得到的相似度分布模型能够准确预测待检测图像和每个候选图像之间的相似度分布,即输出的预测分布。最后,基于根据样本图像的预测分布和相似度值拟合得到的映射函数对预测分布进行映射,能够将预测分布分别转化为每个候选图像对应的目标相似度,目标相似度用于给多个候选图像进行排序,就能快速准确地确定不同候选图像与待检测图像的相似程度。
[0130]
基于上述图2所示的相似度分布模型的训练方法,本发明实施例还提供一种相似度分布模型的训练装置500,如图5所示,该相似度分布模型的训练装置500可以包括:
[0131]
获取模块510,获取多个训练样本。
[0132]
确定模块520,根据多个相似度值,确定样本目标分布。
[0133]
输入模块530,将第一样本图像和第二样本图像输入至预设维度的神经网络,输出样本预测分布;样本预测分布用于反映第一样本图像和第二样本图像的相似度的分布概率。
[0134]
训练模块540,用于根据由样本预测分布与样本目标分布确定的损失函数训练预设维度的神经网络,在损失函数满足预设训练条件的情况下,得到相似度分布模型。
[0135]
在一种可能的实施例中,第二样本图像包括:第三样本图像和第四样本图像,第一样本图像与第三样本图像的第一相似度值大于第一阈值,第一样本图像与第四样本图像的第二相似度值小于第二阈值;
[0136]
确定模块520,具体用于:
[0137]
对第一相似度值和第二相似度值,进行分布映射处理,得到样本目标分布。
[0138]
在一种可能的实施例中,获取模块510,具体用于:
[0139]
获取第一样本图像和多个第二样本图像;
[0140]
从预设维度对第一样本图像和第二样本图像进行相似度打分,得到每个预设维度的相似度值;
[0141]
根据每个预设维度的相似度值,确定第一样本图像和每个第二样本图像之间的相似度值。
[0142]
在一种可能的实施例中,确定模块520,具体用于:
[0143]
对多个相似度值进行离散化处理,得到多个离散区间,每个离散区间包括多个相似度值;
[0144]
确定每个相似度值相对于每个离散区间的概率值;
[0145]
根据多个概率值确定样本目标分布。
[0146]
在一种可能的实施例中,获取模块510,具体用于:
[0147]
获取样本视频,样本视频包括多个第一样本图像;
[0148]
从样本视频中截取多个第一样本图像;
[0149]
从预设图像库中,分别获取每个第一样本图像对应的第二样本图像,第一样本图像与第二样本图像满足预设相似条件。
[0150]
综上,本发明实施例提供的相似度分布模型的训练方法,通过获取多个包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值的训练样本,根据多个相似度值,确定样本目标分布。将第一样本图像和第二样本图像输入至预设维度的神经网络,输出用于反映第一样本图像和第二样本图像的相似度的分布概率的样本预测分布;根据由样本预测分布与样本目标分布确定的损失函数训练预设维度的神经网络,能够不断缩小样本预测分布与样本目标分布之间的差异,在损失函数满足预设训练条件的情况下,得到相似度分布模型。由此,训练的相似度分布模型可以快速准确地输出一组待检测图像和候选图像之间的相似度分布。
[0151]
本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
[0152]
存储器603,用于存放计算机程序;
[0153]
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
[0154]
获取待检测图像和多个候选图像;将待检测图像和候选图像输入至预先训练的相似度分布模型中,输出预测分布,预测分布用于反映待检测图像和候选图像的相似度的分布概率;相似度分布模型根据多个训练样本训练得到,训练样本包括第一样本图像、多个第二样本图像,以及第一样本图像和每个第二样本图像之间的相似度值;基于映射函数对预测分布进行映射,确定多个目标相似度,映射函数根据训练样本的预测分布和相似度值拟合得到。
[0155]
上述终端提到的通信总线可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0156]
通信接口用于上述终端与其他设备之间的通信。
[0157]
存储器可以包括随机存取存储器(random access memory,简称ram),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0158]
上述的处理器可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processing,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现场可编程门阵列(field-programmable gate array,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0159]
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图像相似度确定方法。
[0160]
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的图像相似度确定方法。
[0161]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
[0162]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0163]
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0164]
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1