一种样本分类的方法以及相关装置与流程

文档序号:19420554发布日期:2019-12-14 01:23阅读:193来源:国知局
一种样本分类的方法以及相关装置与流程

本申请涉及人工智能技术领域,尤其涉及一种样本分类的方法以及相关装置。



背景技术:

行人再识别(personre-identification,personre-id)是近年来计算机视觉的一个研究重点,给定一个监控行人图像,跨设备检索该行人的图像。由于不同摄像设备之间存在差异,行人外观易受穿着、尺度、遮挡、姿态和视角等影响,行人再识别是一个既具研究价值同时又极富挑战性的课题。行人再识别技术也可以称为行人重识别技术,以下简称reid技术。

目前reid技术正在被广泛的应用于商业、安防、交通、金融等领域,数据在提升reid模型性能中发挥重要作用,对于研究人员而言,从海量人体图片中挖掘有标签的身份是一个重要任务。聚类技术在挖掘过程中起到核心作用,将相同身份的人聚合到一起,可以减轻后续人工标注量。

由于人脸识别技术已经很成熟,在人脸数据库(labeledfacesinthewild,lfw)上,人脸识别模型准确率要高于人眼识别准确率,利用人脸特征进行聚类得到的效果非常好。然而,reid技术相比较人脸识别技术发展比较慢,模型精度还比较弱。在人脸识别中表现好的聚类算法,在reid技术中聚类效果往往表现不佳,得到的样本往往达不到要求,例如出现坏档和一人多档的情况,或者例如出现同一个人没有聚到一起的情况。因此,将人脸识别技术中的聚类算法应用到reid技术中难以得到合适的样本。



技术实现要素:

本申请实施例提供了一种样本分类的方法以及相关装置,解决现有技术中聚类效果不佳,难以得到合适样本的技术问题。

第一方面,本申请实施例提供了一种样本分类的方法,包括:

获取第一待处理集合和第二待处理集合,所述第一待处理集合包括至少一个第一样本图像,所述第二待处理集合包括至少一个第二样本图像;

获取第一图像特征向量和第二图像特征向量,所述第一图像特征向量与所述第一样本图像具有第一对应关系,所述第二图像特征向量与所述第二样本图像具有第二对应关系;

根据所述第一图像特征向量和所述第二图像特征向量获取所述第一待处理集合和所述第二待处理集合之间的距离,所述距离包括绝对距离,互近邻距离以及邻居排序距离;

若所述绝对距离满足第一设定条件,所述互近邻距离满足第二设定条件且所述邻居排序距离满足第三设定条件,则生成所述第一待处理集合和所述第二待处理集合对应的样本分类结果。

第二方面,本申请实施例提供了一种样本分类的装置,包括:

获取单元,用于获取第一待处理集合和第二待处理集合,所述第一待处理集合包括至少一个第一样本图像,所述第二待处理集合包括至少一个第二样本图像;

获取单元,还用于获取第一图像特征向量和第二图像特征向量,所述第一图像特征向量与所述第一样本图像具有第一对应关系,所述第二图像特征向量与所述第二样本图像具有第二对应关系;

处理单元,用于根据所述第一图像特征向量和所述第二图像特征向量获取所述第一待处理集合和所述第二待处理集合之间的距离,所述距离包括绝对距离,互近邻距离以及邻居排序距离;

处理单元,还用于若所述绝对距离满足第一设定条件,所述互近邻距离满足第二设定条件且所述邻居排序距离满足第三设定条件,则生成所述第一待处理集合和所述第二待处理集合对应的样本分类结果。

在一种可能的设计中,在本申请实施例第二方面的一种实现方式中,所述处理单元还用于:

根据所述第一图像特征向量和所述第二图像特征向量确定所述第一样本图像与所述第二样本图像之间的余弦距离;

根据所述余弦距离确定所述第一待处理集合和所述第二待处理集合之间的绝对距离,所述绝对距离为所述余弦距离的最小值。

在一种可能的设计中,在本申请实施例第二方面的一种实现方式中,所述处理单元还用于:

获取所述第一待处理集合对应的第一绝对距离;

根据所述第一绝对距离的大小排序得到所述第一待处理集合对应的第一最近邻序列;

获取所述第二待处理集合对应的第二绝对距离;

根据所述第二绝对距离的大小排序得到所述第二待处理集合对应的第二最近邻序列;

根据所述第一待处理集合在所述第二最近邻序列的序号与所述第二待处理集合在所述第一最近邻序列的序号确定所述第一待处理集合和所述第二待处理集合之间的互近邻距离。

在一种可能的设计中,在本申请实施例第二方面的一种实现方式中,所述处理单元还用于:

根据所述第一最近邻序列和所述第二最近邻序列确定所述第一待处理集合和所述第二待处理集合之间的邻居排序距离。

在一种可能的设计中,在本申请实施例第二方面的一种实现方式中,所述处理单元还用于:

获取目标集合,所述目标集合包括所述第一待处理集合和所述第二待处理集合;

根据所述第一图像特征向量和所述第二图像特征向量确定单特征向量;

根据所述单特征向量计算所述目标集合之间的相似度;

向终端设备发送所述相似度小于设定阈值的所述目标集合,使得所述终端设备展示所述目标集合。

在一种可能的设计中,在本申请实施例第二方面的一种实现方式中,所述处理单元还用于:

选择所述目标集合中的一个样本图像;

向终端设备发送所述样本图像,使得所述终端设备展示所述样本图像。

在一种可能的设计中,在本申请实施例第二方面的一种实现方式中,所述处理单元还用于:

获取标注信息,所述标注信息与所述目标集合具有关联关系;

根据所述标注信息确定所述目标集合对应的二次样本分类结果。

第三方面,本申请实施例提供一种服务器,包括:

一个或一个以上中央处理器,存储器,输入输出接口,有线或无线网络接口,电源;

所述存储器为短暂存储存储器或持久存储存储器;

所述中央处理器配置为与所述存储器通信,在所述服务器上执行如下步骤:

获取第一待处理集合和第二待处理集合,所述第一待处理集合包括至少一个第一样本图像,所述第二待处理集合包括至少一个第二样本图像;

获取第一图像特征向量和第二图像特征向量,所述第一图像特征向量与所述第一样本图像具有第一对应关系,所述第二图像特征向量与所述第二样本图像具有第二对应关系;

根据所述第一图像特征向量和所述第二图像特征向量获取所述第一待处理集合和所述第二待处理集合之间的距离,所述距离包括绝对距离,互近邻距离以及邻居排序距离;

若所述绝对距离满足第一设定条件,所述互近邻距离满足第二设定条件且所述邻居排序距离满足第三设定条件,则生成所述第一待处理集合和所述第二待处理集合对应的样本分类结果。

在一种可能的设计中,在本申请实施例第三方面的一种实现方式中,所述中央处理器还用于执行如下步骤:

根据所述第一图像特征向量和所述第二图像特征向量确定所述第一样本图像与所述第二样本图像之间的余弦距离;

根据所述余弦距离确定所述第一待处理集合和所述第二待处理集合之间的绝对距离,所述绝对距离为所述余弦距离的最小值。

在一种可能的设计中,在本申请实施例第三方面的一种实现方式中,所述中央处理器还用于执行如下步骤:

根据所述绝对距离确定所述第一待处理集合所对应的第一最近邻序列和所述第二待处理集合所对应的的第二最近邻序列,所述第一最近邻序列为所述第二样本图像按照所述余弦距离的排序队列,所述第二最近邻序列为所述第一样本图像按照所述余弦距离的排序队列;

根据所述第一绝对样本图像在所述第二最近邻序列的序号与所述第一绝对样本图像在所述第二最近邻序列的序号确定所述第一待处理集合和所述第二待处理集合之间的互近邻距离。

在一种可能的设计中,在本申请实施例第三方面的一种实现方式中,所述中央处理器还用于执行如下步骤:

根据所述第一最近邻序列和所述第二最近邻序列确定所述第一待处理集合和所述第二待处理集合之间的邻居排序距离。

在一种可能的设计中,在本申请实施例第三方面的一种实现方式中,所述中央处理器还用于执行如下步骤:

获取目标集合,所述目标集合包括所述第一待处理集合和所述第二待处理集合;

根据所述第一图像特征向量和所述第二图像特征向量确定单特征向量;

根据所述单特征向量计算所述目标集合之间的相似度;

向终端设备发送所述相似度小于设定阈值的所述目标集合,使得所述终端设备展示所述目标集合。

在一种可能的设计中,在本申请实施例第三方面的一种实现方式中,所述中央处理器还用于执行如下步骤:

选择所述目标集合中的一个样本图像;

向终端设备发送所述样本图像,使得所述终端设备展示所述样本图像。

在一种可能的设计中,在本申请实施例第三方面的一种实现方式中,所述中央处理器还用于执行如下步骤:

获取标注信息,所述标注信息与所述目标集合具有关联关系;

根据所述标注信息确定所述目标集合对应的二次样本分类结果。

第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各个方面的方法。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请实施例提供了一种样本分类的方法以及相关装置,能够通过互近邻距离、邻居排序距离以及绝对距离对行人图像进行聚类。本申请实施例将相同的人聚合到一起,并且可以根据聚类后的图像生成样本分类结果,聚类效果好,能够得到适合用于训练行人再识别模型的样本。

附图说明

图1为本申请实施例中行人再识别技术的场景示例图;

图2为本申请实施例中离群点的示例图;

图3为本申请实施例提供的一种样本分类的方法的示意图;

图4为本申请实施例中第一最近邻序列和第二最近邻序列的示例图;

图5为本申请实施例中服务器计算邻居排序距离的示例图;

图6为本申请实施例中目标集合的展示示例图;

图7为本申请实施例中一个可选实施例的流程示意图;

图8为本申请实施例中另一个可选实施例的流程示意图;

图9为本申请实施例中一种样本分类的装置的示例图;

图10为本申请实施例提供的一种服务器结构示意图。

具体实施方式

本申请实施例提供了一种样本分类的方法以及相关装置,解决现有技术中聚类效果不佳,难以得到合适样本的技术问题。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

为了下述各实施例的描述清楚简洁,首先给出相关技术的简要介绍:

人工智能(artificialintelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(computervision,cv)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别、行人再识别等生物特征识别技术。

本申请实施例提供的方案涉及人工智能的行人再识别等技术,具体通过如下实施例进行说明:

图1为本申请实施例中行人再识别技术的场景示例图。摄像设备可以包括但不限于摄像头、监控设备、录像仪等,本申请实施例对此不做限定。摄像设备与服务器通过网络连接,使得摄像设备可以将拍摄到的图像或视频传输到服务器。服务器接收到这些图像或视频后,可以通过行人再识别技术(以下简称reid技术)识别出图像或视频中的行人,具体流程大概如下:

服务器获取摄像设备中的图像或视频数据。若服务器接收到摄像设备传输的视频数据,则服务器可以按照抽样方式抽取其中的若干帧图像。然后,服务器可以将获取到的图像进行聚类,将相同行人对应的所有图像归为同一类别。示例性的,摄像设备a拍摄到行人a的三张图像,摄像设备b也拍摄到了行人a的三张图像,则服务器可以将这六张图像归为同一类别。最后,服务器根据人脸识别等识别算法,识别出每一类图像对应的行人身份。

上述流程中,服务器将图像进行聚类的聚类算法在整个流程中起着重要作用。目前采用的层次聚类算法以及rankorder聚类算法难以得到合适的样本,或者说难以得到归类准确的样本。以下将对层次聚类算法和rank-order聚类算法进行简单介绍:

层次聚类算法实现的方式为:先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到所有对象都在一个簇中,或者某个终结条件被满足。采用层次聚类算法的reid模型特征表达能力弱,同人跨越摄像头、同人正反面等情况相似度偏低,不同人衣着相似相似度高,利用层次聚类方法会产生大量的坏档(不同人的图像归到同一类别)和一人多档(相同人的图像分别归到多个类别)。此外,终止条件不容易设定。

基于rankorder排序距离的聚类方法被广泛应用于手机相册聚类。rankorder基于一个常见现象:同一个人的两张脸有许多共享的邻居,但是来自不同人的人脸的邻居通常差异很大。rankorder聚类算法应用于reid技术时,离群点(outlier)出现会放大排序距离,导致同一个人没有聚到一起。

图2为本申请实施例中离群点的示例图。可见,样本a、b、c,其中a、b属于同一个人,c与a、b不属于同人,如果c与a、b其中一个距离很近,与另外一个很远,则成c为离群点。例如,c是a的第一个邻居,是b的第155个邻居。

因此,上述的聚类算法未能达到要求,不能得到归类合理的样本。

有鉴于此,本申请实施例提供一种样本分类的方法,以解决上述技术问题。图3为本申请实施例提供的一种样本分类的方法的示意图。该方法包括:

301、获取第一待处理集合和第二待处理集合,第一待处理集合包括至少一个第一样本图像,第二待处理集合包括至少一个第二样本图像;

在本申请实施例中,服务器首先获取第一待处理集合和第二待处理集合,第一待处理集合和第二待处理集合也可以称为聚类算法中的类,为方便描述,以下统一将第一待处理集合和第二待处理集合称为a类和b类。可以理解的是,服务器不仅获取到a类和b类,还可以获取到其他类,例如c类、d类等。在本申请实施例中,为方便描述,仅对其中的a类和b类的情况进行描述,不应理解为服务器仅获取到a类和b类。示例性的,服务器获取到的待处理集合包括a类(第一待处理集合)、b类(第二待处理集合)、c类、d类等,本申请实施例中,服务器可以判断a类与b类是否能够合并。若a类与b类能够合并,则服务器将a类与b类中的样本图像均归为一个大类。以此类推,服务器可以将各个类进行合并,得到若干个大类,每个大类下包括若干个样本图像,从而实现样本图像的聚合,将样本图像进行了合理的分类,使得服务器可以根据合理分类的样本图像识别行人身份。例如,服务器得到的一个大类中的样本图像均为行人a的图像,则服务器对该大类下的样本图像进行行人识别时,可以提高识别的准确率,并且可以识别出该大类下的图像均为行人a的图像。

服务器获取的每个类中可以至少包括一个样本图像。在一些实施例中,服务器获取到摄像设备传输的图像或者由视频确定的图像后,将每个图像作为样本图像进行处理。在一些实施例中,服务器可以将每个样本图像作为一个类进行处理,一个类中可以仅包括一个样本图像。示例性的,服务器获取到a样本图像和b样本图像,则服务器将a样本图像初步归为a类,将b样本图像初步归为b类。可以理解的是,本申请实施例中,a类内的样本图像为第一样本图像,b类内的样本图像为第二样本图像。

302、获取第一图像特征向量和第二图像特征向量,第一图像特征向量与第一样本图像具有第一对应关系,第二图像特征向量与第二样本图像具有第二对应关系;

在本申请实施例中,服务器可以根据第一样本图像提取特征,得到第一图像特征向量。提取特征的算法或模型可以包括但不限于卷积神经网络模型(convolutionalneuralnetwork,cnn)、人体姿态(pose)和骨架关键点(skeleton)模型等,具体此处不做限定。同理,服务器可以根据第二样本图像提取特征,得到第二图像特征向量。

可以理解的是,第一图像特征向量和第二图像特征向量用于表示样本图像中的行人的信息。

303、根据第一图像特征向量和第二图像特征向量获取第一待处理集合和第二待处理集合之间的距离,距离包括绝对距离,互近邻距离以及邻居排序距离;

在本申请实施例中,服务器需要计算多个距离,包括绝对距离(也可以称为最近距离),互近邻距离以及邻居排序距离,以下将分别对这三个距离进行详细的描述。

在一些实施例中,服务器计算绝对距离的方式可以是服务器首先根据第一图像特征向量和第二图像特征向量确定第一样本图像与第二样本图像之间的余弦距离。然后,服务器根据余弦距离确定第一待处理集合和第二待处理集合之间的绝对距离,绝对距离为余弦距离的最小值。服务器计算余弦距离的方法在本申请实施例中不做具体限定。服务器计算绝对距离可通过绝对距离计算公式进行计算,绝对距离计算公式为:

d(ci,cj)=min(f(xm,xn));

其中,d(ci,cj)为ci类与cj类之间的绝对距离,xm为ci类中的样本图像,xn为cj类中的样本图像,f(xm,xn)为计算样本图像之间余弦距离的函数。

示例性的,a类包括样本图像a和样本图像b,b类包括样本图像c和样本图像d,计算得到样本图像a和样本图像c的余弦距离为1,样本图像a和样本图像d的余弦距离为2,样本图像b和样本图像c的余弦距离为3,样本图像b和样本图像d的余弦距离为4,则服务器确定a类与b类的绝对距离为1。

在一些实施例中,a类仅有一个样本图像,b类也仅有一个样本图像,则a类与b类的绝对距离可以是两个样本图像之间的余弦距离。

在一些实施例中,服务器还可以确定与绝对距离关联的第一绝对样本图像与第二绝对样本图像。示例性的,服务器根据样本图像a和样本图像c计算得到的余弦距离最小,则服务器以该余弦距离作为绝对距离,与该绝对距离关联的样本图像a可以作为第一绝对样本图像,与该余弦距离关联的样本图像c可以作为第二绝对样本图像。

在一些实施例中,服务器可以计算互近邻距离的方式可以是服务器首先获取第一待处理集合对应的第一绝对距离,根据第一绝对距离的大小排序得到第一待处理集合对应的第一最近邻序列。然后,服务器获取第二待处理集合对应的第二绝对距离;根据第二绝对距离的大小排序得到第二待处理集合对应的第二最近邻序列。最后,服务器根据第一待处理集合在第二最近邻序列的序号与第二待处理集合在第一最近邻序列的序号确定第一待处理集合和第二待处理集合之间的互近邻距离。

示例性的,服务器获取到的待处理集合可以包括a类(第一待处理集合)、b类(第二待处理集合)、c类、d类等。然后,服务器可以计算a类与所有类之间的绝对距离(也可以称为第一绝对距离),并根据该绝对距离将所有类进行排序,得到第一最近邻序列,如图4所示。图4为本申请实施例中第一最近邻序列和第二最近邻序列的示例图。其中,oa为第一最近邻序列,ob为第二最近邻序列,图4中的类可以包括a类、b类、c类、d类等。示例性的,假设服务器计算得到a类与a类的绝对距离为1,a类与b类的绝对距离为0.1,a类与c类的绝对距离为0.8,a类与d类的绝对距离为0.3,则服务器可以根据这些绝对距离由大到小排序得到第一最近邻序列,如图4所示。在另一些实施例中,服务器还可以通过其他方式排序,此处不做限定。

在一些实施例中,服务器可以通过互近邻距离计算公式计算类间的互近邻距离,该互近邻距离计算公式为:

mn(ci,cj)=m+n;

其中,mn为互近邻距离,m为ci类在cj类对应的最近邻序列的序号,n为cj类在ci类对应的最近邻序列的序号。

示例性的,如图4所示,第一最近邻序列的顺序为a类、c类、d类和b类,则b类在第一最近邻序列中的序号为3。同理,a类在第二最近邻序列中的序号为5,则a类与b类的互近邻距离为3+5=8。

在本申请实施例中,服务器计算邻居排序距离的方法可以为:根据第一最近邻序列和第二最近邻序列确定第一待处理集合和第二待处理集合之间的邻居排序距离。

在一些实施例中,服务器可以先计算所有到a类距离比b类到a类的距离近或相等的类,在第二近邻序列中的排序和(也可以称为非对称rankorder距离)。服务器可以通过排序和公式进行计算,该排序和公式为:

其中,d(a,b)为a类与b类的非对称rankorder距离,oa(b)为第一最近邻序列中,b类的序号,ob(fa(i))为第二最近邻序列中,i类对应的序号。

具体地,服务器可以先计算每个类与a类的绝对距离,若某个类与a类的绝对距离大于或等于a类与b类之间的绝对距离,则说明该类更接近a类,服务器可以将该类在第二最近邻序列的序号记录下来。服务器遍历所有类之后,可以将记录下来的序号相加,得到排序和。示例性的,如图5所示,图5为本申请实施例中,服务器计算邻居排序距离的示例图。图5中,a类、c类和d类均排在b类之前,说明a类、c类和d类均比b类更接近a类,也可以说,a类与a类的绝对距离大于a类与b类之间的绝对距离,c类与a类的绝对距离大于a类与b类之间的绝对距离,d类与a类的绝对距离也大于a类与b类之间的绝对距离。而b类与a类的绝对距离等于a类与b类之间的绝对距离。因此,服务器将a类、c类、d类和b类在第二最近邻序列的序号记录,分别是5、2、4、0。因此,服务器可以计算得到5+2+4+0=11。可以通过如下公式表示该过程:

在本申请实施例中,服务器还可以计算得到b类与a类的非对称rankorder距离为d(b,a),计算过程与前述计算d(a,b)的过程类似,此处不再赘述。

服务器计算得到d(a,b)和d(b,a)后,可以将它们相加得到邻居排序距离,邻居排序距离的计算公式为:

ro(a,b)=d(a,b)+d(b,a);

其中,ro(a,b)为a类与b类之间的邻居排序距离。

304、若绝对距离满足第一设定条件,互近邻距离满足第二设定条件且邻居排序距离满足第三设定条件,则生成第一待处理集合和第二待处理集合对应的样本分类结果。

在本申请实施例中,服务器可以预先设定第一设定条件、第二设定条件和第三设定条件,从而当绝对距离满足第一设定条件,互近邻距离满足第二设定条件且邻居排序距离满足第三设定条件时,服务器生成第一待处理集合和第二待处理集合对应的样本分类结果。在一些实施例中,样本分类结果可以是第一待处理集合和第二待处理集合合并为一个大的目标集合,第一待处理集合和第二待处理集合中的第一样本图像和第二样本图像均属于该大的目标集合。在本申请实施例中,目标集合也可以称为大类。

示例性的,若a类与b类的绝对距离小于或等于3,互近邻距离大于t且邻居排序距离小于或等于30,则服务器将a类和b类合并为新的大类,即a类和b类中的样本图像均属于该新的大类。满足的条件可以用公式表示如下:

mn(ci,cj)<=3||d(ci,cj)>t||ro(a,b)<=30;

其中,t可以根据实际需要设定,本申请实施例对此不做具体限定。在一些实施例中,服务器设定t,使得样本分类的准确率达到97%。

可选地,在上述图3对应的实施例的基础上,本发明实施例的一个可选实施例中,生成第一待处理集合和第二待处理集合对应的样本分类结果之后,方法还包括:

获取目标集合,目标集合包括第一待处理集合和第二待处理集合;

根据第一图像特征向量和第二图像特征向量确定单特征向量;

根据单特征向量计算目标集合之间的相似度;

向终端设备发送相似度小于设定阈值的目标集合,使得终端设备展示目标集合。

在本申请实施例中,服务器可以获取到目标集合,目标集合为第一待处理集合和第二待处理集合合并形成的。可以理解的是,服务器可以形成多个目标集合,示例性的,服务器首先获取到了a类、b类、c类、d类,假设a类与b类合并成一个目标集合,c类和d类合并成一个目标集合,则服务器得到了两个目标集合。以此类推,服务器在实际应用中可以获取到若干个目标集合。

在一些实施例中,服务器获取到目标集合后,目标集合中包括第一样本图像和第二样本图像,则服务器可以根据第一图像特征向量和第二图像特征向量确定单特征向量。在一些实施例中,单特征向量为第一图像特征向量和第二图像特征向量的平均值。示例性的,第一图像特征向量为[1,2,3],第二图像特征向量[7,8,9],则单特征向量为[(1+7)/2,(2+8)/2,(3+9)/2]=[4,5,6]。在一些实施例中,目标集合中的所有图像特征向量求平均值可以得到该目标集合对应的单特征向量。

然后,服务器可以根据单特征向量计算目标集合之间的相似度。在一些实施例中,服务器可以根据单特征向量计算目标集合之间的余弦相似度,计算方法此处不做具体限定。

在一些实施例中,服务器将相似度小于设定阈值的目标集合发送至终端设备进行展示。在另一些实施例中,服务器将相似度进行排序,并将相似度最高的前5组目标集合进行展示。在一些实施例中,服务器进行展示的方式可以是服务器将需要展示的内容发送至带有显示屏的终端设备,使得该终端设备在该显示屏上显示需要展示的内容。展示的内容可以是显示该目标集合的向量,也可以是显示该目标集合中的一个样本图像。

在一些实施例中,服务器通过姿态优选算法选择目标集合中的一个样本图像发送至带有显示屏的终端设备进行展示。姿态优选算法在本申请实施例中不做具体限定。图6为本申请实施例中,目标集合的展示示例图。服务器可以将选中的样本图像发送至带有显示屏的终端设备,使得该终端设备在该显示屏上显示该样本图像。从图6可见,界面中包括标题栏、功能板块以及主界面,其中,标题栏用于显示程序的标题,功能板块用于显示可选的功能。主界面中,显示有多组样本图像,每个样本图像可以代表一个目标集合。由于边幅限制,图6中仅显示了3组样本图像,在实际应用中,展示的样本图像数量没有限制,本申请实施例对此不做具体限定。

可选地,在上述图3对应的各个实施例的基础上,本发明实施例的一个可选实施例中,展示相似度小于设定阈值的目标集合之后,方法还包括:

获取标注信息,标注信息与目标集合具有关联关系;

根据标注信息确定目标集合对应的二次样本分类结果。

在本申请实施例中,服务器可以获取标注信息,标注信息与目标集合具有关联关系。然后,服务器可以将标注信息关联的若干个目标集合合并为新的大类,得到二次样本分类结果。示例性的,如图6所示,主界面中第一组样本图像均为老奶奶,工作人员观察到这两幅样本图像中的行人实际上是同一个人,则工作人员可以点击主界面上对应位置的“是”虚拟按钮。响应于该点击操作,该显示屏对应的终端设备可以生成标注信息,该标注信息包括第一组样本图像对应的目标集合标识。然后,终端设备可以将该标注信息发送至服务器,则服务器可以获取到该标注信息。

然后,服务器可以根据该标注信息中的目标集合标识将对应的目标集合合并为一个新的大类。示例性的,如图6所示,服务器可以根据标注信息中的目标集合标识,将老奶奶对应的目标集合合并为一个新的大类,大类中包括该两个目标集合,大类中的样本图像均为老奶奶对应的样本图像。

图7为本申请实施例中一个可选实施例的流程示意图。该流程可以描述为:

701、获取行人图像;

在本实施例中,服务器可以获取有关行人的图像(以下称为行人图像)。在一些实施例中,服务器可以从摄像设备中获取得到行人图像。在另一些实施例中,服务器可以从数据库中读取得到。具体可参照前述步骤301的描述,此处不再赘述。

702、提取特征;

在本申请实施例中,服务器可以从行人图像中提取到关于行人的特征,或者从行人图像中提取整个图像的特征,本申请实施例对此不做具体限定。具体可参照前述步骤302的描述,此处不再赘述。

703、mn&ro细粒度聚类;

在本申请实施例中,服务器可以根据提取到的特征对行人图像进行聚类,具体可参照前述步骤303和步骤304的描述,此处不再赘述。可以理解的是,本申请实施例中,可以将一个行人图像作为一个类进行聚类。

704、类内多特征融合成单特征;

在本申请实施例中,服务器通过上述步骤703的聚类,将多个行人图像进行聚类,可以得到n个类,每个类中包括ni个行人图像。其中,每个行人图像均有对应的特征,则每个类内均有ni个特征。然后,服务器可以将每个类内的ni个特征融合成单特征。在一些实施例中,服务器可以通过特征融合算法进行融合。在另一些实施例中,服务器可以将对每个类的多个特征取平均特征,作为该类的特征表征。每个类ni个行人图像融合成1个特征,形成新特征集f={f1,f2,f3,...fn}。其中,n为大于或等于1的整数,ni为大于或等于1的整数。

705、姿态优选;

在本申请实施例中,服务器得到的每个类中包括ni个行人图像。因此,服务器可以从ni个行人图像中选择一个行人图像代表该类。在一些实施例中,服务器通过姿态优选算法进行选择。在另一些实施例中,服务器可以通过人工选择,此处不做具体限定。

706、自检索;

在本申请实施例中,服务器可以根据新特征集f={f1,f2,f3,...fn}对n个类之间的相似度进行计算。示例性的,服务器可以计算f1,和f2之间的余弦相似度得到1类和2类之间的相似度。以此类推,服务器可以得到所有类之间的相似度,然后服务器将这些相似度进行排序,选择其中相似度最高的前5组类。示例性的,服务器计算得到f1,和f2之间的余弦相似度排序为第1,则服务器可以选择f1,和f2对应的类(即1类和2类)。

707、送标;

在本申请实施例中,服务器可以将前述步骤706中选择到的类对应的代表图像发送至具有显示屏的终端设备,使得终端设备展示该代表图像,如图6所示。在另一些实施例中,服务器也可以直接将前述步骤706中选择到的类发送至具有显示屏的终端设备,使得终端设备通过类似步骤705的算法选择类中的代表图像,然后将代表图像进行展示。本申请实施例对此不做具体限定。

708、获取样本。

在本申请实施例中,步骤707送标后,工作人员在如图6所示的界面中选择相同行人的类,使得终端设备生成标注信息,具体可参照前述实施例的描述,此处不再赘述。然后,服务器获取到该标注信息,并根据该标注信息将服务器中的n个类进一步合并。合并完毕后,服务器可以得到分类完成的样本。

图8为本申请实施例中另一个可选实施例的流程示意图,该流程包括:

801、获取行人图像;

步骤801与前述步骤701类似,此处不再赘述。

802、提取特征;

步骤802与前述步骤702类似,此处不再赘述。

803、mn&ro细粒度聚类;

步骤803与前述步骤703类似,此处不再赘述。需要说明的是,本申请实施例中,服务器通过如步骤803的步骤得到n个类。

804、类内多特征融合成单特征;

步骤804与前述步骤704类似,此处不再赘述。

805、mn&ro粗粒度聚类;

在本申请实施例中,服务器可以对前述的n个类进行进一步聚类。步骤805与前述步骤803类似,但其中的设定条件可以不同。示例性的,步骤803中的设定条件为:

mn(ci,cj)<=3||d(ci,cj)>t1||ro(a,b)<=30;

步骤805中的设定条件可以为:

mn(ci,cj)<=3||d(ci,cj)>t2||ro(a,b)<=30;

其中,t1和t2可以根据实际需要进行修改,使得步骤805得到的p个类,p为大于或等于0,且小于n的整数。示例性的,步骤803中服务器聚类得到10000个小类,步骤805中服务器聚类得到5000个大类,每个大类可以至少包括一个小类。

806、每个大类仅保留一个小类;

在本申请实施例中,服务器可以从每个大类中选择一个小类进行保留(服务器可以删除不保留的小类)。在一些实施例中,服务器将小类对应的代表图像发送至带有显示屏的终端设备,让工作人员选择其中一个小类作为保留。在另一些实施例中,服务器通过统计每个小类中的行人图像数量,选择其中行人图像数量最多的小类进行保留。在另一些实施例中,服务器可以首先通过统计每个小类中的行人图像数量,选择其中行人图像数量由多至少排列的前5个小类。然后服务器可以从该5个小类中选择方差最大的1个小类进行保留。本申请实施例对选择保留小类的方法不做具体限定。

807、获取样本。

在本申请实施例中,服务器根据步骤805得到p个类之后,可以将p个类中多余的小类去除,得到精简后的p个类{c1,c2,c3,...cp}。每个类中包括若干个行人图像。

服务器通过本申请实施例得到的行人图像具有对应的分类,因此服务器在进行行人识别时,可以选择其中一类进行行人识别。示例性的,c1类中的行人图像大概率是关于老奶奶的图像,因此服务器在对c1类的行人图像进行识别时,能够有很好的识别率。

图9为本申请实施例中一种样本分类的装置的示例图,该样本分类的装置900包括:

获取单元901,用于获取第一待处理集合和第二待处理集合,第一待处理集合包括至少一个第一样本图像,第二待处理集合包括至少一个第二样本图像;

获取单元901,还用于获取第一图像特征向量和第二图像特征向量,第一图像特征向量与第一样本图像具有第一对应关系,第二图像特征向量与第二样本图像具有第二对应关系;

处理单元902,用于根据第一图像特征向量和第二图像特征向量获取第一待处理集合和第二待处理集合之间的距离,距离包括绝对距离,互近邻距离以及邻居排序距离;

处理单元902,还用于若绝对距离满足第一设定条件,互近邻距离满足第二设定条件且邻居排序距离满足第三设定条件,则生成第一待处理集合和第二待处理集合对应的样本分类结果。

可选地,在上述图9对应的各个实施例的基础上,本发明实施例的一个可选实施例中,处理单元902还用于:

根据第一图像特征向量和第二图像特征向量确定第一样本图像与第二样本图像之间的余弦距离;

根据余弦距离确定第一待处理集合和第二待处理集合之间的绝对距离,绝对距离为余弦距离的最小值。

可选地,在上述图9对应的各个实施例的基础上,本发明实施例的一个可选实施例中,处理单元902还用于:

获取第一待处理集合对应的第一绝对距离;

根据第一绝对距离的大小排序得到第一待处理集合对应的第一最近邻序列;

获取第二待处理集合对应的第二绝对距离;

根据第二绝对距离的大小排序得到第二待处理集合对应的第二最近邻序列;

根据第一待处理集合在第二最近邻序列的序号与第二待处理集合在第一最近邻序列的序号确定第一待处理集合和第二待处理集合之间的互近邻距离。

可选地,在上述图9对应的各个实施例的基础上,本发明实施例的一个可选实施例中,处理单元902还用于:

根据第一最近邻序列和第二最近邻序列确定第一待处理集合和第二待处理集合之间的邻居排序距离。

可选地,在上述图9对应的各个实施例的基础上,本发明实施例的一个可选实施例中,处理单元902还用于:

获取目标集合,目标集合包括第一待处理集合和第二待处理集合;

根据第一图像特征向量和第二图像特征向量确定单特征向量;

根据单特征向量计算目标集合之间的相似度;

向终端设备发送相似度小于设定阈值的目标集合,使得终端设备展示目标集合。

可选地,在上述图9对应的各个实施例的基础上,本发明实施例的一个可选实施例中,处理单元902还用于:

选择目标集合中的一个样本图像;

向终端设备发送样本图像,使得终端设备展示样本图像。

可选地,在上述图9对应的各个实施例的基础上,本发明实施例的一个可选实施例中,处理单元902还用于:

获取标注信息,标注信息与目标集合具有关联关系;

根据标注信息确定目标集合对应的二次样本分类结果。

图10为本申请实施例提供的一种服务器结构示意图,该服务器1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)1022(例如,一个或一个以上处理器)和存储器1032,一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中,存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1022可以设置为与存储介质1030通信,在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1058,和/或,一个或一个以上操作系统1041,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

上述实施例中由服务器所执行的步骤可以基于该图10所示的服务器结构。

在本申请实施例中,cpu1022具体用于执行以下步骤:

获取第一待处理集合和第二待处理集合,第一待处理集合包括至少一个第一样本图像,第二待处理集合包括至少一个第二样本图像;

获取第一图像特征向量和第二图像特征向量,第一图像特征向量与第一样本图像具有第一对应关系,第二图像特征向量与第二样本图像具有第二对应关系;

根据第一图像特征向量和第二图像特征向量获取第一待处理集合和第二待处理集合之间的距离,距离包括绝对距离,互近邻距离以及邻居排序距离;

若绝对距离满足第一设定条件,互近邻距离满足第二设定条件且邻居排序距离满足第三设定条件,则生成第一待处理集合和第二待处理集合对应的样本分类结果。

在本申请实施例中,cpu1022还用于执行以下步骤:

根据第一图像特征向量和第二图像特征向量确定第一样本图像与第二样本图像之间的余弦距离;

根据余弦距离确定第一待处理集合和第二待处理集合之间的绝对距离,绝对距离为余弦距离的最小值。

在本申请实施例中,cpu1022还用于执行以下步骤:

根据绝对距离确定第一待处理集合所对应的第一最近邻序列和第二待处理集合所对应的的第二最近邻序列,第一最近邻序列为第二样本图像按照余弦距离的排序队列,第二最近邻序列为第一样本图像按照余弦距离的排序队列;

根据第一绝对样本图像在第二最近邻序列的序号与第一绝对样本图像在第二最近邻序列的序号确定第一待处理集合和第二待处理集合之间的互近邻距离。

在本申请实施例中,cpu1022还用于执行以下步骤:

根据第一最近邻序列和第二最近邻序列确定第一待处理集合和第二待处理集合之间的邻居排序距离。

在本申请实施例中,cpu1022还用于执行以下步骤:

获取目标集合,目标集合包括第一待处理集合和第二待处理集合;

根据第一图像特征向量和第二图像特征向量确定单特征向量;

根据单特征向量计算目标集合之间的相似度;

向终端设备发送相似度小于设定阈值的目标集合,使得终端设备展示目标集合。

在本申请实施例中,cpu1022还用于执行以下步骤:

选择目标集合中的一个样本图像;

向终端设备发送样本图像,使得终端设备展示样本图像。

在本申请实施例中,cpu1022还用于执行以下步骤:

获取标注信息,标注信息与目标集合具有关联关系;

根据标注信息确定目标集合对应的二次样本分类结果。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1