一种基于深度学习的增量式物体识别方法与流程

文档序号:13521049阅读:157来源:国知局
本发明涉及涉及机器学习和机器视觉领域,具体涉及一种基于深度学习的增量式物体识别方法。
背景技术
:物体识别是计算机视觉领域中最活跃的研究课题之一,迅速和准确地识别出物体对机器人导航、医疗诊断、安防、工业检测等有着重要的意义。提取图像特征是物体识别中最重要也是最棘手的工作,图像特征的好坏很大程度上决定了识别的效果。相比传统的特征提取方法,深度神经网络能提取到表达能力更强的特征,更有利于分类,因此现在大多数物体识别框架都基于深度学习。现在的大多数物体识别系统都只能识别预先训练过的物体类别,不能在使用的过程中学习新的物体类别,识别率也不会在使用中逐步提升。目前,大多数分类方法都是类似svm这样需要大量的有标签的样本去训练分类模型,这是导致物体识别系统学习速度很慢的一个重要原因。技术实现要素:本发明是为了解决上述问题而进行的,目的在于提供一种基于深度学习的增量式物体识别方法。本发明提供了一种基于深度学习的增量式物体识别方法,用于对图像中的物体进行分类识别,具有这样的特征,,包括如下步骤:步骤1,将1张需要识别图像中物体的图片输入,经过数据预处理后得到20张新图片,所述预处理包括旋转、平移和仿射变换;步骤2,通过特征提取网络提取20张新图片的图像特征,得到多个特征向量v=[x1,x2,...xk],i=1~k,其中xk表示特征向量中的一个特征值;步骤3,根据特征值来判断图像中的物体是新类别还是模板库中已有的类别;步骤4,当物体的类别确定后,用增量式学习方法创建和更新物体的特征模板并将其储存于模板库中。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,物体特征提取网络包括第一分支、第二分支、globalaveragepool层、globalmaxpool层和concatenation层,所述第一分支具有五个卷积块,该卷积块是由卷积层和池化层组成,且所述卷积块之间的前一层的输出作为后一层的输入,所述第二分支具有四个块,每个所述块之前都接有一个所述卷积层和所述池化层,每个所述块内部都由4个小的卷积块组成,且前一个所述卷积块输出会作为后面所有所述卷积块的输入,步骤2具体包括以下子步骤:步骤2-1,物体特征经过第一分支处理后通过globalaveragepool层和globalmaxpool层得到两个特征向量;步骤2-2,物体特征经过第二分支处理后通过globalaveragepool层和globalmaxpool层得到两个特征向量;步骤2-3,通过concatenation层将步骤2-1和步骤2-2中得到的四个特征向量连接成一个i维的向量,该向量即为物体的特征向量v。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,步骤3中,当物体为新的类别时,通过人机交互的方式询问用户该物体的新类别并根据用户提供的新类别名称创建物体的特征模板。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,特征模板的创建包括如下子步骤:步骤3-1,创建三个新向量vmax,vmin,vave,依次对20张图片的特征向量中的同一位置的特征值作比较;步骤3-2,依次取20张新图片的特征向量中每一个位置的最大值并记录为vmax,并依次取20张新图片的特征向量中每一个位置的最小值并记录为vmin;步骤3-3,依次取20张新图片的特征向量中每一个位置的特征值的均值并记录为vave;步骤3-4,将vnmax,vnmin,vnave作为第n类物体的特征模板进行记录。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,步骤4中更新物体特征模板的方法的子步骤为为:步骤4-1-1,得到特征向量v后,与该类物体的特征模板中的vmax的每一位特征值作比较,取二者的最大值作为新的vmax的对应位置的值;步骤4-1-2,与该类物体的特征模板中的vmin的每一位特征值作比较,取二者的最小值作为新的vmin的对应位置的值;步骤4-1-3,计算v和对应的vave中每一个位置的均值,作为新的vave。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,步骤3中,当物体不是新类别时,识别系统利用多特征融合的相似性度量方法进行识别,当识别不正确时,通过人机交互的方式告知用户,并根据用户给出的正确物体类别名更新模板库。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,多特征融合的相似性度量方法具体包括以下子步骤:步骤4-1,根据下式(1)计算特征向量v和每一类物体特征模板中vave的夹角余弦值d并记为dn::步骤4-2,找出n个夹角余弦值中的最大值dmax,用dn除以dmax得到scoren1,scoren1表示该物体的特征向量v和第n类物体特征模板中vnave的相似性;步骤4-3,设定一个初始值为0的变量countn,判断特征向量v的每位特征值是否处于vnmax和vnmin对应位置的特征值之间,当满足时加1,用countn除以i得到scoren2,i表示特征向量中特征值个数且为3072,用scoren1和scoren2相加得到scoren,根据下式(2)和式(3)计算物体属于类别类的得分:式(1)、式(2)及式(3)中,dn表示待识别物体的特征向量v和第n类物体特征模板中vnave的夹角余弦值,x1k表示待识别物体特征向量v中的第k个特征值,x2k表示特征向量vnave中的第k个特征值,dmax是这n个夹角余弦值中的最大值,scoren1表示通过vmax计算的得分,countn表示v中特征值处于vnmax和vnmin对应位置的特征值之间的个数,i是特征向量总的特征值个数,scoren2表示通过vmax和vmin计算的得分,k为权值。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,判定物体属于第n类的方法为:找出最大的score作为最高得分,并判断该最高得分是否小于预定的阈值,当大于时判定物体属于该类。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,当最高得分小于阈值时,判定不能识别该物体的分类。在本发明提供的基于深度学习的增量式物体识别方法中,还可以具有这样的特征:其中,步骤4中的物体类别不能识别或者识别错误时用增量式学习方法,若能识别正确则不需要学习。发明的作用与效果根据本发明所涉及的基于深度学习的增量式物体识别方法,因为所使用的特征提取网络,所以更有效。因为所使用的多特征融合的相似性度量方法能使得系统从零开始学习,可以让用户自己定义想要识别的物体类别,所以使用过程中需要学习新物体类别时,即使样本数量很少也能学得对应的物体特征模板。因此,本发明的基于深度学习的增量式物体识别方法解决了传统物体识别系统只能识别预先训练好的物体类别,学习速度不快,识别率不能在使用过程中提升等缺陷,提高了系统的适用性和鲁棒性。附图说明图1是本发明的实施例中的特征提取网络结构图;图2是本发明的实施例中的物体特征模板图;图3是本发明的实施例中的系统工作流程图。具体实施方式为了使本发明实现的技术手段与功效易于明白了解,以下结合实施例及附图对本发明作具体阐述。图1是本发明的实施例中的特征提取网络结构图,图2是本发明的实施例中的物体特征模板图,图3是本发明的实施例中的系统工作流程图。如图1、图2和图3所示,本实施例的一种基于深度学习的增量式物体识别方法,用于对图像中的物体进行分类识别,包括如下步骤:步骤1,将1张需要识别图像中物体的图片输入,数据预处理后得到20张新图片,所述预处理包括旋转、平移和仿射变换。步骤2,通过特征提取网络提取20张新图片的图像特征,得到多个特征向量v=[x1,x2,...xk],i=1~k,其中xk表示特征向量中的一个特征值。物体特征提取网络包括第一分支、第二分支、globalaveragepool层、globalmaxpool层和concatenation层。第一分支具有五个卷积块,该卷积块是由卷积层和池化层组成,且所述卷积块之间的前一层的输出作为后一层的输入。第二分支具有四个块,每个所述块之前都接有一个所述卷积层和所述池化层,每个所述块内部都由4个小的卷积块组成,且前一个所述卷积块输出会作为后面所有所述卷积块的输入,如:第四个卷积块的输入是原始输入加前三个卷积块输出,每个大的块内部结构一样只是参数n,k不一样。步骤2具体包括以下子步骤:步骤2-1,物体特征经过第一分支处理后通过globalaveragepool层和globalmaxpool层得到两个特征向量;步骤2-2,物体特征经过第二分支处理后通过globalaveragepool层和globalmaxpool层得到两个特征向量;步骤2-3,通过concatenation层将步骤2-1和步骤2-2中得到的四个特征向量连接成一个i维的向量,该向量即为物体的特征向量v。步骤3,根据特征值来判断图像中的物体是新类别还是模板库中已有的类别步骤3中,当物体为新的类别时,通过人机交互的方式询问用户该物体的新类别并根据用户提供的新类别名称创建物体的特征模板;步骤3中,当物体不是新类别时,识别系统利用多特征融合的相似性度量方法进行识别,当识别不正确时,通过人机交互的方式告知用户,并根据用户给出的正确物体类别名更新模板库。特征模板的创建包括如下子步骤:步骤3-1,创建三个新向量vmax,vmin,vave,依次对20张图片的特征向量中的同一位置的特征值作比较;步骤3-2,依次取20张新图片的特征向量中每一个位置的最大值并记录为vmax,并依次取20张新图片的特征向量中每一个位置的最小值并记录为vmin;步骤3-3,依次取20张新图片的特征向量中每一个位置的特征值的均值并记录为vave;步骤3-4,将vnmax,vnmin,vnave作为第n类物体的特征模板进行记录。步骤4,当物体的类别确定后,用增量式学习方法创建和更新物体的特征模板并将其储存于模板库中。多特征融合的相似性度量方法具体包括以下子步骤:步骤4-1,根据下式(1)计算特征向量v和每一类物体特征模板中vave的夹角余弦值d并记为dn::步骤4-2,找出n个夹角余弦值中的最大值dmax,用dn除以dmax得到scoren1,scoren1表示该物体的特征向量v和第n类物体特征模板中vnave的相似性,数值越大越相似;步骤4-3,设定一个初始值为0的变量countn,判断特征向量v的每位特征值是否处于vnmax和vnmin对应位置的特征值之间,当满足时加1,用countn除以i得到scoren2,i表示特征向量中特征值个数且为3072,用scoren1和scoren2相加得到scoren,根据下式(2)和式(3)计算物体属于类别类的得分:scoren=k·scoren1+(1-k)scoren2(3)。式(1)、式(2)及式(3)中,dn表示待识别物体的特征向量v和第n类物体特征模板中vnave的夹角余弦值,x1k表示待识别物体特征向量v中的第k个特征值,x2k表示特征向量vnave中的第k个特征值,dmax是这n个夹角余弦值中的最大值,scoren1表示通过vmax计算的得分,countn表示v中特征值处于vnmax和vnmin对应位置的特征值之间的个数,i是特征向量总的特征值个数,scoren2表示通过vmax和vmin计算的得分,k为权值。步骤4中更新物体特征模板的方法的子步骤为为:步骤4-1-1,得到特征向量v后,与该类物体的特征模板中的vmax的每一位特征值作比较,取二者的最大值作为新的vmax的对应位置的值;步骤4-1-2,与该类物体的特征模板中的vmin的每一位特征值作比较,取二者的最小值作为新的vmin的对应位置的值;步骤4-1-3,计算v和对应的vave中每一个位置的均值,作为新的vave。判定物体属于第n类的方法为:找出最大的score作为最高得分,并判断该最高得分是否小于预定的阈值,当大于时判定物体属于该类。当最高得分小于阈值时,判定不能识别该物体的分类。步骤4中的物体类别不能识别或者识别错误时用增量式学习方法,若能识别正确则不需要学习。实施例一:从imagenet数据集中随机选取了9类,40类,100类物体,分别记作imagenet9,imagenet40,imagenet100,作为实验数据。为了测试深度神经网络提取特征的效果,与图像领域识别效果较好的vgg,googlenet,resnet网络做了对比试验。vgg,googlenet,resnet,本发明的特征提取网络都是在imagenet上预训练过的。取vgg网络的fc6层的输出,googlenet网络的平均池化层的输出,resnet的平均池化层的输出作为图像的特征向量。提取特征后,用多特征融合的相似性度量方法进行分类。为了验证特征提取网络的泛化能力,实验数据加入了没有训练过的caltech256数据集。表1是本发明的特征提取网络和其他深度网络的效果对比表。表1本发明的特征提取网络和其他网络的效果对比数据集vggresnetgooglenetournetworkimagenet997.6%97.2%98.3%98.6%imagenet4084.8%84.1%85.6%88.2%imagenet10083.9%83.4%84.2%85.4%caltech25678.3%77.2%79.0%79.5%实施例二:在imagenet,caltech256数据集上测试了本发明的融合相似性度量方法的分类效果,并与svm方法做了对比试验。选用imagenet9,imagenet40,caltech256作为实验数据,图像经本发明的特征提取网络提取特征后,分别用本发明的融合相似性度量和svm方法进行分类。实验结果如表2。表2多特征融合相似性度量方法和svm识别率对比数据集相似性度量方法svmimagenet998.6%99.3%imagenet4088.2%89.7%caltech25679.5%82.1%实施例三:caltech-ucsdbirds200是一个鸟类的数据集,有200种鸟类,每类大概有50张图片。从中选取了十种很类似的鸟类图片作为实验数据验证系统学习新物体类别的能力。实验时,分别从每类图片中选取5、10、15、20张图片作为训练数据,剩下的图片作为测试数据。一张图片输入系统后,先经数据预处理,得到20张图片。再经特征提取网络提取图像特征,得到多个3072维的特征向量。若该物体为新的类别,系统则会创建一个新的物体特征模板,即创建三个新向量vmax,vmin,vave,特征模板形成方式如图2。将这20个特征向量中每一位特征值作比较,取最大值作为vmax中对应位置的值,取最小值作为vmin对应位置的值,每位特征值取均值作为vave对应位置的值。若不是第一次学习,图像提取特征后得到特征向量v后,与该类物体的特征模板中的vmax的每一位作比较,取二者的最大值作为新的vmax的对应位置的值。vmin的更新同vmax,只是取二者的最小值。计算v和对应的vave的均值,作为新的vave。测试时,图片经特征提取网络得到特征向量,再由多特征融合的相似性度量方法计算得到scoren。计算公式如下:scoren=k·scoren1+(1-k)scoren2实验中k取0.5,阈值设为0.6。找出scoren中最大的值,即判断物体属于该类别。实验结果见表3。表3系统学习图片的张数及对应的识别率变化图片张数5101520识别率76.1%78.3%79.6%80.1%实施例的作用与效果根据实施例一中的表一可看出,本发明的特征提取网络比vgg等目前图像领域常用作特征提取网络的效果要好,充分说明了本发明的特征提取网络的有效性。根据实施例二中的表二可看出,多特征融合的相似性度量方法和svm的分类效果很接近,充分验证了该方法的可行性。该方法不需要像svm那样需要大量有标签的样本去训练,只需不断的更新物体特征模板。该优点使得系统能从零开始学习,可以让用户自己定义想要识别的物体类别,并且在使用过程中需要学习新物体类别时,即使样本数量很少也能学得对应的物体特征模板。根据实施例三中的表三可看出,每类鸟学习5张图片后就能较好的对这10种鸟进行区分,学习样本每增加5张后,识别率都有较好的提升,充分说明了系统的学习新类别能力很强,增量式学习效果很好。实施例一至实施例三所涉及的基于深度学习的增量式物体识别方法,因为所使用的特征提取网络,所以更有效。因为所使用的多特征融合的相似性度量方法能使得系统能从零开始学习,可以让用户自己定义想要识别的物体类别,所以使用过程中需要学习新物体类别时,即使样本数量很少也能学得对应的物体特征模板。增量式的学习框架使得系统能在使用的过程中,识别率不断的提升,能够识别的物体类别越来越多。因此,本发明的基于深度学习的增量式物体识别方法解决了传统物体识别系统只能识别预先训练好的物体类别,学习速度不快,识别率不能在使用过程中提升等缺陷,提高了系统的适用性和鲁棒性。上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1