一种基于无人机的多帧联合人脸识别算法的制作方法

文档序号:18668682发布日期:2019-09-13 20:33阅读:478来源:国知局
一种基于无人机的多帧联合人脸识别算法的制作方法

本发明涉及深度学习、无人机飞控和人脸识别领域,具体涉及到一种基于无人机的多帧联合人脸识别算法。



背景技术:

目前,无人机具有良好的飞行优势和广阔的飞行范围,能够轻松地完成航拍、搜救、地形勘测、监控侦察等任务,在诸多领域有着越来越广泛的应用,人脸识别技术目前在国内外又掀起了一股热潮,但目前,针对无人机视频图像中人脸识别的相关研究还较少,而对于连续帧的人脸识别方面对于现如今市场的各行业都有广泛的需求。

目前研究的大多是对两张静态的图片进行识别,虽然现在精度达到了很高,但是对于动态的人脸识别来说仍然是一个重要的研究课题,在这方面的发展仍有不足,特别是在不同的光照和不同的情境下往往会得出错误的结果。在视频中人的移动速度有时会很快,无人机在拍摄行人时由于角度的不同拍摄出的效果也不一样,这也是目前解决的一大难题。所以,本发明主要解决对图像的处理效果和提高算法速度。

传统的人脸检测算法速度比较快,但是准确率比较低;基于卷积神经网络精度比较高,但是运行的时间比较慢,对于多帧联合的人脸识别技术远达不到需要的效果。



技术实现要素:

为解决现有技术中的缺点和不足,本发明提出了一种基于无人机的多帧联合人脸识别算法,通过获取无人机拍摄的视频流并分离成帧,将每帧照片进行人脸检测、特征提取和人脸识别。采用密集连接神经网络来提取人的全部特征,其特征突出的是不同人脸之间的差异程度而不是曝光、表情等方向上的变化,采用监督下降法来对人脸的关键部位进行定位,考虑到实际图片中会出现光线不均匀的情况,所以在这些关键点周围提取出多尺度的高维lbp特征。采用主成分分析法方法进行特征降维。最后通过余弦距离来计算人脸之间的相似性,与前后帧得到的人脸相似性进行比对,如果在某一阈值内就认为结果正确。

本发明的技术方案为:

a.获取无人机拍摄的视频流。无人机拍摄的视频流传送给地面端后,地面端对视频流的数据进行解码并切分成帧,对每一帧都形成一张图像。

b.对每帧图片进行人脸特征识别。将每帧生成的图像依次进行人脸识别,并且得到与之对应的人脸特征,使用密集连接卷积网络对人脸关键位置定位,参数比一般的卷积神经网络要少,不仅提升了正确率,而且还提高了速度。

c.基于前后帧的准确性,设计一个反向传播函数。在得出的结果与预期效果不符时,通过反向传播函数对参数进行反向更新,对人脸识别的准确性再次进行比较,以便使结果与预期效果更为接近。

d.根据识别出的人脸的位置对无人机进行控制,调整无人机对行人拍摄的的角度以达到更好的拍摄效果。

本发明的有益效果:

(1)本方法通过密集连接卷积神经网络能够消除传统卷积神经网络带来的随着网络深度增加所带来的梯度扩散等问题,密集连接卷积神经网络可以使精度变高、速度变快,非常适合于处理多张连续帧的图片;

(2)本方法采用主成分分析法进行降维,大大的减少了运算次数,在无人机拍摄的视频流中更快的得出结果;

(3)通过反向传播函数来逐渐的更新参数,以找到符合预期结果的最优解。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明一种基于无人机的多帧联合人脸识别算法的结构图;

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,对一种基于无人机的多帧联合人脸识别算法的具体流程进行详细说明。

a.基于高维lbp算法的设计

虽然深度学习未出现在图像领域之前,lbp(局部二值模式)算法占主要的地位,但是由于lbp算法中由于光线不均匀就会出现特征计算错误的情况,采用高维的lbp算法得出的结果可比lbp算法具有更好的鲁棒性,即使受到光照方面的影响,也可以得到很高的准确率。具体的实现方式如下所示:

这代表在一个以某一像素点(这里以50为例)为中心选取一个3×3的大小窗口,将改像素点与周围的八个像素比较大小,大于中心像素点的记为1,反之记为0,得到了8位二进制01001011,转化为十进制之后为75,将其作为中心像素的lbp值。采用监督下降算法来对人脸的关键部位进行定位,采用以下公式来得到lbp特征的维度:

d=n*s*k*size2(1)

其中d代表最终求出的lbp特征的维度,n表示选取关键点的个数,size为选择窗口的大小,即size2表示该窗口内含有像素点的个数,s为对原图像进行缩放的次数,k表示lbp值的位数。

获取lbp算法维度后,还需要对其进行降维,因为到目前提取出来的特征有噪声和其他冗余信息影响识别的准确性。本发明采用主成分分析(pca)方法来进行特征降维,将原来n维的一组向量降成小于n维线性无关的向量,同时还不会影响到识别的正确性。

b.基于多帧图像联合识别的设计

本发明利用密集连接神经网络作为深度学习的基础,第一层通过对图像的输入,对回归向量组进行估计,选出一些候选区域,利用非极大化抑制对这些区域进行合并,得出概率最大的一些值,将以上工作在神经网络中传递三次后,进入到第四层网络,来进行关键点的定位,最终将得到一个n维的向量,同时再次返回第一层读取后一帧的图片,经过四次筛选后得到另外一组关键点,对两个关键点进行对比,通过设置阈值,利用余弦距离对两组特征进行比较,即对两个n维向量作如下操作:

t表示算出两个特征向量之间的相似度,当t的结果趋向于1的时候表示两个特征越相似,反之表示这两个向量越独立,初始阈值设置为0.8,在相似度达到0.8以上则认为是同一个人,将特征保存。然后对下一帧图像开始识别。

c.基于反向传播调节的设计

反向传播可以对识别出的结果进行纠错处理,如果通过高维lbp算法和余弦距离得出了错误的结果,利用反向传播来对参数进行改变,记录下每个样本想怎样修改权重和偏置,最后再去一个平均值。再次进行训练以达到高准确率的结果。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1