一种基于深度学习和躯干提取的行人识别系统及方法与流程

文档序号：11156361阅读：2025来源：国知局

本发明涉及生物识别领域，尤其是一种基于深度学习和躯干提取的行人识别系统及方法。

背景技术：

道路行人识别的核心是利用安装在运动车辆上的摄像机检测行人，从而估计出潜在的危险以便采取策略保护行人。基于统计分类的方法是通过机器学习，从一系列训练数据中得到一个分类器，利用该分类器对输入窗口图像进行识别，并判断是否为行人。基于统计分类方法的优点是鲁棒较好，但是需要很多训练数据，实时性差。目前，基于统计分类方法识别行人主要类型有：神经网络、支持向量机和AdaBoost方法。神经网络方法可以描述极为复杂的模式，已经成功地应用在字符识别和人脸检测上，它在行人的检测上也有应用，但实时性和鲁棒性都不够理想。支持向量机是基于结构风险最小化原理的统计学习理论，该方法比神经网络方法具有更好的泛化能力。

行人兼具刚性物体和柔性物体的特性，表观受光照、尺度、姿态、视角、部分遮挡和复杂场景等因素的影响，使得构建实用化的行人检测器挑战性极大。如何减弱甚至克服各种影响因素对识别的干扰，行人检测方法可大致分为三大类:基于全局特征的方法，基于人体部件的方法、基于立体视觉的方法。此外，除了检测方法的多样化和系统化，行人数据库也越来越完善，如MIT、Caltech、INＲIA等行人数据库，这些行人数据库都为行人检测方法的研究提供了专业的检测和评估方法，但是仍然需要设计一种更完善的行人识别算法。。

技术实现要素：

本发明的发明目的在于：针对上述存在的问题，提供一种基于深度学习和躯干提取的行人识别系统及方法。本发明有效降低了行人检测的失误率，方法具有很强的实用价值。

本发明采用的技术方案如下：

一种基于深度学习和躯干提取的行人识别系统，其特征在于，所述系统包括：数据输入层、第一卷积层、子采样层、第二卷积层和数据输出层；所述数据输入层信号连接于第一卷积层；所述第一卷积层信号连接于子采样层；所述子采样层信号连接于第二卷积层；所述第二卷积层信号连接于数据输出层。

所述数据输入层用于获取原始的图像数据，对获取的图像数据进行预处理，将预处理后的图像数据发送给第一卷积层。

所述第一卷积层用于把输入的图像提取出多幅特征提取图，将提取出的多幅特征提取图发送给子采样层。

所述子采样层用于将获取的多幅特征提取图再次进行特征提取和取样压缩，将处理后的图像发送给第二卷积层。

所述第二卷积层用于将特征图提取成局部检测图，并通过隐藏层获得这些局部检测图的的评分。

所述系统还包括若干个遮挡滤波器，所述折当率波器分为不同等级，高一级的组件由低一级的组件构成，越是高级的组件也就越是完整，最高级的组件也可能处于被遮挡状态，进而得到局部检测图。

一种基于深度学习和躯干提取的行人识别系统的方法，其特征在于，所述方法包括以下步骤：

步骤1：首先对行人的整体特征进行提取，然后构建深度学习模型，获取图像累积梯度信息，找出行人目标可能存在的感兴趣区域；

步骤2：再对行人的局部特征进行进一步提取：构建躯干模型，利用纹理特征提取算法获取行人纹理特征；

步骤3：利用第一卷积层以及子采样层共同作用，形成模型的特征提取层，利用第二卷积层对特征提取图进行处理后得到局部检测图。

所述纹理特征提取算法的方法为：首先对像素点的梯度进行计算，根据计算结果寻找并将像素发生一定程度变化的区域作为感兴趣区域，对这些区域进行重点关注，减少特征提取的搜寻区域，增强特征计算的实时性；同时取区域中像素的平均亮度值为阈值平滑特征纹理信息。

综上所述，由于采用了上述技术方案，本发明的有益效果是：将变形处理引入到卷积神经网络，利用多层相互关联的网络来模拟人类的大脑的多层抽象机制和视觉信息的处理过程，逐层对输入图像进行抽象处理，提取图像的显著特征，实现对输入图像的抽象描述与分类，该基于深度学习和躯干提取的行人识别算法有效降低了行人检测的失误率，方法具有很强的实用价值。

附图说明

本发明将通过例子并参照附图的方式说明，其中：

图1是本发明的一种基于深度学习和躯干提取的行人识别系统的系统结构示意图。

图2是本发明的一种基于深度学习和躯干提取的行人识别系统的遮挡组件的模型示意图。

具体实施方式

本说明书中公开的所有特征，或公开的所有方法或过程中的步骤，除了互相排斥的特征和/或步骤以外，均可以以任何方式组合。

本说明书（包括任何附加权利要求、摘要）中公开的任一特征，除非特别叙述，均可被其他等效或具有类似目的的替代特征加以替换。即，除非特别叙述，每个特征只是一系列等效或类似特征中的一个例子而已。

如图1 和图2所示的一种基于深度学习和躯干提取的行人识别系统，其特征在于，所述系统包括：数据输入层、第一卷积层、子采样层、第二卷积层和数据输出层；所述数据输入层信号连接于第一卷积层；所述第一卷积层信号连接于子采样层；所述子采样层信号连接于第二卷积层；所述第二卷积层信号连接于数据输出层。

所述数据输入层用于获取原始的图像数据，对获取的图像数据进行预处理，将预处理后的图像数据发送给第一卷积层。

所述第一卷积层用于把输入的图像提取出多幅特征提取图，将提取出的多幅特征提取图发送给子采样层。

所述子采样层用于将获取的多幅特征提取图再次进行特征提取和取样压缩，将处理后的图像发送给第二卷积层。

所述第二卷积层用于将特征图提取成局部检测图，并通过隐藏层获得这些局部检测图的的评分。

一种基于深度学习和躯干提取的行人识别系统的方法，其特征在于，所述方法包括以下步骤：

步骤1：首先对行人的整体特征进行提取，然后构建深度学习模型，获取图像累积梯度信息，找出行人目标可能存在的感兴趣区域；

步骤2：再对行人的局部特征进行进一步提取：构建躯干模型，利用纹理特征提取算法获取行人纹理特征；

步骤3：利用第一卷积层以及子采样层共同作用，形成模型的特征提取层，利用第二卷积层对特征提取图进行处理后得到局部检测图。

卷积神经网络的第一卷积层以及子采样层共同作用，形成了模型的特征提取层，卷积神经网络第一层输入层将28×84大小的图片作为第一卷积层的输入，第一卷积层中有64个滤波器，输入数据的每个9×9邻域数据与滤波器中参数作用，作为一幅输出特征图的一个元素，最终，经过第一卷积层的64个滤波器卷积作用，输出结果是64幅20×76大小的特征图。

所述躯干模型的提出源于对道路场景中两大类非行人模式的考虑，一方面，道路场景中的某些干扰热源的温度通常比行人的温度更高，此类干扰热源的轮廓信息比较丰富，所形成的非行人对象通常易于产生虚警，另一方面，道路场景中的某些干扰热源的温度通常比行人的温度更低，其温度虽然明显低于行人但又略高于背景，亦易于形成非行人对象。

在行人对象选取阶段，采用局部自适应双阈值分割算法对图像进行分割以获取行人对象，只对奇数行图像进行分割，偶数行的分割结果直接取自上一奇数行的分割结果，进而采用形态学操作对分割结果进行处理、使用行人对象宽高比和最小高度限制对形态学结果进行过滤，从而得到对象。

利用卷积神经网络的第一卷积层以及子采样层共同作用，形成了模型的特征提取层，利用第二卷积层对特征提取图进行处理后得到局部检测图，由于人身体各个部位的尺寸不同，算法设计了20个遮挡滤波器作为组件模型，组件一共分为三个等级，其中一级组件有6个，二级组件有7个，三级组件有7个，黑色表示被遮挡状态。

高一级的组件由低一级的组件构成，越是高级的组件也就越是完整，最高级的组件也可能处于被遮挡状态，但也会有重复出现，三级和二级中都出现了同样的头-肩部组件，这说明人体能自己遮挡自己，形成另类的遮挡。

本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合，以及披露的任一新的方法或过程的步骤或任何新的组合。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李谦
技术所有人：四川靓固科技集团有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。