基于图像语义分割与分类的身份识别方法与系统

文档序号：37021256发布日期：2024-02-09 13:14阅读：23来源：国知局

本发明属于图像模式识别领域，特别是涉及一种基于图像语义分割与分类的身份识别方法与系统。

背景技术：

1、生物识别系统在不断地发展，并有望在数字集成系统中用于有效地认证一个人的身份，而无需用户携带或记住任何东西。其中虹膜识别技术由于精度高被认为在未来身份安全认证场景中具有广阔应用前景。多项研究表明，虹膜特征相比其他生物特征(例如人脸、指纹、静脉图和步态)具有稳定性和防伪性等独有优势，这使其在高可靠性和准确性的生物特征系统中得到了普遍认可。现有的虹膜识别系统总体上包含软件和硬件两部分：软件主要实现虹膜图像预处理、特征提取和特征匹配；硬件主要包括摄像头(图像采集)、图像存储和运算处理器、液晶屏（结果显示）以及电源部分。

2、对于软件部分，传统的虹膜图像预处理方法（主要包括虹膜分割、定位和归一化）有积分微分算子法、无监督学习、改进的霍夫圆变换等，大多为受控的虹膜识别系统而开发，对光源和用户要求很高，通常可以获取清晰的虹膜图像，因此产生满意的预处理结果。一旦在远距离、移动端和强光反射等非受控条件下，得到的图往往质量差，存在遮挡、模糊、旋转、镜面反射等干扰。面向这种非受控场景，传统的方法必须预设经验性的超参数、复杂的前后处理操作。此外，很多传统的方法只能处理某一类或者几类噪声虹膜图像，不具备普适性，增加了处理未知类别虹膜图像的难度。

3、另外，传统的虹膜特征提取方法主要是用手工设计特征提取器表示虹膜纹理特征，如小波变换的过零检测、离散傅里叶变换、高阶泰勒展开等。然而，这带来的计算复杂度很高，耗时较长，并且这些提取器通常只能利用虹膜纹理的特定特征。与此同时，随着算力和数据增加，基于深度卷积神经网络的图像识别取得了巨大的突破。网络深度的增加带来了强大的非线性拟合能力，对于复杂的图像，确实能学习和获取到的信息特征更加丰富，但深度增加也存在问题，比如产生梯度消失或爆炸、精度饱和甚至退化以及大量的参数和浮点操作降低计算速度。

4、在硬件部署方面，现有的边缘设备往往是单独的一套设备，没有后台服务器的支撑，由于成本原因存在不足通常配置的硬件计算资源少、电池容量低、时效性要求高，难以满足运行深度神经网络所需的硬件计算资源要求。而为所有边缘设备配置过高的硬件算力也是一种资源浪费，对于以移动终端为代表的边缘设备而言，在分类精度不损失或损失程度不大的基础上，速度、体积、能效和硬件成本才是最应该优先考虑的因素。

技术实现思路

1、本发明的目的是提供一种基于图像语义分割与分类的身份识别方法与系统，以解决上述现有技术存在的问题。

2、为实现上述目的，本发明提供了一种基于图像语义分割与分类的身份识别方法，包括：

3、获取人眼图像数据集，构建语义分割网络，基于所述人眼图像数据集与数据集中各图像对应的掩码标签对所述语义分割网络进行训练，获得已训练语义分割网络和虹膜图像集；

4、构建目标分类网络，基于所述虹膜图像集与对应的身份标签对所述目标分类网络进行训练，获得已训练目标分类网络；

5、摄取待识别图像，对所述待识别图像进行预处理后，获取待识别实时人眼图像；

6、采用所述已训练语义分割网络对所述实时人眼图像进行图像分割，获得待识别虹膜图像；

7、通过所述已训练目标分类网络对所述待识别虹膜图像进行分类，获得所述待识别虹膜图像的身份标签，实现身份识别。

8、可选的，获得所述待识别虹膜图像的过程包括：

9、将待识别实时人眼图像输入至所述已训练语义分割网络，所述已训练语义分割网络通过非对称分解后的大卷积核提取待识别实时人眼图像的信息，获得输出特征图，将所述输出特征图输入第一下采样模块处理后通过依次连接的多个第一特征提取块进行浅层特征提取，获得第一特征矩阵；

10、所述第一特征矩阵经过第二下采样模块处理后通过依次连接的多个第二特征提取块进行深层特征提取，获得第二特征矩阵；

11、对所述第一特征矩阵与所述第二特征矩阵进行特征融合，对特征融合后获得的特征图通过空洞卷积进行特征提取后通过点卷积进行通道恢复，最后通过插值操作将处理后的特征图尺寸恢复至与所述待识别实时人眼图像的相同尺寸；

12、将恢复尺寸的特征图经过argmax操作获得虹膜掩码图；

13、将所述待识别实时人眼图像与所述虹膜掩码图进行点乘操作，获得待识别虹膜图像。

14、可选的，所述第一下采样模块和第二下采样模块结构相同，分别包括两条支路；

15、一条支路将输入的特征图通过3×3的最大池化层进行下采样；

16、另一条支路将输入的特征图通过eca模块学习通道的注意力权重后，经过深度卷积进行下采样；

17、将两条支路的输出结果进行通道拼接，获得具有双倍通道数的特征图并进行通道混洗。

18、可选的，第一特征提取块进行浅层特征提取的过程包括：

19、将通过下采样模块处理后的输出图输入至所述第一特征提取块进行通道拆分，获得第一特征图与第二特征图；

20、所述第一特征图依次通过点卷积、批量归一化，并根据gelu函数进行激活后，经深度分离分组卷积进行通道升维和特征提取；

21、将处理后的第一特征图通过eca模块学习通道的注意力权重后，将获得的特征图通过点卷积进行通道降维；

22、将通道降维后的特征图依次进行批量归一化和gelu函数激活后与所述第二特征图进行拼接；

23、将拼接后获得的特征图进行通道混洗，获取浅层特征；

24、多个第一特征提取块级联进行特征提取后获得第一特征矩阵；

25、其中，eca模块包括平均池化层与1×1卷积层。

26、可选的，第二特征提取块进行深层特征提取的过程包括：

27、对所述第一特征矩阵进行通道拆分，获得第三特征图与第四特征图；

28、所述第三特征图通过点卷积操作后进行多分支处理；其中，第一分支经过批量归一化和hswish激活函数进行激活后，获得第五特征图；第二分支通过深度空洞卷积进行特征提取，获得第六特征图；第三分支通过深度卷积进行特征提取，获得第七特征图；

29、将所述第五特征图、所述第六特征图和所述第七特征图进行叠加再通过eca模块学习通道的注意力权重后，与所述第四特征图进行拼接恢复通道数；

30、将拼接获得的特征图进行通道混洗，获得深层特征；

31、多个第二特征提取块级联进行特征提取后获得第二特征矩阵。

32、可选的，所述第一特征矩阵与所述第二特征矩阵进行特征融合的过程包括：

33、将所述第一特征矩阵通过标准卷积操作进行降维后，通过通道注意力模块捕捉关键通道信息；

34、所述第二特征矩阵通过插值处理增大特征图尺寸后，通过标准卷积操作进行特征提取，再通过通道注意力模块捕捉关键通道信息；

35、将处理后的第一特征矩阵、第二特征矩阵相加，完成特征融合。

36、可选的，所述通道注意力模块将输入至模块中的特征分别通过全局平均池化与全局最大池化进行压缩后，分别通过多层感知器进行提取后相加，再经过sigmoid激活函数处理，获得权重，输入至模块中的特征与所述权重相乘后，完成关键通道信息捕捉。

37、可选的，对所述待识别虹膜图像进行分类的过程包括：

38、去除所述待识别虹膜图像的冗余信息并放缩至设定尺寸后输入至所述已训练目标分类网络；

39、所述已训练目标分类网络通过非对称分解后的大卷积核提取处理后的待识别虹膜图像的特征信息，获得第二输出特征图，所述第二输出特征图经过第三下采样模块进行降维后，通过依次连接的多个第三特征提取块获得第三特征矩阵；

40、将所述第三特征矩阵经过第四下采样模块处理后，经过依次连接的多个第三特征提取块进行处理，获得第四特征矩阵；

41、将所述第四特征矩阵通过第五下采样模块处理后，经过若干个第三特征提取块进行处理，获得第五特征矩阵；

42、将所述第五特征矩阵经全局平均池化后，整合全层空间信息，得到第六特征矩阵；

43、所述第六特征矩阵通过两层点卷积处理得到分类任务对应类别数的矩阵后，转换为一维矩阵，根据所述一维矩阵的数值大小进行判别，实现身份识别；

44、所述第三下采样模块、所述第四下采样模块、所述第五下采样模块与所述第一下采样模块和第二下采样模块结构相同。

45、可选的，所述第三特征提取块进行特征提取的过程包括：

46、所述第三特征提取块将输入的特征图经过点卷积进行通道升维后，通过批处理归一化层和gelu激活函数进行激活；

47、通过点卷积进行信息提取后，通过批处理归一化层和gelu激活函数进行激活并降维回初始特征图通道数的一半，获得第一特征输出图；

48、所述第一特征输出图通过大卷积核进行深度卷积，获得第二特征输出图；

49、将所述第一特征输出图与所述第二特征输出图进行通道拼接后与所述初始特征图相加，通过eca模块学习通道的注意力权重，将获得的特征图进行通道混洗后输出。

50、本发明还提供一种基于图像语义分割与分类的身份识别系统，包括：

51、图像采集模块，用于摄取待识别图像，对所述待识别图像进行预处理后，获取待识别实时人眼图像；

52、语义分割模块，用于构建语义分割网络，获取人眼图像数据集与对应的掩码标签对所述语义分割网络进行训练，获得已训练语义分割网络与虹膜图像集；通过所述已训练语义分割网络对所述待识别实时人眼图像进行图像分割，获得对应的待识别虹膜图像；

53、目标分类模块，用于构建目标分类网络，通过所述虹膜图像集与对应的身份标签对所述目标分类网络进行训练，获得已训练目标分类网络，通过所述已训练目标分类网络对所述待识别虹膜图像进行分类识别，获得身份信息。

54、本发明的技术效果为：

55、本发明设计了一种基于注意力机制和轻量高效模块的语义分割卷积神经网络及图像分类卷积神经网络，可用于实时虹膜分割并实现身份识别，使基于虹膜的身份识别方法更安全，更高效。同时，将其部署在资源较少的边缘设备，经验证，可安全实时的进行虹膜识别。本发明可用于对安全性能及处理速度要求高的应用领域。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：骆爱文,温热晖,罗凯泽,赵亚林,杨文杰
技术所有人：暨南大学
我是此专利的发明人

上一篇：弃渣场的三维模型设计方法、装置及电子设备与流程
上一篇：单相交流输入可调直流稳压电源的控制方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。