目标对象识别方法、装置、设备及存储介质与流程

文档序号：36004401发布日期：2023-11-16 18:59阅读：33来源：国知局

本发明涉及人工智能，尤其涉及一种目标对象识别方法、装置、设备及存储介质。

背景技术：

1、随着计算机技术的不断发展，目标对象身份识别在近年来得到很大的发展。在越来越多的领域中得到应用，例如在银行、证券、保险等金融机构的业务量持续扩大，产生大量的身份识别需求。

2、现有技术中，现在的目标对象识别一般是通过声纹识别验证目标对象的身份。例如，在银行领域中，需要对身份信息识别时，通常是通过验证目标对象的声纹信息和预先存储的声纹信息进行匹配，从而确定目标对象的身份。如此，需要大量人员的配合提前存储大量的声纹信息，以在验证时可以确定目标对象的身份。而且对人脸图像中唇部信息的应用，一般是采用对视频进行唇语识别，从而对声纹识别进行辅助验证，这种方式对唇部信息的利用效率低，导致辅助验证的准确率也较低。

技术实现思路

1、本发明实施例提供一种目标对象识别方法、装置、设备及存储介质，以改善现有技术中唇部信息验证目标对象身份利用效率低和准确性较低等问题。

2、一种目标对象识别方法，包括：

3、获取视频文件，以及与所述视频文件对应的音频文件；

4、对所述视频文件中的各目标对象进行人脸检测，得到与所述视频文件中各所述目标对象对应的目标唇部图像序列；

5、将各所述音频文件输入到预设同步模型中，生成与各所述音频文件分别对应的同步唇形视频文件；

6、提取所述同步唇形视频文件中的与各所述目标对象对应的同步唇部图像序列；

7、获取预设比对模型，通过所述预设比对模型对与同一所述目标对象所述目标唇部图像序列和所述同步唇部图像序列进行比对，得到该目标对象的身份识别结果。

8、一种目标对象识别装置，包括：

9、文件获取模块，用于获取视频文件，以及与所述视频文件对应的音频文件；

10、人脸检测模块，用于对所述视频文件中的目标对象进行人脸检测，得到与所述视频文件中各所述目标对象对应的目标唇部图像序列；

11、同步视频模块，用于将各所述音频文件输入到预设同步模型中，生成与各所述音频文件分别对应的同步唇形视频文件；

12、图像提取模块，用于提取所述同步唇形视频文件中的与各所述目标对象对应的同步唇部图像序列；

13、识别结果模块，用于获取预设比对模型，通过所述预设比对模型对与同一所述目标对象所述目标唇部图像序列和所述同步唇部图像序列进行比对，得到该目标对象的身份识别结果。

14、一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述目标对象识别方法。

15、一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述目标对象识别方法。

16、本发明提供一种目标对象识别方法、装置、设备及存储介质，该方法通过对获取的视频文件中的目标对象进行人脸检测，实现了对视频文件中各目标对象的唇部图像的提取，进而实现了在金融或保险等业务中对目标唇部图像序列的获取。通过将各音频文件输入到预设同步模型中，实现了通过预设同步模型将音频文件转换为同步唇形视频文件。通过提取同步唇形视频文件中的与各目标对象对应的同步唇部图像序列，实现了对同步唇部图像序列的获取。通过预设比对模型对与同一目标对象对应的目标唇部图像序列和同步唇部图像序列进行比对，实现了对目标对象身份结果的确定，提高了在金融或保险等业务中对唇部图像的利用效率。进一步地，通过预设比对模型对目标唇部图像序列和同步唇部图像序列进行比对，实现了比对唇部图像识别出目标对象，提高了在金融或保险等业务中目标对象识别的准确率。

技术特征：

1.一种目标对象识别方法，其特征在于，包括：

2.如权利要求1所述的目标对象识别方法，其特征在于，所述通过所述预设比对模型对与同一所述目标对象所述目标唇部图像序列和所述同步唇部图像序列进行比对，得到该目标对象的身份识别结果，包括：

3.如权利要求2所述的目标对象识别方法，其特征在于，所述对所述目标唇部图像序列和所述同步唇部图像序列中的相同序列帧的唇部图像进行相似度比对，得到与每一序列帧分别对应的相似度值，包括：

4.如权利要求1所述的目标对象识别方法，其特征在于，所述将各所述音频文件输入到预设同步模型中，生成与各所述音频文件分别对应的同步唇形视频文件，包括：

5.如权利要求1所述的目标对象识别方法，其特征在于，所述对所述视频文件中的目标对象进行人脸检测，得到与所述视频文件中各所述目标对象对应的目标唇部图像序列，包括：

6.如权利要求1所述的目标对象识别方法，其特征在于，所述获取预设比对模型之前，包括：

7.一种目标对象识别装置，其特征在于，包括：

8.如权利要求7所述的目标对象识别装置，其特征在于，所述识别结果模块，还包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述目标对象识别方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述目标对象识别方法。

技术总结
本发明涉及人工智能技术领域，具体涉及一种目标对象识别方法，该方法获取视频文件，以及与视频文件对应的音频文件；对视频文件中的目标对象进行人脸检测，得到与各目标对象对应的目标唇部图像序列；将各音频文件输入到预设同步模型中，获取与各音频文件对应的同步唇形视频文件；提取同步唇形视频文件中的同步唇部图像序列；通过预设比对模型对目标唇部图像序列和同步唇部图像序列进行比对，得到该目标对象的身份识别结果。本发明应用于金融或保险等业务中目标对象身份识别需求，通过预设比对模型对目标唇部图像序列和同步唇部图像序列进行比对，实现了比对唇部信息识别出目标对象身份，提高了金融或保险等业务中目标对象识别的准确率。

技术研发人员：孙超
受保护的技术使用者：中国平安人寿保险股份有限公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙超
技术所有人：中国平安人寿保险股份有限公司
我是此专利的发明人

上一篇：一种钠电池复合固态电解质、其制备方法及钠电池与流程
上一篇：一种云台模组的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。