一种基于实时视频流的人员识别方法、设备及介质与流程

文档序号：35680618发布日期：2023-10-08 17:22阅读：42来源：国知局

所属的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。根据本发明的这种实施方式的电子设备。电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。电子设备以通用计算设备的形式表现。电子设备的组件可以包括但不限于：上述至少一个处理器、上述至少一个储存器、连接不同系统组件(包括储存器和处理器)的总线。其中，储存器存储有程序代码，程序代码可以被处理器执行，使得处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。储存器可以包括易失性储存器形式的可读介质，例如随机存取储存器(ram)和/或高速缓存储存器，还可以进一步包括只读储存器(rom)。储存器还可以包括具有一组(至少一个)程序模块的程序/实用工具，这样的程序模块包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。总线可以为表示几类总线结构中的一种或多种，包括储存器总线或者储存器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。电子设备也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备交互的设备通信，和/或与使得该电子设备能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口进行。并且，电子设备还可以通过网络适配器与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。网络适配器通过总线与电子设备的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是cd-rom，u盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。在本公开的示例性实施例中，还提供了一种计算机可读存储介质，其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中，本发明的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当程序产品在终端设备上运行时，程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、rf等等，或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如java、c++等，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(lan)或广域网(wan)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。此外，上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

背景技术：

1、在当前的安全监控和人员管理领域中，对于实时视频流的处理和人员特征识别的需求越来越重要。传统的安全监控系统通常依赖于人工操作和分析，耗时且容易出错。随着计算机视觉和机器学习技术的发展，自动化的实时视频分析系统成为了一种更加高效和可靠的解决方案。

2、目前的人脸识别和图像分析技术局限于对静态图像的处理，对于实时视频流的处理能力有限。此外，现有技术在人员特征识别的准确性和效率方面仍面临一些挑战。例如，对于复杂场景下的多个人员同时识别和特征提取，以及准确匹配人员信息的问题仍然具有挑战性。现有技术往往需要大量计算资源和时间来处理实时视频流，并且在复杂场景下容易出现特征提取错误或识别误差的情况。且在高密度人员场景下，同时识别和提取多个人员的特征值会更加复杂，现有技术难以准确区分和提取多个人员的特征，并且容易发生误匹配和信息混淆的问题。且现有技术在将实时提取的人员特征与人员库进行匹配、获取姓名和证件号、将相关信息标注在图像等方面存在局限性和不足之处。在实时视频流处理中，现有技术中的实时流和文件生成方法也存在不便捷、效率低下等问题。

技术实现思路

1、有鉴于此，本发明提供一种基于实时视频流的人员识别方法、设备及介质，至少部分解决现有技术中存在的技术问题，本发明采用的技术方案为：

2、根据本技术的一个方面，提供一种基于实时视频流的人员识别方法，应用于人员识别系统，人员识别系统连接有第一数据库和目标显示界面，第一数据库中存储有若干第一人员对应的第一人脸特征向量和第一身份信息；

3、所述基于实时视频流的人员识别方法包括如下步骤：

4、s100、实时获取待识别人员在第一目标区域内对应的第一视频流；

5、s200、对第一视频流进行预处理，得到若干第一待检测图像；

6、s300、对每一第一待检测图像进行特征信息提取，得到待识别人员对应的若干待识别人员特征信息；待识别人员特征信息中包括待识别人员对应的待识别人脸特征信息和待识别外貌特征信息；

7、s400、若第一数据库中存储有待识别人脸特征信息对应的第一身份信息，则将待识别人员确定为目标人员；

8、s500、将目标人员对应的若干目标外貌特征信息及目标身份信息标注在每一第一待检测图像对应的第一标识框中，得到若干目标图像；

9、s600、对每一目标图像进行封装处理，得到目标视频流；

10、s700、将目标视频流在目标显示界面中展示。

11、在本技术的一种示例性实施例中，步骤s200包括：

12、s210、对第一视频流进行解码处理，得到若干第一视频帧；

13、s220、对每一第一视频帧进行帧提取处理，得到若干第一待检测图像。

14、在本技术的一种示例性实施例中，步骤s300还包括：

15、s301、根据机器学习算法，对待识别人员对应的每一待识别人员特征信息进行分类，得到若干待识别特征信息类组，每一待识别特征信息类组中包括若干待识别人员特征信息。

16、在本技术的一种示例性实施例中，待识别人脸特征信息通过以下步骤确定：

17、s310、根据人脸检测算法，确定每一第一待检测图像中的人脸区域；

18、s320、根据人脸关键点定位算法，对每一第一待检测图像中的人脸区域进行检测，确定每一人脸区域内的关键特征信息点；

19、s330、根据面部特征信息提取算法和每一关键特征信息点，提取每一第一待检测图像中的待识别人脸特征信息。

20、在本技术的一种示例性实施例中，步骤s400包括：

21、s410、根据n个待识别人脸特征信息，得到待识别人员对应的人脸特征信息向量q＝(q1,q2,...,qi,...,qn)；其中，i＝1,2,...,n；qi为待识别人员对应的第i个待识别人脸特征信息；

22、s420、获取第一数据库中存储的h个第一人员对应的第一人脸特征向量r1,r2,...,rg,...,rh；rg＝(rg1,rg2,...,rgi,...,rgn)；其中，g＝1,2,...,h；rg为第g个第一人员对应的第一人脸特征向量；rgi为第g个第一人员对应的第一人脸特征向量中的第i个第一人脸特征信息；rgi对应的关键特征信息点与qi对应的关键特征信息点相同；

23、s430、将q与r1,r2,...,rg,...,rh分别进行匹配度计算，得到对应的第一匹配度m1,m2,...,mg,...,mh；

24、s440、若max(m1,m2,...,mg,...,mh)≥m0，则将待识别人员确定为目标人员；其中，m0为预设匹配度阈值；max()为预设的最大值确定函数；

25、s450、将max(m1,m2,...,mg,...,mh)对应的第一人员的第一身份信息确定为目标身份信息；

26、s460、将待识别外貌特征信息确定为目标外貌特征信息。

27、在本技术的一种示例性实施例中，第一标识框通过以下步骤确定：

28、s510、根据边界框算法，对每一第一待检测图像中的人体区域进行框选，得到每一第一待检测图像对应的初始标识框；

29、s520、获取目标人员在每一第一待检测图像中对应的若干目标外貌特征信息的字段长度，得到字段长度集f＝(f1,f2,...,fj,...,fm)；fj＝(fj1,fj2,...,fjd,...,fjf(j))；其中，j＝1,2,...,m；d＝1,2,...,f(j)；m为第一待检测图像的数量；f(j)为目标人员在第j个第一待检测图像中对应的目标外貌特征信息的数量；fj为目标人员在第j个第一待检测图像中对应的目标外貌特征信息的字段长度列表；fjd为目标人员在第j个第一待检测图像中对应的第d个目标外貌特征信息的字段长度；

30、s530、获取目标身份信息的字段长度g；

31、s540、若g≥max(fj)，则将初始标识框的边界向外扩充g个长度，并将其确定为第j个第一待检测图像对应的第一标识框；否则，将初始标识框的边界向外扩充max(fj)个长度，并将其确定为第j个第一待检测图像对应的第一标识框。

32、在本技术的一种示例性实施例中，在步骤s540之后，方法还包括：

33、s550、若第一标识框中包含对应的第一待检测图像的边界，则将该边界作为对应的第一标识框的边界。

34、在本技术的一种示例性实施例中，步骤s600包括：

35、s610、根据音视频编码算法，对m个目标图像进行编码处理，得到对应的第二视频帧；

36、s620、将每一第二视频帧封装为实时rtmp流，得到目标视频流；

37、s630、将每一第二视频帧以flv文件格式进行存储。

38、根据本技术的一个方面，提供一种非瞬时性计算机可读存储介质，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现前述的基于实时视频流的人员识别方法。

39、根据本技术的一个方面，提供一种电子设备，包括处理器和前述的非瞬时性计算机可读存储介质。

40、本发明至少具有以下有益效果：

41、本发明提供一种高效、准确的基于实时视频流的人员特征提取、识别和标注方法，通过利用计算机视觉、机器学习和多媒体处理技术，能够在实时视频流中快速、准确地提取和识别人员特征，实现实时的信息获取和标注，大大提高了处理速度和效率，并将根据待识别人员特征信息得到的第一人脸特征向量与第一数据库中的第一人脸特征向量进行比对，实现第一人员的第一身份信息的获取，为安全监控和人员管理提供了方便和实用的手段，并将目标人员对应的若干目标外貌特征信息及目标身份信息标注在第一待检测图像上，可以提供直观的视觉信息，使人员识别结果更加明确和可视化，便于进一步分析和应用，同时生成新的实时rtmp流和flv文件，使得处理后的视频流可以方便地进行实时传输和保存，为后续的数据分析、归档和回放提供了便利，满足安全监控和人员管理领域的需求。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐湛李凡平王堃
技术所有人：青岛以萨数据技术有限公司
我是此专利的发明人

上一篇：一种基于实时视频流的人员点名方法、设备及介质与流程
上一篇：一种高抗氧化性超薄电解铜箔制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。