一种远程监控方法及其装置与流程

文档序号：19931174发布日期：2020-02-14 22:02阅读：220来源：国知局

本申请涉及通信技术领域，尤其涉及一种远程监控方法及其装置。

背景技术：

随着物联网技术和互联网技术的发展，通信技术和通信方式也越来越多样化。视频监控设备作为通信设备的一种，在我们的日常生活中也是很常见的，比如商场，街道，电梯，小区的公共区域等区域都安装有监控，为了安全考虑，甚至有的家庭中也安装了监控设备。

然而我们常见的这些监控设备一般都是用来监控一个具体环境和场景的，主要作用是事后调取监控数据，根据监控数据来还原“现场事故”情况，并不能及时地阻止“现场事故”或及时地对“现场事故”采取一定措施，无法满足人们对于“现场事故”的及时获知权，也无法避免一些“现场事故”带来的财产安全隐患和人身安全隐患。

技术实现要素：

本申请实施例提供了一种远程监控方法及其装置，可以克服现有技术的缺陷，保证人们的财产安全和人身安全，提升用户使用体验。

第一方面，本申请实施例提供了一种远程监控方法，包括:

终端设备接收云端发送的含有目标人脸的人脸图像，其中，所述人脸图像是摄像机对私人空间进行采集后上传至所述云端的；

通过图像增强模型对所述人脸图像进行图像增强，得到增强图像；

判断所述增强图像中的目标人脸是否属于预设人脸集合，其中，所述预设人脸集合中的人脸均为允许进入所述私人空间的人脸；

在所述目标人脸不属于所述预设人脸集合的情况下，进行报警，以提示所述终端设备的用户所述私人空间有陌生人入侵。

可以看到，本申请实施例中，摄像机对私人空间采集含有目标人脸的人脸图像，上传至云端，云端再发送给终端，相应地，终端接收到云端发送的含有目标人脸的人脸图像，并对人脸图像进行处理。终端首先通过增强模型对人脸图像进行增强，得到增强图像，然后通过人脸识别来判断增强图像中的目标人脸是否属于预设人脸集合，若判断结果为不属于允许进入私人的人脸，则终端会发出报警提示，以提示用户私人空间有陌生人入侵。所以，实施本申请实施例能够保证人们的财产安全和人身安全，提升用户使用体验。

另外，可以看到，本申请实施例中，终端在接收到云端发送的含有目标人脸的人脸图像后，运用增强模型对人脸图像进行了增强处理，后又通过人脸识别来判断增强图像中的目标人脸是否属于预设人脸集合。终端对接收到的人脸图像采用图像增强处理和人脸识别的判断方法，提高了识别的正确性，增加了判断结果的准确性。

基于第一方面，在可能的实施方式中，所述图像增强模型包括缩小单元、放大单元及叠加单元，所述通过图像增强模型对所述人脸图像进行图像增强，包括：

通过所述缩小单元将尺寸为m*n的所述人脸图像变成尺寸为a*b的中间图像；

通过所述放大单元将所述尺寸为a*b的中间图像变成尺寸为m*n的输出图像；

通过所述叠加单元将所述人脸图像和所述输出图像进行叠加，从而得到所述增强图像。

可以看到，本申请实施例中，图像增强模型的作用是对人脸图像进行图像增强，从而得到增强图像，其中增强模型包括缩小单元、放大单元和叠加单元。将人脸图像输入缩小单元和放大单元处理后，可以得到输出图像，叠加单元再将人脸图像与输出图像进行叠加后，得到增强图像。这样将人脸图像经增强模型增强后得到的增强图像，具有特征明显，画面清晰，易识别的特点，增加了图像的识别性。

基于第一方面，在可能的实施方式中，所述缩小单元包括卷积层以及池化层，所述放大单元包括反卷积层以及卷积层。

可以看到，本申请实施例中，缩小单元由卷积层和池化层构成，其中，卷积层的主要作用是提取人脸图像的特征，池化层主要是保留提取的人脸图像的主要特征，去掉一些不必要的特征，从而起到缩小图像尺寸的作用。放大单元由反卷积层和卷积层构成，其中，反卷积层主要起到将图像放大的作用，卷积层同上面一样，主要作用是提取放大尺寸后图像的特征。因此，将人脸图像输入缩小单元，可以得到一个图像尺寸变小的图像，再将尺寸变小的图像输入放大单元，可以得到一个尺寸变大的输出图像，而且这个输出图像的尺寸大小与人脸图像尺寸大小一样，但是相比人脸图像，此输出图像的各特征相对更清晰、明显。

基于第一方面，在可能的实施方式中，所述图像增强模型是由第一训练样本以及第二训练样本训练得到的，其中，所述第一训练样本包括第一高质量图像以及第一低质量图像，所述第一高质量图像为拍摄得到的，包含第一人脸的高质量图像，所述第一低质量图像为对所述第一高质量图像进行图像处理后得到的低质量图像，所述第二训练样本包括第二高质量图像以及第二低质量图像，所述第二高质量图像为拍摄得到的，包含第二人脸的高质量图像，所述第二低质量图像为拍摄得到的，包含所述第二人脸的低质量图像。

可以看到，本申请实施例中，图像增强模型是由第一训练样本及第二训练样本训练得到，且第一训练样本中包括拍摄的包含第一人脸的高质量图像和由拍摄的包含第一人脸的高质量图像进行图像处理得到的低质量图像，第二训练样本中包括拍摄的包含第二人脸的高质量图像和拍摄的包含第二人脸的低质量图像。使用多种类和多类型的图像作为训练样本，训练出来的图像增强模型的增强效果更佳，使用此图像增强模型进行图像增强时，增强后的图像特征更加精确、清晰、明显。

基于第一方面，在可能的实施方式中，所述进行报警包括：

标记所述人脸图像为非法图像；

显示出一包含所述非法图像的消息窗口，终端接收用户点击所述消息窗口上按钮的操作指令后，通过云端向摄像机发送建立连接的请求，所述摄像机收到所述请求后，会通过云端向所述终端发送视频，终端接收到所述摄像机采集的视频画面。

可以看到，本申请实施例中，标记人脸图像为非法图像，是为了记录该人脸图像，以便发生意外情况时，可将此人脸图像提供给警方。同时，弹出包含非法图像的消息窗口，起到提示终端设备用户的作用，提示其私人空间有陌生人入侵。用户可通过点击消息窗口的按钮，通过云端建立终端与摄像机的连接，这样摄像机就可以通过云端向终端发送视频，终端获取摄像机采集的视频画面，实现远程监控。本实施例可以确保用户及时获取私人空间的视频画面，以及及时采取一些措施，确保人们的人身安全和财产安全，同时也提升了用户使用体验。

第二方面，本申请实施例提供了一种用于远程监控的装置，包括：

接收模块，用于接收云端发送的含有目标人脸的人脸图像，其中，所述人脸图像是摄像机对私人空间进行采集后上传至所述云端的；

图像增强模块，用于通过图像增强模型对所述人脸图像进行图像增强，得到增强图像；

判断模块，用于判断所述增强图像中的目标人脸是否属于预设人脸集合，其中，所述预设人脸集合中的人脸均为允许进行所述私人空间的人脸；

报警模块，用于在所述目标人脸不属于所述预设人脸集合的情况下，进行报警，以提示所述终端设备的用户所述私人空间有陌生人入侵。

在一具体实施方式中，所述图像增强模型包括缩小单元、放大单元及叠加单元，所述图像增强模块具体用于：

通过所述缩小单元将尺寸为m*n的所述人脸图像变成尺寸为a*b的中间图像；

通过所述放大单元将所述尺寸为a*b的中间图像变成尺寸为m*n的输出图像；

通过所述叠加单元将所述人脸图像和所述输出图像进行叠加，从而得到所述增强图像。

在一具体实施方式中，所述缩小单元包括卷积层以及池化层，所述放大单元包括反卷积层以及卷积层。

在一具体实施方式中，所述图像增强模型是由第一训练样本以及第二训练样本训练得到的，其中，所述第一训练样本包括第一高质量图像以及第一低质量图像，所述第一高质量图像为拍摄得到的，包含第一人脸的高质量图像，所述第一低质量图像为对所述第一高质量图像进行图像处理后得到的低质量图像，所述第二训练样本包括第二高质量图像以及第二低质量图像，所述第二高质量图像为拍摄得到的，包含第二人脸的高质量图像，所述第二低质量图像为拍摄得到的，包含所述第二人脸的低质量图像。

在一具体实施方式中，所述报警模块还用于：

标记所述人脸图像为非法图像；

在一种实现中，该装置可应用于终端。

本申请实施例提供的装置中的各个功能模块具体用于实现第一方面所描述的方法。

第三方面，本申请实施例提供一种计算设备，包括处理器、通信接口以及存储器；所述存储器用于存储指令，所述处理器用于执行所述指令，所述通信接口用于接收或者发送数据；其中，所述处理器执行所述指令时，执行如上述第一方面或者第一方面的任意具体实现方式中所描述方法。

第四方面，本申请实施例提供一种远程控制的系统，包括：摄像机、云端和终端。摄像机用于对私人空间中含有目标人脸的视频或者人脸图像进行采集，并将含有目标人脸的视频或者人脸图像上传至云端。云端用于接收并存储各摄像机发送的含有目标人脸的视频或者人脸图像，并将人脸图像发送至终端。除此之外，云端中还存储各摄像机的id信息以及终端与摄像机的关联信息等。终端用于接收云端发送的人脸图像，并对人脸图像运用图像增强模型进行增强，得到增强图像，然后通过人脸识别的方法判断增强图像中的人脸是否属于预设人脸，若不属于，则终端进行报警，以提示终端设备的用户私人空间中有陌生人入侵。本申请实施例提供的系统中的各个装置和设备具体用于实现第一方面所描述的方法。

第五方面，本申请实施例提供一种非易失性存储介质，用于存储程序指令，当该程序指令应用于远程控制时，可用于实现第一方面所描述的方法。

第六方面，本申请实施例提供一种计算机程序产品，该计算机程序产品包括程序指令，当该计算机程序产品被终端执行时，该终端执行前述第一方面所述方法。该计算机程序产品可以为一个软件安装包，在需要使用前述第一方面的任一种可能的设计提供的方法的情况下，可以下载该计算机程序产品并在终端上执行该计算机程序产品，以实现第一方面所述方法。

可以看到，本申请实施例提供了一种远程监控方法，该方法应用于终端装置。终端接收到云端发送的含有目标人脸的人脸图像，并对人脸图像通过图像增强模型进行增强，得到增强图像，使得人脸图像的特征更加明显，提高了图像中人脸的可识别性以及识别的准确性；图像增强模型使用多种类图像和多类型图像的样本训练得到，使得增强模型性能更佳，图像增强效果更好；对增强图像进行人脸识别，判断增强图像中的目标人脸是否属于预设人脸集合，若不属于，则终端进行报警操作，以提示终端设备的用户有陌生人进入私人空间，确保了私人空间的安全，提升了用户使用体验。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例涉及的一种远程监控方法的基本物理要素示意图；

图2是本申请实施例提供的一种远程监控方法示意图；

图3是本申请实施例提供的一种具体的图像增强模型示意图；

图4是本申请实施例提供的一种更具体的图像增强模型结构示意图；

图5是本申请实施例提供的一种硬件设备的结构示意图；

图6是本申请实施例提供的一种远程监控系统的结构示意图；

图7是本申请实施例提供的一种终端设备的结构示意图；

图8是本申请实施例提供的一种云端的结构示意图；

图9是本申请实施例提供的一种摄像机的基本结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

需要说明的是，当在本说明书和所附权利要求书中使用时，术语“包括”以及它们的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或者单元的过程、方法、系统、产品或者装置没有限定于已列出的步骤或者单元，而是可选地还包括没有列出的步骤或者单元，或者还可选地包括这些过程、方法、产品或者装置固有的其他步骤或单元。

还应当理解，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”或“在…的情况下”。

现今，随着监控设备的应用越来越广泛，仅仅在公共场所和公共区域的应用已经不能满足人们的日常生活需求了，而是希望能够利用监控设备来对自己的私密空间进行保护。比如，在一个家庭里，所有人都出去旅游了或者是去上班了，家里空无一人，这时候人们会希望家里是安全的，没有非法用户进入的，一旦发生意外情况，有非法用户进入家里，人们希望可以及时获知有非法人员进入的这个消息，并且及时了解家里的情况；又比如，住户主人和小孩在家里，但是主人急需出去一小段时间，只能留小孩在家里，这时候主人希望可以在出去的这段时间内，一直看到家里的情况，并且一旦有陌生人员进入家里，主人希望及时获知消息，并且获知小孩的安全和陌生人员的情况；又比如，店主有一家金店，在夜晚打烊后，一旦有非法人员闯入，在家里仍然可以及时得到消息，并采取一定的措施等等。基于此，本申请实施例提供了一种远程监控方法及其装置，用于满足人们利用监控设备来对私密空间进行保护的需求。

参见图1，本申请实施例的系统架构涉及云端、摄像机和终端，其中，云端分别与摄像机、终端建立通信连接。摄像机和终端的数量均不作限定，可以为一个，两个或多个。

终端可以是手机，平板电脑，手环，mp4和mp5等，甚至可以是智能交通工具、便携式可穿戴装置等具有视频通信功能的设备。

云端可以管理多个摄像机，每个摄像机对应有各自的摄像机id，云端对应有各摄像机的存储区域，摄像机将拍摄的视频发送给云端进行存储。用户通过在云端进行注册，获得用户账号与密码并登陆云端之后，可以在云端选择需要关联的摄像机，其中每个账号与密码关联摄像机的个数不做限定，可以为一个，两个或多个，云端在接收到终端选择的关联摄像机之后，将用户账号与用户选择的关联摄像机的摄像机id进行关联存储，例如，用户可以将终端与用户家中的摄像机进行关联。

摄像机主要用于采集视频或图像，并采集的视频或图像上传至云端；云端主要用于存储摄像机采集的视频和图像，以及存储摄像机的id信息、用户注册的账号与密码信息以及终端与摄像机的关联信息等相关信息，并将摄像机采集的视频或图像发送至终端；终端主要用于接收云端发送的视频或图像，并对图像进行处理，并根据处理结果进行后续操作。

对于下文描述的各方法实施例，为了方便起见，将其都表述为一系列的动作步骤的组合，但是本领域技术人员应该知悉，本申请技术方案的具体实现并不受所描述的一系列的动作步骤的顺序的限制。

参见图2，基于上述系统架构，描述本申请实施例提供的一种远程监控方法，该方法应用于终端装置。该方法流程包括但不限于以下步骤：

201、摄像机采集含有目标人脸的视频或者人脸图像。

本申请实施例中，摄像机具有检测人体的功能，比如可以是，摄像机上安装有人体红外感应装置，当人体红外感应装置感应到私人空间有人时，会触发摄像机的某些动作。其中某些动作比如可以是开始采集视频或图像，也可以是标记视频或者图像等。

摄像机的主要作用是采集私人空间内含有人脸的视频或者人脸图像。其中，摄像机的采集时间可以根据实际情况自由设置，私人空间可以是家庭内的大厅、卧室等，还可以是用户开的超市、服装店、饰品店、金银首饰店等。比如，当全家人都在家里的时候，可以关闭摄像机，不进行采集，当家里没人的时候，再开启摄像机，进行采集；用户的饰品店或者金银首饰店，在营业时间可以选择关闭摄像机，不进行采集，在打烊以后，再选择开启摄像机，进行采集视频或者图像。

在一种实施例中，当摄像机检测到私人空间中有人时，对目标人脸进行视频采集或者人脸图像采集。

在又一种实施例中，无论私人空间是否有人，摄像机都进行视频采集或图像采集，但是一旦检测到私人空间中有人时，会将含有目标人脸的视频或人脸图像标记出来。

202、摄像机将含有目标人脸的视频或者人脸图像上传至云端。相应地，云端接收由摄像机发送的含有目标人脸的视频或者人脸图像。

不同摄像机对应有不同的id信息，不同摄像机在将含有目标人脸的视频或者人脸图像上传至云端时，会携带各自的id信息。同样，云端将接收到的同一摄像机的id信息和该id信息对应的含有目标人脸的视频或者人脸图像存储在同一区域，不同摄像机的id信息和含有目标人脸的视频或者人脸图像存储在不同区域。

云端可以从含有目标人脸的视频中获取图像帧，再对图像帧进行筛选，得到人脸图像。其中，获取图像帧时，可以从含有目标人脸的视频中按周期获取图像帧，比如可以设置一秒钟或一分钟内获取a帧图像；或者可以设置每获取一帧或获取b帧图像的时间为t1秒钟或t2分钟等。对人脸图像进行筛选时，可以根据图像亮度、对比度、锐化程度、噪声大小等方面来进行筛选，比如，可以选择图像亮度较高、对比度较大、锐化程度较好、噪声较小的图像。

云端可以直接从摄像机发送的图像中进行筛选，从而得到人脸图像。比如，可以从摄像机发送的图像中分别选出一部分图像亮度较高的图像，又一部分对比度较大的图像，又一部分锐化程度适中的图像，又一部分噪声较小的图像等，也可以按照上面根据图像的综合指标来进行选择，比如选一部分兼具亮度较高、对比度较大、锐化程度较好、噪声较小等特征的图像。

203、云端将人脸图像发送至终端。相应地，终端接收云端发送的人脸图像。

终端接收云端发送的人脸图像，可以是云端从含有目标人脸的视频中获取图像帧，再对图像帧进行筛选，得到人脸图像；也可以是云端直接从摄像机发送的图像中进行筛选，从而得到人脸图像；也可以是上面两种情况的结合。

204、终端通过图像增强模型对人脸图像进行图像增强，得到增强图像。

在本申请具体的实施例中，增强模型可以是y＝f(x)，其中输入图像x为人脸图像，输出图像y为增强图像，f为作用于输入图像x的函数，图像增强模型参见图3。

在一更具体的实施例中，图像增强模型参见图4，增强模型可以包括缩小单元、放大单元以及叠加单元。将人脸图像输入缩小单元中，得到缩小图像；再将缩小图像输入放大单元中，得到放大图像；叠加单元是将放大图像的像素与人脸图像的像素进行叠加，从而得到增强图像。

其中，缩小单元包括卷积层和池化层。卷积层，将图像与卷积核进行卷积的过程，实际也是提取图像特征的过程。图像在计算机或者存储设备中是以数组或者矩阵的形式存储的，其中数组或者矩阵中的每个元素称为像素，所以在对图像进行处理时，实质是是对组成图像的数组或者矩阵进行处理，也就是对像素进行运算。卷积过程介绍如下，假设人脸图像是由m1*n1的矩阵组成，卷积核大小为m2*n2，卷积步长为s1，将人脸图像与卷积核进行卷积运算，m2*n2的卷积核以步长为s1的方式遍历m1*n1的这个矩阵，卷积核与其遍历的覆盖区域进行点乘运算，将得到的每个值存入一个新的特征矩阵(表示新的特征图像)，这样这个新的特征矩阵就表示卷积核与图像矩阵卷积的结果。运用池化层对图像进行池化的过程，也是降维的过程。常用的方法有最大池化和平均池化。最大池化，即将上面新的特征矩阵划分成d1*d2的区域块，然后将每个区域块中所有数的最大值取出，得到一个新的d1*d2的缩小矩阵，即缩小图像。平均池化，即将上面新的特征矩阵划分成d1*d2的区域块，然后取每个区域块中所有数的平均值，得到一个新的d1*d2的缩小矩阵，即缩小图像。

其中，放大单元包括反卷积层和卷积层。将缩小图像输入放大单元中，得到放大图像。反卷积的本质其实还是卷积，只是在进行卷积之前，会将输入图像根据步长来补0，以此来使输出的图像的尺寸大于输入图像的尺寸。例如，将d1*d2的缩小图像输入反卷积层，若设步长为s2，卷积核大小为m3*n3，则首先根据步长对缩小图像进行补0，得到补0后的图像矩阵，然后将补0后的图像矩阵与卷积核进行卷积，即卷积核遍历补0后的图像矩阵，与其遍历的覆盖区域进行点乘运算，将得到的每个值存入一个矩阵，得到一个中间矩阵。这就是反卷积层的运算过程。卷积层的运算过程同上面讲的卷积层运算过程原理是一样的，举例来说，将中间矩阵输入卷积层，设移动步长为s3，经卷积核与中间矩阵卷积运算，即卷积核以移动步长遍历中间矩阵，与其遍历的覆盖区域进行点乘运算，将得到的每个值存入一个放大矩阵中，即得到放大图像(m1*n1)。

最后，通过叠加单元将放大图像的像素与人脸图像的像素进行叠加，从而得到增强图像。例如，将m1*n1的放大图像的矩阵与m1*n1的人脸图像的矩阵的像素值对应相加，得到一个增强后的矩阵，即增强图像。

其中，图像增强模型是由第一训练样本以及第二训练样本训练得到的，第一训练样本包括第一高质量图像以及第一低质量图像，第一高质量图像为拍摄得到的，包含第一人脸的高质量图像，第一低质量图像为对第一高质量图像进行图像处理后得到的低质量图像，第二训练样本包括第二高质量图像以及第二低质量图像，第二高质量图像为拍摄得到的，包含第二人脸的高质量图像，第二低质量图像为拍摄得到的，包含第二人脸的低质量图像。第一训练样本中的第一人脸和第二训练样本中的第二人脸可以为一个人的人脸，也可以为不同人的人脸。

205、判断增强图像的目标人脸是否属于预设人脸集合。若不属于，继续执行后续操作206；若属于，继续执行后续操作207。

预设人脸集合中的人脸是通过预先采集允许进入私人空间的人脸图像得到的，其中，人脸图像集合可以是包含允许进入私人空间的一个人或者两个人或者多个人的人脸，且集合中每一个人的图像种类都有很多种，包括有清晰的，有模糊的，有噪声小的，有噪声大的，有亮度较高的额，有亮度低的，有对比度较高的，有对比度较低的，有锐化程度较大的，有锐化程度适中的等，或者某一部分人的图像是噪声较小的，还有一部分人的图像是亮度较高的，还有一部分人的图像是对比度较高的，还有一部分人的锐化程度较好的等等。

预设人脸图像的获取方式有很多种，可以是终端直接采集的，也可以是摄像机采集的预设人脸图像，上传至云端，然后云端经筛选后发送给终端，终端接收得到，或者是摄像机采集的含有预设人脸的视频，上传至云端后，然后云端从含有预设人脸的视频中获取图像帧，再经筛选后发送给终端，终端接收到预设人脸的图像。判断增强图像的目标人脸是否属于预设人脸，可以采用几何特征的方法来进行人脸识别。例如，几何特征可以是，眼睛、鼻子和嘴巴的形状特征，以及两只眼睛之间的距离(也可以是两只眼睛的内眼角或外眼角之间的距离)，鼻子到两眼睛中点的距离，嘴巴到两眼睛中点的距离，以及他们之间距离的几何关系等特征。终端通过计算增强图像中目标人脸的几何特征，并与存储的预设人脸的几何特征进行比较，判断是否属于预设人脸。

判断增强图像的目标人脸是否属于预设人脸，还可以采用支持向量机的方法。首先，终端通过主成分分析法pca来提取预设人脸的特征，得到特征向量，且每个特征向量都标有人脸标签，利用这些特征向量和人脸标签进行训练，得到一向量机。然后，终端通过主成分分析法pca来提取增强图像中人脸图像的特征向量，并将特征向量输入训练好的向量机中进行判断，判断是否属于预设人脸。

判断增强图像的目标人脸是否属于预设人脸，还可以采用卷积神经网络的方法。卷积神经网络进行人脸识别包括训练阶段和测试阶段两个阶段。由卷积层、池化层和全连接层组成。首先，训练阶段，将预设人脸的图像输入卷积神经网络，不断调节网络中各参数进行训练，直到得到训练好的神经网络。然后，将增强图像输入神经网络中进行测试，判断是否属于预设人脸。

206、若增强图像中的目标人脸不属于预设人脸集合，则终端发出报警提示。

若增强图像中的目标人脸不属于预设人脸集合，即为增强图像中的目标人脸不属于预设人脸集合中的任何一个人脸，则终端发出报警提示，以提示终端设备的用户：私人空间内有陌生人入侵。

其中，报警提示包括终端标记接收的该人脸图像为非法图像，标记是为了如果发生意外事情，标记的该人脸图像可以作为线索或证据提供给警方等。报警还包括，终端弹出一含有非法图像的消息窗口，用户可以通过点击消息窗口上的按钮，向云端发送与摄像机建立连接的请求，云端接收到该请求后，通过查找欲连接的摄像机的id信息后，向目标摄像机发送连接请求，摄像机接收到该连接请求后，通过云端向终端发送视频，终端接收到摄像机采集的视频。

207、若增强图像中的目标人脸属于预设人脸集合，则终端不做任何操作。

若增强图像中的目标人脸属于预设人脸集合中的任何一个人脸，则终端不做任何操作。

可以看到，实施本申请实施例的技术方案，摄像机可以采集含有目标人脸的视频或人脸图像，并上传至云端，云端用来保存视频或者图像，并且可以对图像进行筛选，将筛选出的人脸图像发送给终端，终端接收到含有目标人脸的人脸图像后，利用增强模型对图像进行增强，得到增强图像，其中增强模型是由第一训练样本以及第二训练样本训练得到，多种类型样本进行训练，使得图像的增强效果更佳，增强模型更加优化。然后通过对增强图像进行人脸识别，来判断增强图像中的目标人脸是否属于预设人脸集合，若不属于，则用户可以通过终端的报警操作来与摄像机建立连接，获取摄像机采集的私人空间的视频画面，实现画面的监控。所以实施本申请实施例可以增加私人空间的安全性，确保用户的财产安全和人身安全，提升用户使用体验。

为了更加清楚地理解本发明的方案，下面以两个实际应用场景为例进行描述。

举例来说，在一种应用场景中。一用户a全家去外地旅游，连续几天家里空无一人，为了确保家里的财产安全，用户a可以将手机通过云端与家里的摄像机(有自己的id信息)关联。这样，在a全家人外出期间，一旦有陌生人进入，摄像机的人体红外感应装置感应到人体，则摄像机会采集含有陌生人脸的视频或人脸图像，并上传至云端，云端接收该视频或图像，经筛选后将含有目标人脸的图像发送到a的手机，首先，a的手机会对接收到的含有目标人脸的图像运用增强模型进行增强，得到增强图像，然后会对增强图像中的目标人脸进行识别，经判断其不属于预设的人脸集合，这时，终端会发出报警提示，手机上出现一含有人脸图像的提示消息窗口，用户通过点击窗口上的按钮，建立与家里摄像机的连接，获取到摄像机采集的家里的视频画面，用户可以根据视频里面监控的画面判断家里的情况，以便及时采取一些措施。

又举例来说，在又一种应用场景中。一店主b有自己的一家金店，在夜晚打烊后，店主通过云端将手机与店里的摄像机进行关联。夜晚，店里一旦有陌生人进入，则摄像机会采集含有陌生人的视频画面或图像，然后上传至云端，经云端筛选后发送给店主b的手机，手机会对接收到的人脸图像进行图像增强，后再进行人脸识别，经判断若不属于预设人脸集合，则手机会出现一报警提示，店主b通过点击报警提示上的按钮，建立与摄像机的连接，获取到店里的画面，可以获知店里的情况，及时采取措施，避免一些财产损失。

另外，除了本实施例中的方案，还可以通过云端对图像进行处理，并根据处理结果进行后续操作，实现又一远程监控方法。

摄像机采集含有目标人脸的视频或人脸图像，并上传至云端，相应地，云端接收由摄像机发送的含有目标人脸的视频或人脸图像，并对人脸图像进行筛选，然后，云端运用增强模型对筛选后的人脸图像进行增强，得到增强图像，其中，增强模型是由第一训练样本以及第二训练样本训练得到的，第一训练样本包括第一高质量图像以及第一低质量图像，第一高质量图像为拍摄得到的，包含第一人脸的高质量图像，第一低质量图像为对第一高质量图像进行图像处理后得到的低质量图像，第二训练样本包括第二高质量图像以及第二低质量图像，第二高质量图像为拍摄得到的，包含第二人脸的高质量图像，第二低质量图像为拍摄得到的，包含第二人脸的低质量图像。最后，云端对增强图像中的目标人脸进行判断，判断是否属于预设人脸集合，若不属于，则云端进行报警操作。报警操作具体为：云端向终端发送人脸图像及有陌生人入侵的消息提醒。用户通过点击消息提醒窗口的按钮，向云端发送与摄像机建立连接的请求，云端接收到请求后，向摄像机发送连接请求，摄像机收到请求后，通过云端向终端发送视频，终端接收到摄像机采集的视频，实现画面的监控。

上文详细阐述了本申请实施例的一种远程监控方法，基于相同的发明构思，下面继续提供本申请实施例的硬件设备。

参见图5，图5是本申请实施例提供的一种远程监控装置50的结构示意图，该装置应用于终端，可以包括：

接收模块501，用于接收云端发送的含有目标人脸的人脸图像，其中，人脸图像是摄像机对私人空间进行采集后上传至云端的。

图像增强模块502，用于通过图像增强模型对人脸图像进行图像增强，得到增强图像。

判断模块503，用于判断增强图像中的目标人脸是否属于预设人脸集合，其中，预设人脸集合中的人脸均为允许进入私人空间的人脸。

报警模块504，用于在目标人脸不属于预设人脸集合的情况下，进行报警，以提示终端设备的用户私人空间有陌生人入侵。

在一具体实施例中，图像增强模型包括缩小单元、放大单元及叠加单元，所以图像增强模块502还具体用于，通过缩小单元将尺寸为m*n的人脸图像变成尺寸为a*b的中间图像；通过放大单元将尺寸为a*b的中间图像变成尺寸为m*n的输出图像；通过叠加单元将人脸图像和输出图像进行叠加，从而得到增强图像。

在一具体实施例中，所述缩小单元包括卷积层以及池化层，所述放大单元包括反卷积层以及卷积层。

在一具体实施例中，所述图像增强模型是由第一训练样本以及第二训练样本训练得到的，其中，所述第一训练样本包括第一高质量图像以及第一低质量图像，所述第一高质量图像为拍摄得到的，包含第一人脸的高质量图像，所述第一低质量图像为对所述第一高质量图像进行图像处理后得到的低质量图像，所述第二训练样本包括第二高质量图像以及第二低质量图像，所述第二高质量图像为拍摄得到的，包含第二人脸的高质量图像，所述第二低质量图像为拍摄得到的，包含所述第二人脸的低质量图像。

在一具体实施例中，报警模块504还用于标记人脸图像为非法图像；弹出一非法图像的消息窗口，通过点击消息窗口的按钮，向云端发送与摄像机建立连接的请求，云端接收到请求并发送给摄像机，摄像机收到请求后，通过云端向终端发送视频，终端接收到摄像机采集的视频。

上述远程监控装置50的各功能模块可用于实现图2实施例所描述的方法，具体内容可参考图2实施例的相关内容中的描述，为了说明书的简洁，这里不再赘述。

参见图6，图6为本申请实施例公开的一种远程监控系统60的结构示意图。本实施例中一种远程监控系统60可包括：终端70、云端80和摄像机90。其中，终端70在一种示例中可以包括接收模块501、图像增强模块502、判断模块503、报警模块504等。

参见图7，示出的是与本申请实施例相关的终端70的部分结构的框图。终端70包括rf(radiofrequency，射频)电路710、存储器720、其他输入设备730、显示屏740、传感器750、音频电路760、i/o子系统770、处理器780、以及电源790等部件。本领域技术人员可以理解，图7中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。本领领域技术人员可以理解显示屏740属于用户界面(ui，userinterface)，且终端70可以包括比图示或者更少的用户界面。

下面结合图7对终端70的各个构成部件进行具体的介绍：

rf电路710可用于收发信息，包括信号的接收和发送，特别地，将云端的下行信息接收后，给处理器780处理；另外，将设计上行的数据发送给云端。通常，rf电路包括但不限于天线、至少一个放大器、收发信机、耦合器、lna(lownoiseamplifier，低噪声放大器)、双工器等。此外，rf电路710还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议，包括但不限于gsm(globalsystemofmobilecommunication，全球移动通讯系统)、gprs(generalpacketradioservice，通用分组无线服务)、cdma(codedivisionmultipleaccess，码分多址)、wcdma(widebandcodedivisionmultipleaccess,宽带码分多址)、lte(longtermevolution,长期演进)、电子邮件、sms(shortmessagingservice，短消息服务)等。

存储器720可用于存储软件程序以及模块，处理器780通过运行存储在存储器720的软件程序以及模块，从而执行终端70的各种功能应用以及数据处理。存储器720可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据终端70的使用所创建的数据(比如音频数据、视频数据等)等。此外，存储器720可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其他输入设备730可用于接收输入的数字或字符信息，以及产生与终端70的用户设置以及功能控制有关的键信号输入。具体地，其他输入设备730可包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆、光鼠(光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸)等中的一种或多种。其他输入设备730与i/o子系统770的其他输入设备控制器771相连接，在其他设备输入控制器771的控制下与处理器780进行信号交互。

显示屏740可用于显示由用户输入的信息或提供给用户的信息以及终端70的各种菜单，还可以接收用户输入。具体的显示屏740可包括显示面板741，以及触控面板742。其中显示面板741可以采用lcd(liquidcrystaldisplay，液晶显示器)、oled(organiclight-emittingdiode,有机发光二极管)等形式来配置显示面板741。触控面板742，也称为触摸屏、触敏屏等，可收集用户在其上或附近的接触或者非接触操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板742上或在触控面板742附近的操作，也可以包括体感操作；该操作包括单点控制操作、多点控制操作等操作类型。)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板742可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位、姿势，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成处理器能够处理的信息，再送给处理器780，并能接收处理器780发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板742，也可以采用未来发展的任何技术实现触控面板742。进一步的，触控面板742可覆盖显示面板741，用户可以根据显示面板741显示的内容(该显示内容包括但不限于，软键盘、虚拟鼠标、虚拟按键、图标等等)，在显示面板741上覆盖的触控面板742上或者附近进行操作，触控面板742检测到在其上或附近的操作后，通过i/o子系统770传送给处理器780以确定用户输入，随后处理器780根据用户输入通过i/o子系统770在显示面板741上提供相应的视觉输出。虽然在图7中，触控面板742与显示面板741是作为两个独立的部件来实现终端70的输入和输出功能，但是在某些实施例中，可以将触控面板742与显示面板741集成而实现终端70的输入和输出功能。

终端70还可包括至少一种传感器750，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板741的亮度，接近传感器可在终端70移动到耳边时，关闭显示面板741和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别终端姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端70还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路760、扬声器761，麦克风762可提供用户与终端70之间的音频接口。音频电路760可将接收到的音频数据转换后的信号，传输到扬声器761，由扬声器761转换为声音信号输出；另一方面，麦克风762将收集的声音信号转换为信号，由音频电路760接收后转换为音频数据，再将音频数据输出至rf电路708以发送给比如另一终端，或者将音频数据输出至存储器720以便进一步处理。

i/o子系统770用来控制输入输出的外部设备，可以包括其他设备输入控制器771、传感器控制器772、显示控制器773。可选的，一个或多个其他输入控制设备控制器771从其他输入设备730接收信号和/或者向其他输入设备730发送信号，其他输入设备730可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮、光鼠(光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸)。值得说明的是，其他输入控制设备控制器771可以与任一个或者多个上述设备连接。所述i/o子系统770中的显示控制器773从显示屏740接收信号和/或者向显示屏740发送信号。显示屏740检测到用户输入后，显示控制器773将检测到的用户输入转换为与显示在显示屏740上的用户界面对象的交互，即实现人机交互。传感器控制器772可以从一个或者多个传感器750接收信号和/或者向一个或者多个传感器750发送信号。

处理器780是终端70的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器720内的软件程序和/或模块，以及调用存储在存储器720内的数据，执行终端70的各种功能和处理数据，从而对终端70进行整体监控。可选的，处理器780可包括一个或多个处理单元；优选的，处理器780可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器780中。

终端70还包括给各个部件供电的电源790(比如电池)，优选的，电源可以通过电源管理系统与处理器780逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗等功能。

尽管未示出，终端70还可以包括摄像头、蓝牙模块等，在此不再赘述。

参见图8，示出的是本申请实施例涉及的一种云端80的示意图。下面结合图8对云端80的构成进行具体的介绍：云端80的拥有者自己部署云端80的计算基础设施，即，部署计算资源(例如，服务器)810、部署存储资源(例如，存储器)820以及部署网络资源(例如，网卡)830等等。然后，云端80的拥有者(例如，运营商)将云端80的计算基础设施的计算资源810、存储资源820、网络资源830进行虚拟化，并提供相应的服务给云端80使用者(例如，用户)使用。其中，运营商可以提供以下三种服务给使用者：云端计算基础设施即服务(infrastructureasaservice，iaas)、平台即服务(platformasaservice，paas)以及软件即服务(softwareasaservice，saas)。

以用户作为云端80使用者，运营商作为云端80拥有者为例，分别对iaas，paas和saas进行介绍。

iaas提供给用户的服务是对云端80计算基础设施的利用，包括处理、存储、网络和其它基本的计算资源810，用户能够部署和运行任意软件，包括操作系统和应用程序。用户不管理或控制任何云端80计算基础设施，但能控制操作系统的选择、储存空间、部署应用，也有可能获得有限制的网络组件(例如，防火墙，负载均衡器等)的控制。

paas提供给用户的服务是把用户采用供应商提供的开发语言和工具(例如java，python，net等)开发的或收购的应用程序部署到云端80计算基础设施上去。用户不需要管理或控制底层的云端计算基础设施，包括网络、服务器、操作系统、存储等，但用户能控制部署的应用程序，也可能控制运行应用程序的托管环境配置。

saas提供给用户的服务是运营商运行在云端80计算基础设施上的应用程序，用户可以在各种设备上通过客户端界面，如浏览器，访问云端计算基础设施上的应用程序。用户不需要管理或控制任何云端80计算基础设施，包括网络、服务器、操作系统、存储等等。

可以理解，运营商通过iaas、paas、saas中的任意一种为不同的租户进行租赁服务，不同租户之间数据和配置是相互隔离的，从而保证每个租户数据的安全与隐私。

参见图9，示出的是与本申请实施例相关的摄像机90的部分内部结构的框图，用于描述摄像机90的硬件组成及功能实体之间的数据流向。

摄像机90基本结构包括：镜头911及传感器912(镜头及传感器整个装置910)、编码处理器920、ipc主控板930(ipc主控板930包括主控制器931、处理器932和其他装置)等部件，其中的主控制器931通过控制线控制编码处理器920，由编码处理器920将镜头911及传感器912采集的图像以视频信号的形式输入到ipc主控板930，ipc主控板930具有bnc(bayonetnutconnector，刺刀螺母连接器)视频输出、网络通讯接口、音频输入、音频输出、告警输出、告警输入、串口通讯接口等功能，ipc主控板930的处理器932可以通过串口通讯接口与云端80连接。本领域技术人员可以理解，图9中示出的摄像机结构并不构成对摄像机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。

尽管未示出，摄像机90还可以包括人体红外感应装置等，在此不再赘述。

摄像机90，主要用于进行人体检测，以及采集含有目标主体的视频或者人脸图像。在一种示例中，摄像机90通过人体红外感应装置对人体进行检测，当检测到人体时，触发摄像机90对私人空间进行视频或者图像的采集动作，然后按一定的周期或频率将采集的含有目标人脸的视频或者人脸图像上传至云端80。在又一示例中，摄像机90连续地采集私人空间的视频或者图像，但是当人体红外感应装置检测到人体时，触发摄像机90进行标记动作，将采集的含有目标人脸的视频或者人脸图像标记出来，然后将标记的视频或者图像按一定的周期或者频率上传至云端。

云端80，主要用于接收并存储摄像机90发送的含有目标主体的视频或者图像，以及存储摄像机90的id信息、与终端70的关联信息等，并对接收的含有目标主体的视频或者图像进行筛选，将筛选出来的人脸图像发送给终端70。终端70，用于接收云端80发送的人脸图像，然后运用增强模型对人脸图像进行图像增强，得到增强图像，其中增强模型是由第一训练样本以及第二训练样本训练得到。再对增强图像中的人脸进行判断，判断其是否属于预设人脸集合，若不属于，则终端70进行报警操作。

在一种示例中，摄像机90中的人体红外感应装置对人体进行检测，然后采集含有目标主体的视频或者图像，并上传至云端80，云端80接收并保存由摄像机90发送的含有目标主体的视频或者图像，然后进行筛选，将筛选出的人脸图像发送给终端70。终端70中的接收模块501接收到云端80发送的人脸图像，由图像增强模块502运用增强模型对人脸图像进行增强，得到增强图像，其中增强模型是由第一训练样本以及第二训练样本训练得到。判断模块503对增强图像进行识别，判断其是否属于预设人脸集合，其中，预设人脸集合中的人脸均为允许进入私人空间的人脸。若判断结果为不属于，则报警模块504会产生报警，具体为：标记人脸图像为非法图像；显示出一含有非法图像的消息窗口，通过点击消息窗口的按钮，向云端80发送与摄像机90建立连接的请求，云端80接收到请求并发送给摄像机90，摄像机90收到请求后，通过云端80向终端70发送视频，终端70接收到摄像机90采集的视频。

上述远程监控系统60中的各装置可用于实现图2实施例所描述的方法，具体内容可参考图2实施例的相关内容中的描述，为了说明书的简洁，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory，rom)或随机存储记忆体(randomaccessmemory，ram)等。

以上所揭露的仅为本发明一种较佳实施例而已，当然不能以此来限定本发明之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本发明权利要求所作的等同变化，仍属于发明所涵盖的范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：余承富
技术所有人：深圳市大拿科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。