三维卷积神经网络训练方法、视频异常事件检测方法及装置制造方法

文档序号：6626989阅读：320来源：国知局

三维卷积神经网络训练方法、视频异常事件检测方法及装置制造方法
【专利摘要】本发明实施例涉及视频图像【技术领域】，尤其涉及一种三维卷积神经网络训练方法、一种基于三维卷积神经网络的视频异常事件检测方法及装置，用以对拥挤人群场景下发生的异常事件进行检测。本发明实施例的方法中三维卷积神经网络正向传递过程中第N组卷积-采样层中的卷积层上的每个卷积核对第N-1组卷积-采样层中的采样层的所有通道的所有特征图的数据进行卷积，由于最后一层卷积层对所有通道的所有特征图的数据进行卷积，从而可提取更具有表达能力的特征，从而可通过这些特征更好地描述拥挤人群场景下发生的异常事件，进而提高异常事件的检测的准确率。
【专利说明】三维卷积神经网络训练方法、视频异常事件检测方法及装

【技术领域】
[0001] 本发明涉及视频图像【技术领域】，尤其涉及一种三维卷积神经网络训练方法、一种基于三维卷积神经网络的视频异常事件检测方法及装置。

【背景技术】
[0002] 随着经济的快速发展，在商场、体育场等公共场所中常常存在着人流高峰，而这些拥挤的人群对公共安全带来了极大的隐患。如果能够及时检测到监控视频中的异常行为，便可及时采取相应的解决方案，避免重大意外事件发生。
[0003] 现有技术中用于对监控视频中的异常事件进行自动检测的方法需基于运动对象的跟踪，即通过不断检测运动对象运动轨迹，进行异常行为检测。该类方法异常行为检测效果在很大程度上依赖于运动对象跟踪的结果，因此该类方法仅适用于非拥挤场景中，但对于如商场、体育场等公共场所的拥挤场景，由于目标的互遮挡与自遮挡相当严重，导致有效的运动对象跟踪困难，因此在人群拥挤的场景下，基于运动对象跟踪的方法并不适用。
[0004] 综上，亟需一种视频异常事件检测方法，用以对拥挤人群场景下发生的异常事件进行检测。

【发明内容】

[0005] 本发明实施例提供一种三维卷积神经网络的训练方法、一种基于三维卷积神经网络的视频异常事件检测方法及装置，用以对拥挤人群场景下发生的异常事件进行检测。
[0006] 本发明实施例提供一种三维卷积神经网络的训练方法，包括：
[0007] 三维卷积神经网络中按照正向传递过程依次包含第一组至第N组卷积-采样层，每组卷积-采样层中按照正向传递过程包含一个卷积层和一个采样层，第N-1组卷积-采样层中的采样层与第N组卷积-采样层中的卷积层全连接，N>1 ;
[0008] 三维卷积神经网络的训练方法包括：
[0009] 执行正向传递过程，根据正向传递过程的输出结果，在三维卷积神经网络中执行反向传递过程，以修正三维卷积神经网络的模型参数；
[0010] 正向传递过程包括：三维卷积神经网络接收待检测视频序列的特征块，针对特征块执行异常检测过程，根据待检测视频序列的每个特征块的异常事件检测结果确定待检测视频序列是否发生异常事件；
[0011] 其中，第N组卷积-采样层中的卷积层上的每个卷积核对第N-1组卷积-采样层中的采样层的所有通道的所有特征图的数据进行卷积，并将通过卷积所得到的特征图信息输出给第N组卷积-采样层中的采样层进行采样处理。
[0012] 三维卷积神经网络正向传递过程中第N组卷积-采样层中的卷积层上的每个卷积核对第N-1组卷积-采样层中的采样层的所有通道的所有特征图的数据进行卷积，由于最后一层卷积层对所有通道的所有特征图的数据进行卷积，从而可提取更具有表达能力的特征，从而可通过这些特征更好地描述拥挤人群场景下发生的异常事件，进而提高异常事件的检测的准确率。
[0013] 较佳的，三维卷积神经网络接收待检测视频序列的特征块之前，还应做一些前期处理，如：对待检测的第i帧至第i+Ι帧的视频帧序列进行特征提取，并将第i帧至第i+1 帧的视频帧序列切割为RXCX1的多个特征块；其中，i、1、R、C均为大于1的整数，R和C 分别表示特征块的长度和宽度。
[0014] 较佳的，三维卷积神经网络接收待检测视频序列的特征块，对特征块进行检测，输出的异常事件检测结果中包括异常值概率和正常值概率；由于前期可能对视频帧序列进行切割，因此同一个帧序列可能具有多个特征块，三维卷积神经网络会对每个特征块输出一个异常事件检测结果。根据多个待检测视频序列的每个特征块的异常事件检测结果确定待检测视频序列是否发生异常事件时，若待检测视频序列的特征块中至少有一个特征块满足以下条件，则确定待检测视频序列发生异常事件：异常值概率减去正常值概率得到的差值大于设定阈值。
[0015] 如前，三维卷积神经网络输出的异常事件检测结果中包括异常值概率和正常值概率。当想要确定具体哪一帧发生了异常事件时，则需结果多个特征块进行计算。例如，需要确定第k帧是否发生了异常事件，则需将所有包含第k帧的视频帧序列中的所有特征块的异常检测结果中的异常值概率进行加权相加，将包含第k帧的所有视频帧序列中的所有特征块的异常检测结果中的正常值概率进行加权相加；其中，所有包含第k帧的视频帧序列是通过具有1帧时间长度的滑动窗口每次移动单帧得到的；针对所有包含第k帧的视频帧序列中的所有特征块，若加权相加之后的异常值概率减去加权相加之后的正常值概率得到的差值大于设定阈值，则确定第k帧发生异常事件；其中，k为正整数。
[0016] 较佳的，由于第k帧具有多个异常检查结果，因此对第k帧的异常检测结果进行加权相加之前必须设定权值。针对所有包含第k帧的视频帧序列中的所有特征块，将第一特征块的的异常检测结果中的异常值概率和正常值概率的权值设置为最大值；其中，第一特征块满足以下条件：

【权利要求】
1. 一种三维卷积神经网络的训练方法，其特征在于，包括：三维卷积神经网络中按照正向传递过程依次包含第一组至第N组卷积-采样层，每组卷积-采样层中按照正向传递过程包含一个卷积层和一个采样层，第N-1组卷积-采样层中的采样层与第N组卷积-采样层中的卷积层全连接，N>1 ; 所述三维卷积神经网络的训练方法包括：执行正向传递过程，根据所述正向传递过程的输出结果，在所述三维卷积神经网络中执行反向传递过程，以修正所述三维卷积神经网络的模型参数；所述正向传递过程包括：三维卷积神经网络接收待检测视频序列的特征块，针对所述特征块执行异常检测过程，根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件；其中，第N组卷积-采样层中的卷积层上的每个卷积核对第N-1组卷积-采样层中的采样层的所有通道的所有特征图的数据进行卷积，并将通过卷积所得到的特征图信息输出给第N组卷积-采样层中的采样层进行采样处理。
2. 如权利要求1所述的三维卷积神经网络的训练方法，其特征在于，所述三维卷积神经网络接收待检测视频序列的特征块之前，还包括：对待检测的第i帧至第i+1帧的视频帧序列进行特征提取，并将所述第i帧至第i+1 帧的视频帧序列切割为RXCX1的多个特征块；其中，i、1、R、C均为大于1的整数，R和C 分别表示特征块的长度和宽度。
3. 如权利要求1所述的三维卷积神经网络的训练方法，其特征在于，所述异常事件检测结果中包括异常值概率和正常值概率；所述根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件，包括：若所述待检测视频序列的特征块中至少有一个特征块满足以下条件，则确定所述待检测视频序列发生异常事件：异常值概率减去正常值概率得到的差值大于设定阈值。
4. 如权利要求2所述的三维卷积神经网络的训练方法，其特征在于，所述异常事件检测结果中包括异常值概率和正常值概率；所述根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件，包括：将所有包含第k帧的视频帧序列中的所有特征块的异常检测结果中的异常值概率进行加权相加，将包含第k帧的所有视频帧序列中的所有特征块的异常检测结果中的正常值概率进行加权相加；其中，所述所有包含第k帧的视频帧序列是通过具有1帧时间长度的滑动窗口每次移动单帧得到的；针对所有包含第k帧的视频帧序列中的所有特征块，若加权相加之后的异常值概率减去加权相加之后的正常值概率得到的差值大于设定阈值，则确定第k帧发生异常事件；其中，k为正整数。
5. 如权利要求4所述的三维卷积神经网络的训练方法，其特征在于，所述将所有包含第k帧的视频帧序列中的所有特征块的异常检测结果中的异常值概率进行加权相加，将包含第k帧的所有视频帧序列中的所有特征块的异常检测结果中的正常值概率进行加权相加之前，还包括：针对所有包含第k帧的视频帧序列中的所有特征块，将第一特征块的的异常检测结果中的异常值概率和正常值概率的权值设置为最大值；其中，所述第一特征块满足以下条件：
其中， L-J 表示向下取整，表示向上取整。
6. -种基于三维卷积神经网络的视频异常事件检测方法，其特征在于，所述三维卷积神经网络中按照正向传递过程依次包含第一组至第N组卷积-采样层，每组卷积-采样层中按照正向传递过程包含一个卷积层和一个采样层，第N-1组卷积-采样层中的采样层与第N组卷积-采样层中的卷积层全连接，N>1 ; 所述基于三维卷积神经网络的视频异常事件检测方法包括：三维卷积神经网络接收待检测视频序列的特征块，针对所述特征块执行异常检测过程，根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件；其中，第N组卷积-采样层中的卷积层上的每个卷积核对第N-1组卷积-采样层中的采样层的所有通道的所有特征图的数据进行卷积，并将通过卷积所得到的特征图信息输出给第N组卷积-采样层中的采样层进行采样处理。
7. 如权利要求6所述的基于三维卷积神经网络的视频异常事件检测方法，其特征在于，所述三维卷积神经网络接收待检测视频序列的特征块之前，还包括：对待检测的第i帧至第i+1帧的视频帧序列进行特征提取，并将所述第i帧至第i+1 帧的视频帧序列切割为RXCX 1的多个特征块；其中，i、1、R、C均为大于1的整数，R和C 分别表示特征块的长度和宽度。
8. 如权利要求6所述的基于三维卷积神经网络的视频异常事件检测方法，其特征在于，所述异常事件检测结果中包括异常值概率和正常值概率；所述根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件，包括：若所述待检测视频序列的特征块中至少有一个特征块满足以下条件，则确定所述待检测视频序列发生异常事件：异常值概率减去正常值概率得到的差值大于设定阈值。
9. 如权利要求7所述的基于三维卷积神经网络的视频异常事件检测方法，其特征在于，所述异常事件检测结果中包括异常值概率和正常值概率；所述根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件，包括：将所有包含第k帧的视频帧序列中的所有特征块的异常检测结果中的异常值概率进行加权相加，将包含第k帧的所有视频帧序列中的所有特征块的异常检测结果中的正常值概率进行加权相加；其中，所述所有包含第k帧的视频帧序列是通过具有1帧时间长度的滑动窗口每次移动单帧得到的；针对所有包含第k帧的视频帧序列中的所有特征块，若加权相加之后的异常值概率减去加权相加之后的正常值概率得到的差值大于设定阈值，则确定第k帧发生异常事件；其中，k为正整数。
10. 如权利要求9所述的基于三维卷积神经网络的视频异常事件检测方法，其特征在于，所述将所有包含第k帧的视频帧序列中的所有特征块的异常检测结果中的异常值概率进行加权相加，将包含第k帧的所有视频帧序列中的所有特征块的异常检测结果中的正常值概率进行加权相加之前，还包括：针对所有包含第k帧的视频帧序列中的所有特征块，将第一特征块的的异常检测结果中的异常值概率和正常值概率的权值设置为最大值；其中，所述第一特征块满足以下条件：
11. 一种基于三维卷积神经网络的视频异常事件检测装置，其特征在于，包括：存储单元，用于被配置以存储三维卷积神经网络的模型的描述信息，所述三维卷积神经网络中按照正向传递过程依次包含第一组至第N组卷积-采样层，每组卷积-采样层中按照正向传递过程包含一个卷积层和一个采样层，第N-1组卷积-采样层中的采样层与第 N组卷积-采样层中的卷积层全连接，N>1 ; 接收单元，用于在正向传递过程中和视频异常事件检测过程中接收待检测视频序列的特征块；检测单元，用于在正向传递过程中和视频异常事件检测过程中针对所述特征块执行异常检测过程，异常事件确定单元，用于在正向传递过程中和视频异常事件检测过程中根据待检测视频序列的每个特征块的异常事件检测结果确定所述待检测视频序列是否发生异常事件；其中，第N组卷积-采样层中的卷积层上的每个卷积核对第N-1组卷积-采样层中的采样层的所有通道的所有特征图的数据进行卷积，并将通过卷积所得到的特征图信息输出给第N组卷积-采样层中的采样层进行采样处理；输出处理单元：在所述反向传递过程中：根据所述正向传递过程的输出结果，在所述三维卷积神经网络中执行反向传递过程，以修正所述三维卷积神经网络的模型参数。
12. 如权利要求11所述的装置，其特征在于，还包括特征块生成单元，用于对待检测的第i帧至第i+1帧的视频帧序列进行特征提取，并将所述第i帧至第 i+1帧的视频帧序列切割为RXCX1的多个特征块；其中，i、1、R、C均为大于1的整数，R 和C分别表示特征块的长度和宽度。
13. 如权利要求11所述的装置，其特征在于，所述异常事件检测结果中包括异常值概率和正常值概率；所述异常事件确定单元，具体用于：若所述待检测视频序列的特征块中至少有一个特征块满足以下条件，则确定所述待检测视频序列发生异常事件：异常值概率减去正常值概率得到的差值大于设定阈值。
14. 如权利要求12所述的装置，其特征在于，所述异常事件检测结果中包括异常值概率和正常值概率；所述异常事件确定单元，具体用于：将所有包含第k帧的视频帧序列中的所有特征块的异常检测结果中的异常值概率进行加权相加，将包含第k帧的所有视频帧序列中的所有特征块的异常检测结果中的正常值概率进行加权相加；其中，所述所有包含第k帧的视频帧序列是通过具有1帧时间长度的滑动窗口每次移动单帧得到的；针对所有包含第k帧的视频帧序列中的所有特征块，若加权相加之后的异常值概率减去加权相加之后的正常值概率得到的差值大于设定阈值，则确定第k帧发生异常事件；其中，k为正整数。
15.如权利要求14所述的装置，其特征在于，所述异常事件确定单元，还用于：针对所有包含第k帧的视频帧序列中的所有特征块，将第一特征块的的异常检测结果中的异常值概率和正常值概率的权值设置为最大值；其中，所述第一特征块满足以下条件：
【文档编号】G06K9/46GK104281858SQ201410469780
【公开日】2015年1月14日申请日期:2014年9月15日优先权日:2014年9月15日
【发明者】田永鸿, 史业民, 王耀威, 黄铁军申请人:中安消技术有限公司, 北京大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：田永鸿;史业民;王耀威;黄铁军
技术所有人：中安消技术有限公司;北京大学
我是此专利的发明人

上一篇：一种信息显示方法及客户端的制作方法
上一篇：基于深度文档分析的主动知识指导的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。