本发明涉及计算机视觉,具体为一种应用于监控设备的行为识别方法。
背景技术:
1、
2、现有技术中,时空卷积神经网络(3d-cnn)是一种基于2d卷积神经网络(cnn)的模型,它可以处理时序视频数据,并在时空域上执行卷积操作。它要求输入视频序列的长度相同,因此不适用于实时视频流,而且需要较大的计算资源和内存来处理视频数据。长短时记忆网络(lstm)是一种循环神经网络,可以对时序数据进行建模,并通过记忆单元来处理长时间依赖关系,在处理动态场景时表现优异,但存在网络参数量较大的问题。
技术实现思路
1、本发明的目的在于提供一种应用于监控设备的行为识别方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种应用于监控设备的行为识别方法,所述行为识别方法包括以下步骤:
3、步骤1:获取数据集;
4、步骤2:视频预处理和数据增强;
5、步骤3:网络搭建;
6、步骤4:网络训练;
7、步骤5:网络测试;
8、步骤6:量化;
9、步骤7:模型部署。
10、优选的,获取数据集时,获取监控设备记录下的多个盗窃视频,包含偷窃和商店盗窃或更多其他盗窃种类,使用视频剪辑工具,基于25fps的采样率,选择出最能代表盗窃行为的10秒长的视频片段保存,作为数据集中的盗窃类的视频。
11、优选的,视频预处理和数据增强时,统一所有视频片段的采样率和尺寸。
12、优选的,网络搭建时,通过将视频分解为一系列的图像帧,并将每帧作为cnn的输入,输出一系列特征向量,然后使用rnn层对提取出的特征序列进行处理完成分类。
13、优选的,网络训练时,使用步骤2处理后的训练集和验证集,与步骤3得到的模型进行训练。
14、优选的,网络测试时,对步骤4训练后的网络在测试集上进行测试,评估模型性能,确定可以量化的模型。
15、优选的,量化时,将步骤5得到的模型导出生成onnx模型文件,然后根据要使用的硬件,使用相应的软件库对onnx模型进行int8量化。
16、优选的,模型部署时,将步骤6得到的量化后的模型,生成c语言代码文件,部署到嵌入式开发板。
17、与现有技术相比,本发明的有益效果是:
18、本发明提出的应用于监控设备的行为识别方法,使用的mobilnetv2网络和gru单元的参数量和计算量低,保证精度的前提下减少了边缘设备的推理时间,方便在监控设备上实时对盗窃动作进行快速识别。
1.一种应用于监控设备的行为识别方法,其特征在于:所述行为识别方法包括以下步骤:
2.根据权利要求1所述的一种应用于监控设备的行为识别方法,其特征在于:获取数据集时,获取监控设备记录下的多个盗窃视频,包含偷窃和商店盗窃或更多其他盗窃种类,使用视频剪辑工具,基于25fps的采样率,选择出最能代表盗窃行为的10秒长的视频片段保存,作为数据集中的盗窃类的视频。
3.根据权利要求2所述的一种应用于监控设备的行为识别方法,其特征在于:视频预处理和数据增强时,统一所有视频片段的采样率和尺寸。
4.根据权利要求3所述的一种应用于监控设备的行为识别方法,其特征在于:网络搭建时,通过将视频分解为一系列的图像帧,并将每帧作为cnn的输入,输出一系列特征向量,然后使用rnn层对提取出的特征序列进行处理完成分类。
5.根据权利要求4所述的一种应用于监控设备的行为识别方法,其特征在于:网络训练时,使用步骤2处理后的训练集和验证集,与步骤3得到的模型进行训练。
6.根据权利要求5所述的一种应用于监控设备的行为识别方法,其特征在于:网络测试时,对步骤4训练后的网络在测试集上进行测试,评估模型性能,确定可以量化的模型。
7.根据权利要求6所述的一种应用于监控设备的行为识别方法,其特征在于:量化时,将步骤5得到的模型导出生成onnx模型文件,然后根据要使用的硬件,使用相应的软件库对onnx模型进行int8量化。
8.根据权利要求7所述的一种应用于监控设备的行为识别方法,其特征在于:模型部署时,将步骤6得到的量化后的模型,生成c语言代码文件,部署到嵌入式开发板。