一种拥挤区域的确定方法和装置的制造方法_2

文档序号:9911698阅读:来源:国知局
大。而且,拥挤区域和非拥挤区域的估计结果准确, 为人群拥挤度分析算法提供准确的基础,使得人群拥挤度分析算法可以在执法、城市规划、 交通管理中得到更好的应用。
【附图说明】
[0036] 图1是本发明一种实施方式中的拥挤区域的确定方法的流程图;
[0037] 图2是本发明一种实施方式中的基于CNN的网络构造示意图;
[0038] 图3是本发明一种实施方式中的图像处理设备的硬件结构图;
[0039]图4是本发明一种实施方式中的拥挤区域的确定装置的结构图。
【具体实施方式】
[0040] 在本申请使用的术语仅仅是出于描述特定实施例的目的,而非限制本申请。本申 请和权利要求书中所使用的单数形式的"一种"、"所述"和"该"也旨在包括多数形式,除非 上下文清楚地表示其它含义。还应当理解,本文中使用的术语"和/或"是指包含一个或多个 相关联的列出项目的任何或所有可能组合。
[0041] 应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这 些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离 本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第 一信息。取决于语境,此外,所使用的词语"如果"可以被解释成为"在……时"或"当……时" 或"响应于确定"。
[0042] 针对现有技术中存在的问题,本发明实施例中提出一种拥挤区域的确定方法,该 方法可以应用在视频监控系统的图像处理设备上,该图像处理设备用于分析待测试图像中 的各个区域是否为拥挤区域。其中,图像处理设备可以是采集到待测试图像的前端设备(如 模拟摄像机、网络摄像机、编码器等),也可以是从前端设备获得待测试图像的其它设备(如 管理服务器、计算机等),所有用于分析待测试图像中的各个区域是否为拥挤区域的设备均 在保护范围之内。在上述应用场景下,如图1所示,该拥挤区域的确定方法包括以下步骤:
[0043] 步骤101,针对待测试图像的每个像素点,生成K个不同尺度的待测试子图像,该待 测试图像是指需要分析各个像素点是否为拥挤区域的图像。
[0044] 其中,在获得待测试图像之后,需要分析待测试图像的每个像素点是否为拥挤区 域,各像素点的分析过程相同,以一个像素点为例进行说明。
[0045] 为了分析该像素点是否为拥挤区域,首先生成包含该像素点的K个不同尺度的待 测试子图像,这K个不同尺度的待测试子图像均可以以该像素点为中心。例如,生成包含该 像素点的尺度为78*62的待测试子图像1,包含该像素点的尺度为117*93的待测试子图像2, 包含该像素点的尺度为156*124的待测试子图像3。本发明实施例的后续步骤,将利用待测 试子图像1、待测试子图像2和待测试子图像3,分析出该像素点是否为拥挤区域。
[0046] 步骤102,针对每个待测试子图像,按照预设大小在待测试子图像上进行滑动;针 对每个滑动窗口进行特征提取,得到第一特征向量,并将第一特征向量聚类到对应的单词, 并统计聚类到每个单词的第一特征向量数量;利用聚类到每个单词的第一特征向量数量计 算待测试子图像的第一概率向量。
[0047] 其中,预设大小需要小于待测试子图像的大小。
[0048] 在一种可行方式中,针对每个滑动窗口进行特征提取,得到第一特征向量的过程, 具体可以包括但不限于如下方式:利用CNN(Convolutional Neural Network,卷积神经网 络)对每个滑动窗口进行特征提取,得到第一特征向量。
[0049]每个待测试子图像的处理相同,以待测试子图像1的处理进行说明,假设预设大小 为39*31,按照39*31在待测试子图像1上进行滑动,得到多个滑动窗口。利用CNN针对每个滑 动窗口进行特征提取,得到第一特征向量。
[0050] 如图2所示,为基于CNN的特征提取的网络构造示意图,在通过CNN对待测试子图像 进行特征提取时,可得到具有尺度不变的第一特征向量,从而更好的表征待测试子图像的 特征。在图2中,CNN是以两个卷积层和两个池化层为例,实际应用中,卷积层的数量和池化 层的数量还可以为其它数值。在一种优选的实施方式中,卷积层的数量可以为4,池化层的 数量可以为3。
[0051] 如表1所示,为利用CNN对待测试子图像进行特征提取,得到第一特征向量的过程, 假设待测试子图像1是一个大小为78*62的图像,而预设大小(即实际检测窗口)为39*31,则 实际检测窗口与待测试子图像的大小比例相同或者相似,从而保证待测试子图像的清晰 度,保证特征提取的准确性。
[0052] 表 1
[0053]
[0054]在Layer 0(第0层,即输入层),1(39,31)表示的就是该大小为39*31的滑动窗口。 在Layer 1 (第1层,即第一层卷积层),CR( 1,20,4,4)中的(4,4)表示一个4*4的卷积核,该4* 4的卷积核中包含16个数值,这16个数值的大小可以根据实际需要任意配置,20表示卷积核 的数量,即一共使用20个4*4的卷积核,1表示滑动的步长。在Layer 1的处理为:针对每个4* 4的卷积核,利用该4*4的卷积核对39*31的滑动窗口的一个4*4位置进行卷积,得到一个卷 积特征,以步长1在滑动窗口上进一步依次滑动4*4的卷积核,得到下一个卷积特征,以此类 推。在对20个4*4的卷积核均经过上述处理后,得到多个卷积特征,这些卷积特征,构成第一 层卷积特征。
[0055] 在利用4*4的卷积核对39*31的滑动窗口的一个4*4位置进行卷积之后,还可以使 用激励函数对卷积特征进行优化,如可以使用ReLU(Rectified Linear Units,整流线性单 元,即激活函数)函数对卷积特征进行优化,而ReLU函数具有更好的拟合性。通过使用ReLU 函数优化卷积特征,可以使得第一层卷积特征中的小于〇的卷积特征被置〇,而大于〇的卷积 特征保持不变。
[0056] 在Layer 2(第2层,即第一层池化层),P(2)表示对第一层卷积特征进行池化处理, 得到的第一层池化特征。其中,可以利用如下公式对第一层卷积特征进行池化处理,
,其中,S表示对应的池化处理时的窗口大小(s*s),m和η均为 设定的数值,j和k为第一层卷积特征,i表示针对第i个待测试子图像。池化层的作用是保持 特征不变性。
[0057]针对Layer 3 (第3层,即第二层卷积层)、Layer 5 (第5层,即第三层卷积层)、Layer 7(第7层,即第四层卷积层),其相关处理与Layer 1相同,在此不再赘述。针对Layer 4(第4 层,即第二层池化层)、Layer 6(第6层,即第三层池化层),其相关处理与Layer 2相同,在此 不再赘述。
[0058] Layer 8(第8层,即全连接层),用于将Layer 7输出的第四层卷积特征进行全连接 处理,得到一个特征向量,这个特征向量就是通过CNN对滑动窗口进行特征提取时得到的第 一特征向量,如一个240维的特征向量。
[0059] 在针对滑动窗口进行特征提取之后,可以得到多个第一特征向量,并将每个第一 特征向量聚类到对应的单词,其中,针对将第一特征向量聚类到对应的单词的过程,可以采 用k-means(硬聚类算法)将第一特征向量聚类到对应的单词。其中,可以预先配置N个单词 (word),每个单词为一个聚类中心。在得到第一特征向量之后,分别计算第一特征向量与每 个单词之间的欧氏距离,并选择欧氏距离最小的单词作为第一特征向量对应的单词,并将 该第一特征向量聚类到该对应的单词。例如,预先配置单词1、单词2和单词3,当前得到的 240维的第一特征向量与单词1之间的欧氏距离最小,则将第一特征向量聚类到单词1。进一 步的,每次滑动就得到一个第一特征向量,假设滑动次数为15次,则可以得到15个第一特征 向量,假设有10个第一特征向量聚类到单词1,有4个第一特征向量聚类到单词2,有1个第一 特征向量聚类到单词3,则统计聚类到单词1的第一特征向量数量为10,聚类到单词2的第一 特征向量数量为4,聚类到单词3的第一特征向量数量为1。
[0060] 利用聚类到单词1的第一特征向量数量10、聚类到单词2的第一特征向量数量4、聚 类到单词3的第一特征向量数量1,可以计算出待测试子图像1的第一概率向量。在按照上述 方式对待测试子图像2、待测试子图像3进行处理后,可以计算出待测试子图像2和待测试子 图像3的第一概率向量。
[0061] 本发明实施例中,利用聚类到每个单词的第一特征向量数量计算待测试子图像的 第一概率向量的的过程,具体可以包括但不限于如下方式:利用
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1