复杂场景下的人群计数算法探讨

日期：2022年03月04日编辑：ad201107111759308692 作者：无忧论文网点击次数：543

论文价格：150元/篇论文编号：lw202202222215053714 论文字数：33666 所属栏目：计算机应用论文

论文地区：中国论文语种：中文论文用途：硕士毕业论文 Master Thesis

本文是一篇计算机应用论文，本文对人群计数的主流计数进行研究，介绍了人群计数的国内外研究现状，从传统人群计数算法：从基于检测的方法到基于回归的方法分析了人群计数算法对于特征的提取发展历程，自从将卷积神经网络引入人群计数着重研究了深度学习对人群计数的优越性。其主要表现在于能够对大量的数据进行有效的特征提取，具有模型训练周期较短且模型效果较优的结果。同时，对于当下分析了人群计数仍然面临的困难和挑战。

第一章绪论

1.1 研究背景及意义

世界人口伴随着世界经济的大规模、迅速的崛起而爆炸式的增长，估计特定静态图像中的人群计数已成为研究人员日益关注的焦点。随着计算机视觉领域的快速发展，人们探索了更多的人群计数和人群分析方法，以缓解爆炸性的人口和社会经济增长所造成的人群拥挤。据联合国预计在本世纪末，世界人口最终会达到 112 亿，人口的巨量增加，带给社会各方向的压力和社会问题也会相对应的增加，城市日常生活中大规模的游行也会变多，城市空间会变得更加拥挤，城市交通也会变的更加拥堵，在大型活动中的人群会更加聚集，更容易造成人员的意外伤亡。真实发生的在过去的 2014 年上海外滩发生了严重的群众踩踏事件，群体踩踏事故直接导致了 35 个鲜活的生命离开了世界，43 人因此而受伤。除了如图 1-1 所示的类似的踩踏事故，在一些公共场所，还会出现群众聚众闹事，非法聚众游行等各种各样无法事先预料的突发事件，这些群众聚集活动严重影响了社会秩序和安定。但是随着安保力度的加大和视频监控设备的普及，因人群聚集而造成的人员伤亡慢慢的减少，治安情况也因此也得到的很大的改善。然而，视频监控设备的体量巨大，安保人数的有限，在大数据的背景下，视频监控数据规模空前巨大，每时每刻产生新的数据需要处理，因此人为的进行视频设备监控的方法在这个背景下不能够有效的响应，也无法做到实时定点定位。由此在这个背景下，近些年，如何精确的估计一个场景中的人数慢慢受到学术界的研究人员关注。

计算机应用论文参考

1.2 本课题研究背景和国内外研究现状

1.2.1 研究背景

人群计数作为计算机视觉任务中一个重要任务，在复杂的现实背景下获得一个场景中的人群信息有助于了解或监视场景，检测场景中异常群体行为的发生，并能够及时做出警告，可以为公共调度优化方案提供直接性质的指导。因此出于公共安全目的的人群计数分析至关重要。但是由于在现实场景中存在严重的前景遮挡，人头比例变化，场景透视和人群分布不均等很多现实问题，为了克服这些障碍，多年来研究人员一直在探索对现实有效的人群计数理论和方法。现有的人群计数算法所依赖的因素可以概括为整体的，基于局部的或基于直方图的特征[11]，并且有些方法是在像素级别、人群单个对象，纹理特征或者是全局特征上操作。传统的方法包括基于检测的计数，基于聚类的计数和基于回归的计数，分别的对于基于检测的计数它的核心思想在于通过在一个图像场景中检测每一个行人，最终累加每个检测到的人数得出最终的人群计数，对于基于聚类的计数它的核心思想是沿用了目标跟踪的方法，假设每一个行人的轨迹和它的主要特征是明显的且相对均匀的，最后累加检测到人数，对于基于回归的计数它的核心在于继承前两者的思想对检测到人数进行累加。这些方法主要来源于数字图像处理理论为特征提取开辟了一条新的道路。在此期间，建立了一些专门的数据集来实现人群计数任务，边缘检测方法成为了当时人群计数分析的关键点。此后 V.Lempitsky[12]等人将密度估计引入人群计数以提取图像特征，从而大大提高了人群计数的准确性，它的成功在于密度估计专注于映射人群图像并计算图像中每个像素代表的人数。从那时候起，研究人员开始使用神经网络进行人群计数和密度估计新的深度学习算法。与传统方法相比，基于密度估计的计数具有更准确的效果，并且可以有效避免显式检测每个人并获得不断重新获得对人群进行定位的能力。

近年来，基于卷积神经网络（CNN）的计数算法已成为研究的趋势，并且提出了在这一领域拓展新的具有挑战性的数据集。与其他具有机器学习功能的任务一样，如今，新的计数算法也得到了快速更新，目的是实现较小的计算误差，在基准数据集上生成具有更高质量的密度图并获得最新的性能，这些近年来的深度学习算法也给本文的研究打下了夯实的基础。

第二章基于卷积神经网络的人群计数算法相关内容

2.1 卷积神经网络

卷积神经网络是由不同卷积层和隐藏层组成，网络通过不断地调整卷积层与卷积层之间地权重关系使得网络能够对于特定的任务进行权重分配学习，这种方式很像人类以及动物的神经系统对特定的认知事物的学习方式，在训练过程中可以进行分布式以及并行化的处理“日常”事物。如图 2-1 人工神经网络所示，网络由很多神经元组成。

计算机应用论文怎么写

1962 年，Hubel 和 Wiesel[45]首次提出感受野的概念，它的提出对于神经网络进一步发展具有重要的推进作用。所谓感受野，直观的解释就是，每一张特征图的一个点对应于输入图片上的某一个区域，而且因为存在深度特征和浅层特征，所以对应的区域可以重复，不过会存在大小的区别，这个概念在后来被称为卷积网络的原型。而到了 1989年，Lecun 等人通过反向传播算法结合了权重共享的机制，卷积网络由此问世了，并首次成功应用于邮局手写字符体识别应用算法中，并在一定程度上降低了邮局的人工成本，并在 1998 年，LeN et-5[46]被提出，并再一次成功应用于字符体识别应用中并且再次提高了识别的准确率。

2.2 几种经典的卷积神经网络模型

2.2.1 深层卷积网络

Visual Geometry Group(VGG)是 Oxford[47]提出的，主要的工作就是提出了两种不同结构的网络模型，从大量的实验证明该模型有能够高效的提取特征的能力，提出的模型一个是 VGG-16,还一个是 VGG-19，两者的区别在于深度不一样。但是对于其他网络结构，VGG 的改进在于在卷积层中采用了几个连续的 3x3 的卷积核代替原先网络使用的11x11,7x7 或者是 5x5 的这种较大卷积核，使用小的卷积核代替的优点在于，在网络卷积的过程中能够拥有更多的激活函数，具有更丰富的非线性表达能力从而有更强大的辨别能力。此外，单从卷积核大小来看，3x3 的卷积核本身就可以拥有 8 个方向的特征变化，所以完全能够胜任大卷积核的操作任务，如此将几个 3x3 堆叠起来，三个 3x3 的小卷积核就和一个 7x7 的卷积核就很类似，网络的深度也因此而增加了两层，以此而得到多出了两个非线性层，使得网络的非线性可能以及多样性更大以及扩大了网络的容量，对于类别量多的任务的区别能力也越强；另一方面卷积层的参数因为卷积核变小的原因而相对应的减少；最后小卷积代替大卷积核的正则作用也有带来提升。

2.2.2 生成对抗网络

生成对抗网络（Generative Adversarial Network，GAN），最初是由 Ian Goodfellow[48]在 2014 年提出的机器学习架构。GAN 是一种非监督学习，但是它又在此基础之上做了一定的提升。而普通的监督式学习，指的是有大量人为预先标定的图片数据或者标签数据，使得模型通过训练这部分数据指导模型预测偏向标签的一个学习过程。但是对于非监督式学习就不需要预先人为设置很多标定工作，非监督式学习可以从学习错误知识而进行自我改进，并且能够降低接下来工作出错的概率。如图 2-6 生成对抗网络示意图所示，GAN 包括了两个独立的网络模块，第一个模块是网络的生成模型（Generator, G），是用于在网络训练阶段生成一些随机样本供网络训练，第二个模块则是网络的判断模块（Discriminator, D），也可以称之为分类器，用于区别从生成模型生成的图像样本或其他数据是真实的概率还是虚假的概率，直观的解释就是 G 接收一个随机噪声 z，通过这个噪声生成随机样本，记作 G（z），D 则是扮演着一个“警官”的角色，将由 G 生成的 G（z）进行一个判断，假若 D 输出的概率越接近于 1，那么生成样本 G（z）就是真实的，反之 D 的输出越接近于 0，则生成样本 G（z）就是虚假的。

第三章基于特征自学习多尺度残差生成对抗人群计数算法 ............................ 20

3.1 引言 .................................... 20

3.2 特征自学习 ................................. 20

3.3 多尺度残差损失 ............................... 21

第四章基于通道空间注意力特征融合人群计数算法 ......................... 31

4.1 引言 ...................................... 31

4.2 空洞卷积 ......................... 31

4.3 注意力模块 .............................. 32

第五章基于混合损失通道空间注意力特征融合人群计数算法 ....................... 41

5.1 引言 .................................... 41

5.2 迁移学习 .................................. 41

5.3 混合损失 ........................................