第五章 基于混合损失通道空间注意力特征融合人群计数算法
5.1 引言
本节在充分考虑第四章对于人群分布随机性对于模型的预测能力的影响,在基于通道空间注意力特征融合网络中加入混合损失以应对人群分布随机的问题,使得网络能够因为混合损失的加入而对人群分布的问题更加鲁棒获得更加的预测能力。 因此本文的网络结构类似于第四章,对于网络的前端部分继续沿用前十层的深度特征提取网络,网络的中间部分加入了通道空间注意力模块,为了网络能够融合通道和空间特征,网络的后端部分因为空洞卷积在人群计数的优秀性能就继续沿用了 7 层空洞卷积层。与之前同的地方在于,网络初期的参数初始化对于前端十层深度特征提取网络使用了预训练权重参数,其余的参数仍以随机的形式给出;在网络训练阶段使用不同超参数的混合损失函数使得网络能够对于不同人群分布不均匀的场景中有不同的混合损失适应条件,使得网络对于人群离散点更加鲁棒。
迁移学习(Transfer Learning)具体的讲是将一个领域的知识运用迁移学习技术应用到另一个任务中的一种工作过程,这使得当前任务并不需要大量的数据集和花费巨额的时间代价让网络模型去学习一个比较复杂的权重矩阵。例如在一个分类任务中,当前的任务分类从属于或不属于当前最大的 Imagenet 分类集里面的分类,但是由于 Imagenet的源数据丰富,可以通过迁移学习特定特征层的预训练权重矩阵加入到自己提出的网络模型中去,这可以极大的缩短前期任务的耗时和提高模型的精度。怎样高效的利用迁移学习将会是下一阶段机器学习在人工智能领域的巨大驱动力。
总结与展望
论文工作小结 人群计数一直都是一个对于现实很有应用价值又存在仍未解决难题的研究课题。本文针对不同复杂场景下的人群计数问题展开,具体分析了现阶段人群计数存在的挑战,因此本文从不同角度出发,提出了新的网络模型 FSLGAN、CSAN 和 HLCSAN。本文的具体工作如下:
(1)本文对人群计数的主流计数进行研究,介绍了人群计数的国内外研究现状,从传统人群计数算法:从基于检测的方法到基于回归的方法分析了人群计数算法对于特征的提取发展历程,自从将卷积神经网络引入人群计数着重研究了深度学习对人群计数的优越性。其主要表现在于能够对大量的数据进行有效的特征提取,具有模型训练周期较短且模型效果较优的结果。同时,对于当下分析了人群计数仍然面临的困难和挑战。
(2)从卷积神经网络出发,介绍了卷积神经的由来以及详细介绍了卷积神经网路的构成,并且介绍了几种经典的卷积神经网络模型,为后续人群计数模型的设计提供理论依据,最后介绍了本文使用的人群数据集和模型的评价标准。
(3)本文在 GAN+VGG 网络模型的基础之上展开研究,通过对该模型及其变形模型的充分认识,本文在第三章针对 GAN 模型在人群计数的不足,通过研究分析特征自学习模块,提出了新的网络模型 FSLGAN。新模型具有减少信息冗余和更准确的特征提取方式的优点,同时对尺度多变、分布不均等变化具有良好的鲁棒性。
(4)本文针对第三章针对模型训练周期过于长的不足以及没有考虑空间信息层,在基于 CSRNet 模型的基础上,通过研究分析通道空间特征注意力机制的定义与优势,提出了 CSAN 网络模型,并经过大量的实验,证明该网络模型可以在训练周期更少的情况下,可以进一步提高人群计数模型的预测能力。
参考文献(略)