图 5-1 基于多级注意力融合的网络整体框架
...........................
第六章 总结与展望
6.1 总结
细粒度图像分类工作是拓宽计算机视觉方向研究的重要组成部分。针对目前细粒度图像分类面临的问题及瓶颈,本文对细粒度图像分类进行研究。本文设计了基于卷积神经网络的端对端的弱监督学习分类模型,实现对细粒度图像分类精度的提高。本文主要研究焦点在于如何解决细粒度图像中类间差距小、类内差距大以及人工标注成本高等造成的分类误差。本文提出三种不同的卷积神经网络,并在不同的细粒度图像数据集中验证了本文方法的有效性与泛化性,主要内容如下:
1. 基于自注意尺度变换网络的细粒度图像分类方法。为了提高网络提取特征的表现力,本章以 ResNet50 为基础提出自注意尺度变换网络来强化细粒度图像特征提取能力。在自注意力融合模块中,我们压缩了空间和通道两个维度上的信息来辨别各个部位的关键特征,增强了目标的局部特征,获得了强调细节特征的注意力图。在多尺度变换过程中,根据自注意力图模块改善后的裁减放大图像输入网络后,可以将细粒度图像中目标的语义特征和位置、细节信息结合起来,解决由于细粒度图像类间差异小而导致的分类问题。
2. 基于多分支增强的细粒度图像分类方法。针对不同的尺度物体采用相同的网络结构提取的特征显著性低的问题,本章提出以多分支增强的弱监督学习方法,首先采用Inception-V3 网络提取图像基础特征,从中获取多个局部响应区域并进行特征融合,在此基础上采用注意力机制对图像关键区域进行自约束的局部裁剪和局部擦除,避免仅提取目标单个部位的特征,促使网络更加关注目标物体不同部位的细节特征,同时也提升了目标区域定位精度。此外,本章提出中心正则化损失函数来约束训练过程中获取的注意力区域,进一步提升目标定位精度和扩大图像特征的类间差距。
参考文献(略)