(1)提出了一种基于迁移学习的无监督细粒度图像分类模型,该模型是一种两分支神经网络构造的孪生网络。采用两阶段训练策略,第一阶段使用有监督方式预训练基础网络,使模型快速学习到细粒度图像的通用特征;第二阶段通过搜索引擎扩充数据集,并采用无监督方式微调模型以实现知识迁移。该方法可以作为一种通用的数据扩充和性能提升模块。与主流模型 Bilinear CNN、WebData 以及 L2SP 相比,实验结果表明孪生网络分类模型具备较高准确率,在细粒度数据集 Stanford Car 和 Aircraft 上能够达到 91.9%和 90.2%的平均准确率。
(2)提出了一种基于领域适应的容器相似性细粒度图像分类模型,该模型采用容器相似性来测量和选择与目标细粒度数据集相似的源领域数据集,被选中的源数据集实现了对目标任务数据集的扩充。选择 ImageNet 和 iNat 作为源域,将特征空间划分出多个容器,通过统计量计算出源域和细粒度领域之间的相似度。选择相似领域的过程相当于为细粒度图像识别任务扩充数据,从而将相似领域上获得的知识迁移到细粒度识别任务上来。与主流模型 EMD、SJFT 以及 L2SP 相比,实验结果表明容器相似性分类模型能够在细粒度数据集 Stanford Dog 和Oxford Flower 上达到 86.6%和 98.4%的平均准确率。
参考文献(略)