计算机应用论文栏目提供最新计算机应用论文格式、计算机应用硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于度量学习的小样本图像分类探讨

日期:2024年10月30日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:21
论文价格:150元/篇 论文编号:lw202410282207586969 论文字数:35633 所属栏目:计算机应用论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇计算机应用论文,本文主要研究的是小样本图像分类,这是计算机视觉领域中的一个基本研究范畴和重要研究方向。虽然现在已经进入大数据和互联网高速发展时代,计算机视觉领域也已经取得了令人瞩目的成就,如:人脸识别、垃圾分类、自动驾驶等。

第一章绪论

1.1研究背景及意义

1956年,麦卡锡等科学家召开“达特茅斯会议”,首次提出“人工智能”[1],人工智能学科自此诞生。随后,进入长达20年的黄金时期,取得了一批令人瞩目的研究成果,如:机器定理证明,从此掀起人工智能发展的浪潮。1997年,德国科学家霍克莱特等人提出LSTM递归神经网络[1],该网络至今仍被用于手写识别和语音识别。2012年,多伦多大学在ImageNet视觉识别挑战赛上设计的深度卷积神经网络算法被认为是深度学习革命的开始[3]。2016年,谷歌推出的人工智能程序AlphaGo[4-7]连续击败前围棋世界冠军李世石和现围棋世界冠军柯洁,这曾引发巨大轰动。2023年3月,OpenAI推出ChatGPT的升级版——ChatGPT4[8],它通过了美国律师法律考试,并打败90%的应试者。据《2022-2027年中国人工智能行业需求预测及发展趋势前瞻报告》显示,2024年全球人工智能行业市场规模将达到35137亿元,而我国人工智能市场规模将达4015亿元。人工智能的蓬勃发展离不开国家和政府的支持。自2021年起,我国相继出台《“十四五”软件和信息技术服务业发展规划》,《生成式人工智能服务管理办法》等政策文件和战略规划。由此,与人工智能相关的研究和应用喷涌而出。

计算机应用论文怎么写

1.2国内外研究现状

小样本学习的概念由李飞飞等人[20]于2003年首次提出。受人类大脑学习机制的影响,他们认为机器可以利用过去学习的经验知识对未来的样本进行分类预测。于是,使用变分贝叶斯学习框架在仅有少量样本的情况下对未标注的样本进行分类。近年来,随着深度学习的蓬勃发展,小样本学习再一次走进部分科研工作者的视野并在图像分类任务上取得了显著成效,但仍然存在着很多尚未解决的难题。目前,基于国内外学者的研究方法,本文将小样本学习方法大致分为三类:数据增强、元学习、度量学习。

(1)基于数据增强的小样本学习方法为了缓解由小样本数据训练带来的过拟合问题,有不少研究者采用数据增强的方法完成小样本图像分类任务。顾名思义,数据增强是指根据数据集的特点直接增加图像或者通过挖掘图像间的语义特征来实现图像扩充的方法。通过采用多样的数据增强技术,小样本图像分类问题被转化为一般的图像分类问题。最初,研究者们通过加噪、旋转、平移、裁剪等简单的方式[21]扩充样本。这不仅扩充了训练图像,还能缓解由于样本量少带来的过拟合问题。随着深度学习的持续发展,数据增强的方法也越来越多样化。

(2)基于元学习的小样本学习方法

基于元学习的方法旨在学习“如何学习”[33][34]。元学习方法通常用元学习器指导基学习器学习任务,元学习器会根据不同的任务生成不同的初始化或更新方向。在传统的图像分类中,这些参数一般均是提前设定的。可见,元学习方法自适应性更强。相比于其他小样本学习方法,它更注重学习过程,注重学习人类的比较能力,从而泛化到新类。从逻辑上看,它是一类很有潜力的研究方法。不少研究者在元学习的研究方向上颇有建树。

第二章基本理论与关键技

2.1小样本学习概述

深度学习已经取得了令人瞩目的成就,但这离不开大数据和更深更宽的网络模型。在一些数据稀少或获取困难的实际场景中,深度神经网络往往会出现过拟合的训练结果,这就要求研究者转变思路,探索新的模型结构。而小样本学习的核心就是利用极少量的样本训练模型,并泛化到新类,以在从未见过的类别上获得不错的效果。这或许可以实现由“人工智能”走向“类人智能”。由此,小样本学习是极具研究价值和现实意义的研究方向。

2.1.1问题定义

小样本学习任务分为零样本学习任务、单样本学习任务和小样本学习任务。零样本学习是指机器识别从未见过的图像数据。单样本学习指每个类别给定一张图片进行训练并在新类的图像数据集上完成分类任务。零样本学习和单样本学习可视作小样本学习的特例。本文研究的是小样本学习。

2.1.2情景训练机制

小样本学习的训练样本的数据量极少。采用传统的图像分类策略难免会出现过拟合的情况。Vinyals等人于2016年提出了情景训练机制(Episodic Training Mechanism)。该机制自提出起就被众多小样本学习的研究者广泛使用并沿用至今。同样地,本文也使用情景训练机制来完成训练。本文把训练集分为支持集(Support Set)和查询集(Query Set)。支持集和查询集共享类别标签。在训练过程中,随机选取C个类别,从每个类别中随机选取K个样本构成支持集。类似这样的训练模式本文称之为C-Way K-Shot。从每个类别中的剩余样本中随机选取N个样本作为查询集。

2.2卷积神经网络

深度学习是人工神经网络算法的一种有效实现途径,主要用于处理大规模复杂数据。卷积神经网络(Convolutional Neural Networks,CNN)已经被广泛运用于计算机视觉领域和自然语言处理领域,并取得了出色的性能。其实,它是一类包含卷积操作且结构较深的前馈神经网络(Feedforward Neural Networks)。起初,它源于神经科学领域。在二十世纪六十年代,Torsten等人通过研究猫的初级视皮层,提出了神经元的感受野概念,还首次发现了大脑视觉系统中的神经网络结构。1987年,有研究者提出第一个用于语音识别的卷积神经网络,即时间延迟网络(Time Delay Neural Network,TDNN)[61]。1988年,LeCun等人[62]提出了LeNet网络结构。LeN et问世后,并没有得到人们的广泛关注。2012年,随着AlexNet夺得ImageNet图像分类的比赛冠军后,卷积神经网络开始掀起轩然大波,其热度一直持续至今。

卷积神经网络以局部连接和全局共享的特点而著称。因此,在计算机视觉领域中,通常以卷积神经网络为主,结合注意力机制等深度学习技术进行图像处理。卷积神经网络主要由卷积层、池化层、全连接层三大部分组成。一个网络中,通常有多个卷积层和池化层。卷积层和池化层可以交替使用。

第三章基于注意力机制与权重融合的小样本图像分类算法..........................26

3.1研究动机..................................26

3.2算法描述...........................................27

第四章基于目标定位与特征校准的小样本图像分类算法.......................42

4.1研究动机................................42

4.2算法描述..........................................42

第四章基于目标定位与特征校准的小样本图像分类算法.........................................42

4.1研究动机...........................42

4.2算法描述..................................................42

第四章基于目标定位与特征校准的小样本图像分类算法

4.2算法描述

4.2.1算法结构

本章对当前现存的有关问题进行了深入考虑,并结合图像的特点,提出了基于目标定位与特征校准的小样本图像分类算法。首先,为了减少光照、拍摄角度、背景等冗余信息对小样本图像分类结果的干扰,本模型放大显示图像中的物体部分。于是,就对任务中的所有图像使用显著性检测方法中著名的EGNet模型得到它们各自对应的显著性图。再将得到的显著性图与原始图像结合并放大到与原始图像相同的尺寸就得到了微调后的图像。在特征提取时,采用与第三章中相同的骨干网络Conv4进行特征提取以得到图像的全局特征。由于图像类间差异小,类内差异明显,关注每个图像的判别性特征显得尤为重要。本模型考虑到要缩小同一类别内的样本的距离使得类内样本聚簇,加大类间样本的距离以划清类间的界限。另外,还考虑到查询集样本图像与支持集样本图像之间存在着密切的联系。于是,根据查询集样本图像的特点校准支持集样本图像的特征,提出了特征校准模块。本章借鉴了原型网络中用样本均值表示类原型的方法,在每个任务中,根据查询集样本图像特征与支持集样本图像特征之间距离的远近,为每个查询集样本图像分配了伪标签。由于局部特征比全局特征更具代表性,可以更好地表示图像,本模型以局部描述子为单位,在查询集样本图像特征与其同属一个类别的所有支持集样本图像特征之间进行相似性度量从而得到关系矩阵。关系矩阵中的每个值代表着每个支持集图像特征的局部描述子被分配到的权值。之后再将得到的关系矩阵与支持集图像特征加权求和后得到校准后的支持集图像特征。最后,将查询集图像的特征与各个类别中距离最近的P个支持集图像的特征进行相似性度量得到相似性分数。本模型取得分最高的类别即为查询集图像的预测标签。模型的整体结构图如图4.1所示。

计算机应用论文参考

第五章总结与展望

5.1总结

本文主要研究的是小样本图像分类,这是计算机视觉领域中的一个基本研究范畴和重要研究方向。虽然现在已经进入大数据和互联网高速发展时代,计算机视觉领域也已经取得了令人瞩目的成就,如:人脸识别、垃圾分类、自动驾驶等。但当样本量极少时,却分类效果不佳。这一问题至今未被有效解决且缺少具体的实际应用。本文在基于度量学习方法的基础上研究了针对不同小样本数据集的图像分类算法,主要内容如下:

(1)面对一般的小样本图像