计算机论文范文栏目提供最新计算机论文范文格式、计算机论文范文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于生成对抗网络的图像超分辨率重建探讨

日期:2024年06月20日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:96
论文价格:150元/篇 论文编号:lw202406041121529951 论文字数:32566 所属栏目:计算机论文范文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇计算机论文范文,本文对超分辨率重建技术进行了归纳和总结,简要介绍了基于传统的超分辨率重建技术和基于深度学习的超分辨率重建技术。

第一章绪论

1.1研究背景及其意义

生活中的图像可以分为两类:低分辨率图像(LR)和高分辨率图像(HR)。这两者本质上的区别在于图像中像素点的数量和密度。高分辨率图像较低分辨率图像有更多的像素点,更高的像素密度。高分辨率图像可以给人带来更愉悦的视觉观感,其携带的信息量更多。高分辨率图像虽然好,但可能因硬件设备的限制或环境噪声等因素的影响下而获取困难。

获得更高分辨率图像最有效的方法是提高成像设备的成像能力,如增加成像设备感光器件的像素密度或感光器件的尺寸、增加图像采集过程传感器的数量。在硬件层面上来提高设备的成像能力,尽管可以简单快捷地提高采集到的图像质量,但这将会导致设备中采用的感光元件的数量和技术有更高的要求,因而在现实项目中将会使成本预算大幅提高,不利于商业应用及普及。

为此,致使诸多学者开始聚焦软件技术以求能在硬件条件有限的情况下获得更高分辨率的图像,图像超分辨率技术(SR)由此诞生。图像超分辨率技术旨在从各种因素导致退化的一张或多张低分辨率图像重建出对应的一张或多张高清图像。图像的超分重建本质上是一个不适定问题,无法获得一个确定的解。图像超分技术可以在硬件条件有限的情况下获得更高的分辨率,这使得其在诸多领域得以应用。

在医学成像领域[1],计算机断层(CT)、核磁共振(MIR)、超声成像(US)可以更好的辅助医生对病情的诊断,但因医学设备成像能力的瓶颈和这些技术的局限性(如CT是辐射成像,为了病人身体一般采用低剂量辐射;MIR的核磁共振不能过强不然容易损伤病人的内脏;US中的超声会被人体吸收而分散)而使得采集的图像分辨率较低,而超分辨率技术可以提高这些医学图像的分辨率,给医生提供更高清的病理图像,有助于医生发现细微病灶。因此,超分技术在医学成像领域具有广阔的应用场景,极具研究意义。

1.2图像超分辨率的研究现状及存在的问题

1.2.1图像超分重建研究现状

图像超分技术研究最早可追溯到上世纪60年代[6,7],但由于受到噪声的影响导致提出的各种重建模型都难以有效应用。直到1984年Tesai和Huang[8]提出了一种频域中处理超分辨率重建的方法,该方法利用多幅图像之间存在的冗余信息进行信息互补,在频域中补充各部分的细节信息后生成单幅高分辨率图像,相较之前的超分方法,该方法增加了先验信息的利用,因而取得了更好的图像重建效果。随着时代和科技的发展,计算机运算能力极大提高,许多基于机器学习算法的超分重建模型相继被提出,这些模型通过对图像数据集样本进行学习,利用学习到的样本先验知识来重建图像。

按照重建原理的不同,图像超分辨率重构方法主要分为三类:基于插值[9,10]、基于重建[11~13]和基于学习[14~17]。基于插值的方法简单,但其重构出的图像细节模糊,无法还原出丢失频率。主要代表算法有:最近邻插值法、双线性插值法、双三次插值法等。基于重建的方法局限性大,这类方法大部分通过一组高度相关的高清图像序列进行重构,其模型参数难以估计,当使用场景无法提供足够的信息时,重建过程将格外困难。主要代表算法有:凸集投影法[18]、迭代反投影法[19]和最大后验估计法(MAP)[20]等。

Dong等人[21]首次将神经网络应用于图片超分领域并提出SRCNN(Super-Resolution Convolutional Neural Network)算法,该算法利用双三次插值将图像放大,然后利用三层卷积网络提取图像特征,再经非线性激活函数激活以此拟合非线性映射,最后将提取的特征聚合重建出高分辨率图像并输出。相较其他方法,基于神经网络的超分辨率方法有着更为优越的性能。自此,基于深度学习的超分算法的研究开始火热起来。目前,基于深度学习的超分算法研究主要是构建高效神经网络,以便能对LR图像还原出细节纹理清晰的高清图像。

第二章相关理论知识介绍

2.1基于传统的超分重建方法

2.1.1基于插值的超分辨率方法

基于插值的超分辨率方法有最近邻插值法、双线性插值法和双三次插值法[37]。这些插值算法根据待插入像素点邻近处多个已知像素点来通过某种算法或策略来估计出待插入像素点的数值。基于插值的超分辨率方法由于算法简单,运行速度快,在多个领域内曾有广泛地应用。

表1列出了这三种插值算法的优缺点,最近邻插值算法简单,但重建后的图像模糊,容易产生严重的图像失真,其原因在于最近邻插值在插值时往往直接四舍五入,选用最近的像素点的值作为插入值,这就易于产生误差。插入值因该由插入点附近四个真实点来联合确定,双线性插值就充分利用了插入点四周四个真实点来联合确定,虽然重建效果相较最近邻插值有所提高,但重建图像依然有锯齿和模糊现象。双线性插值计算插入点是根据周围四个点和它们的距离比例来计算的,并未考虑周围点的权重关系。双三次插值算法选用了插入点周围16个像素点来计算插入值,由它们的位置关系来计算各点的权重关系,联合确认插入值。双三次插值重建效果在三者中最好,但其计算复杂度太高,造成效率低下。

计算机论文范文怎么写

2.2深度学习理论基础

深度学习一般定义为通过训练多层神经网络对目标数据进行分类或回归。深度学习的基本思想是构建多层神经网络,好对目标进行多层表示。数据经过多层神经网络的特征提取获得高层特征,将对数据的抽象语义信息进行详细表示,这将使得构建的网络拥有良好的鲁棒性。深度学习主要是受到人工神经网络和反向传播算法的提出和发展促进的。深度学习最初受限于计算机的算力,但随着计算机能力特别是GPU的算力的提升使得深度学习成为现今乃至未来一段时间的研究热点。本节将详细介绍深度学习领域中的基础知识。

神经网络起源于对人脑中神经系统的模拟,最初的神经网络模型受限于当时的算力限制,神经网络的网络层数和神经元的个数都较少。随着GPU算力的提升,现今神经网络模型的层数和神经元个数可以达到几百上千。神经网络的网络结构主要可以分为输入层、输出层和隐藏层。隐藏层一般有多个网络层,对于使用者来说一般不可见。在图2.2中,其左边为神经元结构,右边为由多个神经元组成的多层神经网络。对一个神经元来说,当输入数据为(x1,x2,x3),相应的权重为(w11,w12,w13),此时经过神经元激活后的输出y=f(w11*x1+w13*x3+w12*x2)。

计算机论文范文怎么写

第三章 基于坐标注意力生成对抗网络的超分辨率重建 .................... 23

3.1 引言 ....................... 23

3.2 基本模型和方法 .................... 23

第四章 基于多尺度注意力机制的超分重建模型 .............. 37

4.1 引言 .............................. 37

4.2 网络框架 ..................... 37

第五章 总结与展望 ......................... 51

5.1 本文工作总结 ............................. 51

5.2 研究展望 ................................ 52

第四章基于多尺度注意力机制的超分重建模型

4.2网络框架

本文在CSRGAN的基础上结合ESRGAN和多尺度网络的优点,提出了基于多尺度注意力机制的超分重建模型(MFCSRGAN)。本文在CSRGAN的基础上将其基础模块CR模块进行了优化,结合密集连接、残差网络、多尺度网络和CBAM注意力机制构造了MFCR模块。多尺度网络的设计主要是通过增加和分解不同大小的卷积核,利用不同大小的卷积核获得不同大小感受野下的特征信息,增加特征多样性。由于ESRGAN重建的图像在清晰度方面一直不错,本文在MFCR模块内增加了密集连接。参照CBAM注意力机制,在坐标注意力机制后增加了一个空间注意力机制,坐标注意力机制本质是一种通道注意力机制,但更关注于特征图的长距离依赖关系,忽略了特征图内的一些空间信息,而空间注意力机制可以使得网络更关注于重要的空间区域,对于细节的重建更为有效。

计算机论文范文参考

第五章总结与展望

5.1本文工作总结

随着深度学习的不断发展,各种深度学习模型相继在计算机视觉领域被应用。图像超分辨率重建作为计算机视觉的基础任务之一,也有大量的深度学习模型应用于此。随着大量深度学习模型的应用,超分辨率重建的目标也从重建出高分辨率图像转变为重建出更高分辨率、视觉感官良好、细节清晰、结构完整的图像。这一目标的转变,导致重建模型对图像要有更精细的理解,而生成图像的网络要有强大而精准的生成能力。本文沿着这一方向研究,以深度学习理论为基础,将注意力机制和生成对抗网络相结合展开了一系列研究,具体研究内容如下:

(1)本文对超分辨率重建技术进行了归纳和总结,简要介绍了基于传统的超分辨率重建技术和基于深度学习的超分辨率重建技术。以此引出深度学习的理论基础,如卷积、池化、激活函数等,然后对三种经典的超分重建模型SRCNN、VDSR、SRGAN的网络结构、模型优缺点进行分析;最后介绍了常用的两种评价指标PSNR、SSIM,同时介绍在超分变率重建领域常用的图像数据集,如Set5、Set14、BSD100等。

(2)针对现有图像超分辨率重建模型参数过大,难以在现实中应用的问题,提出了一种单图像超分辨率重建模型CSRGAN(基于坐标注意力机制的生成对抗网络)。改进了SRGAN中生成器的残差模块,在残差模块通过引入坐标注意力机制,加强了残差网络的特征选择能力,且模块中通过两次升维和降维操作,有效的促进了通道之间信息的流动。在生成器主网络添加了层次化特征融合结构,这样既充分