软件工程硕士论文栏目提供最新软件工程硕士论文格式、软件工程硕士硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于一致性和伪标签的半监督医学图像分割方法

日期:2024年12月03日 编辑:ad201107111759308692 作者:毕业论文 点击次数:24
论文价格:150元/篇 论文编号:lw202411282158264768 论文字数:38566 所属栏目:软件工程硕士论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇软件工程硕士论文,本文一方面提出了两种先进的半监督医学图像分割方法,通过利用现在最常用的一致性、伪标签、不确定性等热点方法构建医学图像分割新方法;另一方面构建低级特征提取模块以及低级特征注意力机制提升网络框架对于低级细节特征的关注。

第一章绪论

1.1研究背景及意义

医学图像是指利用医学影像设备(如计算机断层扫描(Computed Tomography,CT)、核磁共振成像(Magnetic Resonance Imaging,MRI)、超声成像等)对人体内部结构或病变区域进行可视化所呈现的图像。它是医学领域中最重要的信息来源,可用于疾病诊断、治疗规划、手术导航以及疾病进程监测等。不同的医疗影像装置所产生的影像,各具特色,运用范围也各不相同。例如,CT可以提供高分辨率的横截面图像,适用于胸部和骨骼的评估;MRI可以产生更详细的软组织图像,广泛应用于器官、神经系统的检查;超声成像适用于实时观察和评估器官、血管等。医学图像的分析和解释需要经验丰富的医学专业人员,他们通过观察和解读图像来诊断疾病或提供有关病变的信息,而专业人士可能由于工作时间过长或者注意力下降而引起解读图像信息错误,造成严重后果。因此,计算机视觉和机器学习等技术[1-2]的快速发展为医学图像的自动化分析和辅助诊断提供新的可能性,这种技术可以有效地缓解医学专业人士的工作量。

深度学习网络,如卷积神经网络(Convolutional Neural Networks,CNNs),非显示特征表示能力的进步极大地改进了语义图像分割,为医学图像分割的应用提供了坚实的基础。语义图像分割的定义是将图像中的每一个像素分类为预定义的类别集。近年来基于深度学习的密集预测方法[3-6]在分割复杂形态学特征的医学图像方面取得了很大的进步。因此,这些方法在临床实践中成为有前景的工具,有效地降低劳动成本和最小化主观因素。然而,这些方法都需要大量高质量的像素级标记图像来训练分割模型。与自然图像不同,在医学领域获得像素级标记数据是极具挑战性的,受各种因素的影响,包括不同的模式、低组织对比度和不规则的形状变化(图1-1所示),大量可靠的医学标注图像只能由训练有素的医学领域专家提供。

1.2国内外研究现状1.2.1监督医学图像分割在医学图像分割领域最基础的方法是U-Net[3],其他先进的分割方法大都是基于U-Net改进。Zhou等人[4]提出了Unet++,通过在编码器-解码器结构中间添加密集的跳跃连接路径,减少特征映射间的语义差距,提高模型的学习效率。Isensee等人[6]开发了一个nnU-Net,这是一种基于深度学习的分割方法,可以进行自动配置,包括预处理,网络架构,训练和后处理任何新任务。Xing等人[12]提出对不同模态的医学图像进行分割,该模型在编码器输入端使用多尺度方法进行设计,由多层感知器和卷积模块组成,它可以充分提取图像的全局和局部信息。Milletari等人[13]提出了一个基于体积的3D全卷积神经网络分割方法(V-Net)。Zhou等人[14]提出了一种基于混合状态转移算法的U-Net结构设计方法,通过结合基本状态转移算法和离散状态转移算法并应用在U-Net上,使网络优化结构具有搜索空间大、维度高等特点。王等人[15]提出一种基于DHSwin-Unet的医学图像分割模型,该模型在Swin-Unet模型的跳跃连接中引入密集连接的Swin Transformer块,并加入混合注意力来加强网络的特征信息传递。

还有一些方法提出用注意力机制来解决复杂医学图像难分割问题。Oktay等人[5]提出了一种新型的注意门模型用于医学图像分割,该模型有效地抑制了输入图像中的无关区域,同时凸显出对于特定任务有用的显著特征。Hu等人[16]提出了一个SE-Block,SE-Block包含一个全局平均池化层,用于捕捉每个通道的全局信息,还包括一个激活函数和一个全连接层,用于生成每个通道的权重,其中全局信息被用来动态地调整每个通道的权重,从而更有效地捕获图像中重要的特征。Woo等人[17]提出了一个卷积块注意模块,它将通道注意力和空间注意力有效结合以便同时关注通道和空间信息,提高了卷积神经网络对感兴趣区域的关注度。

第二章面向医学图像分割的深度学习理论知识

2.1卷积神经网络中相关组件

CNNs是一种深度学习模型[52-57],主要用于处理和分析具有网格结构的数据,在计算机视觉领域被广泛的应用,通过使用卷积层、激活函数和池化层等组件,可以实现自动提取图像或者视频等特征,以及通过多层卷积层、池化层和全连接层来构建深层的网络结构。

2.1.1卷积层

卷积层是CNNs中的一个重要组件,主要用于处理各种具有空间结构的数据。它通过卷积核对输入的数据进行卷积操作,从而提取出不同特征层的信息并保留输入数据的空间结构。

卷积层包括三个主要特点:(1)局部感知:仅关注局部区域数据,每个神经元连接一小部分输入数据,共享参数减少学习参数量;(2)参数共享:滤波器使用相同权重参数在不同位置进行卷积,减少模型复杂性,提取相似特征,实现平移不变性;(3)特征映射:多滤波器生成多特征映射,每个映射提取特定特征,叠加捕捉各种特征实现数据建模。

常见的卷积包括普通卷积(图2-1所示)、空洞卷积、深度可分离卷积和转置卷积(图2-2所示)。本节以普通卷积的公式为例展开说明。在卷积过程中,通过一个卷积核对一个二维特征图进行计算可以得到一个二维的输出特征图。

软件工程硕士论文怎么写


2.2常见的数据增强方式

在医学图像分割中,数据增强是一种常见的技术,可以帮助提高模型的泛化能力和鲁棒性,尤其是在数据量有限的情况下。常见的医学图像分割数据增强方式有:(1)镜像反转:在水平或垂直方向上翻转图像。(2)旋转:随机旋转图像角度。(3)缩放:随机缩小或放大图像。(4)平移:在水平或垂直方向上对图像进行平移。(5)弹性形变:在图像上施加随机的弯曲和扭曲变换。(6)亮度和对比度调整:对图像的亮度和对比度进行随机调整。(7)加噪声:向图像中添加随机噪声,例如高斯噪声或椒盐噪声。(8)颜色变换:对图像的颜色通道进行随机变换。(9)Cutout:通过随机将图像中的一部分区域遮挡或者删除,以模拟图像中的信息缺失或遮挡情况。

编码器负责从输入图像中提取特征表示,而解码器则通过上采样操作将这些特征图恢复到原始图像的大小,并生成像素级别的分割结果。在编码器部分,U-Net采用连续的卷积操作和池化操作来逐渐减小特征图的尺寸,这些卷积操作通过不断增加卷积核数量来提取图像中的特征信息。池化操作则通过降低特征图的空间维度来减少计算量并增加感受野大小,该过程在网络的不同层级重复进行,使得网络可以逐渐理解图像的全局上下文信息。

第三章基于强弱增强的双一致性引导半监督医学图像分割方法....................20

3.1问题定义..................................20

3.2分离的弱和强双一致性学习.......................20

3.3整个训练过程和损失函数...............................22

第四章基于一致性与伪标签相结合的双学生与教师联合学习的半监督分割方法....33

4.1双学生与教师联合学习策略....................................33

4.1.1师生一致性学习...................................35

4.1.2双交叉伪监督学习...............................36

第五章细节特征提取与细节特征注意力机制...................43

5.1细节特征增强模块与损失函数..................44

5.1.1多尺度低级细节特征增强模块..........................44

5.1.2类别不平衡的约束函数.....................................45

第五章细节特征提取与细节特征注意力机制

5.1细节特征增强模块与损失函数

本节提出的MLDFE应用在U-Net上所得到的最终网络结构图如图5-1所示,通过这样一个简单的集成,对于模型分割性能的提升有着极大的帮助,并且集成之后的网络模型的参数没有很大的提升,使得网络还属于轻量级模型,有效地防止模型出现过拟合现象。

软件工程硕士论文参考

5.1.1多尺度低级细节特征增强模块

本节提出了一个多尺度低级细节特征增强模块(MLDFE)应用在U-Net之上(图5-2所示),它应用在编码器低层可以有效地提取多尺度特征,并提高了低级特征的表达能力。MLDFE模块是由两个具有全局平均池化的残差U型网络(RGs)组成。每个RG模块如图5-2所示,除了每层的输入通道以及深度不同,其他结构都相同。

如图5-2所示,受到Qin等人[67]的启发,本节提出了一个RG模块来提高图像特征的表示能力。R是一个类似于U-Net的残差网络,通过增加模块的深度,提高了模型的表达能力和分割精度。G是一个集成了全局空间信息的全局平均池化操作。G帮助模型从整体上理解和分析输入图像,并通过汇集整个特征图来捕获广泛的上下文信息。此外,它对输入图像的空间平移具有较强的鲁棒性,减少了网络参数的数量,并防止了过拟合。

第六章总结与展望

6.1工作总结

本文一方面提出了两种先进的半监督医学图像分割方法,通过利用现在最常用的一致性、伪标签、不确定性等热点方法构建医学图像分割新方法;另一方面构建低级特征提取模块以及低级特征注意力机制提升网络框架对于低级细节特征的关注。经过梳理之后,本文所做的工作总结为以下四点:

(1)为了使模型可以在更大空间和维度中从未标记数据中提取