本文是一篇软件工程硕士论文,本文主要做了以下工作:(1)详细介绍了阿尔茨海默症在 MRI 影像和基因组学方面的基础知识和本文所涉及到的机器学习、深度学习、多模态融合等相关领域知识的介绍。(2)使用深度学习方法对 MRI 图像进行研究,提出一种基于残差神经网络和集成学习的 AD 分类模型 2DResnet,从 ADNI 数据库上下载得到受试者的 MRI 影像数据,采用多种数据扩充方式对 MRI 切片进行数量上的扩增,然后对应每个切片训练多个2DResnet 分类器模型并最终投票集成,在 ADvsHC、MCIcvsMCInc、MCIcvsHC 三组二分类上进行了实验,实验结果表明,本文提出的残差神经网络模型在三组二分类实验上的结果和对比实验方法相比有了明显改善。
第一章 绪论
1.1 本课题研究背景及研究意义
阿尔茨海默症[2](AD)是一种脑部疾病,是中枢神经系统的一种慢性神经退行性疾病,患者的记忆力和认知判断能力会随着年龄的增加而下降。据认为,AD 始于症状出现之前的 20 年或更长时间。它始于受影响的人所不注意到的大脑变化。只有经过数年的大脑改变,个人才会出现明显的症状,出现症状是因为与认知功能相关的脑组织神经元被损害或破坏。随着疾病的进一步发展,大脑其他部位也会被损坏,最终导致患者生活无法自理,需要其他人无时无刻地照顾,随着人口老龄化的加重,AD 患者人数增长加快,它的早期诊断对于未来在 AD 治愈方案的研究至关重要。
近年来,人工智能在计算机医疗辅助诊断方面取得了不错的成果。在 AD 的神经影像研究领域,通常对影像特征进行提取,进行特征选择得到特征数据集,然后使用Logistic 回归(LR),K 最近邻(KNN),支持向量机(SVM),决策树(DT),随机森林(RF)和高斯朴素贝叶斯(GNB)等机器学习方法[3]对得到的数据集进行建模,可以实现 MCI 转化预测以及 AD、MCI、HC 间的分类,但是在以往基于机器学习方法的研究中,特征选择步骤由相关领域的专家来执行,而医学图像的结构非常复杂,这让缺乏相关领域知识的人在医学图像分析中使用机器学习方法面临困难,而随着人工智能的发展,深度学习算法现在可以说是临床诊断分类的最佳选择,因为它们可以胜任传统机器学习模型的卓越方法来完成这些任务,如卷积神经网络(CNN)模型[4],通过加深网络结构可提高网络的特征自动学习和表示能力,但当网络更深时训练误差会变大。
1.2 国内外研究现状
阿尔茨海默症是一种常见的神经退行性疾病[7],目前随着科学技术的快速发展,AD 的病理生理学越来越清晰,AD 患者的大脑受损从而造成神经元的损伤或破坏[8]。在大脑出现明显的症状,例如记忆力减退和语言问题症状之前,部分大脑神经细胞(神经元)被损害或破坏从而引起大脑的某些变化[9],而且这些变化通常发生在包括颞叶和海马的脑区中[10]。这里所指的变化通常是脑区发生萎缩,这种不可避免的萎缩可以作为 AD 研究有价值的标志物[11]。这种有价值的标志物可以通过先进的神经影像技术获取,如磁共振成像(MRI)测量和正电子发射断层扫描(PET)等[12],它可以精确测量脑部结构,尤其是在海马和其他 AD 相关区域,通过扫描痴呆患者的大脑,能够分辨出大脑中有没有患痴呆、心血管或者脑肿瘤等疾病,并且在 PET 扫描中,可以反映大脑葡萄糖代谢的变化[13]。
在神经影像研究方面,许多研究一开始基于先验知识勾选出 AD 患者与正常人差异明显的大脑区域,然后对这些图像区域进行图像处理提取形态学特征重建为形态学数据集,再对特征进一步删选提取,然后使用传统的机器学习方法对其进行研究,以实现 MCI 转化预测以及 AD、MCI、HC 间的分类,训练模型获得对病人状态的预测结果,如 Syaifullah 等人[14]使用 MRI 影像数据,基于 ROI 体素的形态学特征结合支持向量机(SVM)进行 AD 人群分类,但这种人工提取 ROI 是根据已有的临床实验经验,不可避免地产生人为因素的误差从而影响诊断效果[15]。随着深度学习的发展,神经影像数据的特征提取不需要人为勾选 ROI 区域,可以由深度神经网络自动学习参数,提取图像特征用于 AD 诊断。Suk 等人[16]使用堆叠式自动编码器(SAE),通过将原始低级特征与SAE学习的潜在特征表示进行级联来构造增强特征向量,可以提高公共 ADNI数据集的诊断准确;Sarraf 等[17]首先在深度学习应用中使用了 fM RI 数据,在预处理步骤中,将 4D rs-fMRI 和 3D MRI 数据分解为 2D 格式的图像,然后基于 CNN 的体系结构在其输入层中接收这些图像。和传统的机器学习方法相比,深度学习会自动搜索整个图像,以确定图像中的空间图案。可以独立学习和更新这些过滤器,以检测关键信息,减少人工选择特征造成的误差和人力成本,提高工作效率。
第二章 基础知识及相关理论
2.1 阿尔茨海默症描述
痴呆症是一个用来描述影响记忆,思维,行为和情感的不同脑部疾病的术语。痴呆症的早期症状可能包括记忆力减退,难以执行熟悉的任务,语言问题和性格改变。阿尔茨海默症(Alzheimer’s Disease,AD)[23]是一种慢性神经退行性疾病,随着患者年龄的增长,记忆能力和认知判断能力逐渐被损坏,最终发展为痴呆症,据数据统计[24],每 3 秒在世界某处出现一个新的痴呆症病例,而全世界多达四分之三的痴呆症患者尚未得到诊断,实际痴呆症的患者人数在全球范围内超过 5000 万人,到 2050 年,这个数字将增加到 1.5 亿多,其中中低收入国家的痴呆症患者人数增长较多,现今统计的患者六成生活在中低收入国家,但到 2050 年,在中低收入国家的痴呆症患者将超过七成。
AD 之前是轻度认知障碍[24](MCI),在此期间,个体具有微妙的认知变化,但不会干扰日常活动。在患有 MCI 的患者中,两年后约有 15%会发展为 AD,约有三分之一的 MCI 在五年的随访中发展为阿尔茨海默症。重点要注意的是,一些人在认知能力下降开始数年后被诊断出患有轻度认知障碍,并且这些人比那些最近认知能力下降的人更容易发展为 AD,但也有一些轻度认知障碍患者会恢复正常认知或没有其他认知功能下降,因此本文将轻度认知障碍进一步分为会恶化为阿尔茨海默症(MCIc)和不会恶化为阿尔茨海默症(MCInc)两种状态,轻度认知障碍是参与药物开发的研究人员感兴趣的关键领域,由于患有轻度认知障碍的患者仍然能够独立运作,因此,防止轻度认知障碍恶化为阿尔茨海默症的治疗方法将对生活质量,护理人员负担以及使用和护理费用产生重大影响。
2.2 磁共振成像描述
与 AD 相关的认知能力下降是一种普遍存在且广泛研究的现象,与神经细胞死亡、淀粉样斑块和神经原纤维缠结的积聚有关,以及整个大脑组织的损失,通常开始缓慢,并随着时间的推移而恶化,简易精神状态检查(MMSE)是通常用于筛选痴呆的简要认知评估工具,但这种方式在早期检测和诊断 AD 上需要医学领域的专家进行仔细评估。而随着神经影像的发展,磁共振成像(Magnetic Resonance Imaging,MRI)[24]已经用来表征脑部发生的变化,磁共振成像是一种断层成像技术,利用核磁共振成像的原理从人体中获得磁共振信号,重建人体信息从而可以得到人体任何方向上的断层图片,三维图像,甚至空间波普分布的四维图像,现已被用于描述 AD 中发生的大脑变化。最突出的是,AD 以灰质萎缩为特征,从海马区开始,然后扩展到其他大脑区域,包括皮质下结构和内侧颞叶,灰质萎缩的位置和程度可以通过结构 MRI[25]来确定。AD患者的大脑改变也涉及白质完整性,这可以通过扩散 MRI[26]显示。此外,使用静息状态功能磁共振成像(rs-fMRI)[27]测量,可以显示 AD 患者大脑区域之间的功能连接发生改变。本文所研究的是结构 MRI 影像,使用深度学习方法训练出 MRI 影像分类器以用于 AD 诊断分类。
第三章 基于残差神经网络的 AD 早期诊断模型研究.........................11
3.1 引言.........................................11
3.2 数据集和预处理................................11
第四章 基于 GWAS 和 GBDT 的 AD 早期诊断模型研究...............19
4.1 引言..............................19
4.2 数据集和预处理..................................19
第五章 基于概率分类器加权的多模态 AD 早期诊断模型研究.......................32
5.1 引言....................................32
5.2 基于概率分类器加权的多模态 AD 早期诊断模型.......................32
第五章 基于概率分类器加权的多模态 AD 早期诊断模型研究
5.1 引言
在第三章我们用基于残差神经网络的 AD 分类模型进行了三组二分类实验(AD vsHC、MCIcvsHC、MCIcvsMCInc),从三组实验结果可以看出结合残差神经网络可以对分类效果有所提高,但 MCIcvsMCInc 这组实验的结果还是不太理想,除此之外,单轴方向上的切片空间信息有所损失,基于以上问题,我们在本章实验中将其扩展到三轴方向上的切片,不同方向上的切片数据结合能够提高模型的准确率,在第四章 SNP模型使用梯度提升决策树搭建 SNP 分类器模型,模型精度与