本文提出一种基于 MRI 和 SNP 数据的改进的概率分类器加权集成框架,总体结构如图 5-1 所示。首先在数据预处理方面,获得的图像数据集后用 SPM12 软件进行预处理,接着进行三轴方向上二维切片,得到 MRI 影像数据集,获得的 SNP 数据使用 PLINK软件进行全基因组关联分析得到与表型相关程度高的 SNP 位点数据,编码成二进制SNP 数据集,然后在多模态融合方面使用两段式集成策略,第一阶段,预处理好的 MRI图像数据每个方向上切片分类器进行排序选择识别度高的切片分类器集成生成三个单轴分类器,SNP 数据训练多颗决策树,本实验决策树个数为 20,使用三种集成策略对决策树进行集成生成三个 SNP 基分类器;第二阶段使用本文提出的改进的概率分类器加权集成进行最终结果的集成。
总结与展望
1)总结
随着医疗科技水平的发展和人类社会的进步,人口的老龄化越来越严重,老龄化所伴随而来的各种老年疾病,如痴呆症的发生也逐年增加,阿尔茨海默症作为痴呆症的最常见原因越来越成为全球公共卫生应该关注的问题,它的早期诊断对于未来在阿尔茨海默症治愈方案的研究至关重要,随着神经影像和基因组学的发展,融合神经影像和基因组学的多模态数据融合能够提高 AD 分类的准确率,本文使用 MRI 影像结合SNP 数据对 AD 分类模型进行研究。
基于此,本文主要做了以下工作:
(1)详细介绍了阿尔茨海默症在 MRI 影像和基因组学方面的基础知识和本文所涉及到的机器学习、深度学习、多模态融合等相关领域知识的介绍。
(2)使用深度学习方法对 MRI 图像进行研究,提出一种基于残差神经网络和集成学习的 AD 分类模型 2DResnet,从 ADNI 数据库上下载得到受试者的 MRI 影像数据,采用多种数据扩充方式对 MRI 切片进行数量上的扩增,然后对应每个切片训练多个2DResnet 分类器模型并最终投票集成,在 ADvsHC、MCIcvsMCInc、MCIcvsHC 三组二分类上进行了实验,实验结果表明,本文提出的残差神经网络模型在三组二分类实验上的结果和对比实验方法相比有了明显改善。
(3)接着使用全基因组关联分析(GWAS)和机器学习进行 AD 分类研究。首先,通过 GWAS 找出与 AD 相关的遗传生物标志物,即 SNP 位点数据,并将其编码成二进制 SNP 数据集,然后使用机器学习算法进行分类研究,GWAS 分析寻找到的 SNP 位点再进一步找到对应所在的基因以及染色体位置,为研究 AD 在遗传信息方面提供帮助;
参考文献(略)