基于机器学习和神经影像对阿尔茨海默病的早期诊断

来源 :山西医科大学 | 被引量 : 0次 | 上传用户:a570121851
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:为了构建一种能够应用于阿尔茨海默病(Alzheimer’s Disease,AD)分类问题和早期轻度认知下降转化问题的机器学习算法,在神经影像上验证预测的准确率,通过考虑特征指标能够找到具有更高预测效能的模型,提高模型在所选数据集上的泛化力,为临床早期诊断AD提供辅助工具。方法:1.数据选择。本研究所使用的数据是国外的阿尔茨海默病神经影像学计划(Alzheimer’s Disease Neuroimaging Initiative,ADNI)公共数据库,根据研究需要选取了543例研究对象,根据患者认知模式发展和功能受损程度将他们分为四组,包括正常认知(normal cognitive,NC)组139例,早期轻度认知功能下降(early mild cognitive impairment,EMCI)组22例,晚期轻度认知功能下降(late mild cognitive impairment,LMCI)组108例以及AD组76例。根据病程发展将四组两两组合共得到六个二分类组,包括NC-EMCI组、NC-LMCI组、NC-AD组、EMCI-LMCI组、EMCI-AD组以及LMCI-AD组。2.数据处理。收集这些研究对象各组对应的结构磁共振成像(Structural magnetic resonance imaging,s MRI)数据以及他们的性别、年龄、教育水平三项人口指标以及MMSE评分统计学资料。通过Freesurfer软件的预处理,将s MRI图像转化为272项特征指标结果,包括68项皮层厚度(Cortical thickness,TA)、69项皮层体积(cortical volumes,CV)、16项海马亚区体积(hippocampal subfields,HS)、70项表面积(surface area,SA)以及49项皮层下体积(subcortical volumes,SV)。本研究针对272项特征数据集和在此基础上融入性别、年龄、教育水平、简易精神状态检查量表(Mini Mental State Examination,MMSE)评分后的276项数据集。3.特征选择。采用L1范数正则化支持向量机(support vector machine,SVM)与L1范数正则化逻辑回归(logistic regression,LR)两种特征选择算法进行特征选择。针对每组得出最优特征子集个数,然后通过探索特征选择后各组中相关度最大的特征来判断该组的病变部位,找到辅助诊断的生物标志物。4.分类模型建立。将每组得出对将选择后的最优特征集放入四种常用的机器学习分类模型中,包括LR、SVM、误差反向传播神经网络(back propagation neural network,BPNN)和随机森林(random forest,RF),将其用于AD病程分类。对比这四种不同机器学习算法的分类性能,从而得到最优的分类预测模型。将数据集分为测试集和样本集,利用十折交叉验证法将四种算法的准确率进行对比,采用敏感度、特异度、受试者工作特征曲线下面积(Area under curve,AUC)值这些指标进行评价。最后,基于SVM和RF这两种分类模型,将L1-LR和L1-SVM这两种特征选择方法与传统统计特征选择方法以及未进行特征选择结果进行对比,得到这四种方法在各组进行分类时的AUC值。结果:1.使用L1-SVM特征选择模型进行特征选择后,在276项特征中,NC-EMCI组的最优特征为121项,其他五组按顺序分别有82、22、113、39、53项特征被选到各个分类模型中。MMSE评分在AD疾病病程的各个阶段都表现出较明显的改变,年龄成为识别NC-LMCI组、EMCI-AD组、LMCI-AD组这三组分类中比较重要的因素。2.使用L1-LR特征选择模型进行特征选择后,在276项特征中,六组分别有67、42、11、56、21、20项被选入分类模型中。MMSE评分在NC-AD组和LMCI-AD组中排第1位。教育水平在NC-AD组排名第7位。年龄这项指标在NC-LMCI、LMCI-AD组中分别排第5和第3位。性别在NC-AD组排第4位。3.将L1-SVM特征选择算法与BPNN算法结合对AD病程转化预测效果更好,但是不同的分类组略有差异。在由NC转化为AD的过程中,准确率高达98.90%,在区分NC-LMCI、EMCI-LMCI以及LMCI-AD组时准确率分别为95.04%、93.01%、92.41%。然而,在识别NC-EMCI组和EMCI-AD组的转化过程中,SVM模型表现最好,准确率分别为85.4%和97.63%。使用L1-LR在276项特征选择下,SVM模型在NC-LMCI和EMCI-AD组的准确率高于其他组,分别为92.26%、96.95%。对于NC-AD组和EMCI-LMCI组RF分类模型的准确率高于其他模型,分别为97.71%和86.74%。4.SVM分类模型经过L1-SVM特征选择后,在276项特征中EMCI-AD组的准确率最高(97.63%),AUC值为0.99。经过L1-LR特征选择后,276项数据中EMCI-AD组的准确率最高,为96.95%,AUC值为0.99。LR分类模型经过L1-SVM特征选择后,276项特征集中预测准确率最高的是EMCI-AD组(95.25%),特异度(98.89%)、AUC值为0.99。经过L1-LR特征选择后,276项特征中EMCI-AD组的准确率最高(96.29%),特异度为98.75%,AUC值为0.99。BPNN分类模型经过L1-SVM特征选择后,276项中NC-AD组的准确率最高(98.90%),特异度、敏感度,AUC值分别为100%、98.75%、1.00。经过L1-LR特征选择后,276项中准确率最高的同样也是NC-AD组,为97.64%。RF分类模型经过L1-SVM特征选择后,276项中同样也是NC-AD组的准确率最高(96.77%),特异度和AUC值分别为98.57%和0.99。经过L1-LR特征选择后,276项中同样也是NC-AD组的准确率最高(97.71%),特异度为98.75%,AUC值为0.99。结论:1.融入三项人口统计资料和认知功能量表后的276特征数据集比272项s MRI特征数据集的分类效果更好,能够更加提高分类模型的预测能力。2.两两分类的各组中得到的最优特征大多分布在边缘系统和颞叶这些结构。3.SVM分类模型在L1-LR特征选择下对病程相近最难区分的EMCI和AD患者的分类预测效果更好。4.BPNN分类模型经过L1-SVM特征选择后对NC和AD患者这两个阶段的预测效能更好。特异度和敏感度也较高,说明漏诊率越低,误诊的比例越低。该模型可以作为临床辅助工具。5.在识别NC-AD转化组时,本研究使用的两种特征选择方法在SVM和RF两种分类模型下的预测效果都较高,但是L1-SVM特征选择法优于L1-LR法。
其他文献
阵列测向技术在民用和军用领域具有广阔的应用前景,一直是业界学者研究的热点内容之一,但是目前大多数测向技术以处理窄带信号为重点。而在现代通信技术中,宽带信号因其传输信息量大、便于提取目标特征参数等优点,在通信系统中得到广泛应用,也因此推动了宽带类相关测向技术的研究。尽管在近几十年有较为蓬勃的发展,但仍然存在低信噪比下估计精度不高,时效性不强和过分依赖先验信息等问题,尤其是在非协作场景下的接收端,往往
[目的]1、培养高纯度的原代小胶质细胞和星形胶质细胞,为进一步研究他们在中枢神经系统疾病中的作用和机制奠定基础。2、关于星形胶质细胞激活后的表型变化研究相对较少,我们将用不同的方法激活星形胶质细胞,在体外探寻激活星形胶质细胞的方法,并检测激活后的星形胶质细胞表型,为进一步研究星形胶质细胞在神经系统疾病中的作用提供细胞模型。[方法]实验分为两个部分,第一部分为小胶质细胞和星形胶质细胞的原代培养、纯化
时间域航空电磁勘探可以广泛应用在矿产资源勘查、油气和水文地质调查以及环境监测等领域。针对一些湖泊、沼泽等地面物探难以开展的区域,时间域航空电磁勘探有着较大的优势。为了准确获得地下介质的电性特征,需要对时间域航空电磁数据做反演解释。随着计算机性能的提升,高维反演成为目前的研究热点,但是由于时间域航空电磁数据量巨大,高维反演计算成本太大,目前尚未在实际生产中应用。因此,在地下解释成像的实用化算法研究中
构建“丝绸之路经济带”和“21世纪海上丝绸之路”是中国当前全面深化改革、开创高水平对外开放新局面的重要倡议。“一带一路”作为世界上跨度最长的经济大走廊,得到了超过五十个国家的参与和支持,覆盖约44亿人口,是世界上最具发展潜力的经济带。它既为沿线国家和地区带来更加紧密的经贸合作,也为各国的文化交流及友好往来开辟了新的通道。在文化交流过程中,我国要想在各国文化交往与文化交锋中既能维护我国文化安全的同时
第一章 分化型甲状腺癌骨转移的危险因素分析研究目的了解分化型甲状腺癌(Differentiated thyroid carcinoma,DTC)骨转移发生的危险因素,以针对性地管理具有高危因素的患者,早期识别骨转移,及早治疗,改善预后。材料与方法回顾性分析在2014年1月-2016年12月期间,在我科行首次131Ⅰ治疗的DTC患者。从人口学特征、临床资料、病理资料三个方面进行分析。采用IBM SP
随着我国智能化与自动化水平的提高与精密制造业的长足发展,传感检测技术在众多高精度制造与测试领域逐步展现出举足轻重的作用。光纤传感技术以其较低的成本与较高的应用灵活性和安全性,在高精度制造与测试领域受到广泛应用。其中,基于准分布式传感的光纤光栅传感系统具有较高的精度,但单点检测的特性限制了其空间分辨率;基于自发布里渊散射分析的BOTDR传感系统可实现长距离的连续传感,但空间分辨率多限制在米级;基于受
自互联网发展以来,人们的生活时时刻刻都被自媒体深深的影响着。由于自媒体深受大学生喜爱,它为大学生思想政治教育提供了机会和机遇。然而,自媒体携带的大量负面信息对大学生的意识形态产生了影响,对大学生的意识形态和高校思想政治教育提出了新的挑战。因此,大学生思想政治教育放在自媒体环境之下的创新尤为关键。本文基于马克思主义理论和思想政治教育理论,借鉴政治学、教育学、传播学、心理学、管理学的学科理论和研究课题
在传感器朝向智能化和网络化趋势发展的今天,分布式光纤传感技术因其具有抗电磁干扰、稳定性好和响应时间短的优势,引起了广泛的关注。光频域反射技术(Optical frequency-domain reflectometry,OFDR)作为分布式光纤传感技术的一个分支,具有高信噪比、高灵敏度,和高空间分辨率的优点而被广泛应用在光纤通信、石油化工、电力电子及生物医药等多个领域中。OFDR分布式系统可以用于
目的:探讨mNGS在肺部感染患者病原体中的诊断性能,分析mNGS对临床调整抗感染策略的影响。方法:回顾性分析2019年9月-2021年2月在山西医科大学第一医院呼吸与危重症医学科、重症医学科和血液科诊断为肺部感染的79例患者,这些患者均完善支气管镜检查及肺泡灌洗技术,并收集BALF同时送检传统病原学检测(细菌培养、真菌培养、抗酸染色)及mNGS。将患者分组为重症组(29例)/非重症组(50例)、合
目的:本研究旨在探究老年非大面积脑梗死患者在未进行溶栓治疗后发生出血转化的相关因素,建立中西医结合的出血转化预测模型,为尽早识别出血转化提供依据。方法:本研究对符合纳入标准的148例老年患者进行资料收集,详细记录基线资料、实验室检查、是否进行抗凝、抗血小板及降脂治疗,再依据临床症状提取证素。将有关数据运用Excel进行统计,先用单因素分析进行影响因素的初筛,比较后得出统计学有意义的因素;再将这些因