基于深度学习的阿兹海默症基因表达模式识别与样本分类

来源 :东南大学 | 被引量 : 1次 | 上传用户:mcl19800627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
阿兹海默症(Alzheimer’s Disease,AD)是一种在老年人中高发的进行性神经退行性疾病,病因未明,病程不可逆。早期诊断与治疗是延缓病情发展的一般措施,对于延长患者存活时间和提高生活质量具有重要意义。目前对AD的分类和轻度认知障碍(Mild Cognitive Impairment,MCI)转化预测研究,主要集中于对影像数据和生化标记物的分析。外周血基因表达数据可以及时反映生理状态和疾病的发展状态,对于AD早期诊断具有潜在的应用价值,但是由于数据获取和分析上存在的挑战还没有得到有效的转化应用。深度学习算法的提出和在多个领域中的成功应用,为基因表达数据的分析和AD相关特征的识别与分类提供了强力的工具。本论文利用堆叠去噪自编码器(stacked-denoise autoencoder,SDAE)开展提取阿兹海默症基因表达特征的研究,辅助AD分类和MCI转化预测。本文将深度学习算法应用于微阵列基因表达数据的分析。使用国际上应用广泛的ADNI(Alzheimer′s disease neuroimaging initiative)专业数据库中的基因表达数据,构建了3层的堆叠去噪自编码器来提取阿兹海默症的基因表达特征,通过使用10折交叉验证实验来优化网络结构参数,确定最优的三个隐层节点数分别为5000、500、50,受损水平分别为0.1,0.2,0.1。利用SDAE提取的基因表达特征构建SVM(Support Vector Machine)分类器,对246名健康人与498名MCI&AD患者的基因表达数据进行分类分析,与原始探针、主成分分析(PCA)和差异表达分析三种特征提取方法进行对比,结果表明,基于SDAE特征的分类结果在准确率、精确率、召回率和AUC这4个性能指标上均要优于三种对照的方法。如果将SDAE的三层特征组合,对阿兹海默症的分类准确率达到100%。对SDAE提取的特征进行进一步的分析,找出对分类贡献较大的节点,以降低特征维度。使用改进的SVM–RFE特征选择方法,从SDAE第一层隐层的5000个节点中,选择43个高贡献节点作为特征,对相同数据集进行分类,其ROC曲线表明在分类性能上只有微弱的下降;同时,使用非高贡献节点为特征的分类性能有大幅度的下降,表明了高贡献节点方法对于样本分类的有效性。提取43个高贡献节点中的5437个高权重探针进行功能分析,KEGG通路富集分析显示,高权重探针显著富集于阿兹海默症、帕金森症和亨廷顿症这三个通路,表明这些基因与这三种神经性疾病的高度相关;同时通路聚类结果表明,非酒精性脂肪肝也与这三个通路具有较强的相关性,隐含着它们存在共同的分子机制。比较高权重探针作为特征和基于高权重探针构建的SDAE特征的分类结果,发现SDAE特征节点的分类效果更好。将这些SDAE特征应用于GSE6613数据集的分析,其分类性能明显优于采用原始探针数据、主成分分析和差异表达分析等方法,进一步验证了SDAE特征节点具有较好的分类效果,SDAE更为有效地提取了基因表达数据中的分类特征。对ADNI数据库中80名MCI转化为AD的患者和271名MCI未转化为AD患者构建基于堆叠去噪自编码器的MCI转化预测模型。与原始探针值、主成分分析和差异表达分析方法进行比较,SDAE模型可以显著地提升预测结果。采用SDAE三层组合特征,分类准确率为0.8577,精确率为0.8720,召回率为0.9240,AUC值为0.91。对SDAE第一隐层的5000个节点进行特征筛选,以338个高权重探针形成52个新特征,其分类性能下降较大,准确率只有0.7746。但是相比主成分分析和差异表达分析,SDAE特征对于MCI转化预测仍然具有优势。本文立足于对基因表达数据的特征提取和分类预测,构建了基于堆叠去噪自编码器的AD分类和MCI转化预测模型,取得了良好的效果,再一次表明了SDAE在表达数据特征提取中的优越性,对于整合更多生物标志物辅助AD早期诊断具有重要意义。
其他文献
近日,新加坡移动运营商Mobile One(M1)公司和Sentry Wireless公司、捷德公司合作,推出了一种基于SIM卡技术的新应用,使家长能够监督其子女使用移动电话。M1公司将这种新应用称为“
为了克服传统觅食算法BFA(BacterialForagingAlgorithm)收敛速度慢以及高维优化收敛性差的问题,提出了一种新的基于微粒群优化策略的自适应觅食算法ABF—PSO(AdaptiveAlgorithmBa
针列客户对高质量,高频率的连接元件以及整体连接方案的显著需求,近日,HUBER+SUHNER推出用于可靠性要求较高的测试测量场合或者高频系统连接中的新产品——低无源互调测试、衰减
为推动蓝牙低功耗技术在运动、健身及保健领域的应用,目前,蓝牙技术联盟(Bluetooth SIG)与知名的国际体育用品及运动时装贸易博览会(ISPO)及世界体育用品联合会(WFSGI)共同举办了蓝牙
在城市电网规划中,为保证各级电网协调发展,需要科学处理电网分区问题.回顾了南京电网现有分区结构的形成,将未来分区规划分为3个发展阶段.同时对电网分区的时机、原则进行了
论述了广西计算机行业的概况和存在的问题,提出解决问题的办法,并给出今后发展的建议。
控制系统中任务的调度不仅影响系统的资源利用率,而且影响系统的控制性能,是控制系统设计和实现的关键技术之一.首先分析了周期性实时任务,并给出了任务模型.基于此,采用了EDF调度
如今我们身处一个全新的世界,基于封包交换技术的现代化通信完全取代了传统的电话通信标准,改变了企业通信沟通的模式。作为推动IP技术市场发展的新生力量的会话发起协议(SIP:S
准确测量传导性电磁干扰(EMI)噪声,是解决电力电子产品电磁干扰问题的重要依据.简述电磁兼容EMC传导性电磁干扰标准测试环境,提出引出地线得到真正的“单相三线”系统,解决了传统实
全球无线数据解决方案提供商爱可信公司(ACCESS)近日宣布,爱可信NF浏览器作为一种标准化配置已经成为欧美地区被使用最多的移动浏览器产品,其装机量超过其他品牌的移动互联网浏览