论文部分内容阅读
随着时代的发展,医疗卫生水平逐步提高,人口老龄化现象日益突出。社会老龄化带来的是老年疾病的增加,其中阿尔茨海默病(Alzheimer disease,AD)是在老年人中属于高发的疾病之一,然而至今还没有发现有效的治疗方法。轻度认知障碍(mild cognitive impairment,MCI)作为从正常状态过度到AD的中间状态备受医学界的重视,对MCI的早期发现和治疗有助于减少AD发生。目前检测MCI的主要的方式有心理学量表检测、体液检测和影像学检测等,其中心理学量表是一种简单易行的评估方法,因此被广泛应用在临床上来进行疾病程度的评估。然而在人工使用的时候,仅用到了总分对病情进行评估,导致该方法准确性低,没有考虑到量表中不同测试项对病情评估的作用。本文采用数据挖掘算法对MCI进行检测和分类,本文使用的数据集包含AD患者15人、MCI患者12人以及对照组14人,其中对照组均为健康的人群。对每个受试组均采用了三种不同的测试量表进行测试,分别为:简明精神状态量表(MMSE)、阿尔茨海默病评定量表-认知量表(ADAS-cog)和汉字书写量表(CCWS)。其中CCWS是北京医科大学附属医院神经心理研究室的汉语失语成套测试(ABC)中的书写部分,本文利用其进行验证汉字书写对MCI是否具有检测意义。本文首先采用支持向量机-递归特征消除(SVM-RFE)算法进行特征选择,然后利用主成分分析(PCA)算法去除特征之间的相关性并对其进行降维,最后使用SVM算法进行分类器模型的训练。本文利用10折交叉验证评估模型的泛化性能,并且使用准确率作为模型的评估标准。本文实验包括两部分,第一部分实验对单个量表的的分类能力进行了评估,得到MMSE量表对AD的分类能力大于ADAS量表,而ADAS量表的对于MCI的分类能力大于MMSE量表。并且根据CCWS量表的模型评价得出中文书写对于MCI有检测的价值,其中MMSE量表、ADAS量表和CCWS量表的三分类准确率分别为0.88、0.87、0.73。第二部分实验针对各个量表的优缺点,通过特征融合的方式来提高对MCI的分类性能,最终经过联合量表的形式得到了三分类的准确率为0.93。联合量表的多分类模型一共使用了12个特征,与MMSE量表特征量一样,比ADAS量表特征量少7个,在不增加特征数量的情况下提高了分类准确度。因此通过数据挖掘的方法可以有效的检测MCI,并且通过特征选择的方式能够选择出更优的量表测试项组合,并且提高分类准确率。最后通过量表联合实现了在不增加特征数量的情况下提高了分类准确率。