基于数据挖掘技术的颈动脉硬化斑块诊断研究

来源 :陕西科技大学 | 被引量 : 0次 | 上传用户:ganjinwei2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我国60岁以上人群中颈动脉硬化的发病率高达70%以上,患病年龄也已从60岁提前至45岁,严重威胁着中老年人身体健康。目前对该疾病的诊断主要是通过医生人工完成,不仅工作效率低下,而且大量高维的数据人脑很难分析。针对这些问题,论文使用数据挖掘工具Weka对来自西安唐都医院的311例颈动脉硬化患者电子病历中的血流动力学信息数据集,分别使用分类算法中经典的BP(Back Propagation)算法、C4.5算法与支持向量机建立颈动脉硬化斑块诊断分类器,对比分析得出性能最优的是支持向量机分类器。并通过进一步的集成优化,使得该支持向量机分类器性能得到了较大提高,进而帮助医生对颈动脉硬化斑块做出科学的诊断决策。以下是论文研究分析的主要内容:  1)充分理解颈动脉硬化斑块临床诊断指标。通过分析可知颈动脉的血流动力学信息与颈动脉硬化斑块的形成有着密切关系,提取该部分数据并将血流动力学信息的所有属性作为此次数据挖掘的主要研究对象。  2)对颈动脉血流动力学信息数据集进行数据预处理。首先,将数据格式调整为ARFF(Attribute Relation File Format)文件格式;其次,将血流动力学信息中的所有属性根据数据挖掘算法的不同需求进行规范化;最后,使用不同属性选择方法对无关属性进行过滤,筛选出最为相关的属性子集建立分类器。  3)分别使用BP算法、C4.5算法以及支持向量机算法建立颈动脉硬化斑块诊断分类器。每种算法建模时都有自己的参数,因此使用不同的参数选择方法进行选择,选择时的原则是选取一定范围内能使所建分类器准确率最优的参数组合并使用这一组合建模。  4)评估三个诊断模型并选择其中性能最优的支持向量机诊断模型进一步优化。分别对BP分类器、C4.5分类器与支持向量机分类器从建模时间、可解释性、误差与成本四个方面进行对比分析并选择三者之中性能最好的,通过评估结果可知性能最优的是支持向量机分类器,但仍有进步空间,因此利用集成学习中的Adaboost算法对其进行优化。  通过实验得到了与颈动脉硬化斑块形成最为相关的血流动力学属性,并且在所建立的三种颈动脉硬化斑块分类器中性能最优的是支持向量机分类器。在对此支持向量机分类器进行集成优化后该诊断型分类器的性能得到了较大提高,最终的分类准确率为75.5%,优化后的分类器有助于医生对颈动脉硬化斑块做出科学的诊断决策,虽然实际诊断中不能仅凭血流动力学信息做出定论性的诊断预测但它对诊断结果的影响也是不容忽视的。
其他文献
随着经济和技术的发展,复杂性研究已经深入到社会的各个领域,包括生物系统、工程系统、社会系统、经济系统。社会系统是一个复杂系统,社会系统中的群体及个体会受到多种因素
目前,随着IPTV业务的广泛开展及IPTV用户群的不断扩大,IPTV运营商与IPTV用户间的交互显得日益重要,运营商需要一种平台来实现IPTV运营商与IPTV用户之间的互动业务。本文首先
随着Web2.0技术的广泛传播,构建安全、高性能、稳定的Web应用系统受到了广大用户的青睐。如何高效地开发满足用户需求的应用系统成为开发人员必须认真探讨的课题。在各大开源
本体是一种用来描述概念以及概念之间关系的模型。本体技术在计算机的许多领域得到了广泛的应用,如知识工程,数字图书馆,软件复用,信息检索和web上异构信息的处理,语义web等。本体
时空数据库是在空间数据库、时态数据库基础上形成的研究热点。时空数据库主要用于处理随时间离散或者连续变化的空间对象,其核心内容为时空对象数据建模、存储结构和拓扑分
静息态功能磁共振(resting-state functional magnetic resonance,RS-fMRI)成像技术广泛的应用于神经科学研究和临床医学研究中,随着RS-fMRI的应用,RS-fMRI数据处理方法也层出不穷
随着计算机技术和网络技术的迅猛发展,教育信息化建设中的教学信息化已逐步成为现代教育技术的重要研究课题。因此,开发出基于网络的在线考试的系统,既可以增强学校考试工作
协作式安全应用是VAENT中最具前瞻性和挑战性的应用,它通过共享的无线信道在V2V、V2I之间相互感知和交互来进行安全预警和位置追踪。但是由于VANET所特有的车辆拓扑结构动态
无线传感器网络(Wireless Sensor Networks,WSN)综合了传感器、嵌入式计算、分布式处理和无线通信等技术,是一种全新的信息获取和处理技术。无线传感器网络由随机分布的集成
在现代软件开发中,耦合性往往是衡量一个系统组件间相互依赖关系的指标。高耦合性系统有着很强的相互交互关系,模块间相互依赖。通常对程序员来说,编写耦合性较低的模块被认