具有删失数据的医疗生存统计分析和粗糙集决策分析的研究

被引量 : 2次 | 上传用户:anquanke123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的飞速发展,数据挖掘的方法不断扩展。粗糙集理论和方法是一种能有效的分析和处理不一致、不精确、不完备等各种信息的数据分析工具。粗糙集决策分析方法因其不依赖于专家知识和经验,具有只依赖于本身数据的客观性,得到了统计学和其他学科的普遍认同。本文对数据挖掘中的粗糙集方法进行了深入的研究,重点分析了基于粗糙集的属性约简算法在数据挖掘规则提取阶段的应用。包括上(下)近似关系、知识的约简、核、不可区分关系、规则的提取。生存分析是研究生存现象和响应时间数据及其统计规律的一门学科。该学科在生物学、医学、保险学、可靠性工程学、人口学、社会学、经济学等方面都有重要应用。本文对一个实际的糖尿病医疗数据进行了Cox回归生存分析和粗糙集医疗数据辅助规则提取。论文主要特点是可以处理删失数据,删失是准确时间未被观察到的情况。研究对象是149位糖尿病人的数据,通过对各生存指标的统计,利用生存分析和粗糙集两大类方法,对糖尿病人的数据分别利用SPSS统计软件和MATLAB中的粗糙集模块分析,得出两种不同角度的结果,分析的结果更加全面。生存分析的方法中,通过建立半参数模型,使用SPSS软件中的Cox回归功能模块,利用生存时间函数,生存分析模型的参数和非参数估计作为理论基础,在风险函数与属性因子之间建立类似于广义线性模型的关联,直接考察研究因子对风险函数的影响效果。该方法可以在不对生存时间的具体分布进行假设的情况下评价因子的效果,大大简化了生存分析的求解过程。粗糙集方法中,通过将连续属性离散化,将生存数据划分为可以用粗糙集方法计算的不可区分关系。利用粗糙集的知识约简,以及决策表在知识表达上的应用,同时,通过对粗糙集数据分析系统的构成和基本算法的研究,列举出系统实现的程序,包括属性约简,核等。最后,通过实例来验证程序的正确性,使用MATLAB中粗糙集程序直接实现不可区分关系、属性约简、核等的求解。通过利用粗糙集规则提取,得到了判定糖尿病人的约简的辅助治疗结果,所得结果与医院实际的诊断的方案吻合度非常高。得出两大类方法的结果有重叠也有不同,实际验证了分析结果的正确性。
其他文献
通过检索CNKI,SCIENCE DIRECT数据库,对近年来出现的中药指纹图谱相似度计算方法进行收集和整理,筛选出20篇相关文献,共共总结出9种相似度计算方法,包括峰重叠率法(Nei系数法
以工业遗产为资源要素,以生态保护为核心理念,以工业旅游为开发手段,积极发展生态工业旅游,是实现工矿企业转型复苏与可持续发展的有效途径。工矿企业需利用丰富的遗产资源,
发酵过程作为啤酒生产中至关重要的一环,直接影响着啤酒的质量与产量,传统的生产操作或控制方式已不再适应当今的生产规模和生产要求,各啤酒企业纷纷采用先进的工业控制系统
价值管理(VM)是应付当今建筑业诸多挑战的一个有用的管理工具。价值管理不但能带来节约成本这样有形的好处,也可以带来增进对业主需求的理解,促进项目相关人员的沟通等无形的
<正>三仁汤出自吴鞠通《温病条辨》,主治湿温初起。笔者在临床治疗胃肠病,疗效满意。1急性肠胃炎男,35岁。2010-07-12初诊。腹痛、腹泻3d。患者因暴食后出现呕吐频繁,水入即
目的:观察抗纤益心方治疗扩张型心肌病患者疗效。方法:将85例患者随机分为治疗组43例,对照组42例(死亡1例),两组均常规西药治疗,治疗组加服抗纤益心方汤剂,日1剂。6个月后观
介绍了2009年我国塑料工业的发展状况,包括各种塑料制品产销量、产值及进出口情况、合成树脂产销量及进出口情况、塑料机械产销量及进出口状况、塑料助剂的产销量等;同时还指
从枸骨(IlexcornutaLindl.exPaxt.)中分离得到20个化合物,鉴定了16个,分别为:枸骨甙1(Gouguside1,Ⅴ)即坡摸酸3 β O α L 吡喃阿拉伯糖甙;枸骨甙2(Gouguside2,Ⅵ)即3 β O D
以总黄酮得率为指标,采用正交试验联合星点设计-效应面法考察乙醇体积分数、提取时间和固液比对西瓜皮总黄酮提取工艺的影响。结果表明正交试验确定最佳提取工艺为30倍量90%
目的:研究胡芦巴的化学成分。方法:利用硅胶柱、RP-8柱、MCI柱、Sephadex LH-20等柱色谱进行分离、纯化,通过理化性质和波谱特征鉴定结构。结果:从胡芦巴乙醇提取物中分离并