基于数据挖掘的肺癌晚期病人肺部感染规律性研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:z360052113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长期以来,癌症一直是人类健康的重要威胁,肺癌的发病率和死亡率的增长情况在所有癌症病例统计结果中均排名前列。肺癌病人通常有伴随的细菌或者真菌感染。根据临床上的不完全统计,绝大多数肺癌患者最终死于病原感染期,死因多为感染并发症,只有极少数患者死于癌症本身。感染原类型的诊断是治疗感染并发症的关键。现阶段临床上的细菌学检验方式主要可分为血液及骨髓标本的细菌学检验,痰及下呼吸道分泌物标本的细菌学检验以及尿液标本的细菌学检验等三种类型。肺癌患者通常接受痰及下呼吸道分泌物标本的细菌学检验,而检验周期一般长达七天。而本文将利用数据挖掘技术,对肺癌晚期患者临床指标进行分析,建立临床指标与患者肺部感染原(克雷伯菌、假丝酵母菌)之间的模型,通过数据模型预测患者的肺部感染原,探索将诊断周期大幅缩短的可能性。为此,本文收集了370例肺癌晚期患者(包含222例假丝酵母菌肺部感染患者和148例克雷伯菌肺部感染患者)的临床指标,每例包含21项临床指标。本文采用简单删除缺失数据所属样本的方法处理数据缺失问题,通过同时对少数类样本进行简单有放回过采样,对多数类样本进行欠采样的数据抽样方法解决数据样本类别不平衡问题,使用PCA做特征提取,RF-RFE做特征选择,使用随机森林作为分类器,建立分类模型。本文采用十折交叉验证的方式评估分类模型的泛化性能,使用特异度,敏感度,阳性预测值以及阴性预测值作为评价标准,使用ROC曲线做泛化能力的可视化,通过AUC值量化模型泛化能力。同时本文还针对数据抽样,分类器,特征选择与提取三个方面设置了对照实验。本文的实验结果如下:(1)以克雷伯菌为阳性,模型输出较高的阴性预测值和敏感性。(2)对于本文数据的类别不平衡问题,同时对少数类样本进行简单有放回过采样,对多数类样本进行欠采样的数据抽样方法取得了较好的效果。该方法对分类器泛化能力有显著提升。(3)随机森林和支持向量机在本文研究的分类问题上的泛化能力比较接近。(4)PCA,ICA等特征提取方法对分类器泛化能力提升明显。
其他文献
古代巴族拥有悠久的崇虎历史,巴式青铜兵器上大量存在的虎纹图案反映出巴人在春秋战国时期的崇虎宗教文化内涵。文章在对虎纹释解的基础上,结合历史文献记载阐述了巴人崇虎的
<正> 禹州市审计局最近制订了《禹州市审计局实施审计项目精品工程活动方案》,为确保这项活动的顺利实施,采取了六项保证措施。 一是加强领导,从组织上保证。该局成立了实施
戎马一生的开国上将王震,幼年家贫,只读过几年私塾和小学,自谦为“粗人”,但他深谙知识和知识分子的重要性,无论战争年代还是和平建设时期,他一直喜欢读书,终生敬重、推崇知识分子,不
作文教学是初中语文教学的重要内容,旨在考查学生的语言综合运用能力和写作水平。学生在作文教学活动中发挥着主体作用,对作文教学的效能具有直接影响,有些学生因诸多因素的制约不能快速掌握知识,而有些学生对知识的掌握和理解较好,这就需要教师在实际教学中因材施教、因势利导,以满足不同层次学生的多样化需求。本文根据初中作文教学中因材施教的原则,对作文指导策略展开分析。  一、因材施教概述  因材施教作为一种新型
在我国社会主义市场经济发展的过程中,高速公路的建设有着十分重要的意义,它不仅直接关系到我国国民经济的增长,还给人们的生活带来了极大的便利,为此,我们在对高速公路沥青
<正>依照当前娱乐圈的发展规则,艺人的成名离不开经纪公司或经纪人的有力市场推广,但是艺人成名后,往往因为各种因素与经纪公司分道扬镳,此时司法应做出如何判定,将直接关系
在高中写作教学中,运用建构主义理论指导下的支架式教学法来教授学生写作技巧,在写作过程中,教师为学生构建支架,积极辅导构建知识内容,然后撤出支架,在此过程中帮助学生独立
<正>阿来的小说一直以来都广受研究者的喜爱,尤其《尘埃落定》在获得第五届茅盾文学奖之后,对阿来小说的解读逐渐成为学界的热点。作为关注的焦点的《尘埃落定》,其主题意蕴
<正>钩椎关节(uncovertebral joint;Luschka joint)是颈椎区别于胸腰椎所特有的重要解剖结构。1834年Rathke[1]首先对钩突进行了描述,认为颈椎后外侧椎体边界向上(颅骨方向)
目的观察左旋多巴对剥夺性弱视猫视皮质神经细胞形态和超微结构的影响。方法正常组猫2只,弱视组猫、弱视服药组猫各4只。剥夺性弱视猫模型制作为14周。弱视服药组猫服息宁(左