多种机器学习算法预测呼吸系统疾病住院费用效果比较分析

来源 :吉林大学 | 被引量 : 0次 | 上传用户:wanglinux_0208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:针对2013年深圳市98家医院呼吸系统疾病住院费用数据,使用随机森林、支持向量机、神经网络三种方法建立模型,比较三种机器学习方法在不同样本量下对住院费用的预测性能,探讨机器学习方法在住院费用预测问题中应用的优劣,为住院费用预测问题提供机器学习方法上的支持。方法:将2013年深圳市呼吸系统疾病住院数据划分为互斥的训练集和测试集。在测试集上分别进行随机森林、支持向量机、神经网络模型超参数优化以及模型训练,然后用完成训练的模型在测试集上对因变量进行预测输出,并与因变量的真实值进行对比。通过ROC曲线下面积、混淆矩阵、精度、查准率、查全率及F1分数等指标对三种机器学习模型进行评价比较。在不同样本量的子集以及完整数据集上重复这一实验过程,从而获得三种机器学习方法在不同样本量下的表现变化。结果:1.500样本量下,随机森林、支持向量机、神经网络模型ROC曲线下面积分别为0.911、0.875、0.796;精度分别为64.80%、63.20%、54.40%;F1分数分别为63.52、62.36、53.29。随机森林与支持向量机表现较神经网络好,但是随机森林模型训练及预测耗时均最长。2.2000样本量下,三种模型ROC曲线下面积分别为0.944、0.915、0.923;精度分别为76.40%、71.80%、74.80%;F1分数分别为75.79、71.33、74.22。此时三种方法的预测性能差距明显缩小,神经网络模型的各项指标都显著提升,随机森林模型依然耗时最长。3.10000样本量下,三种模型ROC曲线下面积分别为0.945、0.934、0.934;精度分别为76.60%、74.44%、74.44%;F1分数分别为76.78、74.23、74.39。三种方法差距进一步缩小,随机森林及支持向量机的训练耗时都明显增加。4.124980样本量下,三种模型ROC曲线下面积分别为0.942、0.939、0.953;精度分别为76.80%、74.88%、77.51%;F1分数分别为77.10、74.81、77.73。无论从训练、预测耗时上,还是预测性能指标上,神经网络模型均是最优的。支持向量机及随机森林模型的预测性能依然较好,但训练耗时分别达到了神经网络模型的4.4倍和44.8倍。总体来看,随机森林在不同样本量下均表现较好,十分稳定;支持向量机在小样本下有不错表现,大样本下虽然预测依然可靠,但计算量过大,耗时过长;神经网络在样本量不足的情况下预测性能远低于其他两种方法,但随着样本量增长,预测性能提升迅速,且始终耗时较短。结论:1.随机森林、支持向量机、神经网络在呼吸系统疾病住院费用预测应用中均具有可行性。2.随着样本量增长:随机森林预测能力稳定且优秀,计算耗时可接受;支持向量机预测能力稳定但稍逊于随机森林,计算耗时呈指数型增长;神经网络预测能力明显提升,计算耗时最少。3.超参数优化对于支持向量机、神经网络模型预测性能提升有明显帮助,对随机森林模型的帮助有限。
其他文献
<正> 据台湾新闻报道,今年4月美国政府同意向台湾出售AIM-120“先进中程空空导弹”(AMRAAM),但是导弹将留在美国,除非中国大陆获得同样先进的俄制导弹,否则将不会交付台湾当
面对目前全国污泥围城的环保问题,如何妥善处理污泥成为了目前急需解决的重要问题。为了实现城市生活污泥资源减量化、无害化、资源化和规模化处置,应充分发挥火力发电厂存量
<正> 简介 从1974年起,中国发射了一系列返回式卫星,这些卫星与涉及遥感和微重力研究等计划相关。虽然第一次发射失败,但其后的飞行均获得了成功,这个记录使中国可以宣称他们
成人教育是九年义务教育的延续,也是高中教育的补充。成人教育功能实现,是成人教育价值的外化表现形式。由于多种制约因素的共同作用,成人教育功能实现渠道受阻现象常常发生,我们
在模糊、多变的职业环境下,人们的职业决策变得更加复杂困难,且一生之中常常要做出多次重要的职业决策,如变换雇主或职业领域,如何选择更适合自己的职业是众多求职者面临的一
教师在“微专题”教学中应先引导学生感受,再进行阶梯式探究,使学生提升知识迁移能力和综合运用能力.“微专题”可以围绕某个小专题或某个具体数学问题进行局部探究,避免让学生陷
Fishbein模型认为消费者对于购买某产品这一行为的态度以及从众心理可以解释购买意愿,本文研究了该模型在国外品牌手机消费行为上的适用性,发现模型可以较好地解释大学生消费
无论是通过携号转网倒逼运营商的品质提升,还是通过携号转网赋予用户自由选择权,都不应该成为口号。这里面,监管层需要做的工作还非常多。随着我国移动通信事业的飞速发展,手
现代足球比赛中,决定一场比赛胜负的是进球,只要在进攻中比对方打进更多进球就可以取得比赛胜利;正因为这样,进球是衡量一支球队进攻质量的标准,对于比赛获胜也是及其重要的
目的针对小儿多发性抽动症,研究分析温胆汤加减方的临床治疗效果。方法以2017年1月至2019年10月我院中医儿科收录的总计42例小儿多发性抽动症患儿为对象,随机以每组21例分为