多种机器学习算法预测呼吸系统疾病住院费用效果比较分析

来源 :吉林大学 | 被引量 : 0次 | 上传用户：wanglinux_0208

【摘要】

：

【作者】

：

孙冲

【出处】

：

吉林大学

【发表日期】

：

2020年08期

【关键词】

：

机器学习支持向量机神经网络随机森林住院费用

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目的:针对2013年深圳市98家医院呼吸系统疾病住院费用数据,使用随机森林、支持向量机、神经网络三种方法建立模型,比较三种机器学习方法在不同样本量下对住院费用的预测性能,探讨机器学习方法在住院费用预测问题中应用的优劣,为住院费用预测问题提供机器学习方法上的支持。方法:将2013年深圳市呼吸系统疾病住院数据划分为互斥的训练集和测试集。在测试集上分别进行随机森林、支持向量机、神经网络模型超参数优化以及模型训练,然后用完成训练的模型在测试集上对因变量进行预测输出,并与因变量的真实值进行对比。通过ROC曲线下面积、混淆矩阵、精度、查准率、查全率及F1分数等指标对三种机器学习模型进行评价比较。在不同样本量的子集以及完整数据集上重复这一实验过程,从而获得三种机器学习方法在不同样本量下的表现变化。结果:1.500样本量下,随机森林、支持向量机、神经网络模型ROC曲线下面积分别为0.911、0.875、0.796;精度分别为64.80%、63.20%、54.40%;F1分数分别为63.52、62.36、53.29。随机森林与支持向量机表现较神经网络好,但是随机森林模型训练及预测耗时均最长。2.2000样本量下,三种模型ROC曲线下面积分别为0.944、0.915、0.923;精度分别为76.40%、71.80%、74.80%;F1分数分别为75.79、71.33、74.22。此时三种方法的预测性能差距明显缩小,神经网络模型的各项指标都显著提升,随机森林模型依然耗时最长。3.10000样本量下,三种模型ROC曲线下面积分别为0.945、0.934、0.934;精度分别为76.60%、74.44%、74.44%;F1分数分别为76.78、74.23、74.39。三种方法差距进一步缩小,随机森林及支持向量机的训练耗时都明显增加。4.124980样本量下,三种模型ROC曲线下面积分别为0.942、0.939、0.953;精度分别为76.80%、74.88%、77.51%;F1分数分别为77.10、74.81、77.73。无论从训练、预测耗时上,还是预测性能指标上,神经网络模型均是最优的。支持向量机及随机森林模型的预测性能依然较好,但训练耗时分别达到了神经网络模型的4.4倍和44.8倍。总体来看,随机森林在不同样本量下均表现较好,十分稳定;支持向量机在小样本下有不错表现,大样本下虽然预测依然可靠,但计算量过大,耗时过长;神经网络在样本量不足的情况下预测性能远低于其他两种方法,但随着样本量增长,预测性能提升迅速,且始终耗时较短。结论:1.随机森林、支持向量机、神经网络在呼吸系统疾病住院费用预测应用中均具有可行性。2.随着样本量增长:随机森林预测能力稳定且优秀,计算耗时可接受;支持向量机预测能力稳定但稍逊于随机森林,计算耗时呈指数型增长;神经网络预测能力明显提升,计算耗时最少。3.超参数优化对于支持向量机、神经网络模型预测性能提升有明显帮助,对随机森林模型的帮助有限。

其他文献

超超临界机组关于燃煤耦合污泥发电的性能分析

面对目前全国污泥围城的环保问题,如何妥善处理污泥成为了目前急需解决的重要问题。为了实现城市生活污泥资源减量化、无害化、资源化和规模化处置,应充分发挥火力发电厂存量

会议

污泥掺烧环保排放机组经济性的影响燃烧分析

人格、职业环境与工作满意度

在模糊、多变的职业环境下,人们的职业决策变得更加复杂困难,且一生之中常常要做出多次重要的职业决策,如变换雇主或职业领域,如何选择更适合自己的职业是众多求职者面临的一

学位

人格职业环境职业分类工作满意度

高三数学教学中“微专题”的教学实践与思考

教师在“微专题”教学中应先引导学生感受，再进行阶梯式探究，使学生提升知识迁移能力和综合运用能力．“微专题”可以围绕某个小专题或某个具体数学问题进行局部探究，避免让学生陷

期刊

“微专题”教学解题原理教学反思

消费者对产品的消费经验、产品的文化意含与Fishbein模型

Fishbein模型认为消费者对于购买某产品这一行为的态度以及从众心理可以解释购买意愿,本文研究了该模型在国外品牌手机消费行为上的适用性,发现模型可以较好地解释大学生消费

会议

消费行为Fishbein模型购买意愿文化适应

实施携号转网还需要进一步的配套措施

无论是通过携号转网倒逼运营商的品质提升,还是通过携号转网赋予用户自由选择权,都不应该成为口号。这里面,监管层需要做的工作还非常多。随着我国移动通信事业的飞速发展,手

期刊

携号转网配套措施手机用户数

足球进攻技战术指标与进球相关性对比分析

现代足球比赛中,决定一场比赛胜负的是进球,只要在进攻中比对方打进更多进球就可以取得比赛胜利;正因为这样,进球是衡量一支球队进攻质量的标准,对于比赛获胜也是及其重要的

学位

进攻技战术指标进球数相关性中超联赛西甲联赛

多种机器学习算法预测呼吸系统疾病住院费用效果比较分析

其他学术论文