论文部分内容阅读
改革开放30年来随着经济的快速发展,我国医疗费用不断增长,2007和2008年我国卫生总费用分别为10966亿元和14535.4亿元,根据《2009年我国卫生事业发展统计公报》预计2009年全国卫生总费用达16119亿元,人均卫生费用1192元。医疗费用快速增长成为全国普遍存在的问题,如何解决好这一问题,已引起社会各界的高度关注。有效地控制医疗费用上涨,尤其是住院费用的过快上涨,首先需要选择正确的数理统计方法分析住院费用的影响因素。以往对于住院病人住院费用影响因素的研究报道较多,分别运用相应的统计方法对住院费用资料进行多种分析处理,其中包括:采用不同多元统计方法探索住院费用的影响因素,并对住院费用发展趋势进行预测;对不同种类的住院费用进行分类等。传统的多元线性回归方法在分析住院费用中存在某种局限性,而BP神经网络由于其可以对线性或非线性多变量问题在不设前提条件的情况下进行统计分析,同传统的统计方法需要被分析的变量符合一定的条件相比有其自身的优点,故越来越多地应用于住院费用研究。人工神经网络(Artificial Neural Network,ANN)是一种模拟生物神经元工作方式的数学模型,在多个学科领域被广泛应用于模式识别,预报预测,数值逼近等问题。误差逆向传播神经网络模型(Back Propagation ,BP)是神经网络中的一种,因网络权值的调整规则采用误差逆向传播算法,即BP算法而得名,是神经网络中目前发展最迅速,应用最成熟的网络模型。由于BP神经网络对于资料的类型、分布等无任何前提条件,且具有一定的容错性,能通过自我学习,自我调整实现输入变量和输出变量之间的复杂映射关系,因此可以考虑将BP神经网络用于对住院费用及其影响因素进行建模,实现住院费用及其影响因素之间的关系拟合。研究目的:本研究通过对河北联合大学附属医院提供的住院费用病案首页资料,分别建立BP神经网络模型和多重线性回归模型,并对住院费用研究中拟合和推广能力及其适用条件进行比较,分析BP神经网络在不同变异资料中拟合和推广能力的稳定性,进而论证正确的住院费用预测方法。同时对BP神经网络建模过程中模型参数的优化进行探讨。同时以住院费用为例探讨因变量为连续变量,自变量为分类变量或连续变量和分类变量均有的非线性关系问题时统计方法的应用。资料与方法:本研究资料来自于河北联合大学附属医院提供的2006~2010年的A组急性阑尾炎(ICD10代码为K35)和B组糖尿病(ICD10代码为E11)病人的病案首页资料,共计病例数2317份。采用BP神经网络和多重线性回归分别进行住院费用的函数拟合建模,在建模过程中采用t检验和相对误差对不同统计方法进行比较分析,在己建立的BP神经网络模型基础上采用敏感度分析进行住院费用的影响因素分析。以上多重线性回归和t检验在SPSS13.0软件中进行,BP神经网络建模和敏感度分析均通过在MATLAB软件中进行编程得以实现。主要结果:一、模型性能结果对两组数据分别进行BP神经网络和多重线性回归建模,其结果如下:急性阑尾炎组结果为BP神经网络:训练集R=0.79,R~2=0.785;测试集R=0.72,R~2=0.704;多重线性回归:训练集R=0.598,R~2=0.357。糖尿病组结果为BP神经网络:训练集R=0.96,R~2=0.869;测试集R=0.51,R~2=0.499;多重线性回归:训练集R=0.685,R~2=0.443。二、BP神经网络和多重线性回归结果比较通过相对误差进行比较,配对t检验结果如下:急性阑尾炎组训练集t=3.63,P=0.000;测试集t=1.31,P=0.190,糖尿病组训练集t=9.65,P=0.000;测试集t=-5.29,P=0.000。三、BP神经网络在不同变异数据中的结果比较通过相对误差进行比较,独立样本t检验结果如下:训练集t=1.18,P=0.237;测试集t=-1.34,P=0.181。训练集相对误差均值:急性阑尾炎组0.31±3.60,糖尿病组0.12±1.08,差值估计0.183;测试集相对误差均值:急性阑尾炎组0.364±0.553,糖尿病组0.52±1.54,差值估计-0.156。四、敏感度分析结果敏感度分析显示:各影响因素的敏感度从大到小依次为:急性阑尾炎组:手术情况(0.27)、住院时间(0.224)、治疗结果(0.157)、住院次数(0.14)、次要诊断(0.058)、入院病情(0.048)、年龄(0.037)、职业(0.033)、费别(0.025)、性别(0.008),显示对住院费用影响最大的因素是手术情况,最小的是性别。糖尿病组:住院时间(0.348)、手术情况(0.162)、年龄(0.131)、住院次数(0.073)、治疗结果(0.072)、次要诊断(0.062)、职业(0.051)、费别(0.045)、入院病情(0.038)、性别(0.019),显示对住院费用影响最大的因素是住院时间,最小的是性别。结论:本次研究采用BP神经网络实现对住院费用进行拟合建模,通过对不同模型参数的设定选择可以达到优化模型的作用。BP神经网络与多重线性回归相比拟合和推广能力更优,性能更稳定。在变异较大的数据中BP神经网络由于学习过多的样本细节,预测能力下降。神经网络的拟合能力和推广能力不能两全,在建模时应根据实际情况对两者加以权衡。基于BP神经网络模型的敏感度分析可以用于住院费用影响因素的分析。基于理论分布的统计方法对资料类型要求严格,而应用BP神经网络来处理非线性问题能克服传统统计方法的弱点,为非线性问题的预测和影响因素分析提供一种较优的分析方法。由于本研究所选择的病案首页信息有限,因此建立的模型对住院费用预测的精度有限,可以提供一定的理论参考。BP神经网络由于不同的参数设定对网络的结果有不同的影响,如不同隐含层神经元数、不同初始权值和阈值等,目前仍缺乏理论上的支持,有待进一步研究。