论文部分内容阅读
目的:针对医学研究资料中经常出现缺失数据和删失数据的情况,探索常用的缺失数据和删失数据的处理方法,最后分别采用删除法、期望最大化法(Expectation maximization,简称EM)和基于MarkovChain Monte Carlo模型的多重估算对缺失数据进行统计处理,比较三种方法的优劣以及各自在处理医学缺失数据上的适用性。方法:采用SAS9.2编程,分别对完整数据集制造不同缺失率的随机缺失数据集,然后用Ad Hoc法、EM法和MCMC法对不同缺失率的数据集分别进行处理,对处理结果进行比较。结果:数据缺失率≤5%时,经Ad hoc法处理的效果较好;数据缺失率在5%-40%时,经MCMC法处理后的分析结果更接近真实数据集;数据缺失率达到50%时,三种方法的处理效果均不理想。结论:Ad Hoc法和MCMC法对不同缺失率的数据集的处理效果有各自的优势, EM法与MCMC法计算结果接近,略差于MCMC法。