【摘 要】
:
目的:比较不同的缺失值处理方法处理随机缺失数据的效果。方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS9.1,分别模拟完整数据集和不同缺失率的
【机 构】
:
郑州大学公共卫生学院卫生统计学教研室,郑州大学基础医学院,上海交通大学医学院,
论文部分内容阅读
目的:比较不同的缺失值处理方法处理随机缺失数据的效果。方法:以HIV/AIDS血液样本血红蛋白、白细胞和血尿素氮检测数据为基础,利用SAS9.1,分别模拟完整数据集和不同缺失率的数据集,从精确度、准确度和分布三方面比较不同方法对缺失数据集的处理效果。结果:任意缺失比例下血红蛋白和白细胞数据经不同的方法处理后与完整数据集比较差异无统计学意义。不同缺失比例下,多重填补(MI)法的精确度最高。缺失率10%~20%时,MI法填充后的准确度最高。缺失率30%时,成组删除法处理后的准确度最高。缺失40%以上时,准确度填充效果不稳定。不同缺失比例下,回归法、成组删除法和MI填充2次后的数据的分布特征与完整数据集一致。结论:数据缺失10%~20%时,MI法填充效果最好;缺失30%时,成组删除法处理效果最好;缺失40%以上时,所有方法填充效果均不佳。
其他文献
随着高等职业教育的发展,企业在高职教育中的主体地位越发明显,在职业教育过程中起着重要的作用。校企"双主体"育人是高职教育的一个标志性特征。但是现阶段存在政策制度不够完
作为国际主要货币,美元的汇率走势对全球经济具有重要影响,而美元指数则是反映美元强弱程度的重要指标。本文在概括总结美元指数变动历程及其特征的基础上,提出影响美元指数
目的:制备双氯芬酸胆碱。方法:以双氯芬酸和胆碱为原料,合成了双氯芬酸胆碱,对其结构进行了紫 外吸收光谱(UV)、红外吸收光谱(IR)、质谱(MS)、核磁共振氢谱(1HNMR)、核磁共振碳谱(13CNMR)元素分析。结果: 实验
提到动漫,人们一开始想到的就是两个动漫大国——美国和日本。而在二十世纪50、60年代,我国的动漫产业同样取得过辉煌的成就,独具中国特色的水墨画风格动漫作品广受世界观众
本文从广义和狭义两个角度分析副语言及其交际功能。力图明确广义与狭义副语言的研究范围及其交际功能。从动态和静态两个方面来看,广义副语言指表情、动作、体势语和狭义副语
本文从民用小型同步发电机的故障现象,分析其故障原因,阐述所采取的维修措施和处理办法,并从理论和实践两方面作出了对发电机绕组重绕及重接的探讨。
利用MODIS影像数据,采用劈窗算法来反演安徽地区的地表温度。结合Sobrine、覃志豪等提出的NDVITEM方法和地物监督分类方法,对地表比辐射率进行了估算,将反演结果与NASA的地表
本文采用因子分析和聚类分析法,对统计抽样选取的307家上市公司的信用风险进行综合评价,将具有相似信用风险水平的受评上市公司划分为同类,确定出评级标准,从而构造出基于我
从核心企业的角度探讨食品供应链社会责任管理问题。从层次模型概述了食品企业社会责任的内涵和食品供应链社会责任的特征,分析了核心企业在供应链管理中的中心地位。无论是