【摘 要】
:
目的:对于数据缺失的处理方法是基于数据集研究的重要组成部分,缺失数据不仅会增大统计分析的复杂性和难度,还会导致分析结果的偏倚。因此,需要提供有效的方法降低缺失数据对
【基金项目】
:
国家重点研发计划精准医学专项基金项目(编号:2016YFC0901602);NSFC-广东大数据科学中心联合基金项目(编号:U1611261);广东省前沿与关键技术创新专项基金项目(编号:2014B010118003);广州市科技计划项目(编号:201604016136,201604020016);国家自然科学基金项目(编号:11661007)~~
论文部分内容阅读
目的:对于数据缺失的处理方法是基于数据集研究的重要组成部分,缺失数据不仅会增大统计分析的复杂性和难度,还会导致分析结果的偏倚。因此,需要提供有效的方法降低缺失数据对整体的影响。方法:基于医学临床数据集,针对不同数据类型,比较了KNN插补、随机森林插补、决策树插补、多重插补4种不同的插补方法在不同的缺失率下的插补效果,并采用均方根误差和错误率评价插补效果。结果:KNN插补和决策树插补对缺失率有较高要求,当缺失率≥50%时这两种方法不适用;多重插补和随机森林插补对不同的缺失率情况下的插补效果变化不明显。结论:各插补方法对不同缺失率和不同的数据类型的插补效果不同。在以上四种方法中,随机森林插补在本研究中表现出较好的插补效果。
其他文献
近10年来,膀胱全切原位肠道代膀胱术广泛用于治疗膀胱肿瘤。现就该手术术后并发症及其防治等问题进行简要阐述。
土壤湿度是陆面过程的重要参量,可以通过影响土壤本身的热力性质和水文过程,导致局部大气环流的改变以及区域性短期气候异常。青藏高原作为全球气候变化的敏感区,其地气间的水分与能量交换对亚洲季风和全球大气循环有着极大的影响,且高原地区的土壤水分数据能够为陆-气相互作用和数值模拟等研究提供重要的观测信息和初始输入数据。文中综述了青藏高原土壤湿度观测和研究对气候变化影响的重要性,高原土壤湿度观测站网建设现状,
目的:研究用右美托咪定与舒芬太尼对接受腹腔镜子宫肌瘤剔除术的患者进行麻醉诱导的临床效果。方法:将近年来在迁安燕山医院进行腹腔镜子宫肌瘤剔除术的80例患者随机分为观察
目的探讨早期护理干预对颅脑损伤患者肢体康复及心理健康的影响。方法将80例颅脑损伤患者随机分为观察组40例和对照组40例。观察组患者采用早期护理干预,对照组患者进行常规的
目的 探讨延续性护理干预对中重度烧伤病人生活质量及负性情绪的影响。方法 调查病例选自医院2013年1月~2016年6月接收的40例重度烧伤病人,对所有病人出院时实施延续性护理指
压塑与注塑采用不同类型的塑料,前者采用热固性塑料,后者采用热塑性塑料。压塑成型工艺及模具设计是一门不断发展的综合科学,不仅随着高分子材料合成技术的提高,压塑成型设备
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
港珠澳大桥每座预制桥墩的承台内预留6个带甩筋的后浇孔,桥墩安装完成后要对预留钢筋进行接驳,并且施加预紧力。在承台预制时,通过内芯模对甩筋进行精确定位,保证对接钢筋具
本文通过制备不同研磨遍数的碳纳米管(CNTs)与天然橡胶(NR)湿法混炼共沉胶,分析共沉胶物理机械性能、硫化性能和动态力学性能。结果表明:在湿法混炼共沉胶中,随着填料中碳纳