【摘 要】
:
目的探讨随机森林(RF)的变量捕获方法在高维数据变量筛选中的应用。方法通过模拟实验和实际数据分析,对两种变量捕获(vh.md,vh.vimp)和逐步剔除方法(var SelRF)进行比较,并通
【机 构】
:
哈尔滨医科大学卫生统计学教研室,哈尔滨医科大学生物信息教研室
论文部分内容阅读
目的探讨随机森林(RF)的变量捕获方法在高维数据变量筛选中的应用。方法通过模拟实验和实际数据分析,对两种变量捕获(vh.md,vh.vimp)和逐步剔除方法(var SelRF)进行比较,并通过选入变量的数目、模型预测错误率(PE)和受试者工作特征曲线下面积(AUC)对其进行评价。结果模拟实验表明,在变量具有联合作用、交互作用和弱独立作用情况下,变量捕获方法均明显优于var SelRF方法和全变量VIMP排序方法;实际数据分析结果表明,变量捕获方法筛选变量结果稳定,并能够保证良好的预测效果。结论变量捕获方法适用于高维数据的变量筛选,具有实用价值。
其他文献
经纤支镜灌洗治疗26例严重肺部感染江西省上饶地区医院呼吸内科(334000)孟庆伟肺部感染常因各种因素致引掀不畅,造成病情迁延不愈,是临床上较棘手问题。我院自1993年5月~1994年8月对26例这类病人,采用OlympusB3型
<正>近年来,昆明市以"军地双六互动计划"为抓手,以双拥创建活动为载体,以解决军民关心的问题为落脚点,以创新富有时代特色的军民共建为重点,确保军民融合发展的各项政策规定
本文对赛艇运动技术的研究进行了综述,从运动学,动力学和流体力学三个方面总结了我国对赛艇技术的研究,得出目前我国对赛艇技术研究的现状和存在的问题,并提出了今后赛艇运动
目的探讨术后复发性直肠癌三维适形放射治疗(3DCRT)联合同步化疗的临床疗效和毒副作用。方法42例术后复发直肠癌随机分为单纯放疗组(单放组)和放疗加化疗组(放化组),各21例。
目的评价308 nm准分子激光治疗白癜风的临床疗效及安全性。评估308 nm准分子激光治疗对白癜风患者生活质量的影响。方法采用308 nm准分子激光治疗68例白癜风患者,共162片皮损
目的以医疗卫生机构年报资料为数据来源,采用成组删除法、极大似然估计法、多重填补法分别对模拟的完全随机缺失数据集缺失值进行处理,比较不同缺失率下三种方法的缺失处理效
对双腔子宫畸形合并妊娠23例的终止方法进行探讨,提示:本组发生率占同期终止妊娠者的1.26%,占有相当比例,值得重视,双腔子宫畸形多合并阴道畸形,占69.57%,并发阴道畸形与阴道正常发生率比较,两者有
3月初.国内尿素市场价格稳中有升,虽然晋、冀、鲁、豫、苏、皖地区高价位成交仍不理想.但由于厂家前期外发东北及南方的订单较多.国内局部地区降雨后市场需求有所增加.支撑尿素市
<正>由抚顺石油化工研究院和中石化洛阳工程有限公司联合承担的丙烷脱氢制丙烯(MPDH)成套技术工艺包,近日在北京通过中国石化股份公司科技部审查,这标志着国产化丙烷脱氢制丙
海洛因中毒致多器官功能衰竭1例报告广东省番禺市何贤纪念医院(511400)郭雪怀海洛因是毒品之一,其主要成分是吗啡,长期大量吸入可致急性中毒,主要症状为昏迷、呼吸深度抑制,血压下降、瞳孔