基于代价敏感性和概率校准的先天性心脏病概率预测模型研究

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:shgrx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的先心病数据存在类别不平衡问题,使先心病预测存在偏差,本文针对以上问题建立基于代价敏感性和概率校准的先心病概率预测模型,以期提高模型概率预测能力,为筛选先心病高危人群给予参考。方法构建调整惩罚权重的加权支持向量机(weighted support vector machine,WSVM)和加权随机森林(weighted random forest,WRF)的Platt和Isotonic regression(Iso)校准模型(WSVM-Platt,WRF-Platt,WSVM-Iso,WRF-Iso),同时与logistic回归模型进行对比。结果通过比较6种模型(WSVM-Platt,WSVM-Iso,WRF,WRF-Platt,WRF-Iso和logistic回归模型)的概率预测效果评价指标AUC(the area under the curves)、RMSE(root mean squared error)及SAR可得,以上6类模型均比较理想。6种模型中,WSVM的Platt校准模型的预测效果最优,logistic回归其次;对于WRF,WRF-Platt和WRF-Iso的预测效果均优于WRF;对于WRF和WSVM,Platt校准的概率预测能力均略优于Iso校准。结论针对极端不平衡数据,本文模型的预测结果较为理想。相比未校准模型,校准模型的预测效果更优,Platt校准预测效果略优于Iso校准,故本文构建的模型可为有效筛选先心病高危人群提供参考。
其他文献
<正>抗战全面爆发后,桂林一度成为抗战时期大后方的文化中心,享有"桂林文化城"的美誉。据统计,当时集结在桂林的作家、画家、音乐家、戏剧家和新闻工作者等,多达1000余人,其
迄今为止,全球已经出现了四次并购浪潮,目前正处于第五次并购浪潮之中。本次并购潮最大的特点是并购规模大,并购对象逐步由传统资源转向企业品牌、核心技术和营销渠道等,高新
本文通过对我国水利建设管理模式发展阶段的分析,阐述了新型代建制管理模式与传统管理模式的区别,在此基础上,就代建制管理模式从系统外部、内部和三维角度进行了分析,提出代
在文献研究的基础上,将服务分为以被操作性资源为基础的服务和以操作性资源为基础的服务,并提出不同类型的服务对客户感知价值有不同的影响。通过对中国精细化工行业的大样本
~~
随着农产品(食品)贸易全球化和现代农业产业化进程的推进,作为关键经营主体的食品企业发展迅速,但食品安全问题也日益凸显;在此背景下,食品企业如何保证食品安全以及向市场传
定语从句是高中英语语法教学的重难点。它始终贯穿于整个高中的英语教学和运用中。学生经常会弄不清定语从句中的关系代词,关系副词的用法。在实际运用中出现了不少问题。
通过实地观察、问卷调查、访谈调查等方法,经过近5 a的调查研究,发现了"三农"气象服务与专项建设中存在的不足和隐患,指出基层认识缺失、人才短缺、科技支撑和设备保障能力弱
<正>《咬文嚼字》杂志在公布2006年中国出现频率最高、覆盖面最广的十大语文差错时,认为涉及标点符号的唯一差错是:很多人在寄信时喜欢在信封上将"收"字用括号括起来。窃以为
<正> "巨刺""缪刺"法是针灸临床上常用而有效的取穴法之一。笔者在学习和运用过程中也有一些粗浅的体会,现就有关问题作如下讨论。
期刊