基于机器学习的大于胎龄儿的预测及分型

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:hionor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大于胎龄儿是指出生体重在相同胎龄平均体重的第90百分位以上(约相当于平均体重的2个标准差以上)的婴儿。大于胎龄儿本身容易产生多种并发症,且产妇容易产生各类产伤。因此,建立大于胎龄儿预测模型对大于胎龄儿进行早期诊断及干预,具有重要意义。除此此外,大于胎龄儿分型的研究顺应精准医疗的理念,有助于提高大于胎龄儿诊治的效益。在医疗领域中,机器学习用于疾病预测、疾病分型等已有许多成功的案例,这为大于胎龄儿预测与分型模型的建立带来了启发。主要采用2010年到2013年之间收集到的新生胎儿数据记录作为样本,运用机器学习技术对大于胎龄儿疾病进行预测及分型。对大于胎龄儿预测及分型的研究主要分为数据处理、疾病预测、疾病分型三部分。第一步数据处理主要是为了解决由于样本信息收集的原始性与真实性带来的问题。这些问题包括样本特征类型复杂、标准不一致、数据缺失、信息重叠、数据不平衡、标签不明等。具体应用到了数据清洗、数据集成、数据规约、数据变换,以及专家知识、特征独立、低方差过滤等特征选择方法。第二步运用数据处理后的数据集构造大于胎龄儿分类器,采用稀疏逻辑回归模型获得分类结果及解释性强的相关特征,采用梯度提升树模型挖掘特征与分类结果的非线性关系,采用弱监督学习利用未标记与标记混淆的数据对大于胎龄儿分类器进行补充和泛化。第三步使用正样本、借助聚类方法,对大于胎龄儿进行分型。利用有监督方法得到的最优大于胎龄儿预测模型召回率为0.66,精准率为0.94,曲线下面积为0.89。使用未标记与标记混淆的数据弱监督学习后,分类器召回率为0.82,精确率为0.965,曲线下面积为0.89。发现双方体重指数、是否吸烟(被动吸烟)、有无生活工作压力、饮酒与大于胎龄儿发生与否相关,此外双方在最佳生育年龄、血红蛋白等指标正常时胎儿更不容易患病。分型得到两个大于胎龄儿亚型,一类与男女双方肌酐、女方血红蛋白、女方体重指数、叶酸服用情况等身体指标相关,另一类则与男女双方年龄、男女双方职业、男女双方教育程度等社会指标相关。利用大于胎龄儿预测领域的相关理论知识、真实数据,运用机器学习方法,得到效果良好预测分类器,发掘出与大于胎龄儿发生相关的特征,得到两类模糊亚型。这有利于帮助医生进行大于胎龄儿诊断,且模型具有一定的可解释性,实现了辅助临床的目标。
其他文献
随着化石能源的枯竭和各种环境问题越来越严重,清洁能源受到世界各国越来越多的关注,波浪能作为非常有潜力的清洁能源之一,对于解决化石能源带来的各种问题,具有重要的意义。
本文为一篇翻译实践报告,报告结合重庆邮电大学的学科优势及其翻译硕士专业的人才培养宗旨,节选英文著作《以人为本的虚拟现实设计》第五部分的内容作为本报告的原文本,旨在
为将低品位可再生能源直接应用于采暖系统,提出了一种以碳钢/水重力式热管为加热管的低温辐射地板采暖方式,分析了其传热特性并对热工性能进行了实验研究。在不同供水温度(35~45oC
贫困作为限制经济增长的一个重要待解决问题,学者对其研究也涉及政治、文化、社会等多个方面,越来越多的学者开始从经济学角度出发,专注于研究金融发展与贫困问题的关系。根
随着现代交际方式的发展,语言或者语言变体之间的接触日趋频繁,而语码转换现象也越来越引起学术界的广泛关注。纵观国内外语言学家从不同角度对语码转换的研究,作者发现现阶
十七大工作报告中,推进信息化的思想贯穿全篇,成为报告的一个重要亮点,与之直接相关的表述共有十处之多,无论是深入贯彻落实科学发展观,促进国民经济又好又快发展,加快行政管理体
HPM在小学数学教学中一直没有得到有效的贯彻,通过文献研究发现,HPM教学的研究在理论上相对比较丰富,而在HPM教学的课堂教学方面,大多数公开发表的文献都只是介绍具体教师的某个具体实践个案,而且普遍集中在初高中,关于小学数学概念教学的相关研究少之又少,更何况对不同学情的学生而言,具体实践个案缺乏可复制性和普遍推广性。但是,国际上对寻找和构建符合学生认知发展水平的HPM教学模式的研究在不断进行着、丰
自石墨烯被发现以来,二维层状材料成为近十几年来的研究热点,在许多领域显示出着巨大的应用潜能。其中,数个原子层的六方氮化硼(h-BN),亦被称为―白石墨烯‖,是一种类石墨烯的