【摘 要】
:
支气管肺发育不良(bronchopulmonary dysplasia,BPD)是一种常见的早产儿严重呼吸系统慢性疾病,其病理特征表现为胸部X线可见弥漫性损伤,多种炎细胞在炎症灶聚集与肺实质纤维化。该疾病在发病早期死亡风险较高,然而存活下来的患儿也常发生生长发育迟缓、喘息、呼吸道反复感染等疾病,会对患儿的健康成长造成严重伤害,给家庭和社会带来一定压力与负担。因此应用数据挖掘技术研究早产儿支气管肺发
论文部分内容阅读
支气管肺发育不良(bronchopulmonary dysplasia,BPD)是一种常见的早产儿严重呼吸系统慢性疾病,其病理特征表现为胸部X线可见弥漫性损伤,多种炎细胞在炎症灶聚集与肺实质纤维化。该疾病在发病早期死亡风险较高,然而存活下来的患儿也常发生生长发育迟缓、喘息、呼吸道反复感染等疾病,会对患儿的健康成长造成严重伤害,给家庭和社会带来一定压力与负担。因此应用数据挖掘技术研究早产儿支气管肺发育不良相关数据建立预测模型十分重要,可以辅助诊断提升早产儿健康水平。针对早产儿支气管肺发育不良预测问题,本文收集了包含孕母及早产儿相关信息的数据进行分析研究。对于收集好的数据首先进行预处理,其中包括缺失值处理、异常值处理、不一致值处理和数据编码等,将处理好的数据进行描述性分析进而探索各变量与早产儿支气管肺发育不良之间的关系。然后运用Boruta算法进行特征筛选,筛选出15个重要性高的特征变量为模型建立做准备。由于数据不平衡,本文利用SMOTE算法对数据集进行平衡处理,再分别建立Logistic回归、XGBoost、LightGBM三种预测模型并且运用网格搜索的方法进行调参提升模型性能,根据模型在测试集上的准确率、召回率、精确率、F1值、AUC值等多种模型评价指标进行综合对比选出最优模型。结果表明三个预测模型在测试集的准确率都在80%以上,Logistic回归、XGBoost、LightGBM模型的准确率依次提高,XGBoost、LightGBM预测模型性能比较接近,各项指标均高于Logistic回归。其中LightGBM模型表现最优,可以较好地预测早产儿支气管肺发育不良。总的来说,在早产儿支气管肺发育不良预测研究上,可以优先考虑LightGBM模型。
其他文献
汽车保有量的持续增多,加剧了环境的污染和能源消耗。在众多的汽车节能减排措施中,降低车重的效果最为明显。研究表明,汽车轻量化可有效降低燃料消耗,减少尾气排放。白车身约占乘用车整车重量的25%左右,有较大的轻量化空间,如何在保证车身性能的前提下实现轻量化,是国内外研究人员关注的一个热点。本文基于结构优化与材料优选的方法对白车身开展轻量化研究,具体内容如下:首先,搭建白车身有限元模型,对其弯曲、扭转刚度
航空发动机和燃气轮机的热端部件长期服役于高热负荷、高机械负荷环境下,为了保障其热效率以及运转稳定性,必须具备优异的耐高温能力。采用热障涂层技术能够有效地提高热端部件的服役温度并延长热端部件的使用寿命。H2由于其独特的理化性质,在添加至等离子射流中时会发生电离、解离现象,该过程能够产生能量的释放及消耗,继而改变喷枪内电弧状态、喷嘴进出口截面温度、等离子气体放电半径,最终改变等离子射流特性。因此,H2
排气系统作为燃油汽车的重要组成部分之一,其主要起着降噪和尾气处理等作用。在发动机正常的工作下,其产生的振动经过排气系统,由系统上的隔振结构传递到汽车底盘及车身,对车辆的NVH特性产生影响。在发动机工作时,由于其产生的扭矩的影响,在一定程度上会加大排气系统吊钩传递到汽车底盘的动态反作用力,当这个力过大时,不但会对车辆的乘坐舒适度产生一定的影响,而且还会使吊耳和系统的疲劳寿命下降。随着驾乘人员对车辆乘
不可再生化石能源的过度依赖,不仅给自然生态造成了不可估量的破坏,而且导致了全球能源局势的紧张。因此,大力发展和科研攻关可再生绿色能源是大势所趋。利用人工半导体光催化剂将间歇性的太阳能转化为易储存和运输的氢能源(H2)被认为是克服能源短缺和环境危机的一种完美解决方案。Ag2S量子点(QDs)在继承Ag2S纳米颗粒(NPs)出色光学和化学性质的同时,又被量子点的量子尺寸效应赋予了一些新的优异特性和应用
城镇居民人均可支配收入反映了一地区城镇居民生活水平的高低,它也可以反映该地区的经济发展状况,对其进行应用统计分析,可以得出对城镇居民可支配收入影响较大的因素,进而提出增加城镇居民收入的建议,有利于改善城镇居民的生活质量,同时也有利于探索促进该地经济发展的策略,实现本地经济的稳步发展。本文以河南省城镇居民人均可支配收入为研究对象,首先对研究目标描述分析,选取2001—2020年人均河南生产总值、社会
颅内出血是早产儿常见的脑损伤疾病。该疾病是造成患儿神经系统发育障碍的重要病因。随着大数据技术的发展,机器学习方法在医学回顾性研究得到了应用。本文将机器学习方法与传统统计方法结合,对早产儿颅内出血进行回顾性分析,以促进临床医生对于该疾病的理解,把握最佳治疗时机,改善患者预后。本文使用广西某市妇幼保健院2012年至2018年995名早产儿住院的数据。首先对原始数据集进行了特重构,并利用Missfore
“互联网+”营销模式备受餐饮行业青睐,用户评论也呈爆发式增长,其中蕴藏的有价值信息对餐饮行业的发展至关重要。本文对广西地区米粉店线上点评数据进行文本挖掘,通过将情感分析、主题模型、语义网络分析等文本挖掘技术与层次分析法相结合,探究消费者的米粉口味偏好与粉店综合服务满意度得分,并以此为依据提出相应的改进建议,本文主要工作如下:一、文本预处理。依次对评论数据进行文本去重、人工标注、Jieba分词以及去
随着国家碳中和目标的提出,实施节能减排,调整产业结构就成为了企业转型升级的关键步骤,该步骤的实施一定程度上会对公司自身产生影响,进而导致企业股价的波动。随着低碳经济的发展以及国家相关政策的大力扶持,股票市场中的碳中和板块也变得越来越活跃,并且由于碳中和板块股票市场的波动性较大,利用传统时间序列方法进行股价预测的精度太低,对于投资者来说风险较大且收益不高。在此背景下,本文尝试将机器学习和深度学习技术
阿尔茨海默病(Alzheimer disease,AD)作为一种常见的慢性神经系统衰退性老年病,至今医学界仍没有确切的治疗手段。基于此,本文通过医学统计方法寻求影响AD的主要危险因素,并利用机器学习方法进行发病风险预测,以期为AD的早期预防提供一定的参考。本文的主要研究内容如下:首先,通过检索中国知识基础设施工程(China National Knowledge Infrastructure,CN
随着社会经济的不断发展和人们生活水平的提升,健康这个从不过时的话题,越来越受到人们的关心和重视。特别是从2020年突发新冠疫情至今,我国居民对自身健康有了更加深刻的感受和理解,对卫生健康服务的需求与日俱增。本文以医疗健康为基本出发点,通过智能医疗设备对用户信息进行采集。首先,对用户数据进行描述性分析,得到用户的性别、年龄、学历的基本构成情况以及用户的BMI、血压、脉率、尿酸、总胆固醇以及空腹血糖等