应用C5.0算法决策树模型预测高脂血症

来源 :预防医学 | 被引量 : 0次 | 上传用户:iqwanifir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的 评价C5.0决策树模型预测高脂血症的效果,为高脂血症预防及早期干预提供依据.方法 选取2019年8月-2020年7月浙江大学医学院附属杭州市第一人民医院的体检人群为调查对象.通过查阅体检人群的健康管理档案收集人口学情况、体格检查、实验室指标和生活行为方式资料.采用C5.0算法决策树模型分别建立个人水平模型和临床模型预测高脂血症,计算准确率、Kappa值和绘制受试者工作特征曲线(ROC)评价预测效果.结果 共纳入382人,高脂血症232例,占70.73%.个人水平模型预测因素预测精度由高到低依次为高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为84.16%,最低为63.44%.临床模型预测因素预测精度由高到低依次为谷丙转氨酶、谷草转氨酶、空腹血糖、血压、总胆红素、高密度脂蛋白、高血压、冠心病、糖尿病、既往史、体质指数、吸烟、高血压/冠心病/糖尿病家族史、高脂血症家族史、年龄和性别,预测精度最高为91.63%,最低为82.38%.个人水平模型训练样本和测试样本的预测准确率分别为80.20%和82.02%;临床模型训练样本和测试样本的预测准确率分别为91.13%和88.76%.个人水平模型的Kappa值为0.623;临床模型的Kappa值为0.803.个人水平模型训练样本和测试样本的AUC值分别为0.824和0.836,均小于临床模型的0.909和0.887(均P<0.05).结论 C5.0算法建立决策树模型对体检人群中隐匿性高脂血症患者具有较好的预测效果,可在临床应用推广.
其他文献
本文通过房屋建筑绿色节能施工技术应用进一步分析,提出应优先使用新型节能环保材料,严格按照节能环保规范施工,全方位、全过程应用,有效提高绿色节能环保措施,合理利用固体废弃物,以期为绿色房建工程可持续发展提供参考.
目的 分析2009-2019年浙江省义乌市输入性疟疾病例特征,为预防和控制输入性疟疾提供依据.方法 通过中国疾病预防控制信息系统收集2009-2019年义乌市输入性疟疾病例资料,分析消除疟疾前(2009-2015年)和消除疟疾后(2016-2019年)输入性疟疾病例的时间分布、地区分布、人群分布、输入来源和诊疗报告情况.结果 2009-2019年义乌市共报告输入性疟疾病例321例,消除疟疾前后年均发病率分别为3.19/10万和4.73/10万,报告病例以恶性疟为主,共260例,占81.00%.病例报告集中
目的 分析浙江省桐乡市老年人群心血管疾病危险因素暴露和聚集情况,为制订针对性干预措施提供依据.方法 通过桐乡市区域卫生信息平台收集≥60岁常住居民的社会人口学资料以及2015年5-8月居民健康体检结果,包括空腹血糖、血压、血脂等,分析不同性别、年龄人群心血管疾病危险因素暴露和聚集情况.结果 共纳入研究对象13512人,其中男性5390人,占39.89%;女性8122人,占60.11%.年龄60~95岁.高血压、糖尿病、血脂异常和肥胖4种心血管疾病危险因素暴露率分别为46.13%、8.91%、22.35%和
目的 了解青年2型糖尿病(T2DM)患者糖尿病痛苦水平并分析其影响因素,为改善青年T2DM患者身心健康提供依据.方法 采用方便抽样法,抽取浙江中医药大学第四临床医学院2020年4-11月收治的196例青年T2DM患者为调查对象.采用一般资料调查表、糖尿病痛苦量表(DDS)、反刍思维量表(RRS)和医学应对问卷(MCMQ)进行调查;采用多重线性回归模型分析青年T2DM患者糖尿病痛苦的影响因素.结果 共发放调查问卷210份,回收有效问卷196份,回收有效率为93.33%.青年T2DM患者DDS得分为(2.77
2020年7月,浙江省江山市发现2例布鲁氏菌病病例.为查明疫情的发生原因和传播链,对病例及密切接触者开展流行病学调查,并采集血液用虎红平板凝集试验和试管凝集试验进行实验室检测.病例1(母亲)和病例2(女儿)分别于6月28日和7月25日发病,虎红平板凝集试验和试管凝集试验均为阳性,布鲁氏菌培养均为羊种1型布鲁氏菌.密切接触者实验室检测结果均为阴性.病例1在无防护措施下多次近距离旁观病羊屠宰,并且帮父亲整理未消毒的屠宰工具和衣物;病例2为新生儿,有母乳喂养史,无其他高危暴露史.这可能是一起母婴胎盘传播或母乳喂
目的 评价南太湖水产品微囊藻毒素(MCs)污染的非致癌健康风险.方法 于2016-2018年采集南太湖水产品,采用全自动固相萃取-超高效液相色谱-串联质谱法检测9种MCs,并采用美国环境保护署(EPA)食入途径模型评价其非致癌健康风险.结果 共采集81份水产品,MCs检出率为9.09%.检出3种MCs,分别为MC-LR、MC-RR和MC-WR.按可食部位分,含有鲚鱼内脏的样品MCs检出率最高,为80.00%;其次为肌肉样品,检出率为5.13%.78份肌肉样品按水产品种类分,软体动物MCs检出率最高,为16
目的 分析2017-2019年宁波市鄞州区糖尿病、恶性肿瘤、冠心病急性事件和脑卒中4种慢性病的流行特征,为慢性病防控提供依据.方法 通过宁波市慢性病协同管理系统收集2017-2019年鄞州区户籍居民糖尿病、恶性肿瘤、冠心病急性事件和脑卒中的报告发病资料,采用描述性流行病学方法分析4种慢性病的时间、地区、人群和疾病种类分布.结果 2017-2019年鄞州区4种慢性病年均报告发病率由高至低为恶性肿瘤503.16/10万、糖尿病469.66/10万、脑卒中267.82/10万和冠心病急性事件51.37/10万.
通过对集中供热工程超概算原因进行详细分析,从完善设计标准、减少设计变更、加强概算审核、重视限额设计以及推进BIM管理方式和提升造价人员素质等方面,具体提出设计阶段的控制措施,旨在更好地实现集中供热工程的社会效益和经济效益.
目的 了解江苏省昆山市18眼深井水水质情况,并进行健康风险评价,为保障居民饮用水健康提供依据.方法 于2014-2017年采集昆山市18眼深井水水样,检测感官性状类指标、一般化学指标、微生物学指标和毒理学指标.根据GB/T 14848-2017《地下水质量标准》和GB 5749-2006《生活饮用水卫生标准》评价水质情况.采用美国环境保护署(EPA)健康风险评价模型评价深井水的健康风险.结果 2014-2017年共采集昆山市深井水水样144份,按GB 5749-2006《生活饮用水卫生标准》评价,合格18
目的 探讨自回归求和移动平均(auto-regressive integrated moving average model,ARIMA)乘积季节模型在湖州市手足口病早期预警中的应用,为手足口病防控提供依据.方法 通过中国疾病预防控制信息系统收集2009-2019年湖州市手足口病月发病例数,采用2009年1月-2019年9月月发病例数建立ARIMA乘积季节模型,并预测2019年10-12月手足口病发病情况,评估模型的可行性.结果 2009年1月-2019年9月湖州市共报告手足口病55099例,发病集中在4