早期糖尿病风险预测模型的比较研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:haliluluya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
糖尿病是一种比较常见的慢性疾病,并且存在较长的无症状阶段。本文主要介绍了机器学习中的5种分类算法,分别是朴素贝叶斯、支持向量机、逻辑回归、决策树和集成分类器Random Forest,并在Weka数据挖掘平台上,对糖尿病数据进行挖掘分析,根据混淆矩阵、Kappa系数、ROC曲线、均方根误差以及相对绝对误差这几个性能指标对分类器效果进行分析,找到最适合糖尿病疾病预测的算法,为当今医疗行业其他疾病数据的挖掘分析提供思路。
其他文献
燃气-蒸汽联合循环机组燃烧室温度模型具有非线性、强耦合的特点,难以建立其精确的过程控制模型。针对这一问题,文中提出了一种基于Elman神经网络的燃烧室温度模型建模。该模
为了解决季冻区沥青路面的反射裂缝问题,以路基路面工程、计算机科学为基础,通过对沥青路面反射裂缝病害影响因素分析,得到不同的基层模量是影响反射裂缝主要诱因之一;运用Ab
东莞作为我国最为典型的制造业基地之一,正面临着人口红利消失背景下的技能人才短缺问题。本文基于“第四次工业革命”背景,结合东莞经济发展新常态和制造业人才队伍现状,探
本文提出了一种快速低秩的判别子字典学习算法。在训练阶段,构造一个子字典的低秩约束项和拉普拉斯矩阵正则化项,加入判别字典学习的目标函数中。将原始样本映射到一个新的空间中,使同一类别的相邻点彼此靠近,同时增强子字典对同类样本的重构能力,针对每类样本的判别性特征,学习出相应的学习字典。在测试阶段,利用k NN分类器估计测试样本的类别标签。同时,将算法应用在3种数据集上,与其他的字典学习算法进行比较,取得