基于决策树的出生缺陷预警系统研究与实现

被引量 : 6次 | 上传用户:illuminate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
出生缺陷是全世界面临的重要公共卫生问题。出生缺陷的发生给家庭和社会带来了诸多压力,严重的阻碍了人口的可持续发展。中国是世界上人口出生缺陷率最高的国家之一,并且我国出生缺陷的发生呈上升趋势,对控制出生缺陷这类非传染性疾病的传统研究采用的是线性还原式的研究方法,这种方法存在着相当的局限性。针对传统研究的局限性,本文将数据挖掘算法引入出生缺陷发生规律的研究中.数据挖掘是当前国际学术界一项前沿的研究课题,它是一个多学科领域。涉及了数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识库系统、知识获取等诸多领域。数据挖掘(Data Mining),也称之为数据库中知识发现,是自动的或方便的模式提取,这些模式代表隐藏在大型数据库、数据仓库或其他大量信息存储中的知识。分类是数据挖掘的重要内容之一。目前,分类已广泛应用于许多领域,如医疗诊断、天气预测、信用证实、顾客区分、欺诈甄别。挖掘分类模式的方法有多种,如决策树方法、贝叶斯网络、后向传播法、遗传算法、基于关联的分类方法、粗糙集和模糊集方法等等。其中决策树方法在海量数据中的应用最为广泛。决策树因其结构象一棵树,而且可以用于决策而得名。ID3和C4.5是两个最为著名的决策树分类算法,是Quinlan为了从数据中归纳分类模型而构造的算法。C4.5算法继承了ID3的全部优点。它是一种归纳学习算法,先从所有的事例中选取一部分构造决策树,再用剩下的事例测试决策树并对它进行调整。它不仅能处理连续值类型的属性,还可以对属性的取值集合进行等价类划分,划分在同一类的属性值在属性值判断时走向同一分支。本文首先详细介绍了数据挖掘概念、数据挖掘技术、应用领域等。其次对分类、分类方法进行了分析研究。在此基础上,对决策树分类方法进行了系统、深入的分析研究。并采用C4.5算法在出生缺陷数据上进行了发生规律的学习和规则提取,为出生缺陷诊断和预测构造系统,在经过处理数据的基础上生成了一组出生缺陷诊断与预测规则。
其他文献
<正>由过去矛盾纠纷的"收发室"变成"调处室",变矛盾"中转站"为"终点站";由信访部门"转交办理"到"直接办理",一条新的、行之有效的信访渠道正被广大群众认知、认可。面对新形
本文利用沙蒿籽榨油后的废渣,提取纯化沙蒿多糖,以125、250、500mg/(kg·bw)剂量灌胃四氧嘧啶诱导的糖尿病模型大鼠,同时设空白对照组、模型对照组和阳性对照组,考察其降血糖作用,
随着计算机技术的普及,计算机软件已渗透到社会生活的方方面面。人们对计算机软件质量的关注也因此达到了空前的高度,实现软件质量保证已成为软件工程领域的一项重要任务。本文
以提高仿真效率为目的,建立了一种适用于永磁直驱同步电机风电场的多机动态等值模型。该模型在同调等值法的基础上,选择能综合反映风电机组运行状态的变量矩阵作为分群指标,通过
理论背景 子宫肌瘤为衍生自单个子宫肌层细胞的单克隆性良性肿瘤,是女性生殖器官最常见和多发的良性肿瘤,也是人体最常见的肿瘤之一,在女性所有良性肿瘤中约占51.87%。近年来
人民公社时期的农村合作医疗制度是以生产大队为单位,由生产大队、生产队和社员共同集资办医疗的集体医疗保健制度。这一制度萌芽于20世纪50年代末期人民公社化运动,60年代末由
财务报告能够全面地反映企业的财务状况、经营成果和现金流量情况。因此,对于企业及企业利益相关者而言财务报告都具有重大意义。然而,财务报告不是孤立存在的而是存在于一定
<正>刘天华是我国二胡学派的奠基人,为实现"国乐改进"而奋斗终身,从民族器乐二胡着手,知难而进,从不为苦难所危惧,经过长期的实践和研究,在音乐教育和近代音乐文化发展中赢得
作为话语的一种最基本的形式,会话已成为当今语言学界研究的热点问题之一。但以往的研究主要集中于对会话结构的分析,即静态描述,而忽视对交际动态过程的研究。本文即从语用
电视谈话节目,也被翻译成脱口秀,是当今流行的一种娱乐节目。本文对中文电视谈话节目进行了会话分析。文中的语料来自60期近年流行的谈话节目:实话实说、对话和艺术人生。由