【摘 要】
:
随着数据库技术和信息技术的发展,人类积累了大量的数据,为了从这大量的数据中挖掘出新颖的、有价值的、有效的信息,满足用户对数据信息的需求,数据挖掘技术迅速地发展起来,
论文部分内容阅读
随着数据库技术和信息技术的发展,人类积累了大量的数据,为了从这大量的数据中挖掘出新颖的、有价值的、有效的信息,满足用户对数据信息的需求,数据挖掘技术迅速地发展起来,并在一些领域引起人们极大地关注。分类作为数据挖掘的一种常用技术,在各行各业不断得到广泛地应用。其中,分类算法中的决策树分类算法因其所建模型结构简单直观、易于解释和理解,并能有效地解决很多实际问题,取得了快速地发展。本文首先对决策树模型和一些经典的决策树分类算法进行了介绍,通过比较这些算法的优缺点,提出了改进的自适应的代价敏感决策树算法。进而根据一组医疗疾病诊断数据集,用改进的决策树算法建立了一棵cost-saving tree,并比较分析了改进后算法的性能,发现改进的算法在精度不差的条件下具有较低的平均分类代价和很好的强健性。从而,本文为用决策树模型分析如何节省医疗诊断费用的问题提供了有益地参考,具有一定的实际意义。
其他文献
目前互联网领域主要的搜索引擎服务商如Yahoo、百度、Google等,为用户提供的都是横向的海量信息搜索。而在互联网不断更新和演化的现阶段,我们发现:普通网络用户想找到所需的
AEA(Alopex-based evolutionary algorithm)算法是一种基于Alopex的群体进化算法。本文在AEA的基础上提出了一种改进的算法QIAEA。QIAEA将AEA和二次插值法进行结合,极大提高
由于经济和社会的迅速发展,单桩越来越广泛地使用于工程中,因此能否准确地确定单桩极限承载力对于工程非常重要。静荷载试验是确定单桩极限承载力的最可靠的方法,然而,由于其代价
心率的RR间期是心脏状态的重要表现之一。心脏运动是一个信息变化的过程,每一次心搏都会耗用上一次心搏的部分信息。因此将信息论方法应用于心率的RR间期研究是有意义的。本
随着社会的发展及科学的进步.微分方程的研究与应用已经深入到了自然科学和社会科学的众多领域,其中微分方程定性理论、稳定性理论的发展更加拓广了它的应用范围.在微分方程的
本文主要研究带运输时间的单机在线批处理排序问题的算法设计及其竞争比分析.每个工件带有到达时间rj,加工时间乃和运输时间qj.给定一台批处理机,它一次可以同时加工多个工件
直觉模糊集是Zadeh模糊集的一种推广形式,该模糊集由于引入了非隶属度的概念,较传统模糊集有更好的表达事物的不确定性的能力.本文研究直觉模糊推理问题和多属性决策问题,建
近年来断裂力学理论取得了迅速发展,但研究模型大多以不带宽度为主。20世纪70年代,我国著名物理学家陈篪先生率先提出了钝裂纹模型,此模型要求要从真实裂纹出发去讨论裂纹问题。
随着科学技术的快速发展,现代控制系统规模日趋大型化、复杂化,其自动化程度也越来越高。特别是高新技术领域,如航空航天业、机器人、飞行器,使得控制系统的精确度也面临更新
脊柱是构成人体的中轴,成人由26块椎骨借直接连结(椎间盘)、间接连结(关节突关节、钩椎关节等)和辅助连结(7种韧带)共同形成的柱状结构,全长约55—70cm,呈“S”形。具有连接颅与四肢、