数据挖掘中一种基于遗传算法改进的ID3算法

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:hezefgj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代信息技术的迅速发展,许多领域都积累了大量的数据,对发现潜在于这些数据中的知识与规律的渴望造就了数据挖掘学科的兴起及数据挖掘技术的发展。作为一个多学科交叉的综合性领域,数据挖掘涉及了数据库、统计学、机器学习、高性能计算、模式识别、神经网络和数据可视化话等学科。决策树算法是对一组已知示例进行归纳学习,并生成一颗决策树的方法。该算法目前已经被广泛应用于自动知识获取领域。最为典型的决策树分类器学习算法是ID3算法,它采用自顶向下分而治之的策略,利用信息增益的标准选择分裂属性,能保证构造出一棵简单的树。该算法简单高效,生成的知识易于被人理解,但是在面对大量的数据获取的数据进行知识提取时存在着过度拟合的问题。在深入分析ID3算法的基础上提出了基于遗传算法改进的ID3算法并利用该算法对网络上包含入侵的数据进行了建模。该算法首先将已有的知识的规则作为遗传基因,进行进化,利用遗传算法将现有的规则集进行了分割,然后再利用划分的规则集生成决策树群,之后利用决策树群给出预测结果。实验结果表明,该算法能够较好的进行分类,并对比了ID3算法给出的结果。
其他文献
随着Web服务技术的广泛应用,Web服务的数量日益增多,如何迅速准确地从数量众多的服务集合中寻找最佳服务日益受到关注。Web服务发现作为Web服务系统框架中的一个重要且关键部
知识管理技术是知识工程理论和互联网技术的结合,随着互联网的普及和快速发展,个人、组织、软件系统之间的交流与协作越来越重要。面对知识的海洋,如何组织、管理和维护海量信息
在数据存储方面,由于数据库的复杂性、多样性和成本等因素,许多公司往往很难作出选择。MySQL是世界上最大的开源数据库,具有低成本,高性能等特点,是可靠和可拓展的网络数据库
日新月异的Web技术正深刻地改变软件,基于Web浏览器的应用将成为计算机行业未来10年的主导。自从1991年互联网诞生以来,它就以史无前例的神奇速度成就了Yahoo、eBay、Google
视频会议系统从20世纪60年代出现至今,经历了从模拟信号到数字信号,从专线网络到公共网络的发展过程。然而,网络技术和成本原因使其无法面向普通大众提供高质量的视频会议通
移动台OTA测试是一种用于评测无线终端设备的测试方法,用于验证无线设备和网络的连接能力,以及使用者对辐射和接收性能的影响。通用接口总线(GPIB)普遍应用于智能仪器的管理,基
疲劳使得人的反应能力和操控能力大大下降,特别是对于外界瞬时的环境变化、出现紧急情况的状态下,如果不能及时地作出反应和应对措施,发生事故的可能性大大提高。特别是在驾
随着计算机网络和信息技术的广泛应用,信息和网络系统的安全变的至关重要。入侵检测技术是继防火墙、VPN、数据加密等传统安全保护措施后新一代的安全保障技术。它作为一种积
近几年来,工作流管理技术被业界广泛采用并得到了迅速发展。工作流管理最重要的功能之一就是工作流建模。这些预定义的过程模型必须能很好的反映实际业务流程,因此需要找寻灵
随着Web的快速式发展,传统的通用搜索引擎技术暴露出了覆盖率低,资源占用多,更新时间长,结果的针对性低等一系列问题。为了克服通用搜索引擎的不足,满足特定用户针对特定领域