【摘 要】
:
数据挖掘(Data Mining)是信息处理技术研究领域的一项重要课题。它是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的以及有潜在应用价值的信息或模式的过程。它融
论文部分内容阅读
数据挖掘(Data Mining)是信息处理技术研究领域的一项重要课题。它是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的以及有潜在应用价值的信息或模式的过程。它融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。分类分析是数据挖掘技术研究的一个重要方向。常用的分类模型有决策树、神经网络、遗传算法、粗糙集模型、统计模型等。本文主要研究决策树 ID3 算法及其改进算法。 由于数据挖掘中分类算法在商业应用最为广泛,而决策树算法是数据挖掘分类的核心技术算法之一。在决策树算法中有 Quinlan 于 1986 年提出的 ID3 算法最为著名,由于该算法有两大主要缺点:1.算法往往偏向于选择取值较多的属性,而属性较多的属性却不总是最优的属性。2.ID3 学习简单的逻辑表达式能力较差。为了解决这些问题,本文在ID3算法的基础上提出了将MID3算法与普通二叉树算法相结合的MID3二叉树算法,通过使用同一训练集对不同算法建立的决策树的比较,得出应用 MID3 二叉树算法比ID3 算法所得的决策数更为理想。 由于以往决策树算法大都用面向过程的语言描述、实现,所以本文将从面向对象的观点出发,用目前较为流行的 C#语言实现 ID3 算法及其改进 MID3 二叉树算法。并且在此基础上开发一个以改进算法为核心的完整决策树生成系统(学习系统)。此学习系统面向实际,实现了从数据导入到生成规则的完整数据挖掘步骤。而且功能较强大(能处理属性值缺失数据、连续属性数据等)。 根据煤矿集团的实际需要,并结合具体问题,将此学习系统应用于某煤矿集团物资设备辅助决策系统,通过对煤矿集团物资设备系统中的数据进行分析和挖掘,生成对辅助决策有用的“规则”。
其他文献
光滑涂液是在生产过程中 ,用于涂覆镀铝玻璃丝表面的保护材料。它可提高镀铝玻璃丝的分散率 ;同时 ,还有抗腐蚀的作用。本文主要阐述了光滑涂液的选材、配方研制及性能试验。
通过设置全光照与遮光处理(透光率分别为80%、50%、20%),研究了弱光胁迫对烤烟中部叶化学成分和主要挥发性致香物质含量的影响。结果表明:弱光降低了淀粉、还原糖、水溶性总糖的含量
本文简要介绍了仿生纺蜘蛛丝技术的研究现状,总结了人工纺丝的技术路线和所得纤维的基本性能。同时,我们从以下二个角度进行了思考,即:转基因蜘蛛丝蛋白水溶液或再生蚕丝素蛋
目的探讨康惠尔增强型透明贴对化疗性静脉炎的影响。方法设计两组实验,第一组选取未发生静脉炎的化疗患者,对实验组使用康惠尔增强型透明贴,对照组使用3M透明敷贴,比较化疗性静脉
以中航紫金广场工程为例,剖析了钢筋混凝土环梁的施工难点,并详细阐述了钢筋混凝土环梁的整个施工工艺流程,主要包括弧形模板的设计与加固、环形钢筋的加工与绑扎、混凝土浇
<正>今日之数学教学,普遍存在着重结果轻过程、重分数轻情感、重教书轻育人、重技术轻文化的现象。"四重四轻"所产生的负面影响是,分数可观但情感消极,解题快速但理解缺失,学
<正>《语文课程标准》指出:"语文教学要注重语言的积累、感悟和运用,注重基本技能的训练,给学生打下扎实的语文基础。"我认为,让学生拥有扎实的语文基础,离不开字、词、句、
本课题针对我国商业银行面临外资银行即将大规模进入国内市场的严峻形势,研究了基于商业智能技术的银行业客户关系管理。众所周知,中资银行与外资银行的最根本差距在于服务。
面向2020年及未来的5G移动通信,将为用户提供增强现实、虚拟现实等更加身临其境的新型业务体验,从而必将给通信网络带来移动数据流量的飞速发展。与此同时也将带动物联网的高
民事诉讼以解决纠纷,保护私权为目的,为了有效解决纠纷,实现对当事人权利保护的及时性,与通常诉讼程序相配套,各国都规定了诉讼保全制度。以保全的客体为标准可分为财产保全