基于改进的K-均值算法的朴素贝叶斯分类及应用

被引量 : 0次 | 上传用户:zzfivy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘,又称数据库中的知识发现,是指从大型数据库或数据仓库中提取具有潜在应用价值的知识或模式。分类是数据挖掘领域中一个重要的研究分支。基于朴素贝叶斯技术的分类是当前数据挖掘领域的一个研究热点。但朴素贝叶斯分类的条件独立性假设和数据完备性要求限制了实际数据的应用。本文利用改进的K-均值算法对缺失数据进行处理,提高了朴素贝叶斯分类的精确度。主要工作如下:1、提出了一种基于改进的K-均值算法IKM,改进后的IKM算法结合了分层聚类和K-均值算法的各自优点,同时也克服了它们原来的缺点。IKM算法的基本思想是:首先进行分层聚类,得到一些初始信息(即分类的数目K的值和初始的聚类中心),然后运用K-均值算法进行精化,最后得到质量较高的聚类结果。2、建立了基于IKM算法的朴素贝叶斯分类模型(IKMNBC)。利用IKM算法先对原始数据中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与K个簇中心的相似度,将记录划分到距离最近的一个簇中,并用该簇中相应属性的均值来进行缺失值的填充,最后用朴素贝叶斯分类器进行分类。通过UCI标准测试数据集进行实验,实践证明算法是可行的,改进之后的分类方法其分类的准确率要优于一般的朴素贝叶斯分类。3、基于IKMNBC模型,设计了一个教学质量评价系统,该系统性能良好,功能较全,操作方便,可方便地对高职院校教师教学质量结果进行测评。
其他文献
当前电互连已经不能满足集成电路向小尺寸方向发展过程中的各项需求,成为限制集成电路工业发展的主要瓶颈。光互连具备高速、低功耗、高可靠性等优势,用它来替代电互连已经成
为促进中国井矿盐工业的技术进步及良性发展,由全国井矿盐工业信息中心组织召开的第二十三届全国井矿盐学术研讨会将于2017年5月或6月择时召开。这次学术研讨会主要议题是“十
建立了膜去溶-ICP-MS直接测定各种地质样品中微量Ag的分析方法。详细比较了采用冷却雾室和膜去溶对降低氧化物和氢氧化物干扰的情况。结果表明:采用膜去溶进样可以很好地解决
本论文主要研究的是在现代企业并购活动当中,在并购的目标企业选择时所面临的多方面风险,及如何通过一系列有效的风险分析、管理的方法,来使企业在并购活动中和并购之后对自身业
《老人与海》的象征手法的运用相当成功 ,这里讨论的是其中的大海、84天和小孩曼诺林的象征意义 ,以及与此相关的海明威对象征技巧的运用问题
本文首先通过因子分析方法,对45家金融公司的财务指标进行降维,给出盈利能力、营运能力、成长能力和偿债能力四个公因子。由因子得分我们得到银行类上市公司盈利能力普遍表现
在现代海洋开发和海洋战争中,声纳设备起到了举足轻重的地位。随着海洋技术的不断发展,对声纳设备的要求也越来越高。声纳发射机一般由电源单元、信号源、和功率放大器(以下
成本控制是企业成本管理的核心,也是财务管理的重要内容,成本控制的效果对企业的经营管理水平和财务管理水平具有重要的作用,是企业实现战略目标和竞争优势的重要策略。本文
虽然现代西方人本主义思潮的主要代表——存在主义的影响主要表现在哲学思想上,并没有提出系统的教育理论,但其对教育思想却产生着极大的冲击。尤其是存在主义对教育活动中的
本文主要阐述我国国际货运代理存在政府部门多头管理、政策法规不统一,各地发展不均衡,国际竞争力较弱,服务质量差,专业人才匮乏等问题。针对以上存在的问题,本人认为应该通