一种新的模糊规则权重方法的数据分类的研究

来源 :大连海事大学 | 被引量 : 1次 | 上传用户:atmywb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是数据挖掘领域的重要研究内容之一。分类是通过分析给出的数据集构造分类模型,利用分类模型对已知类别的样本进行分类的一种技术。现有的一些分类方法对平衡数据进行分类,一般都能取得较好的分类性能。然而对于现实世界中存在的非平衡的数据,传统的分类算法在处理非平衡数据分类问题时会倾向于多数类,而导致少数类的分类精度较低,因而研究用于处理非平衡数据集的分类方法显得相当重要。针对不同类型数据的分类,本文提出了一种有效调节平衡数据与非平衡数据分类准确率的基于模糊规则的分类算法。将Chi et al规则生成算法与模糊分类推理模型相结合进行分类算法设计。引入加权系数和样本分布函数对模糊规则权重的计算方法进行改进,既使得样本类内匹配度得到均匀分布,又加强了类间的对比度,起到了削弱类内差距和增强类间差异的作用。通过加权系数调节规则权重,提高分类准确率。特别地,利用SMOTE算法对非平衡数据进行预处理,使得处理后的数据集少数类和多数类的样本在数量上达到了大致的平衡,在此基础上应用提出的分类算法对非平衡数据进行分类。然后,将平衡的和具有不同非平衡度的UCI数据集进行Matlab仿真实验,验证该分类算法的可靠性。最后,将得到的实验数据与已有的分类算法的数据分类准确率进行比较,结果表明该算法优于其他算法,具有较高的分类准确率。
其他文献
格茫公路地处重盐渍土地区,由于盐渍土具有特殊的物理化学性质,使该地区的公路经常发生翻浆等病害,严重影响交通运输和公路养护的正常运行。通过工程实践对盐渍土地区路基、
随着集成电路的集成密度和性能高速发展,其对半导体存储器的性能指标提出了更高的要求,对大容量、高性能、高密度和低功耗的半导体存储器的追求使得存储器电路设计面临艰巨的
我国集体建设用地使用权管理制度是计划经济体制下形成的一种特殊制度安排,改革开放以来,我国国有土地使用制度改革不断取得进展,但农村集体土地使用权建设用地流转制度改革
本文的研究是一项逆向研究,这种方法在传统的研究方法中很少使用,吉迪恩·图里在他的理论中首次提出了这种逆向研究的方法,并用这种方法分析了隐喻的翻译。初步研究表明,由于
本文主要采用了大型有限元分析软件ANSYS,对实际工程结构的可靠性进行了分析。文章介绍了结构可靠性研究的响应背景,重点阐述了蒙特卡罗法及响应面法两种计算结构可靠度的方
当今营养健康的重点人群已经指向了中小学生,学校营养服务已经成为健康教育的一个重要组成部分。如何有效地开展学校营养服务工作以改善学生的营养健康水平、养成良好的饮食
本文从学术界对宋代佛教的评价入手,论述了宋代佛教的发展及其时代特征,僧人群体的儒学化以及这种儒学化的学术史意义,并从学术史的角度对宋代佛教的历史地位给予了重新的评
本文将现代“信、达、雅”翻译理论运用于影视字幕翻译,分析了字幕翻译的特性和译者应采取的原则和策略,更重要的是,本文探讨了影视字幕翻译中的“信、达、雅”原则各有什么
论文结合依托工程,对设计管理和设计管理模式相关理论概念进行了系统表述,全面论述了EPC项目的内部设计管理和外部设计管理工作,对目前通用的设计管理模式进行阐述。文章重点