基于粗糙集的分类学习研究

来源 :渤海大学 | 被引量 : 0次 | 上传用户:df0225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,大数据已成为最具代表性的时代特征之一,广泛地存在于各行各业及生活中。数据挖掘和机器学习是大数据技术的重要组成部分,通过对大数据信息挖掘和机器学习,构建大数据框架下的人工智能模型,是当今人工智能领域中的重要课题。分类是大数据挖掘的重要研究内容之一。作为数据挖掘的一个研究分支,分类的本质是通过对训练数据的类别学习,构造分类模型,并依据分类规则对未知样本进行类别预判。本文基于邻域粗糙集和模糊粗糙集理论建立了两种分类模型,设计了相应的分类算法。1.基于决策一致性的邻域粗糙分类。首先依照邻域粗糙集理论,对样本邻域进行了重新定义,并基于决策一致性原则,提出了样本的邻域纯度等相关概念。然后对样本邻域半径的选取方法进行讨论分析,使其满足决策一致性条件。针对样本分布情况的不同,提出了相应的样本邻域半径的选取办法。设计确定初级类中心样本及其相应半径取值算法。在算法迭代过程中,考虑到应尽可能缩短分类时间,引入了剪枝算法,去掉冗余样本,得到最终的类中心样本及其相应半径取值,完成训练学习过程。为了对未知样本进行类别预测,构建了基于决策一致性的邻域粗糙分类器,并利用UCI中数据集设计相关实验进行验证和分析。2.基于决策融合的邻域模糊粗糙分类。在经典模糊粗糙集模型中,样本的决策是通过搜索全体样本进行模糊决策的。实际上,一个样本的决策往往与它的同类近邻样本相关,因此在经典模糊粗糙集模型中引入了邻域的概念,提出了样本的模糊粗糙决策模型——邻域模糊粗糙集。同时考虑到邻域阈值的选取会对模糊决策产生不同的影响,便引入了阈值权重的概念。通过对不同邻域阈值下的分类规则进行融合,使得融合决策与真实决策更为接近,构建了以融合决策与真实决策差异度达到最小化为目标的优化问题。将求解分类最优权重的问题,转化为以阈值权重为变量的最优化问题,进而得到融合权值。基于融合决策对未知样本进行类别预测,利用UCI中数据集设计相关实验进行验证和分析。
其他文献
社区发现对于理解复杂系统的整体组织及其功能特性具有重要意义,在个性化服务、广告营销、舆情传播甚至犯罪团伙发现等领域具有广泛的应用场景。近年来,在机器学习聚类问题方
要提高国有企业的经济效益,必须完善企业的经营管理体系。加速国有企业经营管理的现代化。企业经营管理的现代化是根据社会主义市场经济规律,为适应现代生产力发展的客观要求。
本文对混凝土小型空心砌块墙体施工技术质量控制进行研究和论述。文中分析了墙体裂缝的部位、形状和原因,提出了抓好施工准备,进行施工技术交底和墙体砌筑方法要求和墙体裂缝施
随着现代化步伐的到来及工业生产的兴起,许多金属结构的工业产物应运而生,为了保证人类生命安全,需要对这些金属结构进行无损探伤,进而判断金属材料的性能是否可靠。而应力集
事业单位预算管理是事业单位对于国家财政划拔的资金,通过编制预算,内部控制、考核业绩所进行的一系列管理活动,作为我国行政单位财务管理的运行机制,贯穿于事业单位预算编制和执
从严治党是无产阶级政党的应有之义,也是中国共产党一以贯之的管党治党原则。延安时期,在总结早期中国共产党自身建设得失的基础上,毛泽东以马克思列宁主义的党建理论为指导,立足抗日战争时期及抗战胜利之初严峻的国内外形势和党内出现的复杂问题等客观实际,围绕建设一个更加布尔什维克化的克思主义政党的目标,采取了一系列重大举措以推进党的思想建设、组织建设、作风建设和制度建设,从而形成一个较为完整的从严治党理论体系
目的观察针刺配合药罐加手法弹拨三联法治疗膝骨性关节炎的临床症状、关节功能的改善情况,同时评价其安全性。方法将82例膝骨关节炎患者随机分为治疗组和对照组,每组41例,治疗组
“真实与公允”在欧美会计中是一个至关重要的理念,是研制、修订和评价会计准则的指导思想和最高标准,也是会计主体(简称“主体”)选择会计政策、进行会计处理和编制财务报表的依
研究背景:太极拳是我国一种传统的有氧运动,柔和缓慢的方式吸引了更多的老年人参与,适中的强度及独特的身心合一特点尤为适合老年人,习练太极拳对老年人大脑的积极作用已在多
一、内部控制的重要性2008年6月《企业内部控制基本规范》的发布,标志着中国企业进入了风险文化下的内部控制管理时代。成功的内部控制能够给企业带来效益,带来财务增值。企业