基于粗糙集模型扩展的特征选择算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:gzlongzhijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是波兰学者Pawlak于二十世纪八十年代提出的一种能有效处理不完备性和不确定性的新型数学工具,并且在各个研究领域中得到了广泛的应用。但现有的经典粗糙集理论在处理不确定性数据和数值型数据方面存在缺陷,不利于噪声数据的处理和保持数值型数据内部结构的完整性。因此,为了解决上述问题,基于粗糙集模型扩展研究成为了国内外学者的研究热点。本文主要从经典粗糙集的两个拓展模型:决策理论粗糙集模型和邻域粗糙集模型进行研究,并对其相应的特征选择算法进行改进,旨在在不改变分类机制的基础上,使分类精度更精确。本文的主要研究内容如下:(1)本文针对决策理论粗糙集模型中正区域不能随属性增加而单调变化的问题。首先根据贝叶斯决策理论引入决策规则,来确定对象是否属于正区域。然后再此基础上提出新的定义,即约简集的正区域必须不低于属性全集的正区域。最后,结合启发式搜索策略提出了一种新的特征选择算法。通过对比实验分析结果得出该算法能满足正区域的最大化,具有更高的分类精度,从而提高了算法的效率。(2)虽然改进的正区域特征选择算法取得了不错的性能,但放在邻域粗糙粗糙集模型中,可能无法直接处理正区域出现的混合型数据的样本分类情况。并且邻域粗糙集模型在表征属性子集的分类能力时,同样也无法很好地描述类别混合样本的邻域。针对以上两种问题,本文后续针对邻域粗糙集模型的特点,首先分别分析了?邻域和k最近邻两者的优势,将两者进行结合提出了一种新的邻域粗糙集模型,引入了新的诱导信息粒子以及利用迭代策略计算决策上下近似。然后引入可变精度模型到改进的邻域粗糙集模型中来处理噪声数据。最后采用贪婪搜索策略,设计了一种改进的特征选择算法。通过实验结果分析表明,此算法具有更低的泛化能力,能够在不降低分类精度的前提下,有效地去除冗余属性。
其他文献
英特尔芯2合1产品搭载第四代智能英特尔酷睿TM处理器的高性能,产品吸引了消费者的眼球,面对琳琅满目的产品形态和不同的性能配置,消费者如何甄选适合自己的2合1产品呢?首先要
本研究应用理论分布模型和5个聚集强度指标,研究百山祖北坡中山常绿阔叶林多脉青冈种群分布格局。结果表明:多脉青冈种群结构呈基部和中部宽、顶部窄的形状,龄级完整,属于稳定型,
为研究原状黄土结构性随竖向荷载、含水率、吸力的变化规律,进行了非饱和黄土的侧限压缩试验,定量分析了原状黄土联结结构性参数M1与摩擦结构性参数M2,以及黄土的结构性参数M
当今已进入服务经济时代,谁能提供高品质服务,谁就能赢得企业生存发展的空间.作为金融企业的商业银行,多年来服务工作一直陷入时好时坏的境地,规范不够统一,服务不够持久,亟
目的:研究丙泊酚和七氟醚对胸腔镜手术患者围术期免疫炎症反应和血流动力学的影响。方法:选择40例择期在全身麻醉下行胸腔镜肺部疾病手术患者,ASA分级I-III级,术前心功能I-II级,年龄50-75岁,无严重阻塞性或限制性通气和(或)换气障碍、排除近2个月内服用过苯二氮卓类、免疫抑制剂、阿片类药物、有精神或者智力障碍的患者,排除恶性肿瘤TNM分期III/IV期患者,剔除双腔管插管困难及定位不良者,剔
不同尺度上景观格局与生态过程的关系是景观生态学的研究重点。根据Habit-Food-Resource范式,研究土壤养分流动与景观格局之间关系可为认识不同尺度上景观格局与生态过程的关系提供帮助。土壤侵蚀
本文从近年来桓台县域企业信用资源利用情况入手,分析县域中小企业发展过程中的融资困境,并提出重新配置、整合信用资源破解中小企业融资困境的政策建议。为便于阐述,本文所指的
哮喘是一种气道慢性炎症,以气道高反应性、黏液高分泌性和上皮下纤维化为主要特征,以支气管痉挛和可逆性气道阻塞为主要临床表现。病因和发病机制相当复杂,目前还不完全清楚。由于哮喘病因还不清楚,现有治疗手段不足,其发病率也在逐年增高,已成为严重的公共卫生问题。维生素A缺乏是一个世界性营养问题,也是目前包括我国在内的发展中国家最易缺乏的一种营养素。通过检测哮喘人群体内维生素A水平,发现哮喘患者体内,维生素A
降雨径流集存系统由集水、输水和存水三个子系统组成,它把大面积集水区的降雨径流汇集到小面积存水区的土壤水库中,变少雨为多水,是半干旱与干旱地区利用降雨径流资源发展旱作农
基于数据的预测是当今学术和应用领域广泛关注的研究内容,很多学者提出的数据挖掘方法在一定程度上解决了预测的问题,但目前从理论上处理大数据的系统化方法还不完善。因此,本文针对大数据的数据量大的特点做了以下两方面工作:1)以具有结构特征的大数据为背景,研究了基于决策树的有放回抽样与无放回抽样相结合的分类规则获取方法(简记为SDTI)。该研究包括初始分类规则库筛选机制、分类规则库可精炼策略以及基于有放回抽