兼顾分类代价和精度的决策粗糙集属性约简研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:tao1624
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
每天,世界上产生浩如烟海的数据,这些数据不仅在规模和复杂程度上与过去的数据天差地别,而且许多数据具有不确定性、不一致性和模糊性等特点。因此,如何从这些数据中高效地获取知识迫在眉睫。基于此,数据挖掘分类技术中的一个领域——决策粗糙集,因其解决此类问题的有效性,得到了许多学者的关注和研究。其中,属性约简问题一直在该领域研究中占据着重要的位置。目前决策粗糙集属性约简研究主要可分为两类:(1)不考虑分类需要花费的代价;(2)考虑了代价(即代价敏感),使代价最小化。在第一类研究中,其目标是获得分类精度最高的属性集。在第二类研究中,其目标是获得具有最小分类代价的属性集。因此,第二类属性约简后的属性个数会变得更少,但同时也带来了分类精度不高的问题。在实际应用中,适当降低代价和减少属性个数是必要的,但是分类精度无疑具有更重要的地位。因此,本文着重研究了决策粗糙集属性约简中的分类代价和分类精度的平衡问题,完成的主要研究工作如下:1.对决策粗糙集属性约简的国内外研究现状和发展趋势做了较充分的文献调研,了解了该领域研究前沿的情况,并确定了论文研究的主题。2.研究了在分类代价约束下的属性约简问题。代价敏感属性约简中的分类代价,主要包括误分类代价、测试代价或包含两者的总代价。约简后得到的是具有最小代价的属性子集,但此类属性集的分类精度往往不高。鉴于此,本文兼顾分类代价和分类精度的平衡,提出了一种在分类代价的约束下,基于属性重要度的风险决策粗糙集属性约简算法(简称为ARAIM算法)。该算法采用贪心算法的思想,每次选择具有最高属性重要度的属性,如果该属性加入后仍满足分类代价约束,并使得近似分类质量提高,则将该属性加入约简后的属性集。实验研究表明,在代价约束条件下,该算法能够找到一个具有较好近似分类质量的属性集,与不考虑代价获得的属性约简集相比其近似分类质量相差非常小。3.研究了在分类代价约束下,求解具有最高分类精度的属性约简集问题。按照以上的ARAIM算法进行属性约简,获得的是满足分类代价约束下的具有较好分类精度的属性集,但不能保证得到具有最高分类精度的属性集。为了解决这个问题,本文综合考虑分类代价和精度,并结合模拟退火算法进行搜索寻优,提出了一种基于代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。该算法通过模拟退火算法探索不同属性的随机组合,从而搜索满足约束条件并具有最高分类精度的属性约简集。实验结果表明,ARACOQ算法在多项式时间内,能够找到满足分类代价约束的、具有最高分类精度的属性约简集。
其他文献
1概述高等院校教学质量的形成受到所有教学环节的多种因素共同影响,而教师素质和水平是最为关键的因素之一。高校教师对学生的影响都是通过其从事教育专业活动时表现出来的各
产业联动是现代产业体系创新发展的基础,也是推动产业国际化的原动力。哈尔滨市要积极推动区域产业联动发展,推进城市国际化进程。从哈尔滨市区域产业联动的现实基础入手,详
本文阐述英诗汉译之比较,英诗的节奏感及音乐美,英诗汉译应努力体现原诗的内涵。
信息时代科技日新月异,移动通信作为新技术之一,近年来不断深入地改变着人们的工作和生活,随着4G系统的全面应用,第五代移动通信系统将成为未来移动通信的研究和发展趋势。第
光伏并网的接入方式及故障定位对于系统的稳定运行具有重要意义。光伏并网方式的优化可以提高供电的可靠性,使得资源合理配置,从而提高供电水平,带来经济效益。光伏并网后故
针对噪声功率波动时能量检测算法不稳定的缺点,提出了利用小波变换的能量检测算法。该算法利用小波变换实现噪声功率的估计,并根据噪声功率的估计进行能量检测。仿真结果表明
建筑施工过程中的重点之一是水暖的安装工程,对于大部分建筑物来说,水暖的安装都是在土建的基础上完成的,也就意味着在内外墙砌筑结束之前需要进行这步工作,此外在后续的工作
目的:探讨简便、快捷、灵敏的观察阴茎白膜损伤愈合过程中胶原类型、分布动态变化的方法。方法:在15只新西兰兔阴茎背侧切除白膜5mm×5mm造成缺损,分别在术后2,6,12周(每次5
在最新一次的科技革命的推动下,人们生活水平日益提高的背景下,第三产业服务业在国民经济中所占的比例越来越高。文化产业作为第三产业的重要组成部分发挥着不可估量的作用。
文章基于"预算-财务"双轨制视角,探讨我国政府会计概念框架的构建。首先提出"双轨制"政府会计体系,在此基础上分析政府会计目标、会计报告主体、信息质量特征、会计要素、确