基于Tabu搜索的粗糙集属性约简算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:eddiechen3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是Z.PAWLAK 1982年提出的一种处理不精确、噪音的、或不完整的不确定问题的强大工具,在人工智能,认知科学,或者在不精确知识表示及推理,机器学习,知识发现等众多领域都有重大的方法论意义。信息系统的约简是粗糙集理论的关键,为了从信息系统中提取出知识规则,我们必须把信息约简。约简是在不损失信息表述能力的前提下,求得一个最小属性集。显然,属性约简是一个提取子集的过程,但同时也是保留了表述能力,具有最小冗余。许多研究者正在研究高效的特征提取算法。这些技术已经成功的应用在数据约简,文本分类,文本分析中。基于记忆的启发式搜索是一种很有前景的智能计算工具,如Tabu搜索,在许多组合搜索问题中都表现了优异的性能。然而,在信息系统和数据挖掘中,他的贡献仍然逊于其他智能工具,如遗传算法、神经网络。本文,我们提出了一种基于Tabu搜索的方法,称为TSAR(Tabu Search for Attribute Reduction)来解决信息系统的属性约简问题。TASR使用0-1变量来表示约简过程中的解,粗糙集的依赖度函数用来度量解的质量,TSAR的搜索过程是个长期记忆的高性能禁忌搜索,除了使用的邻域搜索方法,TSAR还运用了广泛性和集中性的搜索模式。本文中的TSAR算法使用TS邻域搜索来解决信息系统的属性约简问题,主要基于两个主要概念:避免访问已经访问过的解;接受下山移动方法跳出局部最优。保留一些历史信息使搜索进程更智能化,显然,广泛性和集中性机制通过保存实时的最优约简和每个属性的选择频率而选择更好的解,期间TSAR调用三个过程:产生多样解,最优解震动来减小约简集的势,产生精英解。与文献中算法在10个经典数据集上比较,从试验结果看来,本文提出的TSAR算法在约简质量上很有竞争力,且依赖度函数的计算开销比较小。
其他文献
随着社会的发展,人们的活动范围越来越不确定,这给移动定位业务提供了无限商机和挑战。越来越多的移动定位业务需要更高的定位精度和更短的响应时间。由OMA(开放移动联盟)提出
医学图像配准是信息科学、计算机图像技术与当代医学等多学科交叉的一个研究领域,已经在临床治疗与术前诊断中有了广泛的应用。但由于受噪声、图像细节畸变和模糊度等问题影
Internet已经在各个行业领域渗透日益加深,促使使人类的社会生活和工作产生了重大变革。现今市场对软件的需求越来越复杂、庞大,要求系统对行业的综合性越来越强,同时参与项
秘密共享是密码学的一个重要组成部分,为密钥管理提供了一个崭新的思路,在密钥的安全保存、传输以及合法利用中起到了关键的作用。利用秘密共享来保管秘密信息,一方面有利于
网格计算是以互联网和高性能计算为基础的一门新兴技术。网格作业管理是网格的最主要的功能之一,主要涉及到网格计算环境下作业的提交、调度和分配,资源的审核,作业的执行等问题
在中小型Ad Hoc网络中,DSR协议最为常用。DSR协议采用源路由机制,中间节点不需要存储路由信息,不使用周期性的路由通知,节约带宽并且减少功率消耗,具有高效的路由效率,但是DSR协议
移动自组织网络(MANET)是一种较为灵活的组网方式,它使得在任何地方,若干台具有联网能力的主机可以相互之间组成一个可以交互的网络。这种组网方式在军事、应急处理等需要团队
航空电子系统的发展经历了分立式、混合式、联合式和高度综合化四个阶段。在综合化航电系统中,各子系统之间相互联网通信,资源高度共享,存在巨大安全隐患。此外,综合化航电系统中
随着因特网的迅猛发展,电子邮件成为了现代通信的主要手段。但是同时,许多垃圾邮件也在网络中蔓延,给广大用户带来了大量的麻烦。垃圾邮件成为作为互联网上的一个日益严重的
机器人学的研究进入了一个崭新的发展阶段,近年来,随着应用要求不断增强,机器人技术得到了持续发展。这样延伸出了许多新的技术研究领域,也带动了这些领域的技术水平的提高。