基于优化野草算法的加权模糊粗糙特征选择研究

来源 :大连海事大学 | 被引量 : 0次 | 上传用户:zhou1225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征选择是一种用来降低数据集维度的技术,其核心是从输入的特征集合中选择出最具有预测性的特征子集来代表原始数据集合。特征选择不仅可以简化特征内在的关系还可以改善整体集合的预测能力。目前,许多学者针对模糊粗糙集的特征选择进行了大量的研究,其中比较常见的有,遗传算法、蚁群算法(ACO)、粒子群算法(PSO)等。这些算法在鲁棒性和求解能力等方面均表现优秀,并且它们的共同特点是只有最优秀的个体才能有机会被提取出来。然而,某些初始依赖度值低的个体有可能带有重要信息,因此上述这些算法可能会导致重要信息丢失。针对以上问题,本文研究了野草算法的特点并且发现其特点能使模糊粗糙特征选择更加全面。野草算法认为初始依赖度值低的个体有可能带有重要信息,因而赋予初始依赖度值低的个体一定的存活机会。该算法早期能够维持特征种群多样性而在后期能够保证最优解的选择优势。因此,本文首先将野草算法的特点和模糊粗糙集理论相结合,继而提出了基于优化野草算法的加权模糊粗糙特征选择算法并对其进行编程实现。其次,利用基于模糊粗糙集的快速属性约简算法来验证特征选择结果。最后,将算法模型应用于十四类基准数据集和四类具有现实背景意义的乳腺造影数据集进行特征选择,并且将本文算法的特征选择结果与其他两个算法(蚁群算法和粒子群算法)的特征选择结果分别从分类精度和AUC值两个方面做出对比分析。数据分析结果表明,基于本文算法得到的大部分特征选择结果可以很好地代表原始数据集并且整体性能优于蚁群算法和粒子群算法。同时,这也证明了本文算法具有现实研究意义。
其他文献
随着科学技术的高度发展以及商业文化交流的高速膨胀,信息的传播越来越要求通过高科技手段来实现。数字多媒体终端是一种新兴的媒体概念,具有实时信息发布与联网广告发布的功能
增强现实技术作为虚拟现实的拓展技术,在最近十几年里已经得到了飞速发展,并在各个领域显现出强大的应用价值,广泛应用于工业、产品展示、医疗研究、军事、教育等领域,成为虚
Web服务作为一种自主而开放的应用实体,具有松散耦合、平台无关、互操作性强等特点,特别适合在Internet环境中发布和使用。随着互联网上Web服务数量的快速增长,如何从中快速
随着数据价值不断提升,分布式存储系统中的数据加密存储变得更为重要。为降低对存储系统的信任,以满足对用户隐私保护的需求,端对端的加密存储应运而生。对象存储设备因其智能管
信息化高速增长,带动磁盘理论技术的进步,磁盘记录密度保持着约30%平均年增长率。超顺磁影响的限制制约着磁盘记录密度的无限提高,出现在磁盘市场上磁盘中最高磁记录密度日益接
片式结构(Tile)多核处理器以其良好的可扩展性和低能耗性已经成为一种重要的多核架构。数据流编程(Data Flow Programming)作为一种开发并行性的有效方法已经被广泛应用于多核处
ZigBee无线传感器网络作为一种新型短距离通信技术,具有短距离、低速率、低时延、低功耗、低成本、安全可靠、大容量的特点,最有可能实现“无所不在的网络”理念。它不仅在工
随着虚拟化技术和云计算技术的发展,越来越多的科学计算应用运行在云计算资源之上。MPI编程模型是一种消息传递编程模型,大多数科学计算应用都是基于这种消息传递编程模型的高
服务器是信息服务业的基础设施,但当前利用率普遍偏低。虚拟化技术能够提升服务器效率,降低管理复杂程度,在数据中心得到广泛运用。块设备是存储I/O系统中的主要外部设备,其访问
重复数据删除作为当前存储系统的关键技术,能够大幅节省存储空间,极大减少网络数据传输量,尤其是针对数据备份和归档。然而,当面对大量数据时,数据块指纹索引不能全部放入内存,磁盘