基于启发式优化的特征选择方法研究及应用

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:xiaoshuanshuan521521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,我们正在进入大数据时代,海量数据在各个领域中均呈爆炸式增长。“海量”不仅代表数据量大,同时也表示数据的维度高。如何从大量的数据中提取出真正有效的信息是数据挖掘和机器学习研究的主题。特征选择即是其中的一个主要研究方向,其核心任务是从高维数据特征集中挑选出与处理任务相关的有效低维特征子集。本文针对单一特征选择算法在处理数据时存在的无法兼顾运行效率及准确率的问题开展研究,提出了两种改进算法。课题研究得到了浙江省自然科学基金资助,主要的研究工作及成果如下:(1)针对单独使用过滤式特征选择或封装式特征选择算法处理高维数据时表现不佳的问题,提出了一种参数自动优化的两阶段特征选择融合算法。首先引入最大互信息系数,按照特征-类别属性的相关度对特征进行初筛,然后基于皮尔逊相关系数进一步删除剩余特征中的冗余特征。最后基于遗传算法对前述两个特征选择过程中的两个超参数自动进行优化,构建了参数自动优化的特征选择融合算法。该融合算法结合了封装式特征选择算法具有较高的关键特征辨识能力以及过滤式特征选择算法能够快速筛选出与目标类别相关特征的优点,有效降低了特征集的维数,同时确保获取的子集分类准确率处于可接受范围内。(2)针对单一启发式算法搜索能力有限的不足,本文将鲸鱼优化算法及模拟退火算法相结合,提出了一种基于混合优化的封装式特征选择算法。算法选取最大相关最小冗余准则作为特征选择的评价准则,首先引入鲸鱼优化算法对整个特征空间进行较为详尽的搜索,然后通过模拟退火算法改进鲸鱼优化算法在每轮迭代中获取的最优解。此算法中鲸鱼优化算法用来锁定最可能存在全局最优解的区域,模拟退火算法进行有效的局部搜索,二者结合共同提高特征选择算法的搜索效率。(3)基于Qt应用程序开发框架,构建了特征选择算法的可视化操作软件。该软件具有数据集导入,参数设定,分类器选择,结果显示等功能。
其他文献
每次泰祥集团例行员工培训大会上,都会播放一段销毁自家产品的视频。去年6月17日,泰祥集团一批出口的猪肉产品因某项指标高出国际标准的千分之一而被退货。虽然产品完全符合
文言文教学一直以来都是中职语文教学的重点,但同时也成为中职语文教学的难点,许多学生并不喜欢学习文言文。本文主要从文言文的教学现状出发,探索提高学生学习兴趣的教学方
房产税是向产权所有人征收的一种财产税。开征房产税的目的是要引导居民理性购房。房产税对于房地产市场主要是调节需求方,有助于引导居民合理住房消费,在买房子时能够理性选择
蚂蚁,隶属于膜翅目(Hymenoptera)蚁科(Formicidae),是典型的社会性昆虫。据统计全世界已记载的现存蚂蚁共16亚科,296属,9538种。估计全世界的蚂蚁种类总共约有20 000种,它们
经济新常态下,很多地方都出现了企业资金紧张的问题,尤其是一些素质好但暂时遇到资金周转困难的企业,亟需通过有效的制度安排渡过续贷难关。山东省日前印发《关于金融支持实
摘 要:高职教育要突显职业能力的提升,而英语学科职业能力需要强调学生英语实践应用能力,特别是具备英语社交技能、团队协作和创新等素质。围绕职业能力视角来探析高职英语教学模式改革,从英语职业化教育实践中,来实现英语教育与职业岗位的有效衔接,提升学生英语综合素养。  关键词:高职英语;职业能力;教学模式  一、高职英语教学模式中职业能力缺失的表现  1.职业属性与高职英语教学目标错位  外语应用能力作为
目的:观察低分子肝素钠联合活血通脉汤治疗髋部及下肢骨折后深静脉血栓形成气滞血瘀证的疗效。方法:60例分为治疗纽及对照组各30例,两组均给予低分子肝素钠皮下注射,治疗组加用活