基于多目标优化的多标签特征选择算法研究

被引量 : 0次 | 上传用户:wxdong2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类问题是指通过对已知标签的样本集的学习,预测未知样本标签的问题。按样本所拥有的标签个数,分为单标签和多标签分类问题。目前,多标签分类在文本分类、基因功能分类和图像语义标注等领域已经得到了广泛的应用。在多标签分类中,分类器的性能与输入的特征密切相关。从理论上讲,不相关或冗余的特征降低同类样本间的相似度,从而降低了多标签分类器性能。因此,特征选择在多标签分类中发挥着至关重要的作用。目前,多标签特征选择根据是否包含后续的分类器,分为过滤式和包裹式两种方法。多标签分类有三类性能评价准则,分别是依据样本、标签和排序,且三类之间有一定的矛盾,而特征选择的目标是保持甚至改进分类器的性能。因此,特征选择问题实质上是一个多目标优化问题。本文提出了一种基于多目标优化的多标签包裹式特征选择算法(MMFS)。算法的主要思想是:将多标签k近邻分类器(ML-kNN)包含在改进的非劣分类遗传算法NSGA-II内,从多标签算法的性能评价准则中,选择两个目标函数,即最大化平均精度和最小化汉明损失,利用NSGA-II同时优化这两个目标函数,从而获得最优的特征子集。算法的收敛性实验分别在Yeast和Emotions数据集上进行。实验的结果验证本文提出的算法具有很好的收敛性。在特征选择算法的比较实验中,将本文的方法与特征排序、基于单目标的特征选择方法以及未作特征选择四种方法,在8个基准数据集,基于9个评价准则进行比较,实验结果表明本文提出的方法在其中6个评价准则上排名第一,其余3个准则上排名第二。同时,我们还比较了每种方法所产生的最优特征子集的维度,结果表明,在有效地提高了ML-kNN的分类性能的同时,本文的方法能得到较低维度的特征子集。
其他文献
水域生态系统尤其是淡水生态系统对于整个生态系统的健康运转以及人类社会的持续发展意义重大。一方面,它连接着陆地生态系统和海洋生态系统,在物质和能量循环过程中发挥着桥接
在飞速发展的信息时代,员工成为组织学习、发展、创新和变革的主体,是企业生存,不断保持竞争力的核心。然而,由于不当的领导方式,很多员工对组织中存在的问题有意地保留观点而选择
近些年,国家加大对电力事业的投资和建设,大量高压、特高压电网应运而生了。这些架设在野外的高压输电线路,在寒冷的冬季容易受到冰冻灾害的影响,从而产生覆冰,严重时可能会
草鱼鱼油中不饱和脂肪酸含量高达70%以上,且含有亚油酸、亚麻酸、二十碳五烯酸(EPA)、二十二碳六烯酸(DHA)等多不饱和脂肪酸,极易发生氧化,鱼油的腥味和水不溶性也极大的限制
<正>编者按:如今,遍布各地高校的数字媒体艺术和技术相关专业学生如果想要更好地在这一领域生存,掌握足够的计算机基础知识是必不可少的。在这个资讯传播迅速、技术更迭频繁
伪证罪是一个非常古老的罪名,古今中外很多国家都有关于伪证罪的法律规定。虽然在现实生活中伪证罪不像故意伤害罪、抢劫罪等罪一样常见,但是其所造成的社会危害性并不小。伪证
和谐的人水关系是人与自然协调发展的前提和基础。随着社会经济的快速发展,水问题日益突出,已成为人类社会进一步发展的瓶颈,人水关系面临着前所未有的挑战。寻求人水共同发展之
感恩是一种积极的思考和谦卑的态度,也是一种生活的哲学和智慧。只有人人怀有感恩之心,人与人之间的距离才会拉近,世界才能多一分阳光,少一点冷漠,才能使我们所处的社会更文明,人与
儿童情绪表达规则的发展对儿童社会能力的发展起着重要作用。情绪表达规则是个体在特定的文化背景和社会化过程中获得的,它规定了个体在特定的情境下对谁应该表现出什么样的情