多标签分类中流特征选择算法研究

来源 :南京师范大学 | 被引量 : 2次 | 上传用户:fsdgvii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多标签分类问题中,样本的类别标签之间不再是相互排斥,每个样本可以同时有多个类别标签。在传统的多标签特征选择问题中,特征空间、样本个数、样本标签空间都是已知的,而在多标签流特征选择问题中,特征空间是未知的,样本个数和标签空间是固定的,特征是动态产生且随时间序列到达的。流特征选择是在随时间依次达到的特征集中,选择到目前为止最优的特征子集。通过剔除不相关特征或冗余特征,流特征选择可以降低数据维度,加快学习速度,简化模型,提升算法性能。本文构建了两类多标签流特征选择算法:基于α-投资多标签流特征选择算法和基于互信息的多标签流特征选择算法。1、第一类算法有两个算法:基于二类相关分解策略的α-投资多标签流特征选择算法MLSFSAI-BR和基于多输出回归的α-投资多标签流特征选择算法MLSFS-MOR。我们在11个多标签数据集上与3种多标签特征选择方法比较多标签分类性能。实验表明,MLSFSAI-BR算法的性能优于三种对比算法。与MLSFSAI-BR算法相比,MLSFSAI-MOR算法能够更快地筛选出更少的特征,且能够对标签之间的相关性进行初步挖掘。2、第二类算法有三个算法:基于互信息的多标签流特征选择算法MLSFS-MI、基于互信息的快速多标签流特征选择算法MLSFS-Fast和基于最大相关最小冗余的多标签流特征选择算法MLSFS-MRMR。实验表明,在这三个算法中,MLSFS-MRMR算法的性能最好且选择特征个数最少,既考虑了流特征与标签的相关性,又考虑了特征之间的冗余性。与本文提出的第一类中的两个算法和三个对比算法相比,MLSFS-MRMR算法有更好的表现。
其他文献
<正> (一)问题的提出生物学和其它各个学科一样,既有普遍意义的科学思维方法,又有特殊的研究方法。在教学过程中,如果有意识地强调对这些方法的理解和应用,会使学生打破思想
特发性膜性肾病是原发性肾病综合征的常见疾病,中老年人群尤为多见,男女比例约为2∶1[1]。据北京大学第一医院资料显示,特发性膜性肾病约占原发性肾小球疾病的13.5%,肾病综合
<正> 张力控制是我国塑料、钢带、纸张、感光材料、印刷、丝织等工业生产中一项亟待解决的重要技术.作者研制了采用磁粉制动器作为张力控制器,本文着重介绍张力自动控制方案
针对马铃薯分级设备研究现状总结不全面、分析不透彻的问题。本文在梳理并分析马铃薯分级设备国内外研究现状的基础上,对马铃薯分级设备进行了分类,并阐述了我国马铃薯分级设备
<正>《公开募捐平台服务管理办法》第十条个人为了解决自己或者家庭的困难,通过广播、电视、报刊以及网络服务提供者、电信运营商发布求助信息时,广播、电视、报刊以及网络服
中国的青铜器艺术有着几千年的漫长演变,其中商周青铜器是中国古代的青铜器中最重要组成部分,已经形成了具有明显标志符号与特色的青铜文化。现代设计在追求创新的同时,也会
针对悬臂施工的预应力混凝土连续箱梁桥顶板纵向开裂这一常见质量问题,本文结合实例,将纵向预应力分为直线及平弯2部分,分别研究其对顶板横向应力的影响。结果表明,顶板在节
完善农村职业教育产教融合办学机制是解决好"三农"问题、实现乡村振兴的基础性工程,但仍面临着产教脱节、供需错位、资源错配等现实困境。作为一门新兴交叉学科,教育生态学为
20世纪80年代初,手术显微镜首次应用于口腔内科临床,主要用于观察龋的脱矿、牙龈和口腔黏膜(癌前)的变化及充填体的边缘密合性等。此后,应用手术显微镜进行牙髓病及根尖周病的治疗
面对复杂且快速变化的市场环境,企业为激发组织活力及创新能力,开始推动企业内部创业。政府也不断出台支持创业活动开展的相关政策。母体企业和内创业团队为内创业的成功投入大量资源进行技术研发,通过技术创新实现内创业成功。专利作为技术创新型内创业中较为重要的创新成果,并将研发成果转化形成产品,获得专利显性收益和隐性收益。在母体企业和内创业团队满足自身利益最大化的过程中,以知识价值为导向的专利收益分配是双方合