多标签分类中的降维算法研究

被引量 : 1次 | 上传用户:qqliveqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类中,一个样本可能同时拥有多个标签,因此标签之间可能会发生相互重叠。另一方面,样本特征维数过高可能导致分类器性能下降,计算复杂性增高。因此,降维是多标签分类中非常重要的过程。对于多标签分类中的降维问题,本文采用特征变换的方法,构建了两个线性的多标签降维模型:(1)基于最小特征相关性、最大特征标签间依赖性的降维模型(MCMD):依据主成分分析最小化特征间相关性的特性以及Hilbert-Schmidt独立性评价标签、特征之间依赖性的特性,利用平衡因子将两个特性相结合,构建了一个可以同时最小化特征间相关性、最大化特征标签间依赖性的降维方法。同时,本文设计平衡因子的估计算法;(2)基于线性排序支持向量机的降维模型(ELRS):该模型将特征变换嵌入到线性排序的支持向量机中,来达到利用标签信息降维的目的。对于提出的ELRS模型,本文设计快速的迭代算法进行求解。在算法的实验部分,本文收集了10个多标签分类算法评价准则、8个多标签数据集、5个常用多标签降维算法、2个多标签分类器对提出的降维算法进行实验。在MCMD的实验中,本文首先在Scene数据集验证平衡因子估计算法的有效性;然后利用估计得到的平衡因子,将MCMD和收集的5个降维方法在两种不同的多标签分类器上进行性能比较。实验结果表明,MCMD在获得最低降维数的同时,不会恶化分类器的性能。在ELRS的实验中,本文首先在Scene数据集估计一个合适的降维比例;然后,ELRS同样使用5个多标签降维算法、8个数据集上、2个多标签分类器进行性能比较。实验表明,本文提出的ELRS方法具有较好的性能。
其他文献
目的:系统评价舒肝解郁胶囊治疗轻、中度抑郁症的疗效及安全性。方法:计算机检索Cochrane图书馆、EMbase、PubMed、中国期刊全文数据库、中国生物医学文献数据库、维普数据库
伴随着知识经济时代的到来 ,传统的科层制政府必将被电子政府所取代。电子政府表现出全新的价值内涵 :公开、创新、责任、效率、参与、民主与重塑政府。建立电子政府的关键在
首次以铝箔代替恒电位/电流仪惰性电极作为基体,采用辅助电极电沉积法成功制备了氧化铜纳米颗粒。用X射线衍射仪和透射电子显微镜对所制备的纳米粉体进行了表征,结果表明:氧
汉语教学和推广新HSK考试是海外孔子学院的常规工作。文章以孔子学院的教学为例,探讨孔院初级班汉语教学与新HSK考试一、二级辅导相结合的课堂设计,以期对今后的汉语教学和新
溶胶-凝胶法是制备纳米粉体的一种低温工艺,具有制品纯度高、化学均匀性好、颗粒细、可容纳不容性组分和不沉淀组分、掺杂分布均匀、合成温度低、成分容易控制、工艺设备简单
作为一位富有远见的实业家 ,张謇较早地认识到博览会的作用并投身于中国近代博览会事业 ,积极倡导 ,亲自实践 ,竭力推动 ,把竞争、开放的意识带入实业界 ,为中国近代博览会事
通过盆栽干旱胁迫,研究了不同程度干旱胁迫对7种景天属植物生理特性的影响。结果表明:干旱胁迫下7种景天属植物细胞膜脂氧化产物丙二醛含量及叶片相对电导率均有不同程度的升
目的观察针刺锥体交叉区预防中风偏瘫痉挛状态的临床疗效。方法醒脑开窍针刺组(治疗组)针刺足太阳膀胱经的玉枕至天柱的连线区域,即锥体交叉区(位于锥体交叉前后在体表的投影
子罕,春秋时齐国的一名大夫。他虽身为京城里的官员,却从不恃权营私,贪恋钱财。不管是亲朋好友,还是素不相识的陌生人,别人送来礼物,他一概拒收。一天,子罕正在府中处理政务,
以贵州省人工杉木和马尾松地上生物量数据为例,通过利用线性混合模型和哑变量模型方法,建立了适合不同树种和区域(中心区和一般区)的通用性立木生物量方程,为简化生物量建模