【摘 要】
:
互联网时代,日益增长的数据呈现出样本数目多、特征维度高、类别结构复杂等特点。特征选择可从海量的复杂数据中提取有用的信息,已经成为机器学习、数据挖掘等众多领域的研究
论文部分内容阅读
互联网时代,日益增长的数据呈现出样本数目多、特征维度高、类别结构复杂等特点。特征选择可从海量的复杂数据中提取有用的信息,已经成为机器学习、数据挖掘等众多领域的研究热点。本文从数据样本、特征和类别三个角度分别探索数据之间的联系实现特征选择。其主要内容体现在如下三个方面:1.从数据样本角度出发,提出了基于样本相似性的特征选择算法。首先利用两种不同的方法同时构造样本相似矩阵,并利用其构造低维空间。然后引入范数对低维空间进行稀疏回归,得到特征权重矩阵。定义衡量特征重要性的指标,最终选择最优特征子集。2.从数据特征角度出发,提出了基于特征相似性的特征选择算法。首先利用特征重构的方式获得特征相似矩阵,并在其基础上将原始样本空间进行转化。然后在经验误差最小的条件下,令转化之后的样本空间拟合标签空间。最后对特征权重矩阵进行优化更新,进而实现特征选择。3.从数据类别角度出发,提出了基于类别相似性的特征选择算法。首先利用类别之间的父子关系,模拟近邻类别之间的层次结构,构造类别之间的相似矩阵。然后利用其获取近邻类别的相关信息实现当前类别参数的更新。最后获取特征权重矩阵,选取最佳特征子集。
其他文献
介绍了变压吸附的工作原理,对变压吸附的核心设备变压吸附塔的结构、操作温度、压力等进行了简单介绍。按照规范JB 4732—1995第七章有关筒体和封头的要求,根据吸附塔的设计
我国正步入政府信息公开政策立法时代,《政府信息公开条例》正在讨论之中,而美国政府信息公开政策远远优于其他国家,值得我们学习、借鉴。
通过临床症状、X线软片法、明胶管试验法、血清脂肪酶的测定,确诊1只京巴犬患有胰腺炎,治疗以减轻疼痛、止吐、补充电解质和体液、抗菌消炎为主要措施。
国际经济发展的高度融合,为跨国经营企业的发展提供了良好的环境。在我国“引进来,走出去”的指导方针下,我国近年来外商投资、境外上市均处于利好政策,行业经济飞速发展。近
目的:通过临床实验研究证明加减除湿胃苓汤对湿热下注型肛门湿疹的治疗有更加显著的效果。方法:本研究选取了长春中医药大学附属医院肛肠科门诊及住院部诊断为肛门湿疹的患者
本研究以约翰·杜威的道德教育思想为主要研究对象,通过对杜威的道德教育思想的系统阐述和哲学解读,对杜威的道德教育思想进行了辩证分析。最后贴合我国高校道德教育的现状,对杜威道德教育思想在我国高校道德教育工作中的借鉴意义进行了系统的阐述和分析。具体说,本文将从以下几方面展开分析和阐述:第一章是对研究背景和研究意义的阐述,对国内外学者就相关研究课题的研究现状的梳理和分析,对本研究的研究思路和研究方法的说明
早在2002年即出台的《民用建筑工程室内环境控制规范》规定。所有民用建筑工程完工后必须进行环境质量检测。在对办公楼、商店、旅绾、文化娱乐场所、图书结、餐厅、体育结、
通过工程设计实例,总结了变制冷剂空调系统应用于现代住宅的特点,以及设计中应注意的问题;并结合实际工程具体分析了该系统的优点与不足。
<正>近年来,在治疗犬细小病毒病的过程中,发现有些病犬,在治疗初期基本控制细小病毒症状后,又突发强烈呕吐,便血,触诊腹部坚实、有压痛感,结合实验室诊断为继发性急性胰腺炎
2007年对北京市海淀区29家宠物医院(诊所)宠物犬病历进行调查和统计分析,以评价北京市犬病的流行现状,提出预防措施。调查总病历28783例,其中内科病12485例,占总调查病历数的