基于互信息的多标签特征选择

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:fenghuah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,多标签数据集频繁的出现使得运用多标签学习处理多标签数据在研究界引起了极大的关注.我们在处理多标签数据时,数据的冗余和不相关都会影响分类性能,因此要进行降维处理,特征选择是减轻维数灾难影响的主要方法,所以特征选择对于多标签分类起着至关重要的作用.互信息作为特征选择的方法,考虑到标签间的相关性.本文在基于互信息的研究基础上,通过互信息给出特征的排序来提高分类精度,建立起基于互信息的多标签特征选择算法.本文的主要研究工作如下:(1)对于多标签特征选择问题,给出基于互信息的多标签特征选择的一般公式.但由于公式中条件互信息计算是高度复杂的,通过近似公式来代替条件互信息进行计算,并对一般公式中的参数赋予两组固定的值,提出了基于互信息的两种不同的多标签特征选择算法.并通过多标签数据集对不同算法的分类能力进行了比较,分析得出两种算法的有效性.(2)考虑目前的离散化方法大多将连续数值离散为有限个数.通过模糊离散化,用计算属性间模糊等价划分矩阵的內积来表示联合概率,给出模糊互信息的计算公式.建立了一种基于模糊互信息的多标签特征选择算法.通过多标签数据集对其效果进行检验.(3)为了避免在选取最佳特征子集时,所选取的子集只是局部最优而并非全局最优的这种情况.通过简化标签与属性间的互信息计算公式,将特征选择问题转化为数值优化模型,考虑特征流形的几何结构对结果的影响,建立了一种基于全局数值优化的方法,并通过二次规划进行求解.通过多标签数据集验证了算法的有效性.图13幅,表13个,参考文献54篇
其他文献
问答系统采用自然语言作为交互方式,针对用户提出的问题给出简洁、准确的答案。利用问答系统进行信息检索符合现代社会对于高效获取信息的需求趋势,而知识图谱技术的发展为实
自1997年以来,基于IEEE 802.11标准的无线局域网络(Wireless Local Area Network,WLAN)已经历20多年的发展,目前,WLAN呈现出密集部署的趋势,使得高效率利用频谱资源、提高信
目的通过1例 Lermoyez 综合症患者临床资料分析该病的病因、临床特点和治疗。方法回顾性分析1例 Lermoyez 综合症患者资料。结果患者男性,48岁,2006年4月~2007年3月间反复劳累
会议
生态环境与粮食安全是人类关注的重点,食物产自于耕地,人类生活对耕地存在重要的依赖关系。但是随着环境问题严重凸显,开始追其溯源,研究焦点聚集到耕地资源,在全球倡导绿色化背景下,农业绿色发展势头迅猛,因此,关于耕地绿色利用就显得尤为重要。而新疆作为我国农业大省,农业作为新疆经济的重要支柱,虽然要素不断投入为其带来农业经济发展,但在带来明显的农业红利同时,对环境也造成了一定的负面影响。如何降低农业药、肥
学位
随着互联网和在线社交网络应用的不断发展,数以十亿计的用户活跃在大型社交网络平台并产生大量的社交网络数据。在线社交网络数据放置作为社交网络后台支撑系统的关键技术,是
不同水肥管理模式下的稻田污染物排放变化规律的研究已成为本学科的热点问题。本文以南方稻作区作为研究对象,以不同水肥调控方案作为研究载体,采用田间试验、室内分析和数学模型相结合的研究手段,研究不同地区(平原区、沿海平原区、丘陵区)不同水肥调控下,水稻需水规律、水分利用效率、水稻群体生长指标变化规律(包括分蘖、叶面积指数、株高、根系活力、干物质累积量)和稻田污染物总氮(TN)、总磷(TP)、铵态氮(NH
海洋能是分布最广的一种可再生能源,波浪能是其最常见的可利用的能量形式。目前应用最为广泛的波能转换装置为振荡水柱(OWC)波能转换器,研究振荡水柱波能转换装置的气室结构
在本文中,我们研究了,一类具惯性项四元数值神经网络周期解的存在性和全局指数稳定性.首先,通过选择适当的变量替换,把系统转换为一阶微分方程.其次,结合Mawhin重合度理论的延拓定理,利用不等式方法,得到了具惯性项四元数值神经网络周期解存在的充分条件.通过构造一个新的Lyapunov泛函方法,导出了一些充分条件,以保证四元数值惯性神经网络周期解的全局指数稳定性.最后,给出了两个例子来说明所得结果的有
细胞是生物组织进行生命活动的基本单元,其形状和功能密切相关,因而对细胞形状及其动态研究一直是生命科学和临床医学等学科关注的热点之一。光学显微成像技术是人们研究细胞的有力工具,其中定量相位显微技术因其具有可对原态活细胞无损伤、实时可量化成像的优势而广受关注。但是该技术直接获取到的是样品在光入射方向上的相移分布,样品物理厚度和折射率信息耦合在其中,需要通过相关算法才能从相位信息中提取出来。为获得较高的
钢铁冶金是我国的支柱产业之一,改革开放以来我国经济快速发展离不开钢铁产量与质量的提升。为了培养优秀的连铸工程师,对连铸工艺的培训与仿真也提出了更高的要求。随着计算