【摘 要】
:
多标签分类算法是机器学习中的一个重要方向。多标签分类算法可以用来解决同时具有多个标签的样本数据的分类问题以及排序问题。其研究成果广泛地应用于各个领域,如文本信息
论文部分内容阅读
多标签分类算法是机器学习中的一个重要方向。多标签分类算法可以用来解决同时具有多个标签的样本数据的分类问题以及排序问题。其研究成果广泛地应用于各个领域,如文本信息分类、图像视频的语义标注、功能基因组等。相较于每个样本只对应一个类别标签的传统单标签分类算法,多标签分类算法更能满足实际应用的需求。本文提出两种解决多标签分类的方法MLNMF和i-MLNMF,i-MLNMF是MLNMF的扩展算法,在原算法的基础上变换了概率计算公式,使得算法在对大数据集处理上效果更加明显。目前已经提出了若干多标签分类算法,这些方法均能对样本点进行多标签分类,然而如何更加高效的将样本点与多个标签对应,以及如何挖掘出样本的特征与标签之间的直接对应关系并加以利用依然没有得到彻底的解决。MLNMF和i-MLNMF算法均是利用非负矩阵分解来解决多标签分类问题的。该方法相对于已提出的算法,既能保证多标签预测的准确性,也能保证算法运行时间上的高效性。MLNMF和i-MLNMF算法通过挖掘样本点的特征与标签之间的直接对应关系进而得到标签概率预测模型(LPPM),接着通过决策树算法为每个标签生成对应的分类器。最后,利用LPPM模型和分类器为无标签样本预测所对应的多个标签。论文在多个标准数据集和大数据集上对比了基于非负矩阵分解的分类算法与经典分类算法,实验结果表明,MLNMF和i-MLNMF算法的效果要优于或者接近于经典算法,并且在算法效率方面十分突出。因此,MLNMF和i-MLNMF算法在多标签分类的实际需求中有着非常高的实用价值。
其他文献
在公开的互联网中传输信息很容易受到窃取或者破坏,尤其是涉及到相关领域的核心数据时,就会带来巨大的安全隐患,数字水印技术在维护数字产品版权等领域发挥了巨大的作用。传
随着软件的不断发展,软件测试的重要性逐步显现。回归测试作为软件生命周期的一个组成部分,在整个软件开发的过程中占有相当大的比重。软件在开发过程中会进行多次回归测试,
大数据是信息时代的里程碑,正在以巨大的能量推动着人类社会的深刻变革。随着信息技术的跨越式发展,尤其是互联网和电子存储技术,使得人类与大数据的关系更加紧密。在大数据
对比序列模式挖掘是数据挖掘中的重要课题之一,在实际应用中具有非常高价值。对比序列模式挖掘旨在从具有类标签的序列数据中挖掘出具有明显差别的序列模式。近年来各种各样
传统的X射线探测器结构复杂,成本高,而基于CMOS传感器的解决方案欲求通过X射线的灰度值得出辐射剂量,而灰度值和辐射剂量之间的关系是未知的,因此本文设计和实现了一个基于FP
大数据时代来临,海量数据的存储对当前计算机存储和处理能力提出了巨大的挑战。并行计算、云计算等技术日渐成熟,处理器性能显著提高使得计算机的信息处理能力足够强大,但计
现有的分类算法被广泛应用于数值唯一的数据分类问题。然而,在许多真实应用中普遍存在数值服从某种分布的不确定数据,如果使用传统的分类算法对不确定数据进行分类,那么极有
随着移动互联网的快速发展,智能手机作为移动互联网的接入终端,在全球范围内已经得到了大量的使用,成为了人们工作和社交娱乐最主要的工具之一。其中Android系统因为良好的用
随着移动互联网的快速发展,全网移动应用数量逐年攀升,人们在生活中越来越多地依赖移动智能设备,不法商家找到可乘之机,恶意移动应用层出不穷,移动互联网的安全形势也愈发严
随着硬件技术进步和软件技术积累,软件复杂度随着软件体量日益增加。如何保证软件可靠性越来越得到人们重视。采用基于模型的形式化方法对软件建模以及模型的正确性验证是当