基于Lasso的特征选择方法研究与实现

来源 :安徽师范大学 | 被引量 : 0次 | 上传用户:A403537889
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器学习领域,特征选择作为数据预处理的一种常用的手段,不仅能够提高分类器的分类性能,而且能增加对分类结果的解释性,已被广泛的应用到图像检索、人脸识别、医学图像分析等领域。但随着时代发展和科技的进步,各应用领域积累了大量的高维数据,包括有标签数据和大量无标签数据,应用传统的特征选择方法于处理这些数据时具有一定的局限性。基于全监督机器机器学习,充分挖掘数据自身所具有的先验知识,提出了新的特征选择方法,并将其推广到半监督机器学习场景,从而更好利用大量无标签数据,学习出更具推广性的学习模型。具体而言,本文主要进行了如下研究工作:  首先,在全监督机器学习环境下,针对Lasso特征选择方法的不足,提出了一种新的特征选择方法 Lap-Lasso,保留了基于 Lasso特征选择方法的优点,即:能够进行回归和特征选择,选择出的特征与类标签非常相关,同时又考虑到了样本自身内在的关联信息,以诱导出更具有判别力的特征。通过理论分析和仿真实验,在UCI数据集的实验结果验证了Lap-Lasso方法的有效性。进行特征选择时,相比其他的特征选择方法表现出更好的性能。  其次,考虑到在应用实践中,通常获得有标签数据通常需要大量的人力物力,而获得无标签数据相对较为容易,本文将Lap-Lasso模型推广到半监督机器学习场景,提出了半监督特征选择方法Semi-Lap-Lasso方法,在UCI数据集上,一系列实验验证了该方法的有效性。  最后,在 UCI数据集上,一系列实验验证了 Semi-Lap-Lasso方法的有效性。
其他文献
集装箱装载是指将具有一定体积、重量、价值的不同种类不同数量的货物合理高效地放置到一个具有体积载重等限制的集装箱空间内的过程。装载作为物流供应链中的重要环节,其效
随着数字技术的发展,国内外对图形图像输入设备的需求越来越广泛。其中大幅面工程扫描仪在国内外需求相比则更大,它主要用于实现军事、测绘、建筑等一些特殊领域工程图纸的数
随着计算机技术特别是网络技术的迅猛发展,计算机病毒的更新、传播速度越来越快,危害也越来越大。目前,病毒检测技术已经取得了很大的进步,但传统的病毒检测系统仍然存在一些缺陷