【摘 要】
:
在计算机和互联网飞速发展的今天,不仅数据量变得越来越大,数据的形式也变的越来复杂,对数据的智能处理也变的尤为重要。其中模式识别,数据挖掘,机器学习、深度学习等已经成
论文部分内容阅读
在计算机和互联网飞速发展的今天,不仅数据量变得越来越大,数据的形式也变的越来复杂,对数据的智能处理也变的尤为重要。其中模式识别,数据挖掘,机器学习、深度学习等已经成为了处理和挖掘数据的主要方式。面对越来越复杂多样的数据,数据降维扮演着越来越重要的角色。多标记数据是传统单标记数据的一种延伸,数据形式变得复杂,同时在多标记中标记的缺失也是一个重要的问题,因此针对多标记和弱标记进行特征选择也变得重要起来。传统的粗糙集理论是一种有效的处理不确定性的工具,在特征选择中有着广泛的应用,但是其只能处理离散型数据。之后模糊粗糙集的出现解决这一问题,并扩展出了模糊信息论,其中有模糊熵和模糊互信息等。基于传统信息论的特征选择算法已经得到了很多的研究,但是基于模糊信息论的多标记特征选择算法却比较少,其可以直接处理数值型数据以及混合型数据。因此这里我们将利用模糊粗糙集来处理多标记数据中的特征选择问题。同时针对多标记数据的特点,提出了新的多标记特征选择算法。同时多标记中的标记缺失是一种常见的问题,针对这一情况,结合了粗糙集中不完备信息系统中缺失值的处理方式,多标记中标记缺失情况下的特征选择问题也得到了处理。针对上面提出的问题,本文提出了结合模糊粗糙集,多标记数据和不完备信息系统的多标记特征选择算法和弱标记特征选择算法。本文的主要成果如下:·基于模糊信息论和标记之间的相关性,提出了多标记场景下特征选择算法,并通过实验进行了效果分析。·基于特征相关性,提出了可以去除冗余特征的多标记特征选择算法,并通过实验进行了效果分析。·结合不完备信息系统中处理标记缺失的方式,提出了标记缺失下的多标记特征选择算法,并通过实验对比了不同处理方式的效果和缺失率对算法的影响。
其他文献
CRISPR/Cas9系统是继锌指核酸酶(ZFNs)技术和转录激活因子样效应物核酸酶(TALENs)技术后新的基因编辑技术。与ZFNs和TALENs相比,CRISPR/Cas9系统具有操作简单,花费低的优点。
图像在采集或传输过程中不可避免地会受到噪声污染,图像中噪声的存在不仅破坏图像区域的均匀性,而且不利于图像边缘信息的保持;图像融合是通过同一个传感器不同角度或不同传
可见光通信(VLC)具有频谱资源丰富、保密性好、成本低、能耗小等优点,因而成为近年来无线通信研究热点之一。使用多LED光源发送和多PD接收的MIMO-VLC系统可以极大提升系统的
随着全球经济发展形势和环境的变化,新一轮科技革命和产业变革的到来,我国的经济发展环境也随之发生了变化,产业面临转型升级,经济发展迎来巨大挑战与机遇。高职院校担负着培
VLC(可见光通信)作为传统无线通信的有效补充,近年来成为无线通信领域的热点之一。由于可见光通信系统信号的非负性,使得容量分析不再像传统无线通信系统那样简单。本文对可
社交媒体在为人们带来人际交往的便利和全新体验的同时,也确实引发了层出不穷的道德和法律问题。人们在社交媒体中主动或被动呈现的各种私人数据及原创数字内容,正承受着数据
稀土离子上转换发光被广泛地应用于激光光源、光纤通信、发光二极管、色彩显示和生物系统等领域,因此实时、动态、可逆地控制稀土离子上转换发光对于它们的应用是非常重要的
目的:应用倾向性评分匹配法(propensity score matching,PSM),分析大连医科大学附属大连市友谊医院及大连医科大学附属第一医院经病理确诊的结直肠癌住院患者及同期行肠镜检
模糊分类技术在数据挖掘、模式识别、智能系统等领域有着重要的应用。改进传统模糊分类算法,以适应大数据处理环境,且能够保证其有较高的时间效率或分类精度,已成为模糊系统
随着计算机技术的不断发展,三维重构技术在高速物体动态测量领域中的应用越来越多,尤其是在涡轮发动机涡扇、高速一体化弹药方面的测试需求更加迫切。本课题来源于XXX国防项