基于重建误差的样本加权特征提取算法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:Monkeysct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算、大数据等技术的不断兴起,人们获得的数据在复杂性和数据规模上都发生了巨大的变化,各领域对数据处理也不断提出了新的要求。特征提取作为数据分析和处理技术中的一种有效手段,被广泛应用于模式识别、数据挖掘等领域。基于特征提取问题国内外学者开展了大量的研究工作,但特征提取算法的适用性、鲁棒性、有效性等问题一直是研究的难点。本文针对线性特征提取和非线性特征提取两类方法开展了课题的相关研究工作,具体内容如下:(1)提出了基于PCA的样本加权特征提取算法针对传统的线性特征提取算法PCA在模型构建时并没有较好考虑不同样本特征对最终识别的有效性和重要性各不相同这一问题,提出了一种基于PCA的样本加权特征提取算法。本文依据加权的思想,对PCA重建误差和模型进行加权改进,构建了一个PCA样本加权重建误差和最小模型,并利用信息熵来调节样本的权值。新模型能够获得更小的重建误差和,求解模型得到了一种自适应权值的PCA算法,实验表明该方法具有更好的特征提取效果和重建误差和。(2)提出了融合局部信息的KPCA样本加权特征提取综合模型针对非线性模型KPCA不能较好提取样本数据中的局部特征信息,且对离群点样本的抗干扰能力较差这一问题,提出了一种融合局部信息的KPCA样本加权特征提取综合模型。本文利用LPP模型能较好保持数据局部特征的优势,从重建误差角度对KPCA加权模型引入LPP模型进行改进,得到了一种能更好提取数据局部信息的样本加权非线性特征提取综合模型。实验发现模型具有很好的特征提取效果,且对离群点样本具有很好的鲁棒性。(3)设计并实现了一个特征提取算法分析平台(FEAAP)依据论文的理论研究成果,本文设计并实现了一个特征提取算法分析平台。平台基于Matlab GUI框架,能够完成数据预处理、算法参数设置、实验结果比较等功能,从而为特征提取算法的研究提供一个方便的实验和分析环境。
其他文献
近年来,三维图形仿真技术被广泛运用于城市规划、工程设计、医学、教育等领域。把三维仿真技术运用于工业控制领域,模拟仿真控制过程,可以使控制过程的调试以及结果显示更加
人脸表情识别是情感计算与先进智能的重要组成部分,同时也是人机交互、机器学习、智能控制和图像处理等领域的一个研究热点。为了促进更自然、更人性化的人机交互,对表情识别
动态口令认证系统采用的是一次一密的身份认证形式,比传统的静态口令具有更高的安全性,应用前景更加广阔。然而动态口令认证系统的加密算法计算难度较大,需要一定的硬件资源
随着网络技术的发展和网络上信息量的激增,信息检索越来越受到人们的关注。信息检索系统作为网络信息平台的一个重要组成部分,在用户获取准确的网络信息过程中发挥着重要的作用
近年来,随着计算机和网络技术的迅猛发展,基于对等结构(Peer-to-Peer,P2P)的大规模分布式系统迅速发展起来,成为占用Internet带宽最大的网络应用。越来越多的个人计算机通过有线
互联网上的文件内容分发一直采取传统的Client/Server模式,通过FTP或HTTP协议来进行。在这种模式下,每个客户端向提供内容分发的服务器建立一个TCP连接,通过这一连接从服务器
AVS标准是基于我国自主创新技术和国际公开技术所构造的信源编解码标准,是音视频编解码领域一批关键技术的集中体现。AVS标准的制定和推广对减轻国内音视频相关产业的专利费
车载自组织网络是解决智能交通系统中动态信息服务,实现车联网最为关键的技术。VANET系统的研究在为人们提供更便捷服务的同时,也带来了更多的安全隐患。本文对VANET系统的安全
目前异构数据环境中数据的集成、访问已经引起业界的高度重视。采用软件构件技术(如CORBA、COM/DCOM)虽然提高了效率和质量,但是它们还存在紧密耦合、系统集成困难、局部计算等
作为一种重要的支持技术,并发程序演化技术能够持续地改进并发代码的品质,提高软件开发与维护的效率。重构是软件演化的一种重要手段,它在不改变软件外在行为的情况下,修改程序的