基于非负矩阵分解的图像特征抽取及分类方法研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:willian_tang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
各种数据采集设备的不断升级换代,使得每时每刻都有大量的数据产生,同时网络给这些数据的快速传播带来了便利。人们获取这些数据以利用其中对自己有用的信息,但是这些数据往往是高维的,研究如何对高维数据进行降维获取更加有效的低维信息非常有必要。非负矩阵分解作为一种有效的数据降维方法,它将输入数据表示成两个低维非负矩阵的乘积形式,以近似表示原始矩阵。在数据处理领域,非负性符合人脑的认知,具有很好的可解释性,同时,矩阵在分解过程中,降维可以带来一定的稀疏性,有利于数据分析。非负矩阵分解可以在图片处理上发挥一定的作用,但在实际分析过程中,图像数据会存在噪声污染或者损坏,并且非负矩阵分解算法的运算效率也有待提高。因此本文在总结了目前非负矩阵分解的一些衍生算法的基础上,对存在问题提出了改进和解决方法,主要进行了以下工作:(1)提出了基于稀疏损坏的非负矩阵分解方法。该方法同时考虑图像没有噪声的情况和有噪声的情况,把无噪声的输入矩阵分解为基矩阵与系数矩阵的乘积,图像加噪声后的矩阵近似表示为两个低维矩阵的乘积与噪声矩阵的和。模型同时综合考虑这两方面的限制,并依据此模型迭代求出数据的低维特征。实验证明,提取的特征具有很强的可区分性,将这些特征用于分类是有效的。并且所提算法能很好地重构被非高斯噪声以及非泊松噪声损坏的图像。(2)提出了一种标签嵌入的非负矩阵分解算法。原始的非负矩阵分解算法仅将数据作为矩阵输入进行分解,在分解过程中未考虑数据标签,而本算法在分解时引入了标签矩阵表示图像类别信息。算法将输入数据分解为两个低维矩阵的乘积与一个稀疏矩阵的和,用标签矩阵对系数矩阵进行限制,从而使得同类数据可以被划分到相同子空间。实验证明,算法能有效克服图像噪声的影响,并且迭代出有区分性的基图像。(3)提出了标签嵌入非负矩阵分解的在线算法。每当出现需要分类的新样本,原始的NMF将所有样本重新分解计算的方法是耗时耗力的,为了简化计算从而提取新样本的特征,本文提出了一种新算法。首先通过嵌入标签的训练样本矩阵计算出基矩阵,降低数据量,接着将此基矩阵调整后与测试样本连接成一个新矩阵,最后分解连接成的新矩阵,得到的新的系数矩阵调节后用于新数据的分类。在此过程中,基矩阵不必重复计算,当有新数据出现,只需将新数据与已有的基矩阵进行连接计算。实验证明了算法提取特征的有效性并证明算法具有较高的计算效率。
其他文献
The report of the 19th Congress of the Communist Party pointed out that it is necessary to accelerate the construction of manufacturing power and promote the deep integration of the Internet,big data,
随着信息技术推动社会不断进步,企业管理的方式也逐步升级。化学试剂是人类当今生产与生活不可或缺的一部分,然而他们具有易燃、有毒、易爆、有害等特点,所以一旦发生事故,将造成巨大损失。为了加强对危险试剂的管理,从危险试剂的采购、仓储、使用到危险废物上报等,需要进行全流程把控管理。传统管理都是通过人工手抄记录,无法进行高效完成任务,甚至由于数据繁杂,导致工作人员记录过程中出错的频率提高,而且还可能导致危险
随着世界各国高新科学技术水平的快速发展和进步,我国对各种高新科学仪器的需求量也在迅猛地增长中,不断推动中国的高新科学仪器市场快速的发展和壮大,引来国内外该行业的企业展开对中国科学仅器市场的争夺战。由于该行业的产品在质量方面大同小异,在客户需求方面存在着多样化、复杂化的特征,所以,企业想要在如此激烈的市场竞争中抢占一定的市场优势,就需要从该行业产品的售后服务这一方面入手。该行业售后服务的质量由于受到
我国车险市场竞争激烈,大部分财产险公司都在持续亏损经营,而车险保费规模远高于其他险种,中小财产险公司要扩大市场规模就必须发展车险市场。中小保险公司必须在提升理赔服
数字时代的到来使得艺术与科技的结合达到了一个新的高度。数字技术不仅参与了艺术创作,成为作品有机的整体部分,同时还积极地融入了艺术的传播与批评过程。艺术与艺术理论的面貌都为之一新。尤其是随着虚拟现实(VR)、增强现实(AR)、计算机算法、人工智能(AI)等技术的兴起,数字艺术的类型也得到了极大的丰富:扩展了已有艺术类型的创作媒介、内容和手段,同时也促使了包括VR艺术、生成艺术及人工智能等新兴艺术类型
随着移动互联网的快速发展,在线社交已经成为人们生活中极为重要的一部分。但是,传统社交网络逐渐暴露的隐私泄露问题也让人们越来越担心。另外社交网络等互联网服务带来的移动通信流量的蓬勃增长,也给当前的通信设施带来了极大的压力。区块链技术的出现和近用户端设备缓存思想的提出为解决这些问题提供了新的方向。因此,本文将结合区块链技术、最优化理论等对社交网络及内容缓存两个热点方向进行了研究。主要包含的工作有:(1
随着互联网技术的高速发展,评论、新闻、舆论等文本数据也呈爆炸式增长。如何在巨大的文本数据源中准确、快速的挖掘到有价值的信息成为人们迫切的需要,这也是工业界和学术界一直关注的热点问题。机器学习和深度学习的发展为文本挖掘提供了有力的技术支持,文本分类相关算法也大量应用于各行各业。但是由于算法学习的门槛较高,非计算机相关从业人员难以直接使用相关算法工具开展自身业务的分析。本论文设计并实现的机器学习平台可
和传统的制造、生产型企业相比,房地产行业属于资金密集型企业,且项目开发的周期长,宏观政策影响大,行业本身具有较强的不确定性,风险管理就显得尤为重要,如何提高房地产企业管理水平和风险防范能力,做到稳健经营,持续、合法合规经营,成为摆在房地产开发企业面前的重要课题。在理论分析部分,本文介绍了国内外风险管理研究的现状,对风险官的内涵、风险管理的概念与过程、COSO全面风险管理理论、风险识别与风险应对方法
布氏锥虫(Trypanosoma brucei,T.brucei)是一类具有广泛宿主的血液内寄生原虫,其三个亚种可以引起人类和动物的非洲锥虫病。人类的非洲锥虫病又叫作睡眠病(sleeping sickness),感染后期病人出现神经症状,嗜睡昏迷,如不及时治疗,死亡率高达百分之百;动物的非洲锥虫病也叫作那加那病(nagana),引起家畜营养不良,贫血消瘦,最后因极度衰竭而死,给畜牧业发展带来了巨大
当前经济形势之下,随着儿童消费市场日益扩大,WD儿童娱乐公司正是国内涉足儿童娱乐行业发展较快速的企业。但随着门店数量的日益扩张,岗位空缺、人员流失率、招聘到岗速度及人员素质成为企业人力资源管理面临的重要问题。如何通过培训工作,做好人才培养、梯队建设,为企业发展做好人才储备输出是各公司人力资源从业者和运营部门管理人员需要思考和解决的问题。本文首先对国内外CBET培训模型的发展及应用情况进行了分析,然