机器学习在语音识别和图像识别中的应用

来源 :中北大学 | 被引量 : 0次 | 上传用户:turtle0906
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能时代的不断发展,应用机器学习技术对语音识别和图像识别已成为模式识别中两个非常重要的领域。语音识别在社会生产和生活中,有着不错的发展前景;图像识别属于模式识别的一个重要分支,已经成功应用在军事、医疗和工业等计算机视觉领域中。人工神经网络属于机器学习领域,它具有一个自适应、自学习和并行分布式结构。自上世纪80年代以来,随着计算机科学技术的飞速发展,人工神经网络的研究也取得了很大的进展,目前已经有上百种人工神经网络,其中具有代表性的的有BP神经网络、科赫伦神经网络(SOM)、卷积神经网络(CNN)等,已广泛应用在信号处理、模式识别、图像处理、金融的领域中,在语音识别和图像识别领域中都有着不错的表现。支持向量机(SVM)是一种以统计学习为理论基础的机器学习方法,具备十分强的推广性和全局最优性。本文主要应用不同的机器学习算法来对语音信号和图像进行识别分类,主要采用BP神经网络模型、改进BP神经网络模型、SVM、改进的粒子群算法(IPSO)优化的SVM模型、PCA优化的SVM模型、CNN模型、改进的CNN模型等。对不同的信号、图片集进行特征提取和分类,本文的主要内容包括:1.运用梅尔倒谱系数法(MFCC),对4种不同的音乐信号进行了特征提取,提取了能够代表每种信号的特征,将连续的信号离散化,降低了信号的复杂度。2.运用BP神经网络模型、改进的BP神经网络模型、改进的PSO—SVM模型等对提取出的特征信号进行识别分类,并进行了结果对比,均达到了85%以上的正确率。3.将PCA和SVM进行结合应用到MNIST手写数字集中,进行识别分类。在数据层面对高维的图片数据进行降维处理,将数据进行压缩。这大大提升了算法性能,识别正确率高达98%以上,运行时间缩短了约90%。4.采用CNN对SAR图像目标进行自动学习来提取特征。随后又将传统CNN进行了改进,将Softmax分类器替换成了SVM分类器,分类效果有了更进一步的提高,识别正确率高达99%以上。
其他文献
新三板市场作为我国资本市场的重要组成部分,近年来受到越来越多的关注。其在迅速发展的同时,对实体经济的推动作用也是不可忽视。本文将全面梳理新三板市场的发展历程、现状
铁路货车车钩分离事故发生的频率虽然不大,但却严重影响着铁路运输的正常秩序.针对货车车钩分离的问题,从车钩缓冲装置各配件的损伤及磨耗方面对发生车钩分离的原因进行了详
近年来,供应链结构设计成为学术界研究的热点问题。本文对供应链结构设计的国内外研究现状进行了系统分析,并从定性和定量两个方面对供应链结构设计的研究进展进行综述,从局
<正>中国国际图书贸易集团有限公司(原名中国国际书店、中国国际图书贸易总公司,简称国图公司)隶属于中国外文出版发行事业局(中国国际出版集团),成立于1949年12月,是中国第
1995-1997年通过对大通县巴天酸模资源的调查结果,年产鲜草560万kg。在饲草料供给严重不足的今天,开发利用该牧草前景广阔。
目的研究针灸、推拿配合骨盆牵引治疗老年人腰椎间盘突出症的临床效果进行分析。方法选取110例老年腰椎间盘突出患者作为该次研究对象,时间范围2016年1月—2017年1月,其中55
在不同碎浆浓度、温度和时间的条件下对旧杂志纸、旧报纸、涂布损纸、信封纸、便利贴纸及办公用纸进行碎浆,并测定相应浆料的黏性及胶体和溶解有机物含量,以更好地理解沉积胶黏
骨髓增生异常综合征是血液系统疾病中的一种疑难杂症,中医中药在治疗该病方面具有无可替代的作用。近来,笔者运用健脾温肾法治疗一例骨髓增生异常综合征,取得了良好疗效。
调和级数是级数理论中一种比较重要的级数,而其发散性却不那么直观.本文总结了调和级数的性质,并利用平均值不等式,给出了其发散性的新证法。
为进一步推进安置工作改革,2001年5月,民办函[2001]82号发出了《关于将辽宁浙江湖北三省的部分市县作为退役士兵安置工作改革调研联系点的通知》,2001年8月,民政部在辽宁丹东