论文部分内容阅读
随着人工智能时代的不断发展,应用机器学习技术对语音识别和图像识别已成为模式识别中两个非常重要的领域。语音识别在社会生产和生活中,有着不错的发展前景;图像识别属于模式识别的一个重要分支,已经成功应用在军事、医疗和工业等计算机视觉领域中。人工神经网络属于机器学习领域,它具有一个自适应、自学习和并行分布式结构。自上世纪80年代以来,随着计算机科学技术的飞速发展,人工神经网络的研究也取得了很大的进展,目前已经有上百种人工神经网络,其中具有代表性的的有BP神经网络、科赫伦神经网络(SOM)、卷积神经网络(CNN)等,已广泛应用在信号处理、模式识别、图像处理、金融的领域中,在语音识别和图像识别领域中都有着不错的表现。支持向量机(SVM)是一种以统计学习为理论基础的机器学习方法,具备十分强的推广性和全局最优性。本文主要应用不同的机器学习算法来对语音信号和图像进行识别分类,主要采用BP神经网络模型、改进BP神经网络模型、SVM、改进的粒子群算法(IPSO)优化的SVM模型、PCA优化的SVM模型、CNN模型、改进的CNN模型等。对不同的信号、图片集进行特征提取和分类,本文的主要内容包括:1.运用梅尔倒谱系数法(MFCC),对4种不同的音乐信号进行了特征提取,提取了能够代表每种信号的特征,将连续的信号离散化,降低了信号的复杂度。2.运用BP神经网络模型、改进的BP神经网络模型、改进的PSO—SVM模型等对提取出的特征信号进行识别分类,并进行了结果对比,均达到了85%以上的正确率。3.将PCA和SVM进行结合应用到MNIST手写数字集中,进行识别分类。在数据层面对高维的图片数据进行降维处理,将数据进行压缩。这大大提升了算法性能,识别正确率高达98%以上,运行时间缩短了约90%。4.采用CNN对SAR图像目标进行自动学习来提取特征。随后又将传统CNN进行了改进,将Softmax分类器替换成了SVM分类器,分类效果有了更进一步的提高,识别正确率高达99%以上。