基于HMM-SVM的音频分类与检索索算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:hxz22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着多媒体数据成数量级的增长,对于多媒体的分析和分类变得越来越迫切。当人们阅读和理解视/音频内容时,作为多媒体数据中重要部分的音频,为人们的感知提供了重要的线索。如何有效地对海量的音频数据进行分析、存储和检索是一个需要解决的问题。由于音频文件的非结构化特性,音频检索受到了很大的制约。基于内容的音频检索已成为多媒体检索的研究热点。本文对基于内容的音频分类检索的关键技术展开分析,主要在以下几个方面展开了工作:   首先,按照特征提取单位长短的不同,可以从音频信号中提取音频帧特征和音频例子特征两种形式。基于帧的音频特征包括了过零率、短时平均能量、MFCC及其差分系数。基于例子的音频特征包括带宽均值、静音比、基音变化率、高过零率比以及小波各子带能量比等常用特征,并增加了HMM概率输出值这一特征。   其次,研究了最常用的两种分类模型隐马尔可夫模型(HMM)和支持向量机(SVM)模型。在HMM识别时候,实验发现正分的时候正确分类的类别与其它类别之间的概率输出差值比较大,误分的时候错分类别和正确类别之间的概率输出差值比较小。通过引入最小分类错误(MCE)准则,设定一个阈值,把音频在HMM中最大输出概率和次大输出概率进行比较,如果差值小于某个设定的阈值,则再用SVM进行识别做出最终的识别结果。当用户提交了需要检索的音频例子,检索系统采用基于分类模型的音频例子检索技术从音频例子库中检索出最相似的若干音频例子返回给用户。   最后,采用了COM组件实现Matlab与C#的混合编程来实现音频自动分类系统,介绍了系统的体系结构、主要功能以及开发的关键技术,该系统能够满足对音频分类和检索的基本要求。
其他文献
随着计算机技术与网络技术的发展和普及,为了实现远程数据传输、远程监控等功能,网络化已成为新一代嵌入式系统发展的一个重要趋势。具有远程监控功能的心电仪应运而生。本文
学位
文本分类的一般过程是首先对训练文本进行预处理,把抽取出来的特征用特征选择算法进行过滤,得到一个特征空间,然后对特征空间用分类算法学习获得一个分类器,最后分类器实现对测试
电子邮件以其方便、快捷、低成本等优点逐渐成为日常生活中主要通信手段之一。但是随之而来的垃圾邮件却给社会造成了很大的危害。因此,研究邮件过滤技术具有重要的意义。  
随着我国信息化建设的迅速发展,政府部门及各大企业都建立了各自的信息处理系统。这些信息系统往往是在不同时期、由不同厂商、在不同平台上建设而成的,而且大都是使用不同语
科学技术的进步推动着人类进入了一个崭新的信息时代,信息和信息技术改变了人类的生活和工作方式,已经成为当今最具活力的生产要素和最重要的战略资源。现今,各种各样的信息充斥
随着计算机网络的飞速发展,多媒体数据越来越多地出现在互联网上,多媒体信息的无序使得用户在其搜索和管理上都很不方便。快速便捷地进行多媒体信息的检索、查询和浏览,成了人们
面对海量的Web服务,服务请求者要想快速高效地得到理想的服务,必须要有一种高效的Web服务匹配和Web服务选择方法,因此对Web服务匹配和Web服务选择方法的研究具有重要意义,本
随着互联网与计算机技术的飞速发展,全球各国都在进入一个高速发展的信息化阶段。海量的信息在给人类的生活提供便利的同时,也带来了信息灾难。尤其是最近几年移动互联网与智
微粒群算法是一种典型的群智能算法,其基本生物学背景是模拟鸟群觅食、鱼群游动等动物行为。然而,从决策的观点来看,微粒的进化方程可以视为个体的决策过程。为此,本文将群体