基于小波和隐马尔可夫模型的音频分类

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:yunlian123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音频处理在多媒体信息处理中占有重要地位。原始音频数据是一种非语义符号表示和非结构化的二进制流,如何提取音频中的结构化信息和内容语义是音频信息深度处理、基于内容的音频检索以及辅助视频分析等应用的关键。基于内容的音频分类作为解决音频结构化问题的核心技术,是当前音频内容自动分析领域的一个研究热点。 本文围绕音频分类的两大技术难点一特征分析与抽取以及分类器设计展开研究,主要内容如下: 概要地介绍了HMM的基本理论和主要算法。深入研究了语音、音乐的区别性特征及其计算方法,采用了音频clip和音频帧相结合的方法进行音频特征抽取。提出了一种基于各态历经混合高斯密度隐马尔可夫模型(EMGD HMM)的音频分类器,用于语音、音乐以及它们混合声音的分类。该分类器采用了全连接Markov链,从而能够有效地描述音频中的状态反复情况。对比实验结果表明,该分类器具有很高的分类精度。尝试了结合小波分析和傅立叶分析进行音频特征抽取,其中对子带能量和基音周期采用小波分析抽取,对频谱中心、带宽等特征则采用傅立叶分析抽取,并在本文提出的EMGD HMM音频分类器上进行了实验考察,结果表明该方法也是一种有效的音频特征抽取方法。
其他文献
In2O3是一种重要的n型宽带隙半导体材料,具有较高的可见光透过率和红外反射率,主要应用于光电装置的透明导电薄膜。In2O3纳米结构材料以其不同于块体材料的微观形貌、光学电
A novel channel-wall engineering strategy of the porous materials cationic covalent organic frameworks (COFs) is established based on rapid microwave-assisted a
本文介绍了防城港市生态文明创建现状,以及生态文明创建存在的问题,通过对各种存在问题的分析,研究生态创建目前存在的瓶颈,并提出了生态创建发展的具体推行措施.
随着我们城市化进程的加快,城市污水处理率逐年提高,城市污水厂的污泥产生量也急剧增加,特别是在我国城市化水平较高的几个城市与地区,污泥减量与出路问题已经十分突出。本课题通
我国政府于1993年制定了金卡工程实施计划,旨在加速推动我国国民经济信息化进程,各种自动识别技术得到了迅猛的发展.射频识别技术作为一种新兴的自动识别技术也将在中国得到
水是生命之源,是人类生存和经济社会发展的基础。随着21世纪全球人口不断增长、经济一体化进程加快和各国发展竞争的日益加剧,水资源日益匮乏,人口占世界大多数的80个国家严重缺
诗意是语文生命的血液,语文是诗意栖息的家园,只有让语文课堂充满诗意,我们的学生才能“腹有诗书气自华”。诗歌教学通过听、读、品、迁移等环节使学生的情感得以升华,诗意得以流
Three new rare cyclopiane diterpenes (1–3), together with thirteen known compounds (4–16), were isolated and identified from a sea sediment-derived fungus Pen
细菌,真如课本上描述的那样—— 一般是单细胞,结构简单,缺乏细胞核、细胞骨架以及膜状胞器吗?实际上,越来越多的研究显示,细菌并非如此简单。  有骨架的细菌  课本上只写到细菌有一个厚厚的细胞壁,它们的结构也被概括为“简单”,关于其结构的描述更是十分稀少——可事实却证明,在细菌中,蛋白质骨骼和隔室结构是很常见的。  组成我们身体的那些复杂细胞,可以组成各种各样不同的形状,虽然它们仅被一个软膜包裹着。
Gold nanoparticles functionalized hollow mesoporous Prussian blue nanoparticles (Au@HMPB NPs) were synthesized and its peroxidase-like activity was explored for