一种新的两阶段语音/音乐信号分类器

来源 :第十二届全国多媒体技术学术会议 | 被引量 : 0次 | 上传用户:bailiankk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种自动将音频信号分成两类(音乐和语音)的新方法.第一阶段,我们从音频信号中提取出几个特征,然后用贝叶斯分类器进行初分类.由于信号具有惯性,因此我们对初分类结果再作平滑处理,这是第二阶段.通过第二阶段的处理,准确率有了明显提高.本文提出了两个新特征(SFR,WR)进行检测、分类.所提方法具有模型简单,训练容易,计算量小的特点.
其他文献
解决电子政务应用软件开发效率和质量已成为政府信息化工程的当务之急,青鸟电子政务支撑平台正是为了有效地提高电子政务应用软件的开发效率和软件质量而开发的一个软件平台,
会议
传统的GIS系统由于其封闭的体系结构,缺少互操作、重用性和灵活性,已经不适合现在分布式异构的网络环境.Web服务的兴起为解决传统的GIS问题提供了一个新的方向.本文从Web服务
本文分析了针对多媒体检索应用的XML数据压缩的特殊性.指出XML数据压缩应该采用内容与结构分离的压缩方法,尽可能多地保持其结构信息.本文详细分析了xmlzip的压缩方法,并阐述
图像数据库的不断庞大使基于内容的图像检索成为研究热点,目前主要集中于底层特征的相似度匹配.本文分别利用分块主色法和灰度共生矩阵得到图像的颜色特征和纹理特征.在利用
会议
从Win2k内存体系结构入手,着重阐述Win2k中虚拟内存的分配情况,并在此基础上以Win2k内存堆栈为模板,结合SEH,提出了分配大规模稀疏内存的有效方法.
当前网格是以特殊背景为主的专业化网格,用户明确知识网格中有哪些服务,怎么使用这些服务.然而,随着网格的不断发展,网格中服务的膨胀将是不可避免的趋势.如何让用户能够快速
网格服务是一种特殊的Web服务.基于网格服务,本文提出了一种基于服务的网络计算模型.利用这种模型,我们能够容易地,方便地建立自己的网络计算环境.本文也详细地描述了计算客
基于RGB彩色图象信息特点,本文提出多通道模糊检测加权均值(M_FDWM)算法.首先在RGB三个通道上分别构造模糊隶属函数,再进行模糊加权均值滤波.实验证明,该方法适用于各种噪声
编辑点评随着中国经济的快速发展、人口流动的日益频繁、医疗保险全覆盖的初步实现,异地安置和异地工作人员也会随之增加,异地就医将成为越来越多的参保人员的需求,并成为一
本文提出了一种基于肤色与神经网络的人脸探测算法.该算法首先根据肤色在颜色空间中的分布判别肤色像素,然后将像素点进行滤波,排除孤立点,接着遍历含有肤色点的子窗口,利用