【摘 要】
:
随着互联网技术的发展,各种类型的数据海量增加,如何从海量的信息中寻找出与我们所需求的音频类型逐渐成为音频辨析系统所关心的问题,于是就有了音频场景分析技术,音频场景分
论文部分内容阅读
随着互联网技术的发展,各种类型的数据海量增加,如何从海量的信息中寻找出与我们所需求的音频类型逐渐成为音频辨析系统所关心的问题,于是就有了音频场景分析技术,音频场景分析技术对机器自动感知环境特征具有重要意义。由于人类所接受的信息80%都来自于视觉和听觉,由于音频信息具有直观的特点,从音频角度解决这一问题成为最理想的途径,其中语音和非语音分类的问题属于音频场景分类研究的范畴。针对在语音控制过程中无关的非语音信号容易被误识为语音信号从而引起系统的误操作的问题。本文以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率。系统首先对采集到的音频波形序列提取美尔倒谱系数mfcc得到音频特征矢量序列,再使用矢量量化(VQ)中的lbg算法分别得到语音和非语音信号的模板,将待识别的音频特征矢量序列和每个模板之间进行失真测度,选取量化误差最小的模板类型为待识别的音频类型。从而实现了音频信号类型的辨析和确定。本文在matlab平台上对此系统进行了系统仿真,测试结果表明,本系统实现了语音与非语音辨析的功能,达到较好的工作效果,并且提出后期在DSP实验平台上实现该系统的方案,使在仿真中得到验证的方法在实际的硬件系统中得以应用。
其他文献
随着无线电设备的日益增多,频谱资源显得越来越紧张。认知无线电就是对此提出的一种解决方案。认知无线电技术改变了传统的由政府授权使用无线电频谱的方式,允许非授权用户机
移动通信正向宽带化和个人化方向发展,各种新的无线技术不断涌现,标准化进程也在不断加快。HSDPA作为WCDMA的升级,极大提高了下行链路数据传输能力,峰值速率可达10Mbps;LTE作
目前飞行员在飞行过程中主要通过航道罗盘给出的距离和方位数据来判断当前位置,对当前位置的地理环境和飞行轨迹并不清楚,在飞机出现故障或燃料不足等情况时无法正确选择安全
块截断编码方法是一种编码算法简单、快速的图像编码方法,该方法实时性很强,并且对信道误码不敏感。自从块截断编码方法被提出以来,已经广泛的应用于图像处理领域,尤其在军事
我国市场经济的发展不但给我国企业带来了发展的广阔平台,同时也给我国环境带来了很大的压力.最近几年,我国高层建筑工程企业发展速度在不断提高,对我国国民经济的推动作用也
半导电屏蔽材料是中高压电力电缆必须的配套材料,一般认为半导电屏蔽层起到均匀电场的作用。长期运行经验说明半导电屏蔽层对电缆使用寿命有较大关系。半导电层突起会引起局
对象识别是计算机视觉一个重要分支,对象识别在智能机器人、智能交通监控、和智能家居中都有着重要的应用。交通对象识别是智能交通和无人驾驶研究领域内的重点和难点,它主要通
随着电子技术的飞速发展,数字图像处理技术在航天航空、电子通信、医学影像、军事工业等领域得到了广泛的应用,并且向着实时性、高速性、高分辨率、多媒体化的方向发展。因此
煤炭产量、运量控制系统对于解决煤炭生产行业架构的特殊性造成的难以控管的局面,实现煤炭产业的现代化管理具有重要意义。本文主要研究产运煤源点(生产矿)、结算站和储煤场
下一代网络(NGN)泛指不同于目前一代的,以IP技术为核心的,可以同时支持语音、数据和多媒体等多种业务的开放、融合的网络。下一代网络具有多网融合、多域融合、多业务种类、环