多基音检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:q18198837
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号的基音频率是一个非常重要的参数,广泛应用在听觉场景分析、单声道盲源分离、音律分析等语音和音频信号处理领域。目前,对于单独语音信号的单基音检测,已经得到了许多性能较好的算法。但是对于在同一时刻有多个话音的情况,即多基音检测变得非常困难。本文首先分析和研究了现有的单基音检测算法和多基音检测算法。通过对单独语音信号和混合语音信号的特性进行详细的分析,提出了基于谐波峰值提取的多基音检测算法。该算法在频域对语音信号进行分析,通过对频谱中峰值的选择得到信号的谐波分量,然后统计分析这些谐波分量之间的倍频关系,最终得到混合前两个信号的基音频率。另外,在算法中对语音信号采用清浊音判决技术进行预处理以减少算法的计算复杂度。本文算法采用C语言实现。测试结果显示,对于单独语音信号,浊音段的检测准确率为81.8%,清音段的检测准确率为90.2%;对于混合语音信号,浊音段的检测准确率为80.7%,清音段的检测准确率为90.8%。
其他文献
作为当今最有前景的动态图像压缩编码标准,H.264以其优异的压缩性能和良好的网络亲和力,在数字电视广播、实时视频通信、网络视频流媒体传输以及多媒体短信等各方面发挥着重要
多入多出(MIMO)技术自产生以来凭借其在不增加带宽的情况下能成倍地提高通信系统的容量和频谱利用率的优良性能,成为了下一代无线移动通信的关键技术之一,并得到了广泛的关注
随着网络技术的发展和用户需求的变化,多播业务日益成为一种重要的业务模式。多播业务需要大量的带宽支持,WDM技术的高速传输能力可以满足多播业务的高带宽需求,在光网络中传
Web服务以其统一的数据格式和开放的标准协议,很好的满足了企业的需求。但是其高度的分散性和动态性,带来了传统模型不能解决的很多问题,有效的方法是寻找合适的访问控制模型。
无线多媒体传感器网络(WMSN)是以传统无线传感器网络(WSN)为基础发展起来的新型网络,主要用于处理多媒体信息以满足人们日益增长的需求,具有广阔的发展前景,但现阶段也面临着无
无线信道的传输环境十分复杂,为了有效地获得信道特性,通常采用信道测量的方法来提取信道参数。本文针对低信噪比环境,设计信道测量方案并研究信道参数提取算法。本文首先从理论
人脸检测与跟踪是计算机视觉方面的一个重要和前沿的研究课题。本文针对复杂背景条件下的非头肩人脸视频序列的检测和跟踪技术进行了深入的研究。根据非头肩人脸视频序列的特
网络实物棋盘是网络游戏实物平台研究课题的重要组成部分,它的设计和实现是检测技术和网络技术综合运用的结果,对游戏实物平台的发展具有重大意义。本文首先从网络游戏实物平台
自20世纪80年代以后,正交频分复用(OFDM,Orthogonal Frequency Division Multiplexing) 技术不但在数字音频和视频广播领域得到广泛的应用,而且已经成为无线局域网和无线城域网
3GPP R5 引入 HSDPA 后,下行链路的传输速率和吞吐量得到了很大提高。相比而言,上行链路速率和吞吐量偏低,不能满足更高要求的上行速率业务发展需要。因此,3GPP 从 R6 版本开始,开