语声分割机制的设计与实施

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户：jmfxuexi

【摘要】

：

语声分割机制在很多应用方面均占有重要的地位,比如多媒体音频检索、说话人聚类、说话人跟踪等。例如,当语声分割机制与说话人聚类结合,可形成完整的说话人检测与跟踪系统,有

【作者】

：

马薛涵

【出处】

：

北京邮电大学

【发表日期】

：

2016年01期

【关键词】

：

语声分割机制语音端点检测说话人切换点检测特征提取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语声分割机制在很多应用方面均占有重要的地位,比如多媒体音频检索、说话人聚类、说话人跟踪等。例如,当语声分割机制与说话人聚类结合,可形成完整的说话人检测与跟踪系统,有效提取语音文件的“富信息”。语声分割机制作为说话人检测与跟踪系统的一部分,可同时解决语音端点检测和说话人切换点检测两个问题。由于数据类型多样性、建模数据量少、缺少说话人特性和数目等先验知识,语声分割机制算法实施存在一定难度。在本文中,语音端点检测过程采用支撑向量机分离语音与非语音,并利用时频特征实现非语音分类,说话人切换点检测过程结合韵律特征和贝叶斯信息准则确认切换点,提高实验结果准确率。本文针对语声分割机制主要从以下几个方面进行了研究:特征提取、语音端点检测、说话人切换点检测。具体如下:1)实现并分析语声分割系统,研究每个实验参数的配置,发现系统中存在的问题,并提出解决方案。2)对比分析语音端点检测的语音与非语音分类中不同分类算法性能,选择分类准确率较高的分类算法;研究非语音分类中不同特征表示及分类算法,实现扩展性非语音分类。3)分析说话人切换点检测的两个基准系统,设计基于韵律特征的改进系统,提出降低虚假切换点的补偿算法,提高和改善系统的准确率和稳定性。

其他文献

吐某抢劫案研究

转化型抢劫罪不是一种独立的罪名,而是法律拟制的条款,仅为法学理论上的称谓。同抢劫罪一样,不仅侵犯了他人的财产权利和人身权利,还对社会风气产生极其不良的影响和危害。其

学位

转化型抢劫罪转化的前提条件犯罪形态

四波混频效应在全光信号处理中的若干应用

在当今的通信网络中,信号的传输主要依靠光纤完成。但是信号的处理,还是主要依靠电来完成,这样就增大了传输成本,也降低了传输效率。全光信号处理技术可以在光域直接对光信号

学位

参量过程全光采样硅基波导波长转换调制不稳定性

基于隐式可信第三方的数据持有性证明算法

随着近年来云存储的发展,越来越多的企业与个人开始认识并使用云存储。由于云存储服务提供商不完全可信,云存储的安全性一直是各界关注的焦点,也成为云存储能否大力发展的关

学位

云存储数据持有性同态认证元客户端开销可信硬件

甘肃省女子劳教所劳动教养对象实证分析

我国劳动教养制度的实施已近六十载,期间,适用劳动教养制度的收容对象数量一直趋于稳定。而今,在劳动教养制度面临废、改情势下更需要多方面的研究,尤其是实证分析。本文以甘

学位

劳动教养适用对象分类治理矫治措施

云存储服务中数据的更新和完整性验证

自从云计算平台提出以来,它的高存储性和高运算性能成功地解决了大数据时代带来的问题。然而,因为用户把数据远程的存储在云端,失去了对数据信息的控制能力,所以云端数据的完

学位

云计算完整性验证动态更新自主审计

语者识别系统快速匹配机制的设计与实施

尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。

学位

说话人识别GMM-UBM说话人模型聚类K-means算法初始聚类算法

增强自主创新能力建设高水平创新型国家

党的十九届五中全会明确提出:"坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑,面向世界科技前沿、面向经济主战场、面向国家重大需求、面

期刊

大企业集团高层次人才创新型国家原始创新共性技术科技资源配置公共技术平台综合服务体系高新技术技术创新活动产学研相结合企业为主体侵犯知识产权

全局与局部特征融合的大规模图像检索方法

大数据时代下,随着互联网中大规模图像数据库越来越多,如何使用户快速的在海量、动态的数据库中找到满足需求的图像是现今视觉领域的重要课题。其中,最主要的应用是基于内容

学位

二维倒排索引词袋模型全局特征局部特征权值估计

高速PON信道编码技术研究

无源光网络(PON)以其低成本、高带宽和性能稳定的优点成为一种主流的宽带接入技术。随着PON系统速率的提升,需要使用编码增益更高的前向纠错编码(FEC)来改善PON系统的功率预

学位

无源光网络前向纠错编码准循环低密度奇偶校验码码率自适应

EPG系统数据传输安全性的研究

伴随着我国数字电视技术的快速发展,EPG(ElectronicProgram Guide),即电子节目导航系统孕育而生,它已经衍变成数字电视一项不可或缺的基础性业务。从功能来讲,它是电视和用户

学位

电子节目导航系统文件监听SHA-1算法完整性验证

语声分割机制的设计与实施

其他学术论文