语声分割机制的设计与实施

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:jmfxuexi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语声分割机制在很多应用方面均占有重要的地位,比如多媒体音频检索、说话人聚类、说话人跟踪等。例如,当语声分割机制与说话人聚类结合,可形成完整的说话人检测与跟踪系统,有效提取语音文件的“富信息”。语声分割机制作为说话人检测与跟踪系统的一部分,可同时解决语音端点检测和说话人切换点检测两个问题。由于数据类型多样性、建模数据量少、缺少说话人特性和数目等先验知识,语声分割机制算法实施存在一定难度。在本文中,语音端点检测过程采用支撑向量机分离语音与非语音,并利用时频特征实现非语音分类,说话人切换点检测过程结合韵律特征和贝叶斯信息准则确认切换点,提高实验结果准确率。本文针对语声分割机制主要从以下几个方面进行了研究:特征提取、语音端点检测、说话人切换点检测。具体如下:1)实现并分析语声分割系统,研究每个实验参数的配置,发现系统中存在的问题,并提出解决方案。2)对比分析语音端点检测的语音与非语音分类中不同分类算法性能,选择分类准确率较高的分类算法;研究非语音分类中不同特征表示及分类算法,实现扩展性非语音分类。3)分析说话人切换点检测的两个基准系统,设计基于韵律特征的改进系统,提出降低虚假切换点的补偿算法,提高和改善系统的准确率和稳定性。
其他文献
转化型抢劫罪不是一种独立的罪名,而是法律拟制的条款,仅为法学理论上的称谓。同抢劫罪一样,不仅侵犯了他人的财产权利和人身权利,还对社会风气产生极其不良的影响和危害。其
在当今的通信网络中,信号的传输主要依靠光纤完成。但是信号的处理,还是主要依靠电来完成,这样就增大了传输成本,也降低了传输效率。全光信号处理技术可以在光域直接对光信号
随着近年来云存储的发展,越来越多的企业与个人开始认识并使用云存储。由于云存储服务提供商不完全可信,云存储的安全性一直是各界关注的焦点,也成为云存储能否大力发展的关
我国劳动教养制度的实施已近六十载,期间,适用劳动教养制度的收容对象数量一直趋于稳定。而今,在劳动教养制度面临废、改情势下更需要多方面的研究,尤其是实证分析。本文以甘
自从云计算平台提出以来,它的高存储性和高运算性能成功地解决了大数据时代带来的问题。然而,因为用户把数据远程的存储在云端,失去了对数据信息的控制能力,所以云端数据的完
尽管说话人识别系统在识别结果上已经取得了令人满意的结果,但是随着人口规模的不断增大,传统的GMM模型的识别时间也越来越长,识别速度慢将大大限制说话人识别系统的实用性。
党的十九届五中全会明确提出:"坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑,面向世界科技前沿、面向经济主战场、面向国家重大需求、面
大数据时代下,随着互联网中大规模图像数据库越来越多,如何使用户快速的在海量、动态的数据库中找到满足需求的图像是现今视觉领域的重要课题。其中,最主要的应用是基于内容
无源光网络(PON)以其低成本、高带宽和性能稳定的优点成为一种主流的宽带接入技术。随着PON系统速率的提升,需要使用编码增益更高的前向纠错编码(FEC)来改善PON系统的功率预
伴随着我国数字电视技术的快速发展,EPG(ElectronicProgram Guide),即电子节目导航系统孕育而生,它已经衍变成数字电视一项不可或缺的基础性业务。从功能来讲,它是电视和用户