短时语音说话人识别方法及应用

被引量 : 0次 | 上传用户:fukuilover123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过几十年的发展,语音处理技术取得了许多破性的进展,很多语音技术像语音识别技术、语音合成技术等已经达到了大规模应用的水平。作为一种自然的交互方式,语音技术的普及将为每个人的日常生活提供便利。说话人识别技术是语音处理技术的一个重要分枝。上世纪90年代中期,特别是高斯混合模型应用于该领域之后,说话人识别技术获得极大的发展和完善。说话人识别技术在安静理想环境中和在说话人语音充足的条件下,可以达到很高的识别率,甚至超越普通人类的识别水平,基本满足实际应用的要求。但是在现实的应用场景中,由于开放环境的特殊性和复杂性,存在着噪声、信道、训练与识别语音时长等干扰因素,系统的识别性能往往会出现大幅度的下降,无法达到在实验室环境中的识别水平,这也直接影响了说话人识别技术的大规模普及应用。短时测试语音是影响说话人识别性能的一个因素,由于实际应用场景的条件限制、复杂性或应用需求,会使原始语音信号中包含说话人个性信息的特征数量过少,因此会导致识别性能的急剧下降。针对短时语音的影响,本文提出了一种基于共性特征选择的说话人识别算法,在说话人训练和识别的过程中采用特征选择的方法,通过筛选特征,减少可能导致错误决策的特征向量,降低分险,提高识别率。本文首先详细研究了一个完整的基于高斯混合模型说话人识别系统。然后分析了短时语音的问题和短时语音说话人识别的相关算法,提出了存在的问题。通过对算法缺点的分析,作者被启发出一个更简单更有效的短语音识别算法,对当前的短语音说话人识别算法进行改进。本文将该识别算法应用于一款玩具机器人系统中,试验结果表明,系统识别性能得到了明显的提升,新算法能有效识别0.25秒左右的短时语音,比现有传统算法有明显提升,提高了玩具机器人的智能性和娱乐性。
其他文献
民族自治地方立法,是指民族自治地方的立法机关依照宪法、法律规定的权限范围制定适用于本地方的规范性法律文件的活动的总称。我国民族法制建设经过六十多年的发展取得了巨
在当今社会中,青少年犯罪和环境污染、毒品泛滥一起,成为人类面临的三大公害。城乡接合部的管理成为政府管理体系中的软肋。深入调查城乡接合部环境对青少年犯罪的影响,对于
构建企业员工薪酬增长体系模型合理规划企业员工薪酬增长体系,有助于维护更多员工的切身利益。本文构建了企业员工薪酬增长体系模型,如图所示。本模型旨在探索企业员工薪酬增
<正>"看报先看题"、"题好文一半"这两句话充分概括了新闻标题的重要性。标题,是新闻的眼睛,是新闻编辑工作的重要环节。对网络新闻,标题的作用尤甚,制作一条好的标题需要一定
磁力研磨是一种先进的研磨加工技术,具有切深小、柔性适应强等优点,但同时也有加工效率低、磨料寿命短且制造工艺复杂等缺点。电化学加工是一种基于阳极电化学溶解的加工方式
感应分流器作为一种高准确度和高稳定性的电流比例标准,能高效运用于电流互感器检定以及电流比较仪的量程扩展,特别适用于工频小电流量值溯源。在此背景下,研究感应分流器的
教育部核准并向社会发布的多所大学章程对学生学业评价的要求均是公正评价学生学业。多方面证据表明,目前我国高校行政管理人员、教师、学生主要将公正评价学生学业理解为考