语音编码对说话人识别系统的影响

来源 :第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议 | 被引量 : 0次 | 上传用户:caimingminggood
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了语音编码对文本无关说话人识别性能的影响.在说话人识别系统中,采用的是高斯混合模型(GMM).采用的数据库是TIMIT语料库。研究了五种语音编码对说话人识别的影响,包括:GSM FR(13kbps)、G.729(8kbps)、G.723.1 MP-MLQ(6.3kbps)、G.723.1 ACELP(5.3kbps)和MELP(2.4kbps).首先分析了上述五种语音编码对语音特征参数的影响。这些参数包括:线性预测倒谱参数(LPCC),美尔频率倒谱系数(MFCC),语音信号的频谱以及基音周期.实验结果表明语音编码对语音特征参数的影响具有一定的规律性,可以这些利用这些规律去修改模型来降低语音编码对说话人识别的影响.然后说话人辨认实验结果表明语音编码降低了说话人辨认系统的识别率,尤其是在训练语音和测试语音不匹配的情况下,系统性能下降得更为严重。并且从实验结果还可以看出,说话人辨认系统的性能随着编码速率的降低而降低。最后,针对语音编码的影响,给出了一种修改GMM模型的方法来提高说话人识别系统的性能,结果表明,这种方法是有效的.
其他文献
枇杷为蔷薇科枇杷属植物,性喜温暖湿润,是亚热带常绿小乔木,高可达10米,在年平均温度12℃以上即能生长,树体耐寒性较强,秋冬开花。枇杷果实是由花托和子房共同发育而成,构造
近年来广为关注的媒体内容管理领域内的一个关键问题是对内容对象的特征描述及其智能化的提取识别.本文在大量基础研究工作的基础上,提出了一种基于Gaussian模糊隶属的可配置
本文分析了手工绘制工艺图纸的缺点,并指出了传统CAPP设计系统的不足,论述了草图交互的优越性。给出了基于草图交互的图纸设计系统的框架结构和工作流程,讨论了其中的关键技
设计了一种基于神经网络与专家系统的综合信息作战自学习智能决策支持系统,使得智能决策支持系统能够对过去的经验进行学习,增强了现代模拟战争的真实性.在对舰空对抗作战系
可用性是众多交互产品普遍存在的问题。为提高讲故事软件的可用性,本文提出了基于界面场景的评估方法,设计了基于界面场景的儿童讲故事系统的可用性评估方案,并组织实施了评
为提高网站可用性,许多网站可用性分析人员使用传统的可用性方法。但是传统的这些方法存在许多缺陷,如因为测试使用小样本的用户代表,造成测试得出的信息量的有限性;实验室环
会议
随着计算机应用的普及和信息重要性的不断提高,数据恢复已经成为应急响应中的重要一环,是数据安全的最后保障,数据修复技术也已逐渐成为计算机技术中的一个独立分支。无论在
实现异地服务器上不同数据库之间数据的同步更新,可使用数据库复制等方式,但在使用不同的数据库管理系统,并且数据库表结构、代码不完全一致的情况下,简单使用数据库复制等数
为了贯彻落实毛主席的《六·二六指示》,敬爱的周总理亲自派医疗队到云南西双版纳傣族自治州,我们光荣地参加了第六批医疗队。 为了进一步巩固农村合作医疗,解决边疆各族人
数据总体规划的初步研究探讨"数字城市"数据的总体框架、体系和标准,市民基础信息数据库和单位基础信息数据库等公共基础数据库设计,分布式数据库体系等。