基于特征选择及其融合方法的说话人识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:Zoeyha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别就是通过对话者的语音进行处理来实现对说话人的身份的判别。语音易获取,不像钥匙和卡一样需要随身携带,不会对人体舒适度产生影响,语音不会丢失,在日常生活中的使用十分方便。由此可见,相关说话人识别产品的开发必定会给人们的日常生活带来极大的便利。然而,说话人识别在经历了一段时间的快速发展之后,在比较长的一段时间里都没有跨越性的发展。但是一些学者和机构有的提出了自己的方法,有的在原有算法的基础上提出了一些改进的和融合的方法。例如一些学者在对语音学深入研究的基础上,提出了一些对说话人的个性特征具有较强表征能力的有效特征集的选择方法,并取得了比较好的实验结果。但是迄今为止,人们并没有深入到语音的本质,并没有将说话人的个性信息和语义信息提取并表征出来。因此,对语音深层次的研究有待深入。本文首先对说话人识别的基本理论和一些基本方法进行了介绍。并建立了基于高斯混合模型(GMM)的说话人识别系统,提取表征说话人身份的有效语音数据并进行建模和评估。在对说话人识别相关的理论分析和大量的针对性实验的基础上提出了一种基于有效特征集选择的说话人识别方法。对表征说话人特性的特征数据进行了个性和共性的有效划分,实验证明提出的方法是合理的、有效的。并在此基础上,结合一些好的方法,提出了基于有效融合方法的说话人识别方法,经实验验证,提出的方法有效地提高了说话人识别系统的识别性能。高斯混合模型和最大互信息的结合提高了说话人识别系统的综合性能。在此基础上,进一步融入了有效特征选择的方法,使得说话人识别系统性能得以进一步提高,使系统更加完善。另外,对基于浊音语音的说话人识别方法进行了分析,实验证明浊音语音对说话人身份的表征是比较有效的。课题研究中还建立了基于matlab的实时说话人识别系统,在普通的学生宿舍环境下进行测试,取得了比较理想的判别效果。
其他文献
随着高速客运专线时速的不断加快,现有铁路专用移动通信系统在数据传输的可靠性、实时性和带宽等方面已无法满足要求。高速条件下无线通信环境比较恶劣,存在信号衰减、多普勒
频谱感知技术是实现认知无线电技术及应用、构建认知无线电网络的核心技术,也是保护授权用户免受有害干扰、提高认知无线电网络自身频谱资源利用率的重要前提。本文从快速、
随着计算机和信息技术的发展,用户对多媒体内容的需求也日益增大。在传统的C/S模式中,随着用户规模的扩大,这种模式难以提供服务质量保证,无法满足广大用户的需求。P2P(Peer
软件无线电作为无线电发展的主要趋势,其基本思想是以一个通用、标准、模块化的硬件平台为依托,通过软件编程来实现无线电台的各种功能。在软件无线电和数字接收机系统中,对包含
宽带无线通信系统需要在无线环境下传输宽带高速业务数据,系统要求利用信号检测技术获得对接收信号的精确捕获,为后续通信信号分析与处理提供保障。宽带无线通信系统存在多径
多输入多输出(MIMO)作为B3G/LTE中的物理层核心技术之一,在点对点传输中可有效提升链路吞吐率,降低链路误码率;然而在多小区多用户无线蜂窝网络环境下,MIMO系统所固有的干扰
随着人们生活水平不断提高,食品安全问题越来越受到重视,微生物对食品的污染问题也相应地备受关注.因此,灵敏度高、简便快捷的食品安全检测技术和方法再食品检验过程中显的尤
视频跟踪是计算机视觉领域的一个基础的研究课题,也一个非常具有挑战性的研究方向。在当前的现实生活中,视频跟踪技术已经在各种领域内得到了广泛的应用,其中包括视频监控、
本课题根据系统的功能要求,采用模块化设计思想,提出了基于CPCI总线的多路数据再生系统的设计方案。将整个系统分为三个模块.分别为CPCI总线接口模块,DSP模块和32路数模转换
随着网络信息技术的发展和普及,人们对计算机网络的使用日益频繁,为提高工程项目管理的效率和有效性,建立一种基于B/S结构的有效的工程项目管理系统的设计开发模式,本文对工