分布式说话人识别系统的研究与实现

来源 :广东工业大学 | 被引量 : 5次 | 上传用户:luchsky123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一种最为理想的人机通信方式,随着计算机技术的进步,语音识别技术已经逐渐应用于控制、通信、消费等行业。语音识别既是理论问题,也是一个工程化问题。它综合多学科的理论成果,如声学、语音学、语言学、生理学、数字信号处理、信息工程、计算机科学、模式识别、人工智能等。怎样让语音识别推向更广泛的实用领域是目前语音识别技术研究的热点。本文主要研究的是说话人识别,它是语音识别的一个分支,可分为说话人确认和说话人辨认;同时还对语音特征分组在Internet上的传输进行了研究。文中首先就说话人识别的基本原理进行了阐述,然后详尽地分析了语音信号特征提取的全过程以及应用于语音识别的各种训练模型,包括本文采用的矢量量化模型、隐马尔可夫模型、高斯混合模型、人工神经网络、支持向量机等。在说话人识别系统中,系统识别率的高低直接决定了系统能否走向实际应用;为了提高系统的识别率,本文在最后专门研究了系统中距离测度的问题,对欧氏距离测度进行改进,提出了对各维特征分量进行加权以及考虑类内聚合程度和类间离散程度来对权值进行优化的方法;此外,针对特征分组传输丢失会对说话人识别系统产生较大影响这一事实,提出了在前端分组打包时进行分组交叉以及在服务端对丢失分组进行替代的方法;同时实现了一个分布式说话人识别系统,实践证明了文中所提出的方法是有效的。实验表明,通过对测度方法的改进以及在网络环境不好的情况下对特征分组的处理提高了系统的识别率,使系统具有良好的识别效果。
其他文献
近年来无线传感器网络(Wireless Sensor Network,WSN)技术不断发展,其应用范围也不断扩大,作为WSN的承载体的无线传感器网络节点的能量消耗问题是影响节点寿命和网络性能的关
随着信息时代的来临,作为重要基础设施的Internet上的信息量呈爆炸式增长,而Internet的尽力而为服务模式已经不能适应分布式多媒体等应用对网络的性能和服务质量提出的更高要
Internet已经成为人们获取资源和信息交流的主要场所。然而,在信息量浩如烟海的Internet上寻找所需的信息,仍然是一项极富挑战性的工作。随着传统搜索引擎的发展,一方面其实用性
随着信息技术在各个领域的普及,各种应用每天产生的数据量呈指数级增长。如何有效处理这些数据,从中提取有用的知识,是迫切需要解决的问题。数据挖掘是为了满足人们对数据中所蕴
Web搜索引擎是Intemet信息检索的主要工具,用户通过输入查询词来获取Web搜索结果,在Internet资源中检索得到自己所需的信息。然而,Internet上与用户查询词相关的信息十分丰富
目前,中间件已成为许多企业应用信息系统实施中通用且广泛的解决方案,特别是在Internet成为主流软件运行环境和面向服务架构(SOA)浪潮的推动下,网络的开放性和动态性使得客户
近年来,在嵌入式和网络通信等技术飞速发展的推动下,无线传感器网络不再满足于简单的标量数据采集,开始逐步转向复杂的多媒体数据的获取。视频传感器网络作为无线传感器网络的最
随着通讯技术、互联网的发展,人们对网络应用程序的开发提出了更高的要求。随着用户数目的大量增加,传统的由单个服务器来提供服务的应用模式已经越来越无法满足快速增长的并
针对目前碰撞检测算法普遍存在的准确性和实时性的矛盾,本文提出一种基于特征点的碰撞检测算法,以三维实体的特征点作为碰撞检测的计算依据,应用轴向包围盒AABB作为碰撞检测
选播是一种新型的网络服务模型,它能够使用户通过一个选播地址访问到该地址所标示的一组服务器中对用户来说“最近的”一个。选播服务的应用能够增强网络服务的可用性、提高