非特定人孤立词语音识别系统若干关键技术研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:bear139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学和技术的发展,语音识别技术在人机交互中的地位越来越重要。目前非特定人孤立词语音识别系统被广泛应用于手机、PDA等各种智能终端产品中。同时随着嵌入式技术的不断发展,各种终端产品功能越来越强大,人们对语音识别系统的实用性也提出了更高的要求,因此为了提高语音识别系统的实用性,针对非特定人孤立词语音识别系统关键技术的研究已经成为很多科研人员关注的热点。   本文在非特定人孤立词语音识别原理研究的基础上,主要对语音识别系统中的端点检测算法和隐马尔科夫模型算法进行了深入研究。首先在研究语音端点检测算法的基础上,针对传统端点检测算法对噪音自适应性差的问题,提出了一种能够根据环境噪音实时调整门限值的自适应端点检测算法,并对算法实现过程中的各种具体问题给出了详细地解决方案;其次深入研究了隐马尔科夫模型的原理,对传统隐马尔科夫模型中存在一些问题进行了改进,实现了基于状态持续时间分布的隐马尔科夫模型;最后采用最大交互信息模型训练算法和传统的Baum-Welch算法相结合的策略提高了系统的鉴别能力。   针对非特定人语音识别系统的研究,本文提出了一套完整的PC平台的模型训练方案和基于FPGA嵌入式平台识别系统的设计方案。通过分析识别系统中每个模块的算法复杂度,对系统资源进行了合理的软硬件划分。在系统移植时,对识别算法中遇到的浮点运算、指数运算和对数运算等操作设计了相应了移植方案。最后对移植后的语音识别系统,设计了数字测试方案和音频测试方案,用于对基于FPGA的语音识别系统的正确性验证和性能测试。   本文对非特定人孤立词的嵌入式语音识别系统中若干关键技术问题提出了相应的解决方案,通过试验证明了系统的正确性和可用性,对嵌入式语音识别的研究具有一定的理论价值和应用价值。
其他文献
近年来,网络信息安全与防护已经成为一个不容忽视的问题,保护网络信息安全也是国家信息化所要面临的主要问题。在某些特别的环境下,通过各种手段使用非常规的专用未知协议进
学位
随着YouTube、优酷、土豆等互联网视频网站的迅猛发展,互联网视频数量呈爆炸式增长。面对海量的互联网视频,如何从这些海量视频中准确、便捷地找到所需视频,如何高效使用这些
学位
随着嵌入式技术的飞速发展,应用成本的大幅降低,嵌入式技术已广泛应用于航空航天、智能交通、工业自动化控制等领域。随着应用范围的不断扩张,特别是随着嵌入式系统应用在一
网络编码打破了通信网络中传统的信息处理方式,目前已经取得了巨大的进展。作为网络编码思想在无线网络中的扩展,针对无线单播传输的网络编码机制已经成为当前的一个研究热点。
互联网技术的不断进步,各种新颖的互联网应用服务如雨后春笋般出现在人们面前。以网络视频、网络电视等为代表的流媒体技术的诞生和发展,为互联网注入了新的活力和发展契机。
液滴图像处理和体积控制系统是空间液滴蒸发实验的重要实验设备。由于液滴具有蒸发特性,在实验所要求的时间内(十小时左右)必须连续地补充液体才能保持液滴存在。由于液滴的
人脸视频跟踪是视频交互的重要技术之一,可靠的人脸跟踪也是人脸识别和人脸表情分析的重要前提。然而在复杂环境下进行有效、准确得人脸跟踪至今仍是一个难题。本文简要阐述
在线社会媒体的流行性预测旨在利用在线系统中商品和用户的交互数据预测在线商品在未来一段时间的流行度。在线社会媒体的流行性预测研究在理论层面和现实社会中都有巨大的意
随着Internet技术的不断发展和人们对空间信息系统的需求,为用户提供网络空间数据浏览、查询和分析的功能,已经成为空间信息系统发展的必然趋势。由此,网络地理信息系统(WebGIS)应