条件随机域模型在中文语音识别中的应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:a747470666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别即计算机自动语音识别,简单地说,就是让计算机能听懂人说话,将人说的话转换成计算机文本的一项技术。随着Internet和电子商务的飞速发展,语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大的便利。  随着近代计算机技术的飞速发展,孤立词语音识别系统已经取得了较高的识别准确率,非特定人、大词表、连续语音识别技术成为当前的研究热点。本论文通过条件随机域的方法,对连续语音识别系统中声学模型和语言模型进行了研究。  语音识别系统的模型通常由声学模型和语言模型两部分组成,分别对应于语音到音节概率的计算和音节到字概率的计算。在传统的基于HMM模型的语音识别系统中,声学层主要通过HMM进行建模,辅助一些其他的训练优化准则,例如:最小分类误差和最大互信息准则。语言模型主要分为基于规则的语言模型和基于统计的语言模型。其中,N-gram简单有效,被广泛使用。尽管基于HMM框架的语音识别技术对现代语音识别做出了巨大的贡献,但HMM模型本身存在着一些固有的局限性:一阶假设、独立性假设、训练准则导致声学模型之间可分离度差等,这些局限性限制了经典HMM在语音识别系统中的实际应用。  条件随机域模型作为一种统计和规则相结合的模型,允许特征非独立,允许增加各种不同形式的特征,并且有效地解决了标注偏置问题,其能够很好的弥补HMM模型的缺陷,因此本文首次将条件随机域的方法用到中文语音识别当中,利用条件随机域的方法分别建立声学模型和语言模型,并对得到的实验结果进行了分析。
其他文献
SOA(Service Oriented Architecture)是由IBM, Microsoft等软件公司倡导的一种新型的企业级系统架构,2005召开了第一届SOA年度大会。SOA引起了越来越多人们的关注。SOA强调业
文本过滤是从动态的文档流中,检索出符合用户需求文本的一种技术。随着文本过滤技术在电子邮件、消息订阅、信息安全等领域的应用变得越加广泛,用户对过滤的要求也越来越高。为
图像和视频是人类可以利用的最主要的信息载体。互联网的发展和多媒体的进步使得多媒体的各种新的应用和服务成为可能,尽管互联网的带宽和设备的存储容量都有所提高,但是数字
模型检测是公认的一种比较有效的验证系统正确性和可靠性的方法。在一些安全至关重要的领域检测预知系统的响应时间、事件调度的延迟等一系列的参数尤为重要。实际上大部分的
闪存是一种新型的电可擦除可编程只读存储器,具有非易失、读写速度快、抗震性能好、低功耗、体积小等特性。随着闪存容量的不断增加和价格的逐渐下降,闪存相对于传统机械硬盘具
随着计算机技术和网络通信技术的高速发展,以并发性、分布性、实时性、异构性和互操作性等主要特征的并发分布式系统已成为计算机技术的主流方向。并发现象以其固有的复杂性,
海豚是一种高智商的水生哺乳动物,它们使用自己独特的“语言”——哨声来进行互相交流。要想理解海豚的语言,就必须要对海豚哨声进行分析研究。当前对海豚哨声的分析研究大多是
随着计算机软硬件系统规模的日益复杂化、重要化,如何保证计算机系统的正确性和可靠性,逐渐成为当前理论界和产业界共同关心的重要问题。长期以来,常用的系统设计检验方法是以经
随着Internet上信息量的迅速增长,搜索引擎已经成为人们检索网上信息的主要手段,是互联网上人们获取信息最重要的方式之一。网络爬虫作为搜索引擎中负责采集信息的模块,有重要的
目前,国内外垂直搜索引擎发展迅速,各行业各种类型的垂直搜索引擎如百花齐放。与传统搜索引擎相比,垂直搜索的一大特点就是需要对HTML页面进行信息抽取,但是实现通用自动的抽取系