实用化汉语语音识别理论及关键技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：tmsyh

【摘要】

：

语音识别技术已经取得令人鼓舞的成就。但是，大多数语音识别系统仍局限于实验室中应用，远没有达到实用化要求。制约实用化的根本原因可以归为两类，识别精度和系统复杂度。本文就

【作者】

：

田斌

【出处】

：

西安电子科技大学

【发表日期】

：

1999年期

【关键词】

：

语音识别矢量量化 Lombard效应语言模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别技术已经取得令人鼓舞的成就。但是，大多数语音识别系统仍局限于实验室中应用，远没有达到实用化要求。制约实用化的根本原因可以归为两类，识别精度和系统复杂度。本文就是从这两方面深入研究汉语语音识别实用化面临的理论和技术问题，并用大量的实验进行证明。 1.从通信理论的观点分析了汉语语言系统的信源特性，首次从信息论的角度提出了汉语的根本特点：它拥有非常庞大的基本符号集，每个信源符号所携带的主观信息量可以非常大，而由于上下文相关性其信源熵却并不高。 2.提出一种矢量压缩编码新方法—矢量线上投影法，它将输入矢量用它在某条空间直线上的投影近似表示。理论分析和实验结果表明：码书大小为N的线上投影法的编码精度与码书大小为N~2的矢量量化法相当，并且明显优于用两个大小为N的码书构成的两级矢量量化法，而其码书生成和编码的计算复杂度远低于后者。 3.提出了基于训练数据的加性噪声和Lombard及Loud效应的联合补偿法。对于加性噪声是从谱减法的逆向角度对训练数据在频谱域进行谱加；对于Lombard和Loud语音，则采用基于隐马尔可夫模型（HMM）状态标注的训练数据补偿。这种联合补偿使识别系统在强噪声环境下具有很高的鲁棒性，并且不影响识别系统在正常环境或正常发音时的识别性能，不增加识别时的运算复杂度。 4.提出了基于隐马尔可夫模型的语音识别系统中状态和状态驻留相关的声学置信量度准则。这些拒识准则不仅能很好地拒识词表外语音（OOV或非关键词），而且能在较低拒识率的情况下有效地提高系统的识别率。另外，并根据汉语语音的特殊结构提出了一种基于部分拒识原则的快速搜索算法，既保持了N—Best算法的高识别率，又大大地减小了搜索空间，提高了识别系统的实时性能。 5.提出一种利用同一个句子内最有效预测词对信息的扩展二元文法模型，有效地描述了汉语词语组合中的长距离位移现象。并且提出了最小复杂度准则的有效词对发现算法，克服了互信息准则忽略了各种语言预测单元信息覆盖的缺点。另外，提出一种利用声学匹配提供的汉语分词信息来改进汉语统计语言模型的新方法。

其他文献

伊犁职业技术学院“三合一”体育课程模式的初步探索

新疆地区的高校为了弘扬民族传统体育文化,继承民族传统体育项目,结合本院的区域性、民族性等特点,将一些体育项目和运动融入了本校的体育课程教学之中,使得学生的体育锻炼兴

期刊

三合一教学意义体育课程模式身体素质Three in oneTeaching significancePhysical education curricu

镶黄旗乌兰牧骑不断发展壮大

期刊

镶黄旗乌兰牧骑不断发展

基于AHP的高校创业教育质量360度评价

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

期刊

AHP创业教育360度评价