论文部分内容阅读
由于连续语音在发音时存在协同发音现象,字与字之间的边界并不明显,因而连续语音的端点检测很难达到100%的正确率。而错误的端点必定会导致错误的识别,针对这一问题,本文提出了一种不用经过端点检测和分割的新的语音识别方法——基于高维空间点覆盖动态搜索理论的非特定人连续数字语音识别的新算法。 本文从画法几何的角度,按照集合论的概念对空间中的曲线、曲面等基本元素作了重新定义,在高维空间点覆盖理论的基础上给出了点覆盖的一些基本概念,然后以部分语音信号映射在高维空间中的点为例,分析了这些语音点在高维空间中的分布情况,语音点的各种几何覆盖形体以及这些几何覆盖形体间的相互关系。最后将高维空间点覆盖理论应用于语音识别,提出了一种基于高维空间覆盖动态搜索理论的非特定人连续数字语音识别算法:首先根据实际连续数字语音的各不同数字音节,构建连续语音中各不同数字音节的特征空间覆盖区;然后直接利用高维空间点覆盖动态搜索理论进行识别,最后得到了较为满意的识别结果。 与HMM方法相比较的实验结果表明,在对少量样本进行训练的情况下,本文所用方法的识别结果明显优于传统的HMM方法。随着样本数量的增多,两种方法的识别率之间的差距在慢慢减小,当样本数量趋近很大时,它们的识别率都会渐渐逼近100%,而基于高维空间点覆盖的语音识别方法的识别率一直高于HMM模型方法的识别