论文部分内容阅读
唇读是通过观察说话者口型的变化,“读出”所说的内容。语音识别技术发展日趋成熟,但在噪声环境下识别率大大降低,近年来,计算机唇读技术作为语音识别的辅助手段,受到越来越多的研究者关注。此外,唇部系统在辅助手语识别、在线教学系统、辅助聋哑人交流、生物识别等领域也有广阔的应用前景。
唇部检测作为唇读系统的首要环节,其检测的效果将直接影响整个唇读系统的工作。色度作为区分唇部和皮肤的一个重要特征,并且基于颜色的检测方法具有简单、快速、不受物体形状和视点位置变化影响的优点,因此利用颜色进行唇部检测和定位越来越受到研究者的关注。
本文重点研究彩色图像的唇部检测问题。为了更加精准的定位唇部,本文首先定量分析了8种颜色空间区分唇色和肤色的表现情况,以寻找唇色检测的最优空间。在最优空间的基础上,采用一种Fisher变换得到分类阈值的唇部分割方法。并选取了4种唇部检测算法与本文新算法进行比较,实验表明,本文提出的唇部检测算法更加有效,不易受到外界因素的干扰,更具有鲁棒性。
最后本文将所提出的唇部检测算法用于检测视频图像序列中的唇部,并对检测得到的嘴唇进行归一化处理,得到大小一致,方向保持水平的嘴唇图像,更好地用于唇读系统后续的特征提取和识别工作。