论文部分内容阅读
在建立视觉单通道的大词汇量唇读系统中,提出了归一化的U-LDCT-KL两级唇读特征提取方法,即针对唇区分块的DCT(Discrete Cosine Transform)系数进行二级KL(Karhunen-Loeve Transform)去局域参数的交叠。此方法一方面提取了唇读的最有效的低级语义特征,另一方面更加合理地选择利用了特征的有效可区分性,使得用42维二级视觉特征,对特定人的唇动内容识别正确率达到77.8%。实验还证明了系统中分块的唇区DCT特征对的视觉单通道唇读系统是最有效的。