论文部分内容阅读
视频数据中的文本是视频语义理解和检索的重要信息来源。文中对视频中文本的检测、定位、提取、增强和识别进行了研究。提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化。实验表明文中方法取得了良好的效果。