论文部分内容阅读
图像内容的识别和理解是机器视觉领域的重要研究方向。自动识别用户的操作行为和操作内容具有重要的学术价值和广阔的应用领域。本文面向网吧计费系统自动识别用户操作行为和内容的需要开展对图像截图中要素的分割和其中信息的自动识别研究与初步应用。首先,通过对网吧计费系统图像截图的深入研究和分析,基于截图相邻两行或列的颜色直方图相似度度量定义了截图图像稳定区块(稳定行或列区块)的概念,提出了基于截图稳定行或列区块对截图图像进行三大功能区域(即截图图像表格栏区域、截图图像菜单栏区域和截图图像对话框区域)自动分割的模型,设计了自动分割的算法。其次,进一步结合每一个功能区域的特点开展对三大区域内各要素的自动分割,以及对分割的最小子图进行自动文本信息识别的研究,提出对话框区域中人头像的自动分割方法,提出对菜单栏区域和不带人头像对话框区域自动进行文本行分割和每一个文本行再分割成最小子图的算法。第三,通过采用OCR识别软件对分割后的最小子图进行文本信息的识别,并按照规定格式对这些子图和识别结果进行保存。第四,研究并利用模式匹配方法对截图中鼠标和文字输入法区域进行分割和文本信息的识别。最后,本文利用Visual Stdio 2013开发环境采用MFC技术开发一个面向网吧计费系统截图图像的分割与识别演示软件。所开发的演示系统按照软件工程方法进行设计与实现。演示系统主要功能包括截图图像的预处理、截图图像的三大功能区域的分割、每一个功能区域内的分割和文本行的识别、截图图像鼠标区域的分割、截图图像文字输入法区域的分割和文本信息识别等。通过所设计的演示系统进一步验证所提出的截图图像分割模型和相关算法的有效性。论文最后对所做的研究和应用工作进行了总结,给出了存在的问题和不足之处,展望下一步需要进行的研究和改进方向。