论文部分内容阅读
计算机技术与人工智能的迅速发展,激发着人们为计算机构造一套像人类一样精密而复杂,同时又具有认知能力的视觉系统。上述工作便是计算机视觉学科的研究目标。国际上学术界和工业界对这个领域做出了广泛而深入的研究,并取得了长足的进步与发展。本文的研究不仅涉及到机器视觉的底层问题,又面向高层的图像理解。从底层讲,包括数据的采集与储存、图像与视频显著区域的提取;从高层讲则希望能进一步对目标的特点、运动轨迹以及背后的行为进行认知。这项技术在智能监控、运动分析、视频编解码等领域有广泛而潜在的应用价值。本文从机器视觉的纵向角度出发,在大量阅读国内外期刊文献的基础上,研究了数据的获取、存储方法以及进一步的特征分析,特征描述,目标识别,多目标跟踪,人体运动分析等。针对现有研究的不足,改进并提出了一些新的理论和方法,具体主要的研究内容和创新点如下:(1)大数据量的实时存储。本文针对如今无标记运动捕捉仪中群摄像机的同步采集与存储任务,在非高端计算机中给出了服务于捕捉仪的物理层(硬件架构)与数据获取存储层的解决方案。每秒可处理300M数据采集与存储。(2)自然彩色图像显著性区域识别。本文从人眼视觉系统的显著性机制出发,设计了一种基于计算模型的显著性检测方法,用于图像中目标区域(又称语义区域)的提取,通过在公开数据集上的实验证明了算法的有效性,与当前的领先算法相比具有一定的竞争力。解决了其他研究工作中没有解决的具有复杂纹理背景图像的显著性区域识别问题。为进一步的应用,比如智能视频处理和目标检测提供了一个思路。(3)工业玻璃生产中缺陷类型的可靠性分类。针对研究对象的本质问题,提出了有效的特征描述方法BSP,并将其与常见特征融合并纳入一个统一的分类器,给出了玻璃生产中由于受现有工艺流程所限的不可避免的缺陷的实时可靠分类的方法。实验结果表明其准确率为95%,单缺陷的处理时间为0.05ms。(4)基于前景提取的群目标跟踪方法。在大规模运动群体中,每个个体的形状、纹理都很相似。本文基于鲁棒的前景提取,采用区域与轮廓信息,给出了群目标的跟踪方法。同时提出了外形相似性描述方法,并采用高效的算法,进一步提高了跟踪的实时性等级。