论文部分内容阅读
在公安机关部署视频监控系统的前期,虽然在一定程度上实现了警务信息化,提高了工作效率,但随着视频监控系统规模的不断扩大、公安信息化应用的持续深入和公安机关业务需求的日益增长,现有的视频监控系统已经不能满足。面对数量巨大的视频监控图像数据,如何让计算机自动“理解”视频,实现对海量视频图像资源快速而有效的管理成为公安研究领域一个亟需解决的重要问题。视频结构化描述技术是对视频的语义信息进行提取及描述,采用镜头分割、特征提取、对象识别、视频标准化描述等处理手段,通过对视频内容进行语义化分析,将视频图像信息组织成可对视频内容进行准确描述,同时便于检索和压缩的文本语义信息,并转化为公安实战所用的情报。本文针对公安部门警务工作对监控视频情报化应用的需求,提出并深入研究了面向公安业务的视频结构化描述技术,涉及图像处理和模式识别、语义提取、嵌入式等领域;最后研究了视频结构化描述技术处理设备的软硬件实现。在计算机视觉、智能视频监控领域,视频图像的背景建模技术对视频场景分类、行为理解等后续处理产生重要影响。本文对道路交通复杂场景的背景建模与运动目标提取进行了较为深入的研究,针对普通混合高斯背景模型计算量大、实时性较差等问题,提出一种快速的混合高斯背景建模算法,该算法根据各像素点颜色值出现的混乱程度不同采取不同的高斯函数参数更新机制。大量实验表明,该算法能在保证背景建模与运动目标提取效果的同时,较大提高混合高斯模型的处理速度。视频语义信息提取,是根据给定的一组特征类别对视频数据进行自动标注,能够很好地支持基于内容的视频分类与检索。本文将基于局部语义概念表示的视频图像运动目标作为主要研究对象,研究了基于语义主题(p LSA)模型的视频关键语义信息提取方法。首先对图像中的运动目标进行多尺度分解,采用SIFT局部特征提取算法和特征聚类提取图像不同粒度的视觉信息;其次利用基于密度的最优主题数选择算法确定p LSA模型的主题数;然后利用p LSA模型分析图像块之间的语义共生概率,并结合Markov随机场(Markov Random Field,MRF)共同挖掘图像块间的信息;最后加权连接不同尺度上的图像特征构建图像的多尺度直方图表示,结合SVM算法实现图像运动目标信息的提取。实验结果表明,本节算法能够有效利用图像的视频语义信息,提高图像运动目标识别率和视频关键语义信息提取的性能。根据从视频中提取的语义信息,对视频流进行结构化描述,可以增强对视频内容的访问、检索和操作功能。本文着重研究了视频语义信息的层次化描述技术,设计了一种视频语义信息的结构化描述方案,用对象层次来描述不同层次对象之间的关系,通过实体关系图来描述同一层次对象之间的关系,实现对视频语义信息的多级概括。并利用以上模型设计了一种视频数据库查询系统,用户可以根据不同的层次特征,对视频数据库进行有效地浏览和检索。最后本课题以FPGA+DSP为架构,研究了基于FPGA+DSP的视频结构化描述处理系统的软硬件实现,采用DSP作为主处理器,进行图像数据的核心算法处理,采用FPGA作为辅助处理器,负责图像采集与部分图像预处理工作,以及与DSP芯片的数据通信。利用上述研究成果,构建了嵌入式视频信息结构化描述系统,对采集的道路车辆信息实现实时分析与传送,建立了一个有关道路交通视频描述的数据库,交警部门可以根据需要对描述数据库进行查询和检索,极大地提高了道路交通视频使用的效率,该系统已经取得了初步的成果,在南昌、太仓等地的公安部门得到试用。