论文部分内容阅读
网络多媒体技术已经在我们的生活中占据着主导地位,人们可以从网上获得很多文本和试听信息,它的高速发展,正在逐步改变人们的生产和工作方式。但随之而来的,寻求媒体内容的多样性的需求就显得愈加困难。目前基于文本内容的搜索引擎虽然众多,但这并不满足我们对多媒体信息内容搜索的广泛性、兴趣性和有效性的要求。MPEG-7是对多媒体信息内容描述的重要标准,所以对其的深入发掘研究就具有极大的应用价值。本文主要研究和使用MPEG-7标准构建相关的人脸结构模型,利用多媒体描述技术研究人脸面部区域的结构和相关内容。在组合人脸图像处理算法的基础上提取五官轮廓和坐标,统一描述人脸图像内容的特征关系,编写相应的索引应用程序,完成图像查询的信息索引。本论文从人脸结构区域的特征关系和图像的标准描述机制入手进行了相关的研究。主要的研究内容可以分为三步:一是大量查阅国内外的相关文献资料,研究MPEG-7的原理和图像处理算法,并利用标准描述方案对图像内容建立完善的描述模型,以实现快速有效的信息检索与定位。二是对人脸数字图像处理的算法进行重组,完成五官分割定位和特征提取,借助图像的颜色直方图分别在频域和空域上对图进行处理,形成丰富的信息互补和信息关联(例如红色的嘴唇、大眼睛)特性,用以满足用户的多条件特征索引需求。三是以人脸结构(主要包括五官和颜色)的整体性为主,结合图像特征与描述定义语言进行全面的MPEG-7人脸描述,通过MPEG-7标准生成多个时间与空间相互关联的文本描述文件,用以提高对图像感兴趣区域内容的快速索引定位。