论文部分内容阅读
随着图像应用需求以指数级的增长以及图像、视频设备的普及,在互联网中存在着越来越多的图像资源。如何有效的组织、管理、索引这些海量的图像数据以方便用户的检索是一个巨大的挑战。基于检索的图像标注技术的应运而生,在一定程度上解决了这个问题。目前图像标注技术在整理、分类、组织和检索互联网图像中扮演着重要的角色。本论文将提出一种基于用户交互的web图像标注框架,该框架充分将web 2.0背景下的用户交互性和多用户反馈考虑到标注系统中来,并融合“人”计算的概念,尝试提出一些常规标注系统中诸如人工标注的主观性、语义鸿沟等问题的解决方案。本论文主要有四个方面的工作:首先,提出一种在web 2.0下社区网站中的图像多模式融合的标注设计方案,其用来在人机交互过程中的收集各种文本形式的标注信息。其次,提出了一种面向目标检测的自动标注框架,该模块将会向用户提供自动标注的结果,以供用户修改和提出反馈。之后,用户的反馈结果将被数据库记录并纳入到新的训练样本中,以提高标注系统性能。第三,提出了一种简单而有效的候选关键词过滤算法,能够有效的减少标注噪声,从而得到较好的标注结果。第四,作为补充,提出了一种利用爬虫技术爬取指定目标网站的图像以及相关文本的方法,以此为本论文的完整性和未来的工作做出准备。