基于多距离学习的图像语义自动标注研究

被引量 : 0次 | 上传用户:ym_l
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码摄像设备的普及和社交网络的流行,每天有数以万计的数字图像被上传到互联网上并分享。正所谓一图胜千言,海量图像数据中蕴藏着丰富的信息资源有待我们去发掘,而对这些图像进行有效的管理和利用的前提是要对图像进行语义标注。但互联网上大部分图片本身不具有语义标签,有语义标签的图片又存在着标签错误或者标签不完整等问题,加之人工图像标注代价较高、难以大规模使用,图像语义自动标注(Automatic Image Annotation, AIA)—直是近十年来的热门研究课题,引起了学术界、工业界的广泛关注。图像标注面临的最大挑战来自于高层语义和底层图像视觉特征之间的不匹配,即所谓的“语义鸿沟”。近年来研究者们提出了很多方法尝试跨越语义鸿沟,这些方法大致可以分为两类:其中一类为视觉特征学习技术,主要关注多种图像特征如何综合使用;另一类方法是语义上下文建模技术,主要利用了高层语义概念之间的相关信息。相比之前的标注模型,这两类方法都在标注效果上取得了较显著的提高。如果能进一步将两者结合起来,图像标注准确性应该能得到进一步的提升,然而据我们所知,目前几乎没有工作尝试整合这两种方法。本文提出了一个基于条件随机场(Conditional Random Fields,CRF)的统一模型——“核条件随机场(Kernelized Conditional Random Fields, KCRF)”模型,将稀疏多距离学习和语义上下文建模融合到一个框架中,在底层图像特征学习和语义上下文建模之间建立了紧密的相互作用。具体来讲,CRF负责建模图像语义上下文关系,在CRF的大框架下我们通过引入核Logistic回归(Kernelized Logistic Regression, KLR)[17]实现了多视觉距离学习。我们分别为语义上下文参数和多距离学习参数使用L2正则化项和L1正则化项。语义上下文参数和多距离学习参数在统一的框架下同时学习得到。我们在两个公用数据集——Corel5k和TRECVID2005——上进行了系统的实验,验证KCRF模型的标注性能。从实验结果可以看出,KCRF模型比目前较先进的多特征学习、语义上下文建模等图像标注模型在标注准确度上有比较明显的提高。实验同时证明了KCRF的性能提升来自于上下文建模和多距离学习的结合,而非来自于单独一种方法。另外,当图像特征的数量较多时,KCRF模型也表现得更加稳定。本文还基于较成熟、有效的上下文建模方法实现了一个具有交互功能的图像语义自动标注系统。该系统操作简单,能够对用户上传的图像实现批量式的有效的语义标注,也允许用户使用自己的训练图像集,系统能针对用户提供的图像集进行模型参数训练。通过用户友好的系统界面,可以直观地展示图像的标注效果。该系统还通过人机交互,引导用户对标注结果进行评判,标出正确的标注结果。
其他文献
目的:探讨尿液分析的标准化应用,对尿液分析仪器的干扰因素造成的假阳性结果进行分析.方法:采用UF-100全自动尿液分析仪和尿干化学仪联机后结果与显微镜结果进行分析比较.结
关于《荒原》的宗教思想主线 ,目前主要有两种观点 ,但各有其不足。本文从论证艾略特创作《荒原》时作为一个非基督徒的基督教视角入手 ,找出《荒原》各部分的基督教思想内涵
对女性歇斯底里的描写是《呼啸山庄》等19世纪英语文学中的常见现象。著名女性主义学者伊利格瑞认为,"女性歇斯底里"是完善女性形态、获得独立女性主体的女性话语方式之一。
美国黑人女作家艾丽丝·沃克的长篇小说《紫色》自1982年发表以来,便轰动美国文坛,接连获得了美国普利策文学奖、全国图书奖、全国书评家协会奖。小说通过黑人女子茜莉给上帝,给妹妹
某轻烃回收单元装置采用膨胀制冷工艺,随着气质气量的变化,装置出现产品质量不合格、收率与产量明显下降及能耗增加等问题。本文针对装置存在的问题提出了参数优化、DHX塔+顺
<正>古笛,1932年生,著名壮族文学艺术家,著名诗人、词作家,国家一级编剧,歌舞剧《刘三姐》执笔之一,被评为“当代中华诗神”、“中华先锋诗人”、“当代诗坛楷模”。已出版《
林芙美子的成名作《放浪记》和晚年的巅峰之作《浮云》,描写的都是年轻女性的流浪生活,然而两个女主人公的结局却大相径庭:一个走向成功,而另一个埋骨异乡。其原因和经过,揭
<正>城中村的概念"城中村"是指在城市总体规划城市建设用地范围内仍然保留和实行农村集体所有制、农村经营体制的农村社区。城中村是城市化过程的产物,是一定发展阶段的特殊
突发公共事件是对政府执行力的严峻考验,也是政府形象塑造的重要契机。面对突发公共事件,政府的作为不同,在公众心中的形象也就会有天壤之别。因此,在突发公共事件中,政府形
文学局是殖民宗主国对殖民地进行文化传输、实施文化霸权的主要途径之一,具有灵活性、响应性和创造性等特点,但同时兼具矛盾性。北尼日利亚殖民地文学局的流变由翻译局、文学