基于上下文相关模型的图像语义标注

来源 :科学与财富 | 被引量 : 0次 | 上传用户:tsl9906202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:图像语义标注技术对于多媒体数据管理来说有着重要的意义,主要可以减少管理的混乱性,提升管理效率。本文将主要演示的是一个在多马尔科夫随机场的基础上一个图像语义自动标注方法(multiple Markov random field,MMRF)的图像予以标注系统,利用交互式标注模型的训练和演示,展示MMRF技术最主要的标注功能,使得观众能够简明了解到图像语义自动标注的系统实现。
  关键词:图像语义标注;马尔科夫随机场;系统实现;语义上下文
  引言
  目前,互联网上数字图像的数量呈现出直线式上升的状态,比如目前十分流行Instagram照片分享网站每分钟上传的照片高达5000张左右,虽然某些社交网站的图像会附带有用户标签,但就实际情况而言垃圾标签的现象十分普遍,或者标签语义过于模糊等等[1]。因此行业内掀起了一阵对图像语义自动标注(automatic image annotation,AIA)的研究热潮。现阶段AIA研究面临的瓶颈就是“语义鸿沟”(semantic gap),也就是高层次抽象语义概念表达出的含义与低层次数字图像内容之间的冲突。现将对本文研究结果进行讨论:
  一、系统框架设计
  本系统的主要流程框架见下图所示:
  1.系统主流程
  该系统的主要流程主要由两个部分组成,分别是离线预处理和在线图像标注,其中离线预处理有三个步骤:
  (1)训练图像库构建
  系统主要提供了2个图像库,其一是图像标注研究领域中经常使用到的Corel数据集,其中包括了5000幅图像,4500张会直接成为训练图像,剩下500幅是测试图像。在每幅图像上标注至少1个至多5个语义标签,将这4500幅图像作为训练图像集,再通过网络下载得到另一个图像库,主要从各大图像分享网站或者google等搜索引擎等收集,对这些图像中的错误标签全部去除[2]。
  (2)图像特征提取
  提取每幅图像中的15个特征,然后利用Tagprop的方法对每个训练库学习权重向量w。
  (3)模型参数学习
  本系统主要通过图像标注算法得出第i个语义标签,并且观察出图像的特征d,将二者结合之后得出联合概率P(d,w),再将MMRF中的学习模型参数代入其中,如下文算法1所示。在对模型进行训练的时候主要有三个步骤,首先对每个语义标签构建语义概念图,然后系统会筛选训练图像并且得出一个正负样例平衡的训练集,最后利用MMRF模型算出参数θ。
  算法1:MMRF模型参数学习方法
  输入:待标注的图像I,词表S和训练图集X;
  输出:MMRF模型参数θ
  ①for每个词∈S do
  ②构建语义概念关系图
  ③构建训练图像集
  ④求解MMRF模型参数θ
  ⑤end for
  标注系统在对线上图像进行标注的时候主要包含以下三个步骤:
  (1)图像上传及标注
  客户端在上传一张或者多张图像之后,系统会对图像进行分别的标注,并且得出标注结果,每一幅图像得到的标注结果都是P(f)最大化之后的标签组合,也就是f=arg maxP(f)。
  2.用户评判
  客户端的用户会对标注结果进行评判,并且标记正确的标注结果,达到交互式标注。
  3.标注结果保存
  用戶评判的结果会直接进入到数据库之中,也会进行下载下来的训练图像图,由于这些新入库的训练图像的标注准确度较高,因此系统能够对模型的参数进行有效的修正,所以能够帮助提高系统的标注能力[3]。
  4.系统图像标注效果
  Corel数据集的标注结果见下表所示,将其与传统的MBRM与Tagprop相比,该系统在Corel数据集上的precision和f1明显高于其他两种方法,recall的水平也较高。
  二、系统演示
  该系统在C++语言的基础上建立,因此在用户界面上拥有比较良好的性能,用户可以在该界面上轻松完成上传图像并标注的任务[4],并且该界面还具有一定的人机交互功能,用户在对标注结果进行判断之后,系统可以将判断的结果重新储存,并且将新的标注图像添加至训练库之中。
  1.界面介绍
  在系统界面之中,用户可以自行选择训练图像库,上传待标注的图像,完成之后在界面上显示“待标注”,点击“标注”按钮之后可以对该图像进行标注,标注之后会给出标注结果和相应标签,用户可以对标注结构进行判断,在“用户评判”一栏的正确选项上打钩,如果错误也可以选择“错误”选项,系统会将这一信息反馈给cpu,进行重新标注。确认完全正确之后点击“保存”按钮,系统会自动将标注完成的图像存储到数据库之中,并且还会随之添加到训练图像集之中。
  2.图像标注演示步骤
  该系统利用交互式图像语义标注模型的标注,使得MMRF技术的标注性能得到了有效的展示,用户能够更加充分地了解到图像语义标注的系统实现全过程。系统在演示的时候主要有以下几步:
  (1)选择训练图像库
  (2)选择需要标记的图像,将其上传到标注系统之中。
  (3)点击“标注”按钮,系统开始对图像进行标注,并且给出标注结果。
  (4)用户判断标注结果
  (5)保存标注结果
  三、结束语
  综上所述,本文在语义上下文建模的基础上演示了一个对图像进行自动语义标注的系统,利用交互式的系统演示,可以将系统中的图像标注功能充分展现出来,观众可以从中更好地了解到目前语义自动标注系统的发展现状,以及该标注系统的实际工作流程,使得该系统更具有操作性和实用性,促进各大网站能够对上传的图像进行精准的标注,帮助其他用户可以快速寻找到自想要找到的图像,达到精准分类的目的。
  参考文献:
  [1]田东平, 李乃乾. 基于上下文相关模型的图像语义标注[J]. 小型微型计算机系统, 2016, 37(4):000855-000860.
  [2]郭乔进. 基于上下文的图像区域标注关键技术研究[D]. 南京大学, 2013.
  [3]王小蕾. 基于上下文的社交图像语义信息的精化与丰富[D]. 华北电力大学(北京), 华北电力大学, 2012.
其他文献
摘 要:企业文化是一个企业建设和发展的核心,无论是对于企业本身而言还是从工作员工的角度出发,企业文化都占有非常大的比重。在竞争力日益增加社会经济背景下,企业发展更需要企业文化的支撑,建设有效的企业文化,能够充分凝聚员工力量,带动员工工作的积极性与主动力,为他们、为企业指引未来发展的方向。而企业文化的宣传工作主要依靠工会,对此,企业工会应该充分发挥自身的宣传能力,推动企业文化的有效建设,与不断完善。
杂波抑制是外辐射源雷达目标检测的一项关键技术。尤其在单频网配置下,多径杂波和地杂波相对于单发射站情况成倍增长,造成其在空域和时域均具更大扩展,使得传统杂波处理方法
摘 要:随着经济的迅速发展,国家的不断建设,国家对于人才的需求也越来越多,因此,很多高校开始大量的进行招生。随着学生的增多,高校的管理方式也越来越多样化,随之学生的学习以及生活都发生着重要的变化。对于学生的思想教育可以在学生的住的公寓内进行。本文将研究在高校的公寓内进行学生的自我管理,进而让高校的学生能够进行自我的管理,进一步提升学生的整体素质,这对于学生以后步入社会,起着重要的作用。  关键词:
摘 要:随着建设"创新型国家"战略的全面实施,普通劳动者创新素质的培养成为当今我国高校继续教育的主要任务。然而目前我国高校的继续教育在教育理念、办学形式、教学内容、考试评价、教学管理等诸多方面都面临着一些问题,所以如何改革我国高校的继续教育,使之更好地适应"创新型国家"的发展战略,便显得十分重要了。文章重点就建设"创新型国家"战略下我国高校继续教育的发展路径进行研究分析,以供参考和借鉴。  关键词
摘要利率期限结构(the Term Structure Curve of Interest Rates, 以下简称TSCIR)指一国市场均衡状态下,无风险零息票债券的到期收益率(即下文所述的即期利率)与到期期限之间的关系曲线。TSCIR是一国基准利率重要参考基础,是其它一切金融产品及其衍生品的定价基础。  关键词国债利率 期限结构 实证研究  中图分类号:F83文献标识码:A    1 TSCIR
山西省平息地震谣传事件是我国近期发生的一起典型事件。在事件中,民众因误信谣言造成恐慌,政府在应对这一突发事件时,利用了各种信息化手段进行辟谣,解除了危机。本文主要以
摘 要:无论企业还是事业单位,其发展都离不开员工的共同努力,员工的思想和工作态度直接决定了员工的工作效率和工作热情。推动企业基层党建工作开展,就是为了全面提高企业员工的思想境界和工作热情,增加企业的凝聚力,为员工发展提供一个广阔的平台,全面促进企业发展。  关键词:电力企业;基层党建;思想政治工作  一、企业基层党建思想政治工作的重要性  1.1加强基层党建思想政治工作是企业坚持正确发展方向,贯彻
摘要我国自1994年实施分税制财政体制以后,取得了巨大的成效,但我们也要看到存在的问题。本文探讨了分税制对乡镇政府的影响,并提出了相应地对策。  关键词分税制 乡镇政府 税费改革 转移支付  中图分类号:D63文献标识码:A    我国自1994年实施分税制财政体制以后,取得了巨大的成效,但在成绩的背后,我们也要看到存在的问题:1994年分税制改革的主要思路是提高中央财政的收入比重,增强中央财政的
摘要电子政务发展是世界性潮流,是当代信息化最重要的领域之一,是信息技术应用到政府管理的必然趋势。流动人口档案管理作为政府机关的一项重要工作,必须适应行政管理体制改革,积极有效地推进电子政务建设。本文从档案管理重要性出发,来探讨依托电子政务对流动人口档案进行管理的可行性措施。  关键词电子政务 流动人口档案 管理  中图分类号:G27文献标识码:A    所谓流动人口,是指离开了户籍所在地,跨越了一
摘 要:当前高校思政工作开展了多种形式的工作,但是效果不突出,效率低下,其中一个原因就是是因为高校思政工作显性思政教育与隐性思政教育结合不够。解决这个问题,对于完成《高校思想政治工作质量提升工程实施纲要》总体目标具有重要的现实意义。  关键词:隐性思想政治教育 显性思想政治教育 育人质量 合力  一、引言  目前各个高校开展了多种形式的思想政治工作,有作为主渠道的思政教学,作为辅渠道的心理健康教育