融合文本和语义的Web图像检索

被引量 : 0次 | 上传用户:hnzxjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代,一图胜千言,图像在日常生活中的地位举足轻重。人们习惯于借助Internet来搜索和查询图像信息。面对浩瀚如海又纷繁复杂的网络信息,迫切需要高效精准的Web图像检索技术来满足人们日益增长的需求。目前图像检索领域主流的方法有两种:基于文本的图像检索(TBIR)、基于内容的图像检索(CBIR)。TBIR虽然简单方便,但是需要人工标注,太受限制;CBIR使用视觉特征来检索,提高了检索效率,但无法精确表达图像语义;二者各有利弊。对Web图像来说,它嵌在Web网页中,既包含图像自身信息,其所在网页也会提供大量的文本信息。如何有效地利用这两种信息,综合TBIR和CBIR的优势,实现性能较优质量较好的Web图像检索,成为研究的热点。针对上述问题,本文探索研究一种融合文本和语义的Web图像检索方法,来改善检索的性能。该方法有效利用了Web图像包含的两种信息:图像本身的语义信息和从图像所在网页中提取的反映图像内容的文本信息,并权衡考虑TBIR和CBIR的利弊,大大改善了检索效果。为了实现有效的Web图像检索,本文首先介绍自然语言处理领域中的词汇语义相似性计算技术,为文本信息的相似性度量提供基础,同时为文本特征和语义特征的融合做准备。其次利用TF/IDF技术的统计特性,分别从图像的名称、注释性标签、所在网页的主题和图像周围紧密环绕的文本,提取关键词的组合,按概率大小抽取图像的文本特征。然后重点研究一种用次梯度下降算法优化改进的基于补全标记矩阵的图像自动标注算法,用以填补语义鸿沟。该算法是以图像的SIFT视觉特征为基础,通过补全标签与图像之间的标记矩阵来建立从低层视觉到高层语义的映射模型,有效地提取图像的高层语义特征。在优化改进问题上,为标记矩阵引入一个L1范数的正则化矩阵来满足对标记矩阵的约束条件,而且同时使用L2范数和L3范数达到产生稀疏矩阵的目的,通过复合函数优化理论得到矩阵的稀疏解,使用计算速度最快的次梯度下降算法来解决最终的优化问题,大大提高了算法的收敛速度。最后把提取到的文本信息和语义信息,放入贝叶斯推理网中,使二者充分融合,最终实现有效的Web图像检索。基于上述的探索和研究,实现了融合文本和语义的Web图像检索,通过实验验证,本文的方法可靠有效。
其他文献
近年来,为了使航空运输网更加完善,国家大力开展机场的基础设施建设。在机场工程施工项目管理中迫切需要规范项目管理的方法和手段,编制适宜的施工组织设计方案。因此,一方面
随着安然、世通公司等一系列会计丑闻的爆发,2002年美国实施SOX法案。第404条款要求上市公司管理层对内部控制进行评价,可供选择的内部控制框架包括COSO内部控制框架。随后,
在二语习得过程中,学生不可避免地受母语迁移的影响。从母语迁移的角度入手,按照词汇、句法结构、文化差异等不同层面,对英语专业学生在汉英翻译中受母语正、负迁移的影响进
当代社会已进入高科技的读图时代,图形设计已与实用美术、手工业、高科技等融为一体。为了达到信息传播的目的,图形与人进行沟通交流被应用到人们生活的各个方面。随着数字化
随着高速铁路的发展,铁路线路结构已经突破了传统的轨道-道床-土路基结构形式,既有有砟轨道,又有无砟轨道。对于有砟轨道,已经抛弃了将道砟层直接铺设在土质路基上的方法,而
在30多年的改革开放发展历程中,中小企业得到了迅速的发展,已然成为我国经济的重要组成部分,但是目前我国中小企业的发展过程中也存在着许多阻碍,其中最大的阻碍就是融资难。
1 问题的提出如图1所示,质量为m,带电量为+q的粒子,以初速V_0垂直进入相互正交的匀强电场E和匀强磁场B中,从P点离开该区域,此时侧向位移为s,则A.粒子在P点所受磁场力可能比
随着互联网在技术层面的不断更新和其本身极强的渗透性,人们的生活方式、工作方式和学习方式在无形中已经发生了重大变革,与此同时国内各大高校纷纷开始加强建设高校网络平台
贾樟柯和李沧东分别是中韩两国现实主义电影导演的杰出代表,两位导演的处女作于1997年同年推出,在至今近20年的创作生涯中,他们的电影作品屡屡在国际上获得重要奖项,使他们受