基于图像与标注语义上下文的图像自动标注算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:snoopy10222001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像自动标注是图像检索的重要组成,随着对图像检索功能的需求的日益增加,如何对图像进行有效的组织和管理也成为信息检索领域的研究热点,因此对图像自动标注进行研究具有其重要的研究价值和应用价值。本文在现有基于内容的图像自动标注方法的基础上,着重研究基于图像块上下文的图像自动标注方法和基于标注词图像上下文的图像语义反馈验证方法,以最终改善图像自动标注的性能。  针对目前图像自动标注算法中图像分割的独立性假设问题和词到图像的语义反馈验证问题,开展了本文的研究工作,提出了以下主要工作和创新:  1.提出了基于图像块上下文的图像自动标注方法。针对现有图像自动标注模型对图像分块之间的独立性假设和权值分配问题,本文通过关联图像各个分块之间位置关系,在图像内容上下文关联关系的寻找上,首先对图像块进行上下文关联的序列化表示,然后利用条件随机场模型对图像块的关联关系进行建模并进行自动标注。通过构建图像分块的序列来增加对图像中上下文关系的考虑。  2.提出了基于标注词图像上下文的图像语义反馈验证方法。由于目前的图像自动标注算法中认为一幅图像中所有标注词的贡献相同,因此学习算法只能计算标注词是否与图像相关,但无法获得标注词语义与图像语义的相关程度。针对上述问题,本文利用标注模型得到的标注结果所映射的图像与测试图像建立起图像间的上下文关系,通过度量图像间的相似度距离,来对标注结果进行排序和筛选,实现对图像语义的反馈验证。  最后通过实验分别验证了本文提出的基于图像块上下文的标注方法和基于标注词图像上下文的反馈验证方法的有效性,同时在ImageNet数据集上得到准确率为0.267实验结果,同比于在该数据集上利用SVM的实验结果0.209提升了27.8%。
其他文献
共轴双旋翼飞行器因其结构紧凑、悬停效率高、操纵性好等特点,被广泛应用到军事和民用上。为了使其可以在相对狭小的空间内达到理想的飞行效果并且具有良好的机动性能,对共轴双
连铸二冷控制是钢水连铸过程中的重要环节,直接决定着坯壳的表面温度、钢液的结晶方式和铸坯的质量。连铸过程具有结构复杂、强耦合性、反应机理复杂等特点,其生产条件相对恶
视频图像序列中的运动目标跟踪一直是计算机领域中的热点问题,在动态场景中运动目标的检测和跟踪技术通常可以利用在视频监控、人机交互、汽车辅助驾驶、运动行为分析等方面
学位
学位
随着信息技术的发展,图像配准技术已成为非常热门的研究课题,在许多领域有着广泛的应用。图像配准研究的主要目标是改善图像之间匹配的精度和速度,尤其是配准精度。图像的精确配
近年来,半导体晶体直径朝着大型化的方向发展,晶体的直径逐渐从6英寸发展到12英寸。晶体直径的大型化发展成为当前的主流趋势。生长出质量好、尺寸大的单晶硅需要非常稳定的
随着语义Web上发布的RDF数据量爆炸式的增长,具有海量规模和无标度特性的RDF图数据的划分,成为分布式RDF数据管理的重要问题。根据术语集和断言集结构对RDF数据整体特性的影
社会的迅速发展带来大量的数据信息,而如何找出有用的信息就显得尤为重要,而且对于声音数据来说,若是可以有效地采集、处理、识别这些数据,就会变得更有价值。本文所研究的是
工业领域是无线传感器网络的一个重要应用方向。工业现场对信息实时性、可靠性和吞吐量的特殊要求,决定了工业无线网络具有特殊的网络结构——星型拓扑结构。同时,工业无线网络