海量图像语义分析和检索技术研究

被引量 : 0次 | 上传用户:cccpx918
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展、各种数字化设备的普及以及大规模存储设备的不断改进,全世界以各种形式产生的数字图像的数量正在以惊人的速度增长。大量使用的数字图像构成了娱乐、商业、教育等应用的基础,出现了许多大型图像数据库。海量图像信息的管理、检索及其应用得到越来越多的关注和研究,如何快速、有效地检索迅速激增的可视信息已成为一个亟待解决的问题。基于内容的图像检索技术(CBIR)利用图像的客观视觉特征进行图像的相似匹配检索,作为一种自动的客观的反映图像内容的检索方式,在上世纪90年代被提出并逐渐蓬勃发展起来。然而,图像低层的视觉特征内容难以表达用户的高层语义理解,即存在“语义鸿沟”,这种底层内容与高层用户理解之间的差异性是目前CBIR技术难以被广泛用户所接受的根本原因。另外图像低层视觉特征的提取效率以及基于视觉高维特征的检索技术的局限性(“维度灾难”)也使得CBIR技术难以直接应用于海量图像数据的检索。基于语义的图像检索,从图像内容理解出发,着眼于提取和分析用户对图像的理解信息,研究结合高层语义理解信息进行检索,是CBIR发展的一个方向。由于图像语义信息本身的复杂性、主观性等特点,在语义提取、表达、比较上都存在技术难点,因此,图像语义检索目前仍是多媒体信息检索领域一个重要且极具挑战性的研究课题。本文着重解决海量图像数据语义检索的核心问题,研究特征关联分析、语义知识描述、语义相似度量、语义融合检索机制以及查询理解、检索结果聚类等一系列关键技术,并集成以上系统性研究成果,实现新型、完整、高效的海量图像语义检索原型系统。本文工作的主要贡献和创新总结如下:(1)深入探究“语义鸿沟”的原因、表现形式,从层次语义提取入手,以语义分析为出发点,提出一种面向海量图像数据库的语义层次模型:该模型结合词汇学知识、领域知识、以及用户反馈信息,以层次化结构反映了“语义鸿沟”在不同层次上的表现形式,其优点概括如下:a)通过层次语义关系既可以清晰表达不同的语义粒度,也可以表达不同语义之间的关联,丰富语义层次和范围;b)语义的复杂性和多样性导致直接获取语义十分困难,自顶向下层次化语义构建符合人们的认知过程,更有效的获得多方位多粒度的图像语义。(2)研究融合语义非测度(non-metric)空间索引和视觉测度(metric)空间索引的检索机制:首先提出了一种综合度量图像相似程度的“语义相似度量”准则,从不同语义层次(视觉内容、元语义、高级语义与图像语义类别)探讨了图像语义的相似性问题。基于此,设计了一种快速高效的二阶段相似查询索引机制。其优点在于:a)以文本语义为主,辅以视觉特征综合考虑的相似度量准则,更好地获得用户对图像语义相似匹配的查询理解;b)两阶段相似检索算法结合文本语义和视觉特征分阶段比较过滤,大大缩小了查询检索范围,不仅在性能上相对于传统的顺序索引算法有指数级提高,同时也大幅提高查询准确度。(3)基于以上理论研究成果,实现高效可扩展的支持多模式用户查询的海量图像语义检索原型系统-HISA:系统集成图像特征获取、图像语义层次分析、图像语义模型建立、语义相似度量、融合索引机制等研究技术成果,支持基于关键字、图像例子、以及二者结合的查询,支持动态层次分类目录维护和浏览,提供图像自动标注等功能以完善现有的检索功能。并在此原型系统平台基础上用大量真实世界的图像数据对本文提出的检索算法进行全面的评价分析,包括算法的各项参数调优测试,以及与传统检索算法的效率比较和实例分析。实验结果证明了本文提出的检索算法具有高可扩展性、在性能上和准确度上相对传统检索算法有显著改进。(4)针对目前互联网协作标签(tag)的应用背景,进一步研究海量图像共享资源基于tag关联的语义理解和分析,提出了一种结合tag语义关联信息分析的图像结果聚类技术,以及基于此的迭代聚类检索模式-Pivot Browsing:该查询模式融合查询扩展机制、tag聚类算法、视觉特征重排、以及用户反馈等关键技术,提供全新的灵活友好的图像信息导航和用户交互方式,使用户能够方便地浏览大量的纷繁复杂的查询返回结果,快速准确地找到想要的目标,以及进行信息发现。其中,对于关键技术-tag聚类,本文采用自顶向下的启发式的图划分算法实现快速、高效的结果聚类,满足在线查询的性能需求。该检索模式不仅仅适用于图像,也能应用于更一般的tag空间信息检索的模式,有很好的应用前景。(5)将基于tag的图像结果聚类迭代检索技术系列研究纳入之前海量图像语义检索的研究框架下,实现新颖的带tag图像语义检索原型系统-PivotBrowser,并对基于tag迭代聚类的图像语义检索技术应用展开全面的分析:该原型系统支持多种用户查询操作和反馈形式,利用用户的反馈信息去矫正、改进或者进一步细化查询。通过大量真实的用tag描述的图像数据集进行定性的实例分析和定量的性能和效率评价,验证了本文提出的基于tag迭代聚类的图像语义检索模式的有效性,特别是能一定程度上解决tag空间的不一致性和多义性等问题,聚类效果理想,极大的提高了查询准确率和用户满意度。
其他文献
《劳动法》关于劳动者范围的规定存在严重缺陷,并且日益暴露,使得劳动者保护面临困难,《劳动合同法》针对《劳动法》的规定进行了修改与完善,但是本文认为《劳动合同法》依然
<正>工会女职工委员会是在同级工会领导下的具有民主性、代表性的女职工组织,基本职责是维护女职工的合法权益和特殊利益。进入新世纪新阶段,我国发展呈现一系列新的阶段性特
目的研究不同胎龄胎儿脐带血17α-羟孕酮(17α-OHP)浓度分布状况,了解胎儿17α-OHP浓度生理变化特征。方法利用Wallac1420 VICTOR分析仪,应用时间分辨荧光免疫分析法(TRFIA)
随着改革开放的不断深化,吉林省已经进入经济转型的中期,随着市场化、城镇化水平的不断提高,吉林省经济获得了飞速发展。然而与经济高速增长形成对比的是吉林省居民消费水平
文章分析了高速公路软土路基的特征,并结合高速公路施工过程中对基层稳定性的要求。深入探讨软土路基不同处理技术手段,从优势与缺点两方面进行对比,可以作为高速公路软土路
阿尔茨海默症(AD),又名痴呆,是一种与年龄相关的影响健康的病症。大量神经病理学研究表明:单胺能系统结构和功能的异常与AD病理学之间有着密切的联系,而与其它单胺相比5-HT对
特殊医疗空间的室内设计不同于一般意义上的室内设计,在空间色彩、室内陈设、灯光照明等方面具有相对独特的要求。特殊医疗空间通常是恶性疾病的治疗空间,设计师需要从其功能
释明制度是大陆法系国家和地区民事诉讼中的一项基本制度,其存在的合理基础是对辩论主义和处分主义进行限制和修正,纠正绝对当事人主义带来的诉讼滥用、程序复杂、裁判迟延等
建筑物广泛地充斥于人们的生活中,各式各样,各种类型与风格的建筑物在现今的世界中似乎已经是司空见惯,想要让生活的环境中更有新意、创意、美感,就需要通过设计与艺术来展示
随着我国汽车工业和交通运输事业的迅猛发展,近年来我国机动车辆保有量大幅增长,附带产生的交通噪声污染问题己经成为影响和滋扰居民生活的一大公害,对人们工作和健康的造成