论文部分内容阅读
摘 要:随着大数据时代的到来,图像每天极速增长,图像已经成为人们生活中的重要成员之一。本文首先介绍了当前图像检索的研究现状,随后介绍了图像检索存在的问题,最后本文针对这些问题提取了海量图像检索的对策和建议。
关键词:图像检索本体 XML
一.引言
近年来,图像信息呈爆炸状态的快速增长,每天都有数千兆字节的图像产生。在这样的情况下,使人们苦恼的问题已经不再是缺少信息的问题,而是如何从浩如烟海的信息中及时、高效地获取需要的信息。20世纪70年代末,图像检索技术是基于文本的,是一种"字找图"的模式。这种方式存在很多缺点:例如,耗时耗力、主观性强、检索的效率低下等。
二.海量图像检索研究现状
2.1基于内容的图像检索研究
基于图像内容的检索是一门如何快速有效地从海量图像中检索出相关图像的技术。近年来国内外学者主要从图像的视觉特征入手,将研究热点放在了基于颜色特征、基于形状特征、基于纹理特征的图像检索,对推动基于内容的图像检索起到了重要作用。
基于颜色特征的图像检索方面最新研究成果包括了:Joost等人提出通过学习来获取颜色名称从而实现图像检索;Chen等人提出自适应颜色特征提取方法来描述图像并实现检索,该方法在考虑图像中颜色分布的基础上进行自适应特征提取。基于形状特征的检索方面最新代表性成果包括:Peter等人提出利用改进的k最近邻图来构建形状特征的流形空间,从而更有效地计算相似性; Bai等人提出根据形状间的相似性来构建图,根据图的转换来学习一个更有效的形状相似性测量方法。在基于模型的纹理分析及特征提取方面,假设纹理按某种统计模型分布,模型中的参数将作为纹理特征。Pentland提出将分形模型应用于图像纹理分析中;Serafim等人提出利用自回归模型结合多分辨率金字塔结构来描述图像纹理特征。
国内外学者对CBIR的研究也日益深入和广泛,并已取得了一些重大成果,但从目前的研究来看仍然存在一些问题,主要包括:图像信息内容的描述、特征的自动提取、匹配和结构化的选择,查询和检索等等。
2.2基于语义的图像检索研究
为了克服基于内容的图像检索的这些不足,人们提出了基于语义的图像检索方法。基于语义的图像检索常用的语义内容提取算法最主要的就是基于关键字的语义网络。
为了达到良好的检索效果,CiacciaD提出了基于关键字的语义网络,语义网络由一组与数据库中图像链接的关键字表示,并在每个连接上加上权值W,表示此关键字与图像的相关程度,一幅图像可以对于多个关键字,一个关键字也可以对应多幅图像。这种方法利用语义网络,结合文本检索和内容检索的关键技术,通过语义推理和相似性匹配查询出符合用户真实意图的图像。但是缺点是各个关键字之间没有关联,但实际中许多关键字之间存在许多关系,如果能充分的利用这些关系,就能进一步的提高语义图像检索的性能。
三.海量图像检索存在的问题及对策
3.1海量图像检索存在的问题
近年来,随着人工智能、计算机视觉、数据挖掘和Internet技术水平的不断发展,国内外学者对图像检索的研究也日益深入和广泛,并已取得了一些重大成果,但从目前的研究来看仍然存在一些问题阻碍着图像检索技术的应用,主要包括以下几个方面:
(1)图像特征不能进行最优描述
目前图像语义的标注方法主要采用手工标注的方法,即用关键字表达图像的部分高层语义,这种方法在某些场合是非常有效的,但采用手工方法用关键字标注图像语义,由于用户对图像的理解不同,不可避免地存在主观性和不精确性。
(2)描述数据不能有效组织
在如今的互联网时代,需要实时更新的图像数据库,如果这些图像数据一发生变化就需要重新发布整个结构化数据,需要不断刷新整个用户的界面才能将更新后的数据完整地呈现给用户的话。因此,图像数据在传播和交换的过程中,如果没有一种执行标准这不仅造成了图像数据组织的高难度,更是造成了图像检索的低效率。
(3)检索系统不能较好地满足特征信息的查询和检索
图像具有丰富的语义信息,用户对图像的理解又经常表现出主观性和易变性,即不同的用户在检索时对同一幅图像的理解与判断经常会不一致,甚至同一个用户在不同的时间或不同环境下对同一幅图像的语义判断也会不同。
3.2海量图像检索的对策及建议
总的来看,国内外对于图像检索的研究各有特色,同时也存在上述一些问题这些问题都影响和阻碍着图像信息检索的实际应用。针对这样的问题,本文将尝试将本体描述语言XML的文档描述技术、查询技术和检索技术与图像信息检索技术相结合,在理论上尝试提出基于本体的图像语义信息检索。具体的检索过程为:允许用户提供一张目标图像,检索系统根据图像对其进行低层特征语义的提取,然后对提取到的语义信息进行本体标识并存储,将经本体标识的目标图像与本体标识的图像特征库进行匹配检索,并根据检索结果进行用户体验评价。检索过程如下图3-1所示:
3-1 基于本体的图像语义检索过程
四.结论
尽管本体为图像检索提供了一种新的方式,但总的来说目前该方面的研究还处于起步阶段,其中大部分仅仅是利用本体对图像进行手动标注。我们将可扩展性的本体描述语言XML引用到我们的基于本体的图像语义检索中来。作为一种成熟的标识语言,XML是结构化的数据,可以使用自定义标签,具有强大的链接功能。因此,可以使用XML文档来处理图像的特征语义信息,将现有的图像的技术与基于本体标记语言的检索相结合,建立基于本体的图像语义检索系统,从而解决海量图像检索存在的问题。
参考文献:
[1].王伟平.基于内容的图像检索技术研究进展及其在数字图书馆中的应用[J]. 图书情报作,2009,09:116-120.
[2].陆敏,杨发毅,彭骏.基于本体的知识检索研究[J].图书馆学研究,2009,02:41-45.
[3].顾英,柯平,李泽华.基于领域本体的数字图书馆及应用研究[J].图书馆工作与研究,2013,05:41-44.
[4].吴楠, 何云峰.一种基于颜色特征的图像检索方法 [J].中国图象图形学报,2010, 12.
[5].陆伟,张宓,刘丹.基于XML文本片段的图像检索实现与评价.中国图书馆学报, 2009(2): 53-58.
[6].Datta R, Joshi D, Li J, et a.l Image retrieval ideas, influences, and trends of the new age. ACM Computing Surveys, 2009, 40(2): 5: 1-5: 60.
[7].王玉操.一种海量XML文档存储和检索平台的研究与实现[D].西安电子科技大学,2013.
关键词:图像检索本体 XML
一.引言
近年来,图像信息呈爆炸状态的快速增长,每天都有数千兆字节的图像产生。在这样的情况下,使人们苦恼的问题已经不再是缺少信息的问题,而是如何从浩如烟海的信息中及时、高效地获取需要的信息。20世纪70年代末,图像检索技术是基于文本的,是一种"字找图"的模式。这种方式存在很多缺点:例如,耗时耗力、主观性强、检索的效率低下等。
二.海量图像检索研究现状
2.1基于内容的图像检索研究
基于图像内容的检索是一门如何快速有效地从海量图像中检索出相关图像的技术。近年来国内外学者主要从图像的视觉特征入手,将研究热点放在了基于颜色特征、基于形状特征、基于纹理特征的图像检索,对推动基于内容的图像检索起到了重要作用。
基于颜色特征的图像检索方面最新研究成果包括了:Joost等人提出通过学习来获取颜色名称从而实现图像检索;Chen等人提出自适应颜色特征提取方法来描述图像并实现检索,该方法在考虑图像中颜色分布的基础上进行自适应特征提取。基于形状特征的检索方面最新代表性成果包括:Peter等人提出利用改进的k最近邻图来构建形状特征的流形空间,从而更有效地计算相似性; Bai等人提出根据形状间的相似性来构建图,根据图的转换来学习一个更有效的形状相似性测量方法。在基于模型的纹理分析及特征提取方面,假设纹理按某种统计模型分布,模型中的参数将作为纹理特征。Pentland提出将分形模型应用于图像纹理分析中;Serafim等人提出利用自回归模型结合多分辨率金字塔结构来描述图像纹理特征。
国内外学者对CBIR的研究也日益深入和广泛,并已取得了一些重大成果,但从目前的研究来看仍然存在一些问题,主要包括:图像信息内容的描述、特征的自动提取、匹配和结构化的选择,查询和检索等等。
2.2基于语义的图像检索研究
为了克服基于内容的图像检索的这些不足,人们提出了基于语义的图像检索方法。基于语义的图像检索常用的语义内容提取算法最主要的就是基于关键字的语义网络。
为了达到良好的检索效果,CiacciaD提出了基于关键字的语义网络,语义网络由一组与数据库中图像链接的关键字表示,并在每个连接上加上权值W,表示此关键字与图像的相关程度,一幅图像可以对于多个关键字,一个关键字也可以对应多幅图像。这种方法利用语义网络,结合文本检索和内容检索的关键技术,通过语义推理和相似性匹配查询出符合用户真实意图的图像。但是缺点是各个关键字之间没有关联,但实际中许多关键字之间存在许多关系,如果能充分的利用这些关系,就能进一步的提高语义图像检索的性能。
三.海量图像检索存在的问题及对策
3.1海量图像检索存在的问题
近年来,随着人工智能、计算机视觉、数据挖掘和Internet技术水平的不断发展,国内外学者对图像检索的研究也日益深入和广泛,并已取得了一些重大成果,但从目前的研究来看仍然存在一些问题阻碍着图像检索技术的应用,主要包括以下几个方面:
(1)图像特征不能进行最优描述
目前图像语义的标注方法主要采用手工标注的方法,即用关键字表达图像的部分高层语义,这种方法在某些场合是非常有效的,但采用手工方法用关键字标注图像语义,由于用户对图像的理解不同,不可避免地存在主观性和不精确性。
(2)描述数据不能有效组织
在如今的互联网时代,需要实时更新的图像数据库,如果这些图像数据一发生变化就需要重新发布整个结构化数据,需要不断刷新整个用户的界面才能将更新后的数据完整地呈现给用户的话。因此,图像数据在传播和交换的过程中,如果没有一种执行标准这不仅造成了图像数据组织的高难度,更是造成了图像检索的低效率。
(3)检索系统不能较好地满足特征信息的查询和检索
图像具有丰富的语义信息,用户对图像的理解又经常表现出主观性和易变性,即不同的用户在检索时对同一幅图像的理解与判断经常会不一致,甚至同一个用户在不同的时间或不同环境下对同一幅图像的语义判断也会不同。
3.2海量图像检索的对策及建议
总的来看,国内外对于图像检索的研究各有特色,同时也存在上述一些问题这些问题都影响和阻碍着图像信息检索的实际应用。针对这样的问题,本文将尝试将本体描述语言XML的文档描述技术、查询技术和检索技术与图像信息检索技术相结合,在理论上尝试提出基于本体的图像语义信息检索。具体的检索过程为:允许用户提供一张目标图像,检索系统根据图像对其进行低层特征语义的提取,然后对提取到的语义信息进行本体标识并存储,将经本体标识的目标图像与本体标识的图像特征库进行匹配检索,并根据检索结果进行用户体验评价。检索过程如下图3-1所示:
3-1 基于本体的图像语义检索过程
四.结论
尽管本体为图像检索提供了一种新的方式,但总的来说目前该方面的研究还处于起步阶段,其中大部分仅仅是利用本体对图像进行手动标注。我们将可扩展性的本体描述语言XML引用到我们的基于本体的图像语义检索中来。作为一种成熟的标识语言,XML是结构化的数据,可以使用自定义标签,具有强大的链接功能。因此,可以使用XML文档来处理图像的特征语义信息,将现有的图像的技术与基于本体标记语言的检索相结合,建立基于本体的图像语义检索系统,从而解决海量图像检索存在的问题。
参考文献:
[1].王伟平.基于内容的图像检索技术研究进展及其在数字图书馆中的应用[J]. 图书情报作,2009,09:116-120.
[2].陆敏,杨发毅,彭骏.基于本体的知识检索研究[J].图书馆学研究,2009,02:41-45.
[3].顾英,柯平,李泽华.基于领域本体的数字图书馆及应用研究[J].图书馆工作与研究,2013,05:41-44.
[4].吴楠, 何云峰.一种基于颜色特征的图像检索方法 [J].中国图象图形学报,2010, 12.
[5].陆伟,张宓,刘丹.基于XML文本片段的图像检索实现与评价.中国图书馆学报, 2009(2): 53-58.
[6].Datta R, Joshi D, Li J, et a.l Image retrieval ideas, influences, and trends of the new age. ACM Computing Surveys, 2009, 40(2): 5: 1-5: 60.
[7].王玉操.一种海量XML文档存储和检索平台的研究与实现[D].西安电子科技大学,2013.