Web图像搜索器的关键技术研究

被引量 : 0次 | 上传用户:DSFDSAF
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用基于内容图像检索技术在Internet上查找用户所需的图像是一个重要且具有挑战性的学术研究。Web图像搜索器能为基于内容的图像搜索引擎提供源源不断的图像数据,使基于内容的图像搜索引擎对提高用户的服务质量具有重要的意义。本文在本课题组开发基于内容图像搜索引擎系统V1.0研究基础上,引入多线程技术,提出多线程Web图像搜索器的磁盘I/O缓冲方法。在深入分析和比较几种常见的搜索策略基础上,探索出适合于多线程Web图像搜索器的新搜索策略。最后开发了多线程Web图像搜索器子系统,完成与图像检索子系统的融合,构建出基于内容的图像搜索引擎系统V2.0。提出多线程Web图像搜索器的磁盘I/O缓冲方法。频繁的磁盘I/O操作导致多线程Web图像搜索器的性能显著下降。为此提出磁盘I/O缓冲方法,它包括待采URL的双队列缓冲和图像存储与URL存储中的循环缓冲池等两种措施。在URL待采队列中采用双队列缓冲,当其中一个队列处于使用状态时,另一队列执行从磁盘读取新URL的操作,使得各个线程可以不间断地获取URL。两个循环缓冲池分别用于图像和URL磁盘存储操作中,其工作原理相同。实验结果显示,磁盘I/O缓冲方法显著改善了多线程Web图像搜索器的性能。提出Web图像搜索器的基于深度的广度优先搜索策略。本文对不同质量的图像在Internet站点中的位置进行了统计分析,实验表明高质量图像在深站点页面中的数量比浅站点页面多。通过对传统搜索器的基于广度搜索策略和基于深度搜索策略的研究,提出基于深度的广度优先搜索策略。为构建基于深度的广度优先策略的Web图像搜索器,提出了DR-BTree(Determine Repeat-BTree)的页面URL判断重复方式和页面URL的数据库存储方式,将这种搜索策略与图像过滤方法结合并实现对下载图像的过滤。实验结果对比显示,在相同时间内三种搜索策略下载的图像数量相近,但是本文搜索策略下载高质量图像的数量是基于广度优先策略和基于深度优先策略的3.6倍和2.7倍,说明本文搜索策略更适合于多线程Web图像搜索器。基于上述研究结果,设计并开发了多线程Web图像搜索器子系统,它是基于内容的图像搜索引擎系统V2.0的重要组成部分。该子系统采用了多线程技术、磁盘I/O缓冲方法和基于深度的广度优先搜索策略。实验测试证明,该子系统提高了图像下载的速度,能较好地为基于内容的图像搜索引擎提供大量的图像数据,达到了预期目标。
其他文献
2,3-丁二醇(2,3-butanediol,简称2,3-BD)是一种具有重要价值的化工燃料和液体燃料,在化工、日化、食品、医学以及航天航空等多个领域受到广泛应用。本实验是以实验室保存的已经
本文论述了直线电机及其驱动控制技术的进展,在机床中的应用及发展趋势,提出了我国机床行业加速开发应用直线电机技术的建议.
我国对特色旅游商品包装研究多数是从商品的风格与文化传达方面进行论述,相比国外特色旅游商品包装,唯独缺少唯一性,典型性的特点,以及强烈的品牌特色形象意识,而这些正是目
近年来,随着国家扶贫政策的实施,扶贫行动的开展,中国饲料企业积极投身于扶贫行动中,一线饲料工作者克服重重困难,认真贯彻落实国家重大部署,开拓创新,推动我国饲料行业大步
在上世纪的欧美文坛上,最令人震惊、最惹人争议的小说莫过于劳伦斯的《查泰莱夫人的情人》了。长期以来,这部小说因涉及大量裸露的性描写而被视为“淫书”遭到查禁,曾经在英
以天然淀粉和丙烯酰胺单体为原料,过硫酸铵为引发剂,合成淀粉接枝丙烯酰胺共聚物(ST-g-PAM)。考察了淀粉种类、聚合方法、油水比、乳化剂配比对接枝效率的影响,对产物结构进
静探是岩土工程勘察最常用的一种手段,其测试结果几乎与土的各种物理力学指标建立了关系。但影响测试结果精度的因素很多,而且影响程度也各不相同。分析了实际存在的贯入速率
本文分别从香山西铜镍矿床的地质构成、岩体特征以及成矿规律三方面进行了分析,为矿山的开采提供了有利依据。
实施改革40多年来,我国家具行业取得了极大发展。如今不仅生产数量在国际上名列前茅,而且消费量也非常高。目前,已经打造出多个名牌企业,吸纳了很多的就业人员。这部分企业均
人文社科期刊导向管理指的是通过管理导向保证期刊正确的政治方向、学术导向和价值取向,其实质是要正确处理好学术与政治的关系问题。这是由哲学社会科学“有补于治道”的本