Web图像检索中并行聚类技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hdmlb2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络带宽的增长和图像技术的发展,Web上图像资源变得越来越丰富,形成一个海量的图像资源库。Web图像检索致力于解决从这个海量的图像资源库中,帮助用户快速地、准确地检索到所需要的图像信息。在Web图像检索系统中,为了减少对所需要图像的查询时间,为用户提供快速且有效的检索服务,采用数据挖掘领域中的聚类技术来对网络上的图像进行聚合归类,建立图像索引。然而,Web图像检索所面对的是大规模的网络图像数据,现有的大量聚类算法在处理大规模数据时效率较低,不能满足Web图像检索中对网络图像进行聚类的效率要求。根据EMD相似度匹配算法,在动态自适应图像聚类算法的基础上,提出了并行层次化自适应图像聚类算法,克服动态自适应图像聚类算法效率下降的缺点,充分利用动态自适应图像聚类算法适合对网络图像进行动态聚类的优点,即聚类过程不依赖聚类中心点和聚类个数以及聚类层数。动态自适应图像聚类算法最大的缺点在于,算法复杂度为O(MN),即在已得聚类的规模M保持稳定时,随着图像数据规模N的增大,算法花费的时间会线性增长。影响图像聚类性能的因素有两个,即I/O时间和EMD匹配时间。在并行层次化自适应图像聚类算法中,使用全局EMD匹配方式整合了聚类过程,有利于动态自适应聚类算法的并行化实现;采用内存方式减少I/O时间。在聚类的并行化实现中,采用数据并行使各个结点并行进行EMD相似性匹配,减少串行聚类中的EMD匹配时间;采用消息机制使各个结点上的聚类信息保持一致,并在主结点上进行结果的合并,保证了合并后结果的有效性。通过对系统的性能测试,应用并行层次化自适应图像聚类算法,提高了图像聚类的效率。通过与串行图像聚类进行对比,可以获得较好的加速比。采用5,10,20个结点进行并行图像聚类,加速比分别为3.5,7.5,16。
其他文献
利用现代教育技术手段搞好高校的计算机基础教学和考核是一项重大改革,是提高高等学校计算机基础教学水平的具体措施。但现有的网上考试系统在功能上还不够完备,其性能和适用范
网络化制造可以使企业间的合作效率更高、成本更低,资源得到更充分和合理的利用,因此,对于提高企业的新产品开发能力,快速、低成本地制造产品能力等都具有非常重要的意义。然
WEB资源的复杂化、多样化,数据量的日趋庞大对网络的传输能力提出更高的要求,对不同平台、不同格式的数据源进行数据集成和数据转化等成为远程教学急需解决的问题。另外,从繁多
近年来,随着无线网络的大范围推广和移动设备以及定位设备的大规模使用,普适计算正迅速地变为一种可用的实体,成为了人们日常生活一部分。为适应这种发展趋势而开发的高级服
近年来,许多专家受自然界行为的启发,提出了很多启发式优化算法来解决复杂的计算问题,例如:蚁群算法、粒子群算法、模拟退火算法、遗传算法等等。虽然这些算法为解决一些问题
规则格网模型、不规则三角网模型和等高线模型是数字高程模型(DEM)的三种表示方法。其中不规则三角网(TIN)能以不同层次的分辨率来描述地形表面,被视为DEM中最基本和最重要的
视频运动分析有着非常广阔的应用背景,在视频监控系统、视频浏览、视频信息检索、感知接口等产品的设计过程中,都需要对大量的视频运动信息进行分析。视频运动分析最终得出对
本文在泛系理论的基础上,介绍了泛权场粗糙集模型,提出了粗糙集中规则提取的新方法一用图的匹配提取信息表中的规则。并将基于泛系的泛权场粗糙集模型应用到具体学科中。研究
无线传感器网络常常被布置在极端恶劣的环境中,敌对者很容易能够捕获其中的一个或多个传感器节点。一旦传感器节点被捕获,攻击者可以通过逆向技术来重编译这些节点并且复制出
随着计算机网络的快速发展和安全性分析方法研究的深入,基于安全评估模型的评估方法被不断提出。网络攻击图是分析网络安全性的一个重要手段。对网络安全策略的制定具有重要