基于pHash分块局部探测的海量图像查重算法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:david6357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库中大量重复图片的存在不仅影响学习器性能,而且耗费大量存储空间。针对海量图片去重,提出一种基于pHash分块局部探测的海量图像查重算法。首先,生成所有图片的pHash值;其次,将pHash值划分成若干等长的部分,若两张图片的某一个pHash部分的值一致,则这两张图片可能是重复的;最后,探讨了图片重复的传递性问题,针对传递和非传递两种情况分别进行了算法实现。实验结果表明,所提算法在处理海量图片时具有非常高的效率,在设定相似度阈值为13的条件下,传递性算法对近30万张图片的查重仅需2 min,准确率达到了
其他文献
近年来,随着我国经济发展水平的提高,建筑行业也取得了快速发展,人们在生活水平提高的同时,对建筑工艺施工的质量以及效率等方面提出了更高的要求。在建筑施工过程中,为了保
<正>内蒙古白云鄂博矿是世界级的超大型稀土-铁-铌矿床。经过建国前的地质调查阶段(1927-1949)、建国后详查阶段(1953-1967)以及补勘阶段(1974-1977)的大量辛苦的地质勘查工
FABP5和CRABP2同属于脂肪酸结合蛋白,在动物体内均受视黄酸调节,调控脂质氧化和能量利用。本研究利用实时定量荧光PCR技术,对山西肉用绵羊母本品系10月龄去势公羊的皮下脂肪
<正> 梣属(Fraxinus L.),隶属于木犀科(Oleaceae)木犀亚科(Oleo-ideae)的梣族(Fraxineae),又称为白蜡树属,包括许多经济价值很高的乔灌木,有许多质地优良的用材树种以及绿化
科技日报多伦多9月4日电(记者冯卫东)世界上大多数人终其一生会讲一种语言。如果他们同时或是在发育早期学习两种以上的语言,那么他们的语言能力会非常强。加拿大蒙特利尔神经学
报纸
目的探讨慢病毒介导的RNA干扰技术抑制RRS1表达对人乳腺癌细胞MCF-7生物学行为的影响。方法采用Wcstcrn blot方法检测RRS1在MCF-7与正常乳腺上皮细胞HMEC中的表达;分别构建携
在当前初中英语教学过程中,大部分教师受传统教学观念的影响,没有树立正确素质教育认知,对学生英语单词及语法的记 忆理解重视程度过高,没有意识到情感教学的重要性。长此以
针对传统外墙保温系统存在的不足,本文提出一种全新的外墙保温装饰一体化系统,并在明确其优势与特点的基础上,提出了生产流程与施工工艺,为该系统的应用和推广提供可靠的依据
2016年世界新闻摄影奖,即第59届“荷赛”评选结果现已揭晓。本届评选共有来自128个国家的5775名摄影师参加,作品数量82951幅。澳大利亚自由摄影师Warren Richardson以一张记
农业产业化经营是社会主义新农村建设的主要内容,而农业产业化组织模式是影响农业产业化经营实施成效的制度因素,在产业化过程中应予以关注.本文在分析云南龙头企业带动型、