论文部分内容阅读
针对海量视频检索,提出一种结合Bloom Filter和SimHash的视频相似性检索方法。采用SimHash算法对视频关键帧构建特征,从而将海量视频检索问题转化为汉明距离检索问题,在此基础上提出一种基于Bloom Filter算法进行汉明距离检索的方法,该方法对SimHash签名库中所有签名穷举其汉明距离在K以内的所有签名,并将Bloom Filter结构汇总在一起组成类似BitMap的结构,最终查询汉明距离时,只需要计算BitMap的并集,提高了查询效率。针对海量视频检索提取特征存在的空间复杂度问题,引入MapReduce框架,设计MapReduce算法进行分布式处理解决了空间复杂度较大的问题。