一种结合BloomFilter和SimHash的海量视频检索方法

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:shijun21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  针对海量视频检索,提出一种结合Bloom Filter和SimHash的视频相似性检索方法。采用SimHash算法对视频关键帧构建特征,从而将海量视频检索问题转化为汉明距离检索问题,在此基础上提出一种基于Bloom Filter算法进行汉明距离检索的方法,该方法对SimHash签名库中所有签名穷举其汉明距离在K以内的所有签名,并将Bloom Filter结构汇总在一起组成类似BitMap的结构,最终查询汉明距离时,只需要计算BitMap的并集,提高了查询效率。针对海量视频检索提取特征存在的空间复杂度问题,引入MapReduce框架,设计MapReduce算法进行分布式处理解决了空间复杂度较大的问题。
其他文献
  近年来,用户在社交媒体上越来越多地使用多媒体内容来分享经历和表达情绪,如新浪微博的一条微博常常包含文本和图像。相比于单独分析文本和图像的情感,融合文字和图像的多媒
会议
  本文考虑了微博中的多样性检索问题。我们第一次将多样性排序学习方法应用到微博多样性检索中,并针对微博的特点设计了一系列社交媒体特征。实验结果表明,多样性排序学习方
世界经济的高速发展,得益于石油、天然气、煤炭等化石能源的使用。然而,这一经济的资源载体将在21世纪上半叶迅速地接近枯竭。同时,化石能源的过度开采与使用所造成的环境污染和
  近几年,我国P2P网贷行业在高速发展的过程中出现了大量的失联跑路事件。本文基于P2P网贷及大数据相关概念深入剖析,创新性地将平台的风险预警同大数据技术相结合,最终通过海
  雾霾监测点作为雾霾大数据感知的源头,其自身的可靠性对大数据的可靠性至关重要。当感知源行为出现异常不可靠时,其所获得的数据本身就是不可靠的,更勿论进一步的处理和决策
会议
为了促进干旱区林果业的发展,创建水资源高效利用环保型生态林果业。本研究利用全生物降解膜套袋种植技术在吐鲁番市亚尔乡建立了生物降解膜杏树节水种植示范区。本试验对全
  现有的大部分分类算法都是针对多维数据的,虽然存在一些方法可以用于不是用多维表示的数据类型,即非多维数据,但这些方法本身的弱点往往也都很明显。在大数据时代,复杂的数据
会议
  随着文本数据量变得很大且仍在迅猛增加,自动文本分类变得越来越重要。为了提高分类准确率,特征词权重计算方法是文本分类领域的研究热点之一。我们研究了各种特征词权重
会议
本文简要介绍了MBS树脂的性能、重点研究了采用种子乳液聚合工艺合成了具有核-壳结构的PVC高透明、高抗冲型改性剂MBS树脂的过程,对影响种子乳液聚合反应的乳化剂、电解质、
  The goal of postharvest research is to optimize and extend fruit storage and quality.Common parameters measured include texture,sugars,acids and flavor vola
会议