基于大数据平台的音频指纹检索系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xiahou001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络流媒体技术以及社会化网络的发展和大数据时代的到来,越来越多的音频信息出现在互联网中,在给人们的生活娱乐带来便利的同时,也对其存储和管理增加了难度。大量重复、冗余的数据对音频数据库的存储空间造成巨大浪费的同时,也增加了数据库维护、数据分类和检索的难度。如何识别出重复冗余的音频数据、对音频数据库进行有效维护以及在海量音频数据中快速有效地进行检索成为当前信息检索领域的一个研究热点与难点。木课题首先对音频指纹检索技术的商业前景以及研究现状进行了详细介绍,说明了该技术的优点以及研究的必要性。该技术是基于内容的音频检索技术的一种,与传统基于文本的检索技术相比,它的优势在于信息检索不再依赖于人工标注的标签和关键字,而是使用音频本身的时间、频率率、振幅、能量等多个维度的特征进行检索,在减少人力的同时,提高了检索的准确性和效率。然后对Echoprint、Chromaprint、Philips等几种现有的音频指纹检索技术进行了研究比较,并在现有国内外算法和技术成果的基础上,提出了一种基于FFT的哈希指纹提取算法和基于阈值的固定间隔抽样的哈希检索算法,使得提取算法在保持鲁棒性和抗噪性的同时,提高了检索算法的准确性以及效率。同对音频指纹数据进行了优化以缩短指纹的长度、提高检索的效率并设计了几种基于Hash表的存储结构,出于对存储空间的占用以及检索效率的综合考虑,最终选择了基于动态数组的Hash表作为指纹在内存中存储的数据结构。最后对Hadoop、Storm、Spark大数据平台进行了分析比较,并在此基础上提出了音频指纹的序列化分布式存储方案,提高了算法的并发性,进而构建了 一套Spark大数据平台下的高并发、高性能的音频信息分布式存储与检索系统,对音频指纹检索技术的发展和实际应用具有指导意义。
其他文献
本试验旨在研究食淀粉乳杆菌发酵产物以及发酵产物中不同分子量范围分泌蛋白的抗RV的抗病毒效应,分析胆盐、胰酶处理前后各分子量段的分泌蛋白抗病毒能力,比较它们之间的差异
目的探讨多发性肌炎/皮肌炎(PM/DM)的中医证候特征及辨治规律。方法对56例PM/DM患者一般资料、中医诊断、舌象、脉象、用药进行分析,探讨其中医证候特征与临床用药规律。结果3
CeO_2改性的SrTiO_3陶瓷采用传统的陶瓷工艺制备。SrTiO_3基质与CeO_2按化学式SrTiO_3+x(CeO_2nTiO_2)配比[x(wt%)分别为2、5、10、15、20、25和30]。样品在1400℃下烧结1h。Ce在SrTiO_3陶瓷中起施主杂质作用。扫描电镜形貌分析和X射线物相观察表明,在此种陶瓷中有
我知道恽逸群是在解放初期读到他的《蒋党真相》,颇吃惊于他能掌握那么多的内幕资料。以后知道恽逸群却已是在“三反”运动中,那时他一下由新中国新闻界的著名领导人物变成
<正>随着我国立法进程的不断发展和演变,我国的行政法学经过了漫长的三十年发展,已经取得了较高的成就,形成了具有中国特色、中国风格、中国气派的中国近代行政法学风范。追
南非劳动关系立法对不公正解雇作了详细而具体的规定,为了解南非不公正解雇的立法与实践的运行,特选取皮厄纳尔诉斯坦陵布什大学及齐科特教授案进行分析和论述。案例中,南非
康力电梯一场角力两年、涉案标的高达3297.8万元的诉讼,从上市前打到上市后依然是悬而未决。不过,今年法院两次冻结康力电梯1297.8万元资产的消息和这场诉讼角力,在康力电梯应该公
为研究不同相对分子质量聚合物复配对驱油效果的影响,基于在线核磁共振成像技术,对相对分子质量为1000&#215;104的单一聚合物及复配聚合物开展岩心驱替实验。根据水驱阶段结
本文对气相色谱法分离α-乙酰基-γ-丁内酯(ABL)的条件进行了系统的考察,建立了校正因子峰面积归一化法测定ABL含量的分析方法,并且当甲苯含量大于0.0005%时能同时准确测定其
从知识社会学的视野来考察林语堂的“闲适”文学理念,会发现这种闲适话语在1930年代的各种意识形态中隐伏着沉痛.这种沉痛来自于闲适话语处境的尴尬,来自于“闲适”文化视角