音频感知哈希算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：k364709757

【摘要】

：

感知哈希是由多媒体数据集到感知摘要集的单向映射,它将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要。感知哈希兼具对内容保持操作的鲁棒性和对内容篡改的区

【作者】

：

焦玉华

【出处】

：

哈尔滨工业大学

【发表日期】

：

2010年期

【关键词】

：

感知哈希音频语音多媒体内容认证性能评价压缩域算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

感知哈希是由多媒体数据集到感知摘要集的单向映射,它将具有相同感知内容的多媒体数字表示唯一地映射为一段数字摘要。感知哈希兼具对内容保持操作的鲁棒性和对内容篡改的区分性,并满足单向性、抗碰撞性等安全性要求。感知哈希已逐渐成为多媒体内容认证的重要技术,并且在基于内容的多媒体识别、检索中得到了广泛的应用。作为最典型、最普及的多媒体信息之一,音频信息的真实性和完整性关系到公民个人权益,媒体公信力乃至国家安全,音频感知哈希的研究具有很强的社会意义和理论价值。音乐与语音是最具有代表性的两类音频,它们在信号特点、编码方式、存储和传输信道等各方面截然不同,因此,必须针对音乐和语音的各自特点,研究不同的音频感知哈希算法。鉴于“音乐”这一名称的使用范围非常广泛,所以在信号处理研究中通常称之为宽带音频。而根据数字化过程中是否存在压缩编码,又可进一步分为原始宽带音频、压缩宽带音频、原始语音、压缩语音四类。感知哈希的研究目前仍处于起步阶段,缺乏通用的模型和性能分析方法,用以指导算法的设计与优化。当前具体算法的研究集中于原始宽带音频,对于压缩宽带音频和语音等上述三类典型信号,缺乏有针对性的感知哈希算法,不能满足实际应用的需求。本文针对上述问题展开研究,在充分研究音频感知哈希研究现状的基础上,给出了感知哈希的一般模型和通用性能评价指标;提出了可抵抗高强度转码操作的压缩宽带音频感知哈希算法、针对语音信号特点的原始语音感知哈希算法和压缩语音感知哈希算法。论文的主要研究工作和创新性如下:(1)提出了与具体算法无关的感知哈希一般模型和性能评价指标。本文基于人类认知原理,概括了感知哈希的定义和一般技术框架,给出了感知哈希各项性质的数学定义;将感知哈希算法抽象为离散马尔可夫信源,以信源熵率作为感知哈希的性能评价指标。该性能评价指标与具体算法无关,可用于算法的黑盒测试。并且,作为单位信息量测度的信源熵率,不受数据量大小的影响,可以联合评价算法的区分性、压缩性等性能。再次,熵率有明确的上下限值,可客观全面地评价算法的优劣。(2)提出了压缩宽带音频感知哈希算法。该算法以宽带音频压缩编解码的中间结果——改进离散余弦变换(Modified discrete cosine transform, MDCT)系数为输入,计算感知哈希值。实验结果表明,该算法在保持了良好区分性的同时,对高强度低码率音频压缩的鲁棒性明显优于现有算法,并且大大降低了计算与存储消耗,特别适用于无线通信等能源、计算、存储资源受限的场合。(3)提出了原始语音感知哈希算法。本文基于语音信号的数字模型,以线谱频率为基本感知特征,提出了原始语音感知哈希算法。实验结果表明,该算法实现了单词级的篡改检测精度,且具有良好的鲁棒性和安全性,可实现准确可靠的语音内容认证。同时,该算法不受语音编码标准的约束,可适用于各类语音通信系统。(4)提出了与编码标准相结合的语音感知哈希算法。为了满足移动电话、卫星通信等语音通信系统的低数据量、低延时要求,本文以G.729和MELP为低码率压缩语音标准的代表,研究了与之相结合的压缩语音感知哈希算法。算法以编解码的中间结果——线谱对作为基本感知特征,计算感知哈希值。实验结果表明,所提出的算法在确保较好的区分性和鲁棒性的前提下,具有极低的数据率和计算复杂度。

其他文献

子宫腺肌病诊治的临床分析

目的：探讨子宫腺肌病的诊断及治疗。方法：回顾性分析经术后病理确诊为子宫腺肌病患者85例的临床资料。结果：妇科检查符合率71．76％，超声诊断正确率78．82％，妇检与超声的协同诊断正确率83

期刊

子宫腺肌病诊断治疗

原生模式GML空间数据管理机制研究

空间数据管理是地理信息科学的重要研究内容,也是空间信息系统相关厂商重点研发的部分。空间数据管理的高效与否,直接关乎空间信息系统的成败、关乎空间数据的有效利用、关乎

学位

GML空间数据原生模式存储索引查询传输与交换数字地球G/S模式应用集成

Web应用的验证与测试方法研究

Internet的普及以及分布式计算、基于构件的开发和Web Services等技术的迅速发展和应用使Web应用渗透到国计民生的各个领域。Web应用的质量将直接影响人们的生活和工作。验证

学位

Web应用形式验证基于模型检验的测试构件组合反例引导的抽象精化

谈美声唱法演唱中国作品时的发声与吐字

根据美声唱法的特点和汉字发音的规律，论述了美声唱法在演唱中国作品时的发声与吐字问题。

期刊

美声唱法吐字发声bel canto vomit word phonation

大规模图像库的高维索引技术研究

高维数据的索引机制是大规模图像库的基于内容检索能够达到实时性要求的关键技术。面临“维度灾难”带来的影响,如何通过索引的表示、索引的组织和索引的提取提高高维图像数

学位

基于内容的图像检索高维索引高维主存索引KNN查询主成分分析活性维位码

IPF85—B型混凝土泵车滑阀动作失灵的故障分析

随着施工技术的不断发展，混凝土泵车被广泛用于各类混凝土建筑施工中，搅拌楼、混凝土运输车、混凝土输送泵车三位一体的施工结构将取代现在使用的中、小型搅拌机的施工结构。

期刊

混凝土泵车施工混凝土建筑搅拌楼混凝土输送泵混凝土运输车搅拌机失灵发展三位一体

基于密态的安全数据库应用研究

密态数据库技术是密码学[Stallings W，2001；Atul Kahate,2005]与数据库[Chaudhuri S．，2001；Haraty，2003；Preston Carole，2002；Bettino Elisa，2002]技术的融合，在这个结合的技术中，人们在

学位

安全数据库密态密钥生成数据挖掘安全科学计算

雨林探险

地处东南亚的婆罗洲,是世界上著名的热带雨林区之一,其浩瀚与辽阔的程度,仅次于我们熟悉的亚马逊河雨林.这片号称地球肺部之一的热带雨林,虽然与中国仍有相当的距离,但这片雨

期刊

探险亚马逊河热带雨林婆罗洲东南亚

五花八门的动物葬礼

灰鹤当灰鹤发现死亡的同类,便会久久地在尸体上空盘旋徘徊.然后由首领带着大队飞落地面,默默地绕着尸体团团转,悲伤地"瞻仰"死者的遗容.最后,停立在尸体跟前,发出凄楚的叫声,

期刊

动物死亡动物行为葬礼灰鹤野山羊大象

长期使用电脑者如何护眼

长时间使用电脑的人要注意：1．要注意用眼卫生。眼睛与文稿，眼睛与电脑屏幕的距离应保持在50cm以上，最好采用光下视20°的视角。

期刊

电脑屏幕长期使用用眼卫生长时间眼睛

音频感知哈希算法研究

与本文相关的学术论文