论文部分内容阅读
随着多媒体技术与网络技术的迅猛发展,网络普及率大幅提高,人们可以方便快捷地下载、存储和分发多媒体信息。这给人们的娱乐生活带来便利的同时,也给多媒体作品的版权保护带来了极大的威胁。盗版问题和版权纠纷问题日趋严重,引起了国内外政府部门和研究机构的重视。数字指纹作为一种非常有前景的取证技术。在出售数字作品之前,它通过预先在作品中嵌入与购买者身份相关的唯一性指纹编码。当发现盗版作品时,通过提取作品中的指纹码可以识别非法作品的原始购买者,进而通过法律的手段对非法用户进行惩戒,从而达到保护版权所有者利益的目的。 虽然现有的数字指纹算法可以成功地阻止多媒体内容的再分发,但是在社交网络任务中,它们会面临着一些新的挑战。首先,现有的数字指纹编码方法都是一些盲编码的方法,没有考虑社交网络的结构,其编码效率很低。其次,在大规模的社交网络任务中,基于相关性检测的数字指纹检测方法是非常低效和耗时的。为了解决上述问题,进行了具有数据感知特性的指纹编码和高效数据指纹追踪方面的理论和关键技术研究,而数据感知哈希方法是其中的核心技术。因此,首先集中研究了数据感知哈希算法,并提出了两种新的算法:近邻保持哈希算法(Neighborhood Preserving Hashing,NPH)和非负稀疏局部保持哈希算法(Nonnegative Sparse Locality Preserving Hashing,NSLPH)。然后,基于所提出的哈希算法,设计了一种面向社交网络的数字指纹编码和其对应的数字指纹检测方案,最后提出了一种通用的大规模的数字指纹快速检测方案。 数据感知哈希方法可以将高维的特征向量映射成高效紧凑的哈希码,并且能保持数据的近邻结构。一些基于特征值分解的方法虽然性能比较优秀,但是通常会面临着语义损失的问题。如应用于数字指纹编码,会导致指纹编码效率低下。另一方面,当数据的维度高于样本数时,特征值分解会面临奇异值问题,使得问题不可解。根据矩阵分解和投影映射两个思路提出了两种方法。采用矩阵分解的思路,我们提出了一种NPH算法,它使用一种比较新颖的方式结合了两种经典算法:非负矩阵分解(Nonnegative Matrix Factorization,NMF)和局部线性嵌入(Localiy Linear Embedding, LLE),并且没有引入额外的参数。该方法可以学习得到一种非负的基于部件的表达,这一特性不仅符合人脑对事物的认知特点,并且可以保持数据内在的近邻结构。采用投影映射的思路,我们提出了一种NSLPH算法。它在目标函数中引入了非负和稀疏约束,可以使求得的解尽量与真实的解接近,进而可以很好地保持语义信息。另外,我们采用非负二次规划的方法来求解而成功地避免了奇异值问题。 结合数据感知哈希方法与社交网络,提出了一种面向社交网络的两层数字指纹编码结构,包含社区关系码和用户识别码两部分。为了有效地保持社交网络结构,我们拓展NPH算法,提出了一种核化的近邻保持哈希(Kernelized Neighborhood Preserving Hashing,KNPH)方法来生成社区关系码。该方法可以为相同或相近的社区用户分配相近的社区关系码,进而提高指纹码的抗共谋攻击性能。因为社区关系码是二值的,可以被当作索引值用来建立哈希表和用户的倒排索引表,以加快数字指纹的检测。 尽管在数字指纹编码研究中,提出了一种对应的快速数字指纹检测方法,但是该方法只适用于我们所提出的编码方案。因此,需要提出一种适用于常用数字指纹的快速检测方案。一些常用的数字指纹编码存在着一些局部近邻结构,但是在全局性它们的判别性较大,而之前所提出的哈希方法只考虑了局部特性。基于此考虑,对应地提出了一种局部和全局近邻保持哈希(Local and Global Neighborhood Preserving Hashing,LGNPH)方法来实现数字指纹快速检测。通过所提出的哈希方法,我们可以为高维的数字指纹生成一种低维的近邻保持哈希码。利用哈希码,可以快速地找到查询指纹的最近邻用户集,并可以使用传统的指纹检测方法从近邻集中快速地追踪来真实的叛逆者。局部结构的保持便于我们快速地找到近邻,而全局结构的保持可以使指纹对应的哈希码尽量可区分。这两个特性使提出的方法能够进行准确高效的数字指纹检测。 该项研究可以促进数字指纹技术在社交网络中的应用,丰富数字指纹技术的相关理论。