相似哈希相关论文
传统相似PDF合并方法不仅费时、费力,而且准确性易受限于主观判断,且在线合并方式存在用户PDF文件明文内容泄露风险,易导致数据安......
代码相似性检测(code similarity detection)是软件工程领域的基本任务之一,其在剽窃检测、许可证违反检测、软件复用分析以及漏洞......
由于EB(extreme binning)使用文件的最小块签名作为文件的特征,它不适合处理主要包括小文件的数据负载,会导致较差的重复数据删除......
[摘 要]哈希表由于能夠实现高效的数据存储和查找,操作时间可达到O(1)级,所以其被广泛应用于信息安全、操作系统、数据挖掘和生物信息......
针对无线网络中的节点仿冒等安全威胁,无线设备的身份识别成为了亟待研究的问题。在现有的识别方法中,MAC地址由于启用了随机化技......
针对JPEG格式图像提出一种隐私保护的图像查重方案,该方案联合符号加密和伪随机异或加密方法对JPEG图像进行格式兼容加密。同时,利......
为对Web大数据环境下的相似重复冗余数据进行清理,降低数据存储与管理的时间和成本,提出Web大数据相似重复数据清理方法。对Web数......
面对网络上更新快速的海量新闻,如何快速、有效地从中自动发现敏感话题并进行持续跟踪是当下研究的热点。文章以网络舆情分析系统......