隐私保护聚类挖掘方法的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:waterhunter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘技术的发展和数据挖掘工具的大量出现,人们对自己隐私的保密性要求也变得越来越迫切。如何在保证个人隐私的前提下进行数据挖掘,已经成为一个迫切需要解决的问题。目前,人们对隐私保护聚类问题研究较少,使用的方法也较单一。而聚类挖掘是分析管理问题的重要方法之一,常应用于市场细分、客户分类、模式识别、Web文档分类与制造系统单元化设计等重要领域。通过对目前已有的隐私保护聚类挖掘方法进行深入地研究分析后发现,几何数据转换方法应用最为简单且不影响挖掘结果的准确性,但是隐私保护度较低。为了解决已有的几何数据转换方法隐私保护度低的不足,本文分别提出了基于平面反射的几何数据转换方法和随机响应几何变换算法。基于平面反射的几何数据转换方法,即任意选择平面上的一条直线,且将所有属性两两配对以构成平面上的点,对每个点作关于直线的对称点,所得数据即转换后的数据。通过实验证明,这种方法简单易行且比平移、缩放、旋转等几何数据转换方法具有更高的隐私保护度。为了进一步提高隐私保护度,本文又提出了随机响应几何变换算法。该算法将随机响应技术与几何变换方法相结合,根据随机数生成器生成的随机数的不同,选择不同的几何变换方法,起到了双重隐私保护的效果。实验证明这种算法确实具有较高的隐私保护度,并且是高效可行的。
其他文献
随着Web2.0技术的广泛应用,越来越多的网页文档上留下了用户给出的标签信息。这些附加在网页文档上的用户标签信息是对网页主旨内容的一个高度概括。而目前绝大多数的网页文
无线传感器网络(Wireless Sensor Networks, WSN)是物联网的基础网络,具有非常广阔的应用前景,同时也是科研领域的研究热点。无线传感器网络中关于研究分布式访问控制模块的
Web服务技术和语义网技术是万维网发展的两个重要趋势。Web服务是通过Internet标准技术传递的、松散耦合的软件组件、是在网络上可被访问的程序。随着网络上Web服务数量与种
本文按照某电力呼叫中心系统的监控需求,设计并开发了一套分布式呼叫中心的监控系统,能够利用监控目标系统保存的日志信息获取了目标系统的原始信息,并将获取的信息进一步处
文件传输时间的长短是评判一种传输机制传输效率的直接因素。本文针对如何提高大数据量文件的传输效率提出了一种新的传输方式。目的是为了缓解文件传输时网络发生拥塞或因带
近年来,海量视频数据的出现给视频存储以及视频内容分析带来较大的挑战。在视频内容分析中,目标通常是我们关注和研究的重点,如何将这些感兴趣的目标从背景中分离出来,是计算
随着软件技术的发展和软件规模的不断扩大,传统软件开发方法存在的先天不足开始显现出来。软件管理专家根据不同的实践经验加以总结,在原有模型的基础上提出了模型驱动架构、
图像在实际获取的过程中,由于天气、个人的拍摄水平、相机的因素、光照以及相机与被拍摄物体之间发生相对运动等原因导致图像模糊。有效地提取出局部模糊图像的模糊区域,可以
热红外图像与可见光图像融合是计算机视觉领域的一个基础问题,它采用一些算法提取出不同波段图像的特征,将它们融合在一起,使得融合后的图像更加清晰、信息更加全面,更便于人
随着信息技术的迅速发展、经济全球化趋势不断地加剧以及企业客户需求的不断变化,企业对加强技术的改进、提高管理的创新和提高竞争力提出了十分迫切的需求。然而企业生产管理的核心是生产计划调度问题是否能够获得优化解,因此,多年来,优化调度方案的研究一直是国内外许多学者们的关注热点。考虑调整时间的调度问题是指当设备加工不同工序时,设备需要进行自身调整,调整时间不仅与当前要加工的工序有关,而且还与之前加工过的工