基于RSA隐私保护的分布式关联规则挖掘方法研究

来源 :桂林理工大学 | 被引量 : 0次 | 上传用户:w818150
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络与数据挖掘技术的飞速发展,海量数据的收集,知识“金块”的挖掘变得越来越方便、快捷,这在商务决策、科学以及医学研究等各领域中发挥着积极的作用。然而,在现实中数据挖掘不可回避的一个重要问题是隐私保护,如顾客的购买喜好、病人的电子病情信息、银行卡客户的交易行为等极其敏感信息将会泄露,这些问题的出现向数据共享和传统数据挖掘提出了挑战。在数据挖掘过程中如何解决好隐私保护的问题,已经成为数据挖掘界的一个研究热点。   本文主要研究内容是基于RSA隐私保护的分布式关联规则挖掘方法。传统隐私保护的关联规则挖掘算法主要基于特定的集中式数据库设计,针对分布式环境下的隐私保护关联规则挖掘尚不多见。目前,通常把分布式环境下的隐私保护关联规则挖掘归结为安全多方计算问题,但需要付出高额的计算与通信代价。因此,研究并设计高效隐私保护的分布式关联规则挖掘方法是本文研究的主要目标。   本文主要要研究内容与创新点如下:   1.在深入分析经典Apriori算法基础上,针对Apriori算法瓶颈问题,设计一种改进的关联规则挖掘算法——基于事务相似矩阵的关联规则挖掘ARBSM算法。该算法是在压缩事务布尔矩阵基础上构建一个事务相似矩阵,跨越了从低向高逐阶查找频繁项集的限制,有效地解决了Apriori算法由于逐层搜索的迭代产生大量候选项集的问题。经实验验证该算法具有较好的准确性和效率性。   2.引入密码管理服务器(CMS)和数据挖掘服务器(DMS),构建一个分布式安全体系总体框架,并结合RSA公钥加密和伪随机数生成器技术优势,在ARBSM算法基础上,设计一种隐私保护的分布式关联规则挖掘PPD-ARBSM算法。理论分析与实验结果表明,该算法具有较好的隐私性、准确性和效率性,但同时存在一个明显瓶颈问题:存在大量指数运算,极大影响算法执行效率。   3.进一步优化CMS和DMS功能,构建一个改进的分布式安全体系总体框架,并结合RSA公钥加密和HES同态加密机制的优势,在ARBSM算法基础上,采用密码分级管理机制,设计一种基于RSA隐私保护的分布式关联规则挖掘PPDM-ARBSM算法。它有效地解决PPD-ARBSM算法的瓶颈问题,理论分析与实验结果表明,该算法具有更好的隐私性、准确性性高效性。
其他文献
从古至今,人类从未停止过对美的追求。“什么是美?怎样变美?”一直是美学研究者们探讨的话题。随着计算机图像处理技术的蓬勃发展,用机器来评价人脸美丽程度已经成为可能。在
随着Internet和地理信息技术的快速发展,人们对地理信息系统(GIS)的要求越来越高。网络地理信息系统(WebGIS)作为网络技术和GIS技术的结合点,具有广泛的前景。WebGIS以网络为
.NET Compact Framework是完整桌面版.NET Framework的一个精简版本,它包括完整.NET Framework基类库的一个兼容子集,同时.NET Compact Framework也包含公共语言运行库(CLR)
随着移动互联网的兴起,人们对路径导航的需求越来越高,对基于位置服务的需求更多样化。由于终端的不停移动,基于位置的实时导航对算法性能有着更严格的要求。交通工具的发达,
随着在线数据库应用的流行,整个互联网已经被迅速地“深化”。越来越多的数据以动态生成网页的形式呈现给用户。这些必须通过填写提交查询表单才能访问的网络资源就是所谓的D
支持向量机作为一种机器学习方法,较好地解决了非线性、高维数等实际问题,是机器学习领域的研究热点,为人脸识别提供了一条有效的路径。鉴于样本通常具有模糊特性且分布有稀
手机已经成为人们生活中不可缺少的电子产品。手机功能也在不断的扩展,现在的中高端智能手机集信息通讯、事务处理、娱乐功能于一身,为人们提供全方位的便利服务。手机的普及
传统基于C/S的服务模式,对于视频流媒体这种数据量大的应用,由于服务器有限的服务能力和网络带宽,限制了系统的容量和扩展性。P2P技术可以充分利用网络闲置的带宽资源和客户
随着我国电信产业的高速发展,设备种类与组网方式逐渐多样化,多厂商问题也变得越来越突出。目前,各个厂商都有针对自己设备的网络管理系统,但是这些网络管理系统之间无法提供
近年来,人脸识别技术因具有非侵扰性、采集设备简单等优点而成为当前的研究热点,但人脸的结构比较复杂且会受到表情、光照等很多因素的干扰,导致人脸识别还未取得十分满意的