基于隐私保护的关联规则挖掘研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:B511B500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术、网络技术、数据存储技术和高性能处理器技术的快速发展,数据的收集和管理变得越来越方便。数据挖掘技术可以从收集到的大量数据集中挖掘出潜在的知识,这就可能把涉及到个人隐私的信息挖掘出来,从而产生了隐私保护下的数据挖掘。 首先阐述了数据挖掘的基本理论和隐私保护关联规则挖掘的国内外研究现状,然后从输入隐私和输出隐私两个角度对隐私保护关联规则的挖掘方法进行了研究。 输入隐私方面研究了国外学者提出的MASK算法和对MASK算法进行改进的EMASK算法,MASK算法估算n-项集真实支持度需要计算CT=M-1CD,其中M是阶数为k(k=2n,n=1, 2,3…)的概率变换矩阵,计算M-1的时间复杂度为O(k3)。本文将分治策略运用到MASK算法,提出了改进的MASK算法,提出了递归计算2”阶M-1的方法,计算M-1的时间复杂度仅为O(k),比原MASK算法计算M-1的时间复杂度提高了两个数量级。实验结果表明改进的MASK算法时间效率比原MASK算法有了提高。在不考虑空间开销的前提下,本文又将分治策略运用到EMASK算法,提出了改进的EMASK算法。EMASK将n-项集对应的M从2n阶降维到n+1的阶数,计算该n+1阶矩阵M-1的时间复杂度为O(n4)。改进的EMASK算法仍然认为M是2”阶的,提出了计算M-1的递归方法,时间复杂度为O(2n)。理论分析表明在项集n较小时,改进的EMASK算法计算n-项集对应的M-1时间复杂度比原EMASK算法低。实验结果表明本文对EMASK算法的改进是有意义的。 从输出隐私的角度研究了保护敏感规则的关联规则挖掘方法,给出了保护敏感规则的三种算法并分析了算法的时间有效性。
其他文献
背景差分是目前视频领域中运动检测最常用的一种方法,主要思想是比较视频图像序列中的当前帧和背景参考模型来检测目标,但是受内外条件变化的干扰,存在虚警、相机抖动等许多
XML(可扩展标记语言),作为网络上数据表示和信息交换的工具,以其自描述性、独立于平台等特点,已经成为新一代的网络语言。随着XML的广泛应用,XML上的索引及其相关技术的研究
研究的目的是建立一套自动化程度高、技术先进的玻璃瓶在线检测系统。该系统要求实现两个基本检测功能:玻璃瓶直径测量和模号识别。在对尺寸测量和模号识别的相关技术深入研
勘探生产门户是用微软企业信息门户解决方案实现的。随着门户文档的上载,门户内目前各类文档数达到了53733个,勘探生产公司领导和员工提出了准确、快速地检索到这些文档的要求,
数字图像修补,是利用受损区域周围的图像信息给受损区域填充信息的一门技术,本质上是一种图像插值问题。它属于图像复原的研究领域,是图像处理领域的一个分支。在多余物体的剔除
Shor于1994年提出多项式时间内求解大因数和离散对数的量子算法,使得目前使用的基于大因数分解困难性提出的RSA公钥密码体制可以被量子计算机快速破解:Grover提出量子搜索算法,
手写数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。由于阿拉伯数字的世界通用性,并且数字的识别和处理也常常是一些自动化
随着科技的进步以及人们生活节奏的加快,智能化的生活已经逐渐取代原有的生活方式。电力技术的发展也进入了智能电网时代。针对早期的电力系统,智能电网通过完全自动化的,基
XMPP协议作为即时通信领域的开放标准,有着良好的开放性和扩展性,但其核心协议只是即时通信所需的最小完备集,而已有的扩展存在不少缺陷,主要表现为:消息确认机制低效,XMPP协
P2P网络具有高可扩展性、健壮性、自主性等优点,被广泛应用。结构化的P2P数据管理系统具有结构化P2P网络的优点,可以为数据管理用户应用提供具有以上优点的服务。现有的结构