面向外包服务的关联规则挖掘隐私保护方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:lgkenny1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会,随着科技水平的不断提升,信息技术和数据库技术也得到了飞速发展,许多企业或组织都囤积了大量的数据,如何从这些海量数据中获得有用的信息,已经引起了广泛的重视。数据挖掘的最终目标就是从海量数据中挖掘出隐藏的、有价值的信息和相关知识。数据挖掘在商业决策、市场分析等领域的作用已经越来越明显和重要。数据挖掘虽然能给相关企业或组织带来丰厚的回报,但是其本身对软件和硬件环境要求很高,对于那些资源相对缺乏的企业或组织来说,将这项工作外包给专业的服务机构,是一个不错的选择。然而,这样必然会涉及到信息及隐私的安全问题。因此,原始数据在外包给专业机构进行挖掘分析前,需要对其进行变化处理,这样才能对隐私进行较好的保护。本文主要研究外包关联规则挖掘中的隐私保护问题,相关工作有:①学习探讨了一般关联规则挖掘隐私保护技术,对几个典型的方法进行了总结,分析了其优点和不足。②对外包环境下的关联规则挖掘隐私保护技术进行了研究,分析了其基本要求及与非外包环境下的隐私保护方法的不同之处,给出了外包关联规则挖掘隐私保护算法的基本流程。③对现有的几种外包关联规则挖掘隐私保护方法进行了深入学习,分析了其优点和不足。对基于布隆过滤器的外包关联规则挖掘隐私保护算法提出了两种改进。改进方法一,采用了独立映射空间的布隆过滤器和可逆的地址映射函数,将原始事务数据库变换成布隆过滤器的形式,然后按照转换过后的每个事务记录的布隆向量的汉明重量进行事务压缩,并利用矩阵列向量进行“与”运算,计算候选频繁项集的支持度,从而得出频繁项集。实验结果证明,该改进方法具有良好的可逆性,并使时间效率大幅提高。改进方法二,同样采用独立映射空间的布隆过滤器,还是采用原算法中的hash不可逆地址映射函数,同时对还原所需的映射表进行了重新编排。该方法大大缩小了算法的存储空间,减小了开销。④分别采用模拟数据集和真实数据集对两种改进方法进行验证。通过实验结果得出,两种改进方法均能达到很好的效果,更能有效应用于实际。
其他文献
在市场经济和网络条件下,高校马克思主义理论教学面临前所未有的挑战。为保有马克思主义理论应有的生命力,提高马克思主义理论教学的实效性,高校马克思主义理论教学必须适应
文化是各民族智慧积累的结晶,非物质文化遗产是历史长河中留下的不可再生资源,承载着人类的精神与意志,同时也见证者时代的兴衰、发展与演变。此研究以国情发展和思想政治方
基于盾构掘进的已有历史数据,建立数据库对盾构掘进数据进行管理,分析挖掘影响盾构姿态的主要因素,并得出地质条件与盾构掘进千斤顶推力之间的关系,更有效地实现盾构的姿态控
梨树沟地处祁连与北秦岭结合部位的娘娘坝-太阳寺反"S"构造带东段,属于甘肃东南部构造岩浆岩发育区的一部分。区域上金矿床(点)成群成带分布,其中李子园群为北秦岭最重要的含
随着社会的不断发展,人们的生活水平和物质需求有了明显提升,对于居住环境的需求上人们不再是强调舒适性和居住空间,人们更多的是追求大自然绿色生态景观,认为身处于自然环境
幼儿园教师不仅需要掌握渊博的学科知识、精湛的教学技能、生动的教学方法,而且更需要拥有"精神"的成长。文章提出,与知识、技能、方法相比,应更看重幼儿园教师是否能给予儿童
从满足加工所需的功能进行分析,有针对性对数控车床进行改造。在不改变原有功能的基础上,增加了铣削功能,实现三轴联动和闭环控制。同时对运行中出现的问题,提出改进措施,并
文章选取了三种比较常见的幼儿园教育场景,联系具体的情境,解析其中的教师指导行为的意义。研究发现,在"问候"场景中,幼儿的交往被形式化,教师的指导行为实用场面控制;在"创造"场
绿地规划是园林景观设计的一个重要的部分。工程团队进行合理地绿地规划,对有效进行城市中所排放的碳的降解具有积极作用,从而提升城市的宜居程度,并为居民带来更加舒适的生
当前随着各行各业的发展以及社会经济体系的进步,人们越来越重视物质和精神方面的双重追求,进而对城市中园林绿化工程的建设提出严格要求,也带来了一定的挑战。随着城市规模