保护隐私的决策树算法的研究

来源 :兰州理工大学 | 被引量 : 1次 | 上传用户:dolan525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,数据挖掘技术已经被广泛使用到包括金融、医学等的各个领域。虽然利用数据挖掘技术得到的规律和模式对我们后来的工作起到了有效的指导作用,但是,也给我们的生活带来了其他的问题,这当中被人们广泛关注的就是隐私的泄露。就数据挖掘技术而言,隐私包括两个方面的内容,一个是挖掘技术作用的原始数据;另一个则是从原始数据中挖掘出来的有价值的规律。目前,保护隐私的数据挖掘主要从两个方向进行研究,数据变换和密码学方法。第一种是改变原始数据,通过添加噪音或者随机改变数据来隐藏原始数据,该方法主要用于集中分布的数据;第二种是对原始数据及中间计算结果进行加密,主要用于分布式数据挖掘。本文提出了一种决策树改进算法,该算法利用原始数据构造属性间单步转移概率矩阵,并且在单步转移概率矩阵的基础上,根据构造决策树过程中需要的属性自行计算属性间联合概率,使得决策树构造算法在计算信息熵的时候不用从原始数据中统计获得概率。并且该算法改进了决策树创建叶节点的条件,从而决策树不会用尽所有的候选属性才停止构造,这就消除了没有原始数据造成的影响。由于属性问联合概率矩阵是通过单步转移概率矩阵计算得到的,因此其结果会与从原始数据中得到的结果有差异,而且终止条件的改进也会影响决策树的准确性,但是实验证明,由此差异造成的最终决策树同样会有较高的分类精度,能够达到应用的要求。这样既可以有效的保护原始数据,又没有降低决策树的分类精度。
其他文献
期刊
本文基于IEEE 802.16e标准,对移动WiMAX系统中的同步技术进行了深入的研究。论文给出了一个完整的同步解决方案,该方案涵盖了上行和下行同步的各个技术细节,其中下行同步方案包
无线通信技术的不断进步给人们的生产和生活带来了极大的便利,促进了社会的繁荣和发展,使人们的沟通方式变得越来越简单,越来越便利,促进了人与人之间更加频繁的沟通交流。但
本文对光纤光栅传感技术及其理论进行了系统的研究,提出了基于超结构光纤光栅的传感器在油气井中进行压力、温度测量的方案。系统分析了影响超结构光纤光栅光谱的各种参数,并
合成孔径雷达(SAR)作为一种有源微波遥感技术,具有全天候、全天时的工作能力。它可以在不同频段和不同极化下得到目标的较高分辨率图像,在军事应用和国民经济的各个领域中表
期刊
期刊
基于通信的列车控制系统(CBTC)采用先进的通信、计算机技术实现地面控制系统和列车信息的双向传输,可连续控制和监测列车运行。CBTC系统通常采用IEEE802.11无线局域网技术实
期刊
肝癌是我国最常见的消化道肿癌之一,严重威胁着人类的生命和健康。如何有效地提高肝癌的诊断和治疗,进而最大限度地降低病死率,已成为医学临床应用所面临的一个急需解决的问