【摘 要】
:
Hadoop作为典型的开源分布式数据存储处理框架,已成为商业化处理大数据的工具之一。Hadoop平台的应用与发展面临着诸多问题,其中Hadoop安全已成为关注的重点。Hadoop平台在数据分布式存储和并行处理过程中存在着一些安全漏洞,恶意用户利用安全漏洞获取数据或针对平台进行攻击,威胁着存储在平台的敏感数据和个人隐私。本文针对Hadoop平台的安全威胁与安全机制进行了分析与研究,主要的工作如下:(
论文部分内容阅读
Hadoop作为典型的开源分布式数据存储处理框架,已成为商业化处理大数据的工具之一。Hadoop平台的应用与发展面临着诸多问题,其中Hadoop安全已成为关注的重点。Hadoop平台在数据分布式存储和并行处理过程中存在着一些安全漏洞,恶意用户利用安全漏洞获取数据或针对平台进行攻击,威胁着存储在平台的敏感数据和个人隐私。本文针对Hadoop平台的安全威胁与安全机制进行了分析与研究,主要的工作如下:(1)针对当前Hadoop已有的安全机制和安全组件,围绕身份验证、授权、加密和审计四个方面进行分析,同时分析了Hadoop平台可能遭受的网络攻击方式并针对性地提出攻击检测方法。(2)根据核心组件HDFS的结构特性分析在未施加安全机制情况下可能存在的安全威胁,针对HDFS透明加密技术提出了一种优化方案。该优化方案主要对密钥管理服务器KMS进行安全设计以确保HDFS和KMS的数据安全。安全设计通过添加混合式身份认证机制对身份进行验证;在各端添加接口以减轻KMS实现HTTPS安全传输后的密钥管理负载,进而加强对密钥的保护;设置ACL访问控制列表实现用户的细粒度访问授权。实验设计并实现所需安全功能,通过安全性分析证明此方案对KMS和HDFS数据的安全保护。(3)根据核心组件Map Reduce的结构特性与数据处理机制分析未施加安全机制情况下存在的安全威胁,提出了一种基于Salsa20的Map Reduce并行加密方案。此方案是Map Reduce任务通过对存储在HDFS中的数据进行处理,在数据到达Data Node进行存储之前使用流密码算法Salsa20对数据块进行加解密操作,而非对整个文件加解密,由并行处理特性达到并行加解密的效果,进而提高数据处理性能。通过编程实现并行加密系统,系统主要分为加密模块、解密模块和算法模块,Salsa20写入算法模块中等待加密模块或解密模块调用。此并行加密系统的加密算法并不局限于Salsa20,可根据需要自行添加加密算法,极具灵活性和可扩展性,根据实验及数据对比分析,基于Salsa20的并行加密系统可在保障Map Reduce数据安全的同时确保数据处理效率。
其他文献
脉冲神经膜系统(SNP)是一种受生物神经元以脉冲的方式传递信息的机制启发设计的神经计算模型,属于第三代人工神经网络。SNP应用潜力巨大,研究SNP的学习算法可以构建一个机制更加符合人脑模型的学习框架,但是将其应用在模式识别领域一直是一个未被完全解决的公开问题。本文以数值型脉冲神经网络为出发点,结合SNN中的成熟的学习算法、网络结构,以及马尔可夫决策过程的思想和强化学习方法,设计了两类数值型SNP学
云南电网与南方电网主网异步联网后,外送直流容量远远大于本地负荷水平,水轮机组占总装机70%以上,部分电网发电机组惯性降低,直流闭锁故障往往产生系统有功功率的不平衡,极易发生超低频振荡,云南电网中功角稳定问题转换为频率稳定问题。为了提高主网对云南电网频率稳定性的辅助调节作用,实际工程建设中在直流送端系统中加入频率限制控制器(FLC,Frequency Limit Control)与一次调频协调作用,
图像分割是一种关键的计算机视觉技术,其将图像的像素分为不同的具有区别性事务的块。多层次图像分割是图像分割方法的一种,可捕获目标的所有尺度,故被广泛运用到语义分割和区域建议生成等计算机视觉场景。多层次图像分割的结果可表示成树形结构,图像中目标根据分割粒度不同,分布在树中不同层次。尺度感知是从目标的多个分割尺度中捕获其合理分割尺度,是多层次图像分割方法实现图像分割的关键。本文基于已有多层次图像分割方法
20世纪20、30年代的摩登上海,是中西文化的交流场域,书籍设计作为一种文化载体不仅反映了时代的审美,更是成为那个时代的文化表征。文化的大熔炉也为中国现代书籍设计提供源源不断的创作资源,而叶灵凤作为那个文化场域的跨文化译介者,在受到从清末到民初繁杂的文艺思潮影响后,所做的书籍设计也成为了那个时代的表征。就将西方元素本土化的这一创造性过程,叶灵凤承担了一位审美现代性与启蒙现代性的推者,其创造性不仅在
网络是一种有用的模型工具,许多现实中的复杂系统都可以借助网络模型来进一步研究。社区是网络中一种重要的结构性质,它是由网络中联系紧密的节点构成的集合。同一个社区内的节点具有某种共性,因此社区体现了网络的局部特性,能够帮助人们挖掘和分析网络中所蕴含的知识。社区发现是检测网络中社区的主要方法,然而网络往往规模庞大且结构复杂,社区间的分界线不明显等为社区发现带来了巨大挑战。为了解决这些问题,本论文从重叠和
轻型载货汽车在城市道路的公路运输中扮演着重要角色,而与此同时,消费者对载货汽车的品质有越来越高的要求,消费者越来越关注汽车行驶的平顺性与舒适性,使得车辆的振动性能成
乳腺癌是全世界范围内威胁女性健康最主要的癌症之一,而超声(US)是乳腺结节的主要影像学检查和术前评估之一。然而,在超声诊断领域,由于良性和恶性乳腺结节图像的相似表现形式,这使得诊断结果在很大程度上依赖于医生的经验判断。而且具有不同资历的医师的诊断准确性相差高达30%,因此,很容易导致误诊并增加不必要的穿刺活检率。近年来随着计算机科学的不断进步和医学方面的数据集的不断丰富,计算机辅助的医学诊断逐渐成
随着信息时代的不断进步以及电子产品的全民化普及,网络上代表着用户情感和观点的短文本内容呈现爆炸式的增长,传统的基于深度学习的中文情感倾向分类方法无法完全挖掘出这些评论的商用价值。为此,本文研究了中文评论短文本的情感倾向以及与互动率的关系,并设计实现了一个评论情感倾向与互动率预测系统。本文针对电影新闻相关的在线短文本评论数据,首先提出了一个基于LSTM的前融合情感倾向分类模型PF-LSTM,实现了不
目标跟踪作为计算机视觉领域的重要分支,已经广泛应用于智能视频监控、自动驾驶、军事侦察、医学诊断等领域。传统的目标跟踪算法在面对目标快速移动、模糊、物体形变、光照变化等复杂场景的时候,有着很大局限性。随着深度学习的发展,一系列基于深度学习的目标跟踪算法逐渐被提出,这些算法凭借着卷积神经网络强大的特征提取能力,极大地提高了目标跟踪的精度,在面对复杂场景时也有着更好的鲁棒性。但是基于深度学习的跟踪算法网