基于HDFS小文件处理的安全存储系统的设计与实现

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:blyd831104
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络建设的不断发展,数据正在呈爆炸性的增长,如何管理这些海量数据成为了一个研究的热点和难点问题。Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)是主要用于存储大文件的云存储系统,小文件存储的支持尚不完善,但现在网络中存储以及传输的数据大部分都是小文件,这便导致了系统的存储瓶颈问题。除此之外,网络中的安全事故也频频发生,究其原因还是云存储系统的安全性工作尚不完善。针对以上的问题,对HDFS的存储和数据面临的攻击方法进行研究,分析了HDFS存储数据的优势和劣势以及安全性问题。通过对HDFS小文件存储和高级加密标准(Advanced Encryption Standard,AES)的深入研究,设计和实现了一个具有数据保密性、支持海量小文件高性能存取且易扩展的云存储系统。论文的主要工作如下:(1)优化HDFS小文件处理方法。对国内外关于HDFS小文件问题的解决方案进行分析,总结其中的优点及不足,提出了小文件处理模块的概念。该模块由文件判断、文件合并和文件索引三部分构成,实现了小文件分批处理、集中合并的功能;将索引记录与数据库动态连接,避免了与HDFS多次连接而导致不必要的消耗;采取预取和缓存技术进一步提高了文件的访问速度。(2)优化AES算法。由于AES算法的加解密原理是公开的,针对AES算法的原理,在加密过程和解密过程进行优化。通过加解密过程相关步骤的合并及重新排序,对加解密过程进行优化,提高算法的处理速度。(3)将身份认证机制、优化的小文件处理方法、改进的AES算法和混合加密思想有机组合,设计并实现支持海量小文件存储并且安全的HDFS系统。该系统在身份认证方面采用哈希函数,保证了密码的安全;使用小文件处理模块对上传的文件进行处理,节省了NameNode的内存空间,并提高了文件的读取速度;使用改进的AES算法进一步加强了数据的安全性;将改进的AES算法和RSA算法结合使用,这种混合加密方式提高了文件的传输速度和密钥的安全。
其他文献
2019年5月15日-17日,首届全国机械手表维修工职业技能竞赛启动会议在中国钟表协会召开,会议由中国钟表协会秘书长李夏主持,中国钟表协会理事长张宏光先生出席会议并宣布首届
天气预报系统对模式本身的误差非常敏感,尤其是次网格物理参数化过程的不确定性对天气预报系统的准确性具有重要影响。由于风暴尺度系统时间尺度较小、发展剧烈以及高度非线
针对合成气变换工序在线水汽比及在线变换率分析仪存在的仪器费用高、维护难度大、维护费用高的问题,提出了1种水汽比和变换率计算方法,以此植入计算机,可实现在线显示,而无需投
对高职音乐表演专业就业现状进行了分析和总结,并针对现状提出了一些改进的意见和建议。
侗族以建筑艺术见长,并且具有独特的民族特色。侗寨的鼓楼、风雨桥结构精巧,形式多样,最为引人注目,十分具有代表性。该文作者通过研究五溪流域侗族鼓楼、风雨桥,探寻其对中
目的探讨妇科恶性肿瘤并发多原发癌的发病特点及治疗与预后。方法回顾性分析18例多原发恶性肿瘤患者的临床及病理资料。结果平均年龄55.9岁,同时癌6例,异时癌12例,18例均进行手术
本文介绍一种由微机和单片机构成的汽车轮胎自动充气系统的控制技术.该技术主要采用MAX232SE芯片作为接口电路转换的关键部件,实现微机的RS232C串行接口和89C52单片机的UART
抑郁是一种心境异常低落、不愉快的负性情绪状态,个体长期处于抑郁状态,会导致心理障碍的发生。有学者指出,抑郁在正常人群中的发生率,呈不断增长的趋势,成为21世纪影响人类
对前南峪旅游资源进行了定性和定量的评价,结果表明,前南峪旅游资源丰富,气候适宜、空气负离子含量高,交通便利特点。对抗大观瞻区、生态观光区、化山览胜区三大景区的景观价值特
经对农户走访调查及对调查结果的详细分析,结合我市2014年全市农作物种植情况及化肥使用量,分析了目前我市化肥施用中存在的问题及原因,并围绕到2020年实现化肥使用量零(负)