容器化大数据云平台及其存储与调度技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:aijieyeyi559
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算技术的不断发展与成熟,越来越多的上层应用能够通过云计算虚拟化技术来实现底层物理资源的管理与弹性伸缩。传统的虚拟化技术通常以虚拟机为单位,存在资源利用率低、启动速度慢、运维成本高等问题。因此,以Docker容器技术为代表的轻量级虚拟化容器技术受到了学术界与工业界的广泛关注。除了单个容器技术之外,容器集群管理系统在实际综合性应用中也非常重要。Kubernetes是Google内部经过数十年生产实践考验的容器集群管理系统Borg的开源版本,使用Kubernetes对Docker容器集群进行统一管理能够为容器化应用提供资源调度、自动化部署、服务发现、弹性伸缩等功能。大数据并行计算是云计算平台中的典型应用场景。在当今数据量急剧增长的时代,大数据并行计算系统如Hadoop、Spark等在工业界和学术界被广为使用和研究。当前大数据并行计算系统种类繁多且适用场景多样,因此将大数据系统和应用部署在云平台中,实现大数据与云计算平台的融合与集成使用,具有多租户资源共享、任务弹性调度、方便运维、资源利用率高等优点。而传统的虚拟化方式难以满足大数据综合部署应用场景的需求。将大数据并行计算系统部署构建在基于Docker+Kubernetes容器云平台中,能够有效解决传统云计算平台在大数据场景下资源利用率低、启动速度慢、运维成本高等方面的不足。但是,集成和部署容器化大数据云平台在提供众多优势的同时,也带来了数据分布式持久化难以处理、数据本地化调度性能低下等存储与调度方面的问题。针对上述问题与不足,本文研究容器化大数据云平台集成技术,研究构建基于Docker+Kubernetes、融合Hadoop+Spark的容器化大数据云平台。本文的主要工作和贡献点如下:(1)容器化大数据云平台技术研究,在此基础上研究构建基于Docker+Kubernetes、融合了 Hadoop+Spark的容器化大数据云平台。基于Docker容器技术,使用Kubernetes进行统一管理,可将多种大数据并行计算系统和应用部署构建在云平台上,以实现自动化部署、在线扩容缩容、应用滚动升级等功能。(2)YARN和Kubernetes双层调度机制研究。为了提高云平台在大数据场景下的调度效率,研究实现一种YARN和Kubernetes的双层调度机制,并基于cAdvisor、Docker Registry、Zeppelin等开源软件,在集群监控、镜像存储、可视化等方面对平台功能进行扩展。(3)基于Push模型的YARN本地性优化调度方法研究。在分析总结YARN现有调度机制及其数据本地性调度影响因素的基础上,针对YARN现有调度机制在内存计算场景下数据本地性调度能力不佳的问题,研究提出一种基于Push模型的YARN本地性调度机制,并进一步研究实现一种Resource Request剪枝算法。实验结果表明,该调度机制在数据本地性、应用运行时间、吞吐量方面,相比YARN的现有调度机制,均有较大的性能提升。(4)基于Alluxio的统一数据存储访问技术研究。基于Alluxio统一命名空间,研究实现云平台统一数据存储访问技术,在解决云平台数据分布式持久化问题的同时,简化容器化大数据云平台底层文件系统的管理。同时,研究实现一个以目录为单位的CacheList方案,提高了 Alluxio中间结果缓存访问效率。本文研究工作中的YARN本地性调度优化以及CacheList缓存优化工作,已经部署使用于苏宁云商的大数据云计算系统平台中,并得到上线运行服务。
其他文献
动作识别作为人体运动分析研究的重要组成部分,在生活中的应用已经随处可见,如人机交互、视频监控等。由于人体的动作存在非刚性的特点,因此在不同的环境或条件下各种动作所表达的含义是完全不同的。由于存在同一个动作表达的含义差异较大或者不同动作表达的含义相同或相近的问题,因此人体动作检测、识别所面临的困难往往比其他目标检测和识别大得多。本文首先在视频中检测人体目标,然后分析目标以实现分类效果。本文研究的主要
党内问责是执政党建设的重要内容,是实现全面从严治党的利器。进入新时代以来,党内问责制度建设取得重要突破,党内问责实践探索已有长足进展,但对党内问责思想的研究滞后于党
由于氮化镓(GaN)具有宽禁带宽度、大击穿电场、高电子迁移率、强抗辐照能力等优异的材料性能,非常适合制备在极端条件下工作的高频、高压、高功率电力电子器件,如AlGaN/GaN异质结高电子迁移率晶体管(HEMT),在新能源汽车、5G通讯、激光雷达等行业具有重要的应用前景。然而,GaN基HEMT器件却面临严重的电学可靠性问题,如:高温退化效应、栅漏延迟效应、kink效应、动态电阻增大效应等,不利于其大
本文以摩尔真实游戏的理论为基础,对民间影像进行研究,通过实地调研、文献整合、案例分析等方法进行研究,通过梳理发现,我国当下民间影像的数量庞大,但是相关研究较少。因此,
BFe10-1-1白铜管因具有良好的耐蚀性能而在海洋工程中应用广泛,如大型的军舰、轮船的研发需要大量的大口径白铜管。扩径拉拔是生产大口径白铜管的常用工艺方法,但BFe10-1-1白
人体动作分割和识别是人体动作分析的重要组成部分。虽然目前已经有了许多研究,但是人体动作分割和识别仍然存在着挑战性。例如,大多数基于无监督学习的人体动作分割方法存在
本翻译报告选取英国著名历史小说家瓦尔特·司各特所著小说《盖·曼纳令》作为翻译文本,对其中的引言和编者前言部分进行了英译中的翻译实践。《盖·曼那令》又名《占星师》,
本文阐述了设计要素在教育信息可视化中的应用以及设计要素要与创作相结合,并且认为设计者在教育信息可视化的设计时应该从设计要素中的人性化要素、信息定位要素、视线流动
得益于计算机技术和网络媒介的迅猛发展,数字科技广泛的应用于各行各业。本文通过研究,以中国画《嘎仙洞的故事》为背景,鲜卑族对中华文化的影响为基点,探索运用现代手段,将
从理论上,商标专用权与商标禁用权作为维护不同商标权之间平衡的两个“砝码”,本应当在商标权的体系中“和平相处”,不会互相重叠与冲突。但在现实中,由于商标禁用权界限的模