云环境下中间数据集存储问题优化算法研究

来源 :中南民族大学 | 被引量 : 0次 | 上传用户:weiwei00414
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学研究过程越来越复杂,科学计算的步骤越来越繁多,因此云计算平台上运行科学工作流越来越受欢迎。然而,科学工作流在云计算平台上运行伴随着云环境下中间数据集存储问题,该问题本质是代价最小化。科学工作流运行过程中会产生大量含有对于科学家们来说至关重要信息的中间数据集,因此,如何处理这些中间数据集变得尤为重要。云计算平台提供了处理这些中间数据集所需的存储资源、计算资源和宽带资源。然而,用户在享受这些云服务的同时,还需付出存储代价、计算代价和传递代价,因此,怎样让用户高效享受云服务的同时付出较小代价显得尤为重要。目前,云环境下中间数据集存储问题的研究主要集中在以下三个方面:第一、云环境下中间数据集存储问题代价模型优化;第二、单云环境下线性数据流和非线性数据流存储问题算法研究;第三、多云条件下线性数据流和非线性数据流存储问题算法研究。本文研究的主要内容是云环境下线性数据流存储问题代价最小化算法时间效率优化和云环境下非线性数据流中间数据集存储问题代价模型优化,具体如下:(1)阐述云环境下中间数据集存储问题优化算法的理论基础,包括问题定义、代价模型以及对应的中间数据集存储算法,并指出算法存在的问题和研究重点;(2)采用动态规划思想优化多云条件下线性数据流存储问题算法,将时间复杂度由O(m~4n~3)改进为O(m~3n~3);(3)针对多云条件下中间数据集存储问题存在代价模型表达不够全面的问题,通过研读大量参考资料,将数据集的使用频率、用户数据访问延迟容忍度、传递代价有效组合,得出该问题新代价模型,新模型定义数据集的使用频率为更能反映用户的实际需求的高峰期数据集使用频率;(4)在新代价模型条件下,使用贪心策略,提出一个新算法并通过实验模拟结果对算法进行分析,实验结果表明贪心策略对新的代价模型是可行的。论文最后总结本文的主要工作,并且对下一阶段云环境下中间数据集存储问题算法的研究重点进行展望。
其他文献
在互联网飞速发展的今天,人们的生活发生了翻天覆地的变化,传统而保守的金融行业也受到了很大的冲击。P2P网络借贷行业从国外诞生,在国内借贷供需失衡的市场环境下,获得了巨
基于传统Nyquist采样理论,为了保证采样信号的无失真重构,采样信号的频率不得低于信号最高频率的两倍,因此带来许多高速率数据采样的成本增加,同时也导致后续数据存储和传输
科学技术是经济增长的重要源泉,对提高综合国力具有重要作用。企业的技术创新能力是国家科学技术创新能力的重要组成部分,为国家经济发展提供了原动力,是实现建设创新型国家
运动目标检测技术在智能视频领域占有重要地位,在很多领域有着广泛的应用。然而,当前的运动目标检测算法在实际的应用中对于适应复杂的场景方面存在很多不足。因此本文针对运
在我国农地经营细碎化、分散化的格局下,全面推行规模化农业经营显然不适应我国国情,因此,农业机械外包服务体系的形成则成为发展农业现代化的关键,并已经成为国内外众多学者
随着图像处理理论和技术的发展,图像处理在工业、医学和计算机视觉等领域的应用越来越广泛,对于图像处理技术的研究与开发处理中算法稳定性的要求越来越高.图像识别技术和图
背景近些年,我国部分地区陆续发生并报告了些许以发热、血小板减少、腹泻等临床表现为主的感染性的病例,其中,一部分病情较为严重的病例因多器官功能衰竭而导致死亡。2010年5
产业结构优化调整决定了经济发展方式,是我国经济保持持续健康发展的重要内容。收入差距变动作为影响产业结构调整的重要因素,对于两者之间的研究一直是学术界的焦点。文章基
随着云计算技术的飞速发展,云存储成为一种新型存储模式,被普遍应用于企业和个人等领域。然而,当数据由云服务器存储时,数据拥有者将失去管理数据的权限,这有可能会导致恶意
随着智能电网的不断建设,输电线路电压等级越来越高,电网规模日益扩大,跨区域间互联越来越紧密,电网的安全稳定运行变得尤为重要。由于自然灾害、人为误操作等因素,电网故障的发生不可避免,如何在涌入调控中心的众多故障信息中,快速识别出故障元件已成为电网故障诊断的主要难题之一。现有的电网故障诊断研究大多基于保护和断路器动作的开关量信息,而针对此类信息的诊断方法往往要求保护和断路器动作信息具备一定的完备性和准