基于学习代价的存储结构自动选择系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:haofei88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据库系统的设计中,数据表的存储结构在理论上决定了数据访问过程的复杂度,因此对数据表存储结构的选择是由系统所面向的工作负载决定的。如对于高写入负载,基于LSM存储结构的数据库系统较传统数据库有更强的性能表现,而对于分析型负载,基于列式存储的数据库系统可以在更短时间完成大型查询。但是在混合负载中,数据表的不同水平分区上需要处理的负载不同,并且同一分区上需要处理的负载可能发生变化,这也导致了不同数据表分区下的最优存储结构在持续变化。过去使用静态存储结构或者由人工方法调整存储结构的方法不能够实现对存储结构的充分使用,因此本文提出了一个基于学习代价的存储结构自动选择系统。该系统解决了对多引擎数据库下存储引擎的选择问题,以及针对工作负载的数据布局选择问题。除此之外,本文还提出了基于机器学习的,用于跨存储引擎进行代价比较的代价模型,并提出了用于建立该代价模型的数据库性能测试流程。实验结果表明,基于学习的代价模型可以对跨存储引擎的操作性能给出较为准确的估计。在使用TPC-H公开测试集上,事务型数据分区和分析型数据分区中自动选择得到的存储结构较静态存储结构总体查询时间降低了约35%。因此在分析型负载和事务型负载对数据的访问相对分散时,本系统对查询的总体时间有较大提升,并且过程中无需人工干预。
其他文献
自动驾驶车辆的路径跟踪控制技术是自动驾驶技术中的重要组成部分,而车辆的横向路径跟踪控制技术作为路径跟踪控制的关键技术,逐渐成为专家和工程人员追逐的研究重点。本文针
背景:肺动脉高压(Pulmonary artery hypertension,PAH)是一类严重的心肺血管疾病,临床麻醉风险很高。肺血管重塑和肺动脉平滑肌的过度增殖构成肺动脉高压的重要病理特征。研究提示肺动脉平滑肌过度增殖和肿瘤存在相似性,目前细胞周期蛋白依赖性激酶9(CDK9)是重要的抗肿瘤靶点,但是CDK9在肺动脉高压中的作用目前尚不清楚。目的:探究肺动脉高压中CDK9在肺动脉平滑肌中的表达改
随着内燃机强化指标的不断提高,内燃机零部件,如气缸盖、排气歧管等面临的热机疲劳导致失效问题越来越突出,在设计阶段选择合适的材料,可以有效地提高构件的抗热机疲劳能力。目前选材依据通常是根据材料标准试件的热机疲劳试验(TMF)结果,该试验对不同材料的标准试件施加相同的温度循环载荷及应变循环载荷。但是这种方法忽略了一个事实,即在相同工况下,不同材料承受相同热通量时,由于材料的弹塑性及物理特性(导热系数、
第一部分白杨素抑制炎症状态下内皮细胞粘附分子的表达目的目前发现血管内皮炎症的发生与多种血管疾病如动脉粥样硬化、血栓闭塞性脉管炎、糖尿病血管病变等等密切相关。黄酮类化合物被证明能有效预防动脉硬化、降低血脂和胆固醇、及减少冠心病发病率等。然而黄酮类化合物在内皮炎症方面的研究较少被提及。本实验旨在探究一种黄酮类化合物即白杨素(Chrysin)对内皮细胞炎症的影响及对粘附分子的表达。方法将原代人脐静脉内皮
随着社交媒体的发展,用户在社交平台发表自己的观点已成常态。如何有效地利用这些平台的数据一直是自然语言处理研究中比较火热的话题。其中,利用评论文本来进行情感分类则是
双馈感应发电机(Doubly Fed Induction Generator,DFIG)具有变速恒频运行、控制性能灵活以及发电效率高等特点,得到了十分广泛的应用。由于我国风能资源与负荷中心在空间上具
随着半导体制造工艺进入亚微米级以后,静电放电(ESD)已成为集成电路可靠性问题的主要因素。为避免芯片内部电路受损和发生闩锁现象,ESD设计窗口也随着工艺的发展而不断缩小,
视觉目标跟踪是计算机视觉研究中极其重要并极具挑战性的工作之一,广泛应用于智能视频监控、无人驾驶、运动分析、服务机器人等众多领域。当前的机器人应用背景中,通常采用单
C.S.路易斯是20世纪英国文学界和神学界的重量级人物,他身兼作家、文学批评家和基督教护教学家等多重身份。他批判性地指出,文学批评不能离开客观价值之道,道之不存,批评无根。本文拟在文本细读的基础上,简要勾勒路易斯文学观研究的三个向度——道,阅读和批评。论文由绪论、三章正文和结语三部分组成。绪论部分概述了 C.S.路易斯的生平、学术、信仰等基本情况,在梳理国内外学界相关研究的现状及存在问题的基础上,
股指期货是以股票指数为标的金融期货产品,是我国金融市场的重要组成部分,在发挥价格发现、对冲股票风险等作用的同时,极大丰富了金融投资者的投资渠道,影响了投资者的投资策略。股指期货独有的做空机制在金融市场中起到了重要的作用。目前在股指期货价格预测方面经常使用的方法包括传统的时间序列预测方法,如:ARIMA、GARCH等;神经网络算法,如:LSTM、GRU、XGBoost等方法;或是时间序列预测方法与神
学位