异构内存文档数据库数据访问路径的动态优化技术

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:shadowhigher
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着需要存储的数据类型不断增多,管理海量非结构化数据的需求不断增加,受限于磁盘的工艺和架构,文档数据库已无法满足数据处理对于及时响应的要求。新型持久内存(Persistent Memory,PM)由于同时具有非易失特性以及近似于动态随机存储器(Dynamic Random Access Memory,DRAM)的快速的读取速度,为提升文档数据库的性能提供了新机会。但直接将传统的面向磁盘设计的文档数据库迁移到持久内存上,并不能明显提升数据库读取关联数据的速度。原因在于:持久化存储设备性能的提升导致在数据库查询操作中,性能瓶颈从持久设备的访问变为频繁的索引查询和内存中的数据移动;此外,持久内存的可直接字节寻址等新特性没有得到利用。针对持久内存文档数据库访问路径的瓶颈,利用基于持久内存的指针转化技术简化数据访问路径,可以避免非必要的索引与数据拷贝。优化策略可以总结为直接读取和数据访问路径的动态选择两个优化技术。直接读取技术将文档持久内存地址直接加入到数据库引用中,简化从文档ID到文档地址的转换过程,从而加速文档访问速度。在文档移动导致混合引用失效时,直接读取技术仍然可以确保混合引用的及时更新和读取数据的有效性。数据访问路径动态选择技术根据程序运行的动态环境,通过动态调整策略确定的阈值,从不同的数据访问路径中选择最佳的读取路径进行数据加载,例如直接从持久内存中以文档粒度加载数据,或以页面粒度将数据拷贝至DRAM后再从DRAM中加载文档。基于OO7标准测试集的实验结果表明,基于直接读取和数据访问路径选择技术开发的持久内存文档数据库PMLite DB,与将持久内存视为磁盘而不利用字节寻址能力的设计相比,实现了平均2.33倍和最高6.18倍的加速比。
其他文献
光纤传感因其灵敏度高、传输容量大、抗电磁干扰等特点,广泛应用于结构监测、医疗诊断、生化检测等方面。光纤布拉格光栅作为光纤传感和光纤通信中应用最广泛的无源器件,其依赖于精确的解调方案探测布拉格中心波长的漂移。现有的光纤布拉格光栅解调方案无法兼具高解调精度、高解调速度、大复用容量,大动态范围、高系统稳定性和低成本等优点。因此,本文提出一种基于热导啁啾和神经网络的光纤光栅解调方案,利用直接调制激光器内部
学位
本文是主要研究中国期货市场处于一个飞速发展阶段,从国家红头文件落实到证监会下达措施,推动期货发展,市场容量赶不上期货公司的设立,导致在市场生存中竞争激烈,主要面临的是期货公司处于强者越强,弱者被兼并的地步,分支机构逐年减少,每家公司营销服务升级,服务成本高但对应的经纪收入低,整体的营销方式大致相同,缺少差异化服务,让期货公司对于赖以生存的收入来源方式--经纪业务和营销模式如何转变成为巨大问题,本文
学位
在党的十八大将可持续发展战略正式列入国家战略后,国家的生态文明建设逐渐进入新时期。作为推动经济增长的主力和环境保护的主体,履行环境责任已然成为企业转型升级的必然要求。虽然环境治理带来的成本支出与企业经营的盈利性目的存在的矛盾导致不少企业缺乏保护环境的动力,甚至牺牲环境以谋求短期的高速发展,但从长远发展的视角来考虑,企业主动积极履行环境责任有利于提升自身价值。诸多学者的研究表明,企业内外部的各种因素
学位
随着混合所有制改革的不断深化,我国混合所有制改革的双向性日益凸显,民营企业逆向引入国有投资者的案例越来越多,实务界甚至出现了“国进民退”的讨论。学术界普遍认为外部民营投资者的引入对国有企业僵化的治理结构具有“鲶鱼效应”。那么,外部国有投资者的引入对于民营企业是否也同样具有积极效应?这种积极效应又是如何实现的?本文以此为切入点,对民营企业逆向混改中的控制权配置问题展开研究,试图从控制权配置与运用的角
学位
自2013年场内股权质押市场的开放以来,股权质押以其低门槛、低成本、高效率等优点深受股东喜爱。控股股东的股权质押融资不但可以反哺企业,为企业带来充足资金,还会加剧代理问题,加大控制权转移风险。随着经济全球化、经济金融化的风靡,金融投资广受逐利资本所偏好,实体企业“脱实向虚”现象显著。因此,研究控股股东的股权质押行为是否会影响企业金融化发展十分必要,厘清其中内在的影响路径也具有重大现实意义。回顾国内
学位
2015年,在股价大幅下跌的背景下,为了稳定公司股价,向投资者传递积极的信号,资本市场出现了一种特殊的增持方式——兜底式增持。兜底式增持与传统的由大股东直接进行增持不同,一般由上市公司大股东作为倡议人,倡议员工进行股票增持。这种增持方式以低资金成本、流程简便等优势为各大板块、各大行业的上市公司所“青睐”。近年来,由于兜底式增持的相关法规还未完善,一些上市公司实施的兜底式增持变成了一种“忽悠式增持”
学位
随着人工智能技术的发展,模式识别为工业物联网系统提供了更高效的自动化控制与人机交互方式,已经成为实现工业化和信息化融合的主要手段。传统模型训练依赖特征分布均匀的数据输入,因此在特征分布不均匀的工业数据输入下,模型出现了失效与遗忘问题。近来有研究表明通过多次增量训练调整参数的方式,可以帮助模型适应数据流特征分布的变化。针对工业环境特征不均匀的数据流输入,提出了基于记忆回放的工业增量(Industri
学位
社区搜索作为图挖掘的重要研究内容,能被运用到社交网络推荐、语义扩展和流行病学调查等诸多应用当中。目前的社区搜索研究主要是在静态图上进行的,无法处理现实中广泛存在的时序信息。同时,现有的研究没有对顶点在不同社区中的参与情况进行区分,而一个顶点在各个社区中的参与情况通常存在着差异,其参与更多的社区对该顶点更为重要。因此,寻找到特定顶点参与最多的社区具有重要的意义。基于上述问题,对时序图中顶点重要参与社
学位
间隔理论的相关工作表明,相比于最大化样本的最小间隔,优化间隔分布可以带来更好的泛化性能。最优间隔分布学习机正是基于这样的间隔理论提出的全新统计机器学习框架,并在大量机器学习任务中展示出了极佳的通用性和极好的泛化能力。然而,由于需要引入非线性核函数以解决线性不可分问题,其计算核矩阵的时间复杂度和空间复杂度都与样本数量相关,因此在训练数据集较大的情况下,训练最优间隔分布学习机所需的计算和存储资源都是难
学位
数据作为当代互联的智慧城市生活中的一项关键资产,越来越多机构通过共享数据来推进科技发展。但由于数据本身敏感性,在共享的同时必须考虑到数据隐私保护的问题。在利用属性权限共享数据的过程中隐私问题可以被大致分为数据隐私、属性隐私和权限策略隐私三类。现有的方案主要基于区块链、密码学等技术实现数据共享,但都侧重于数据共享过程的访问控制与记录审计,仅保护了用户的数据隐私,忽略了属性和权限策略隐私。因此如何在数
学位