分布式存储系统在通信运营商中的应用分析

来源 :中国新通信 | 被引量 : 0次 | 上传用户:linsible1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】    随着运营商的网路的发展,数据大部分存储在不同的区域网络,所以数据管理系统将面临数据的存取效率以及确保取得的数据内容一致的问题。针对数据分散存储与数据存取的问题,本论文提出一个通过阶层式逻辑数据索引与快取的设计建立在分布式数据管理系统中的数据存取机制,在现有网络带宽与架构下,提供更有效率的数据传输与数据管理。
  【关键词】    分布式数据存取    阶层式索引    分散存储
  引言:
  现今数据管理系统的数据大部分存储在不同的区域网络,且数据存放越来越分散,如何做到有效率的管理十分重要。对于此种情况,使用者取数据的存取效率以及使用者取得的数据内容一致的问题变得更繁琐。
  以上所面临的问题可分为:1.数据内容一致性问题:由于数据内容可能不断持续在更新,即使采用异地备份或数据复制机制,数据的同步仍须配合复杂的算法才能达成;2.数据存取效率问题:使用者必须从远端下载文件至本端,如果有多线程同时下载文件,将会导致原本的网络带宽不敷使用。没有效率的数据存取机制将会用尽所有网络带宽,甚至影响到正在运作的其他系统。任由使用者在服务器间传输大量数据,对运营商来说是一个无形的成本支出。
  我们将重点放在如何快速有效率的取得远端数据,寻求更好更佳的解决办法,在不改变现在低效能的网络带宽与架构下,系统能自动适应使用者位置,自动调整数据存取位置的分布式数据管理系统,希望能满足运营商所需的数据集中管理、分散存储的需求。
  一、适应性数据存取机制
  本论文主要在不改变运营商现有的网络架构与带宽的情况下,大量提升数据管理与存取效率,提供运营商完整的数据管理解决方案。此方法的重点在于设计通过集中管理的知识地图,提供使用者一个一致性的存取界面,通过这个界面,使用者可以从任何地方进行数据存取的动作,而做到数据集中管理、分散存储的管理机制。另一重点则是实体文件分散存储,系统必须能自动适应使用者所在位置,并且动态的调整回复实体文件的文件服务器。
  通过快取机制(Cache)的设计、多层逻辑文件索引等使用者适应性机制的建立,所有的使用者将只通过本地端的文件服务器存取文件,如此可让99%以上的数据存取效率与本地数据存取效率几乎一样快。各个客户端的文件树通过中间层的分布式文件服务器(Distributed File Server),对应至各个不同地区存储器的实体文件。黄色部分为文件服务器之间互相快取(Cache)的实体文件。
  此系统的软件架构如图2所示,整个适应性分布式数据存取系统大致上可以分为两个主要子系统,分别为DMS服务器(Document Management System)以及DMS文件服务器。一个DMS可以连接多个DMS文件服务器,每DMS文件服务器也会借由内部的Cache Policy模块连接到其他 DMS文件服务器或通过索引分割树(Index Partitioner)来与下一阶层的DMS文件服务器互动。以下将描述本架构的内部设计。
  1.1 DMS服务器
  DMS服务器主要负责接收所有的使用者的请求。对于Metadata的相关请求,则于DMS服务器直接回应,如果是对于远端文件的上传或下载请求,则会通过Adaptive File Server Locator 模块的判断,将该请求送到对应的DMS文件服务器。DMS服务器主要由Global Document Index、Adaptive File Server Locator、GlobelIndex Partitioiner 、Metadata Manager 、File Server Manager以及Authentication/Authorization 模块组成。以下概述2个核心模块的主要功能。
  1.2 Global Index Partitioner
  此模塊的主要功能是将运营商内的单一知识地图切成许多个子地图,分别由一个DMS文件服务器来负责存储。图2-3可以清楚描述设计该模块的主要目的。树状结构即是运营商内部完整的知识文件地图。FS1~FS4各代表不同文件关系树,整个完整的文件树可以被切分为三个主要Partition,而每一个Partition分别为文件服务器FS1, FS2与FS3负责。其中FS4为FS2的下游文件服务器。此外,系统也可以再将 FS2的其中一个文件交由FS4管理。如此,通过 FS2 与FS4的委托关系,便可建构出阶层式的文件服务器软件架构。
  1.3 Cache Policy 模块
  Cache Policy 模块负责管理当地使用者存取文件时,发生Cache miss的文件实体文件。目前我们规划的Cache Policy如下:
  1.3.1Cache in policy
  我们预计将文件快取的模式分为以下三种:要求模式(On-Demand)、定期模式(Periodical)以及手动模式(Manual)。要求模式是指当使用者有文件下载,但发生 Cache miss时,立刻启动快取机制(Cache),将文件从远端的DMS文件服务器快取到目前的DMS文件服务器。定期模式则是每天固定时间将其他 DMS文件服务器的文件快取到目前的DMS文件服务器。手动模式则是管理者随时可以决定要快取那个文件到DMS文件服务器中,可以提供临时的数据传输需求。至于系统将采用哪种模式的Cache策略则由管理者自行决定。
  1.3.2 Cache out policy
  我们将根据管理者设定的Cache Size,在Cache Size 剩下不到管理者设定的threshold时,于半夜启动Cache out机制。而Cache out的算法则采用LRU (Least Recently Used)的方式,将最少用到的快取文件清除。   1.Data Transmission。此模块主要负责文件的传输,需要特别獨立此模块是因为部分产业的文件Size非常大,需要特别管理上传的文件格式、以及传输时间。尤其当通过Web的方式上传、下载文件时,常会发生暂停(timeout)的问题,必须通过数据传送(Data transmission)模块专责处理相关问题。
  2.Index Bridge。此模块负责将逻辑的文件索引,对应到实际的文件存储位置。例如可以将DMS服务器的\root\SOP\请假标准程序,对应到DMS文件服务器FS1的\SOP\请假标准程序,再对应到FS1的d:\00000001\00000002.doc。或当FS1 后端的文件系统是NFS时,则必须对应到/user/home/files_server/001/003.doc。通过这个模块的构建,我们可以将实体文件存储的文件系统以及存储空间做很好的分离切割。如此才能连接到运营商既有的所有大型的存储空间。
  二、 效果分析
  我们通过一般网络传输速度来分析所提出的算法。假设有两个文件服务器分别架设于A地与A地两地,其网络架构是双向512K,本地端的内部网络速度为100MByte/sec。以下分别分析有无使用适应性数据存取机制的数据存取状况,其中A代表文件在网络上的传输时间、B代表文件存储时间、C代表使用者端文件开启时间。
  表1为一般网络文件下载情况,表2为有适应性数据存取机制的数据存取分析且DMS服务器位于中国,那么数据传输的时间如表(以10M文件大小计算),精确的时间尚须视使用者的机器设备能力而定。
  以上计算方式均以理论值的最大极限计算,不考虑平时网络被其他应用系统或数据传输所占据带宽的情况。在使用适应性数据存取机制的情况下,使用者如下载为非文件服务器所拥有的文件或非Cache文件则只须花费一次远端下载时间,之后其他使用者只须花费本地端下载时间,由结果得知,此作法大大减少多端点与不同网域文件下载时间。
  三、结束语
  目前运营商多属地域公司,运营商最重要的智慧资产就是数据,往往会因为数据维护单位的设立地点不同而导致数据散落在各个地区,此外中国信息部门对于关连式数据库的技术依赖性太高,导致有很多新的系统功能无法被快速开发,多层次的逻辑文件索引,以及适应文件服务器的Cache即是最好的解决办法。
  本论文设计的适应性的分布式数据存取系统,提供自动化的适应能力,根据使用者来源,调整数据回复的文件服务器,以及设计逻辑文件索引与 Cache来加强数据存取的效能,希望能有助于建构适用于目前运营商网络架构与带宽的高效能分布式数据管理系统。
  参  考  文  献
  [1]王意洁,孙伟东,周松,等. 云计算环境下的分布存储关键技术[J]. 软件学报,2012,(4):962-986.doi:10.3724/SP.J.1001.2012.04175.
  [2]覃雄派,王会举,李芙蓉,等. 数据管理技术的新格局[J]. 软件学报,2013,(2):175-197.
  [3]叶小平,汤庸,林衍崇,等. 时态数据索引TDindex研究与应用[J]. 中国科学(信息科学),2015,(8):1025-1045
  [4]叶小平,汤庸,林衍崇,等. 时态拟序数据结构研究及应用?[J]. 软件学报,2014,(11):2587-2601.
  [5]刘玲玲. 分布式大数据云存储技术分析[J]. 数码设计(上),2018,(6):169.
  [6]周西柳. 面向大数据的分布式存储技术研究[J]. 电脑迷,2016,(3):136-136.
  [7]刘圆,王峰,杨明川. 面向大数据的分布式存储技术研究[J]. 电信技术,2015,(6):33-36.
  [8]姚迎乐,张志华. 面向大数据的并行数据分布式备份存储仿真[J]. 计算机仿真,2018,35(8):401-404,409.
  [9]胡健,袁军,王远. 面向电网大数据的分布式实时数据库管理系统[J]. 电力信息与通信技术,2015,13(2):49-54.
其他文献
【摘要】 社会经济的快速发展及互联网技术的发展进步,使得当前通信工程的作用越来越重要。当前时代下,通信工程的信息化与综合集成化发展,是保障通信工程稳定、持续发展的必然趋势,本文论述通信工程自身特点,结合通信工程的综合集成与管理信息化的必要程度,基于当前时代下,通信工程项目管理存在的问题,寻找相关解决措施,探讨通信工程项目管理中系统化、集成化实现方式,促进通信工程管理工作的高质量开展。  【关键词
【摘要】 随着互联网技术的迭代升级,互联网用户不断增加,学生生活工作中的方方面面都需要互联网,且大众对传播技术的要求越来越高,以致高速运转的互联网数据越来越庞大,互联网可持续发展面临着更加艰巨的挑战。因此,要加大互联网传播技术的深入研究,探索出更加合理的技术,降低数据重复传播的出现率,在网络安全保障的前提下,在降低能耗的同时提高网络传播速度。当前,有线传输和无线传输是国内互联网传输技术的主要手段
【摘要】 文章分析了5G移动宽带和移动物联等应用场景的技术特点及性能指标,从无线空口、无线传输、无线网络等方面深入研究,总结了在对应场景下,支持其强大性能的无线关键技术,最后对下一代及未来移动通信的应用场景与无线新技术发展趋势提出展望。  【关键字】 5G 应用场景 关键技术 未来趋势  引言:  移动通信从第一代发展到第五代实现了从模拟到数字、语音到数据、移动互联网到移动物联网的演进。
世界各国都特别注意保护海洋环境和环境,我国的海上活动变得越发活跃,交通量急剧增加,大型船舶,油轮和集装箱船的装箱量将超过10,000个,同时也成为了一有事故较多的国家。溢油型船会导致严重的溢油污染事故,例如10,000吨的石油流入,将导致不可逆转的环境灾难和巨大的经济损失。因此,在石油开发过程中,有必要加强海上航行的安全性,提高处理溢油事故的能力,这也成为海上石油开发的重要任务之一。我们密切监控溢
【摘要】 在社会经济与科技飞速进步的背景之下,电子信息技术的发展已经深入到了人们的日常生活当中,对于改变人们的信息交流方式带来了极大的促进作用。为了更好地保障电子通信中的信息稳定度,需要提前做好传输过程中的抗干扰处理,使移动设备的信息传输质量更加可靠,更好地满足人们日常通信的各项功能需求,不断促进我国现代化电子通信事业的发展。因此,文章将系统性地介绍电子通信工程概念和常见的干扰因素,并详细讨论解
【摘要】 本文基于地铁线网指挥中心,从应急指挥、清分收益以及运力组织三方面分析5G如何助力地铁线网指挥中心的建设,深入研究5G技术在城市轨道交通领域的应用价值。为城市轨道交通线网指挥中心的发展提供新手段。  【关键词】 线网指挥中心 5G 清分收益 运力组织 单兵  5G移动通讯技术的飞速发展给城市轨道交通线网指挥中心系统的发展带来了新的思路。5G较于4G而言具有明显的三大优势:1、传
借助通讯技术的发展公众获取气象信息的手段越发便利,用户的个性化需求也越来越突出,课题针对上下学出行这一服务场景提出了一种面向分众人群的气象服务方案。通过对目标用户的需求分析进行了产品的功能设计和技术选型,用可以跨端发布的UNI-APP框架开发完成了一款集合了强天气提醒、精细到上下学时段的异常天气提醒和日常出行提示、短时降水影响的上下学天气小程序。小程序目前已经上架微信平台,将在各平台上进行多端发布
本文分析信息中心网络和分布式账本的技术特点,结合两者的优势,提出了以接入节点作为信息中心网络和分布式账本共同节点构建物联网系统的设计思想,阐述了这种新型物联网架构下数据结构、数据传输的方案,为后续的深入研究提供方向性指引。
【摘要】 物联网作为新一代信息技术的重要组成内容之一,对信息化时代的发展与不断深化有着重要的作用和影响。本文将通过对物联网的特点及其网络通信安全分析,围绕物联网计算机网络的安全与远程控制技术进行研究,以供参考。  【关键词】 物联网 计算机网络 安全 远程控制技术 分析  随着社会经济的快速发展与科学技术水平不断提升,推动了计算机与互联网技术在人们日常生活与社会生产各领域的广泛应用,同