浅谈数据元技术在水利信息资源管理中的应用

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:daijiangduck
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]本文主要阐述水利信息资源的元数据的管理方法,从数据源、元数据注册及更新几个方面进行研究。分析在数据源管理中可能遇到的问题,研究元数据的注册、更新机制及存储模式,从技术角度,初步探索出一套实用的元数据管理方法。对于开发各级水利信息资源共享系统,具有参考价值。
  [关键词]水利信息 信息资源 数据源注册 元数据注册
  中图分类号:R931.2 文献标识码:R 文章编号:1009―914X(2013)34―0555―01
  引言
  在信息领域,目录服务体系是统一管理数据资源的有效途径。水利信息资源目录服务体系通过数据源管理能实现水利信息资源在目录服务系统中的注册,利用元数据对已注册水利信息资源进行统一描述,最终实现对水利信息资源的统一管理和共享。
  数据源即数据的来源,是对水利信息资源管理系统的抽象。元数据,又称元资料、中介资料,是描述数据的数据。通过数据源管理能够实现数据的注册与元数据的发现。
  本文从技术角度来探讨在构建水利信息资源目录服务体系过程的数据源与元数据管理,并提出一套可行的解决方案。
  1 相关研究
  近年来,水利信息资源目录服务体系数据源与其元数据的管理方法一直是水利信息化领域的研究热点,主要集中在如何从理论角度用元数据来描述水利信息资源。朱星明等探讨了基于数据元的水利科学数据交换,阐述了水利科学数据的数据源标准体系结构,为实现水利信息共享提供了很好的解决方案。王卫等研究了水利行业基础数据应用系统的建设,未利用元数据来描述水利数据,而是直接管理各种分散存储在关系表中的水利统计信息,避开元数据直接管理具体数据不易于后期的系统维护与重构,也会造成多系统间信息共享上的困难。目前,涉及水利信息资源数据源与元数据的管理方法主要是针对单一数据类型,且以地理空间数据较多,为此本文将从技术上研究对3种數据类型的水利信息资源的数据源与元数据进行统一管理的机制。
  2 水利信息数据源管理框架
  数据源是提供某种所需要数据的器件或原始媒体,在本文中指的是能够提供水利信息资源的原始媒体。元数据是数据源下水利资源的描述信息。
  水利信息数据源管理的框架如图1所示,本文按照水利数据的表现方式,将数据源分为关系库、遥感库和矢量库数据源3种类型,元数据类型分别是关系、遥感和图层元数据。水利信息数据源管理提供数据源的注册,元数据的发现、自动抽取、注册和更新等服务。其中数据源注册支持3种水利信息数据源的注册;资源共享用于支持对注册数据源中的数据资源进行共享;元数据自动抽取用于抽取数据源中数据资源的元数据;在数据源的数据中资源发生变化的情况下,元数据发现服务会监测到其更新,并通过元数据更新服务实现信息资源元数据的更新。
  关于元数据标准,国内外对涉及水利信息资源的元数据已有大量研究,主要成果有:ISO 19115-2003,GB/T l9710-2005,SDS/T2112-2004,SL420-2007,和 SL473-2010,等,这些标准主要针对特定数据格式(矢量、遥感)的水利信息资源,在统一描述属性(关系库数据)、矢量和遥感数据等水利信息资源上显得不足。故本文采用笔者研究小组定义的水利信息资源目录服务元数据来描述水利信息资源。
  本文将以“数据源的注册-元数据的注册-元数据的更新”为主线,分别阐述以下几个问题:1)数据源注册机制,实现数据源的注册和判重;2)元数据注册,实现元数据的发现、注册和审核;3)元数据更新机制,实现在水利信息资源更新后程序化地更新元数据。数据源管理框架如图 1 所示。
  3 水利信息数据源管理中关键技术应用
  3.1 数据源的注册
  数据源相关信息主要包括数据源自身和管理机构的描述信息。通常在数据库中需要2张表来存放数据源的相关信息,一张存放数据源的描述信息,另一张存放数据源管理机构的描述信息。在注册数据源时,首先要判断该数据源是否已经在系统中注册,判断依据以数据源描述信息为主。对于关系库数据源,如果IP地址、端口号和用户名相同的关系库数据源在系统中已经存在,则该次数据源注册将会失败,否则注册成功。数据源成功注册后,为该数据源分配1个唯一的ID作为标识,其下的元数据信息将通过该ID与数据源关联。相关表结构设计如图2所示。
  3.2 元数据的注册
  水利信息资源目录服务元数据描述的是整个水利信息资源,有部分选填元数据项。本文针对不同类型的水利信息资源,定义了相应核心可查询目录服务模式和核心可返回目录服务模式(核心元数据子项),利用元数据项子集描述特定类型的水利信息资源,达到提高系统响应效率的目的。
  3.2.1 元数据的存储
  按照元数据规范,完成元数据项的填写后,将会生成1个符合水利信息资源目录服务元数据标准的XML文档,为了提高目录服务发现的效率,本文将水利信息资源目录服务元数据标准的核心可查询和返回目录服务模式提取出来,存储到关系数据表中,并建立相应的倒排索引。由于水利信息资源数据类型的不同,相应的核心可查询目录服务模式也会有差异。
  本文采用2层继承结构来存储元数据,在数据库中表现为父表和子表。父表中存放水利信息资源各核心元数据项子集的公共元数据项,子表中存放各种核心元数据项子集的特有元数据项。采用这种2层继承结构来存放元数据有着比较明显的优点,如果系统中新增加1种水利信息资源数据类型,数据库中原有表结构不需要更改,直接增
  加1个相应子表即可,具有良好的可扩展性。元数据的存储类图如图3所示。
  3.2.2 元数据的自动抽取
  不同数据类型的水利信息资源具有不同核心目录服务模式和自动抽取的元数据项,为了代码的可读性和后期维护,本文采利用抽象工厂模式创建一系列标准接口,屏蔽底层实现。抽象工厂模式定义是:提供1个创建一系列相关或相互依赖对象的接口,而无需指定他们具体的类。   AbstractMeta 是一个抽象产品,它可能有3种不同的实现,RMmeta,RSMeta 和 MapMeta 就是对抽象产品的具体分类的实现。
  利用抽象工厂模式,不同类型的元数据的抽取任务就实现为不同的具体类,共享同一个抽象产品接口,这样就可以将具体的发现元数据实现机制屏蔽在接口之后。
  3.2.3 元数据的注册
  元数据的发现,方便元数据管理员查看数据源下到底含有多少元数据,只提供核心可查询和返回目录服务模式。当元数据管理员要注册1条元数据时,就需要根据上文中提到的元数据规范提取元数据描述信息,最终形成1个待审核的XML片段,成功审核后即完成元数据的注册。考虑到以后数据量非常庞大时,数据库可能成为性能瓶颈,所以本文将待审核的和审核成功的元数据分别存放在不同的表中。这样有利于以后利用数据库垂直分区(将不同的表放到不同的数据库服务器上)技术,以减轻单个数据库上读写压力。
  3.3 元数据的更新
  在元数据注册成功后,它指向的真实数据可能会发生变动,比如关系表的字段数、记录条数,所以需要定时进行元数据描述信息的更新。
  3.3.1 元数据的更新依据
  如何判断元数据是否应该更新,这也是应该考虑的问题。对于关系库数据源,判断依据为表的最后一次DML和DDL时间;对于遥感库数据源,判断依据为遥感影像文件的修改时间;对于矢量库数据源,判断依据是图层信息的修改时间。
  3.3.2 元数据的更新策略
  本文采用自动和手工2种方式来更新元数据信息。在系统启动时,开启1个后台线程,定时扫描已注册了数据源的水利信息资源,如果符合更新条件,则更新该资源的描述信息。定时线程的更新时间一般定在凌晨以后系统负载比较小的时候,这样不会影响用户正常访问系统。当然元数据管理可以手工触发更新操作,粒度可以到达数据源下的某具体的资源(1 张数据库表、遥感影像或矢量图层)。
  3.4 应用实例
  水利信息资源目录服务体系的数据源与元数据管理机制,根据国家水利数据中心水利信息资源目录服务系统对水利信息资源管理的基本要求制定。水利信息资源目录服务系统管理水利资源数据分中心信息资源涉及的水文、水质、水资源、水利设施(空间)、土壤侵蚀、灌溉、水能资源调查、农村水电 8 个专题信息库,涵盖了属性、矢量和遥感影像数据等类型的水利信息资源。目前,本文提出的管理方法已经成功地运用到水利信息资源目录服务系统中,实现对属性数据、矢量图层和遥感影像等类型的水利信息资源的数据源注册,元数据发现,元数据自动抽取和更新功能。在数据源注册方面,能够实现上述8个专题库中3种数据类型的数据源注册;资源共享服务能够实现对上述 8 个专题库中属性数据(关系数据库与数据表)、遥感影像数据和矢量地图等数据资源的共享;元数据自动抽取能够自动地抽取出属性数据中关系数据库的联系信息、关系数据表的表结构、库表的中文名称,遥感影像数据的波段、投影参数、坐标参数、时空范围、分辨率,矢量地图的时空范围、几何数据对象等元数据项;元数据更新服务能够在监测到上述数据资源变化情况后,自动或手工抽取变化后的元数据,并进行元数据的更新。本文的数据源与元数据管理机制在水利信息资源目录服务系统的应用表明,本文提出的管理机制能够很好地管理水利信息资源的数据源和元数据,并为目录服务体系提供基础。
  4 结语
  本文主要讨论了水利信息资源的元数据管理方法,提出了一套初步的解决方案,该方案在水利信息资源目录服务系统中应用表明,本文提出的元数据管理方法是有效可行的。
  为了实现更广泛的水利信息资源共享与交换,围绕水利信息资源元数据还需要做以下工作:1)研究面向水利行业的元数據检索体系,以进一步推动水利信息资源的共享与交换;2)研究元数据的交换机制,以实现不同目录服务系统间元数据的交换。
其他文献
[摘 要]缓凝剂在混凝土夏季施工、泵送施工中得到广泛应用。根据化学成分的不同,将混凝土用缓凝剂划分为无机缓凝剂和有机缓凝剂两种,并分别论述了无机缓凝剂和有机缓凝剂的作用机理。  [关键词]混凝土 缓凝剂 分类 作用机理  中图分类号:TQ178 文献标识码:TQ 文章编号:1009―914X(2013)34―0574―02  缓凝剂是一种能推迟水泥水化反应,从而延长混凝土的凝结时间,使新拌混凝土较
期刊
[摘 要]苹果树是较为常见的蔷薇科落叶乔木,也是世界四大水果之一。在我市有大面积的苹果树栽植,是我市产量最多的水果品种之一。苹果树对于生长环境中光照、气候、土壤、水分等要求都相对较低,但是又由于受到人为或自然因素的影响,苹果树经常会发生各类病虫害。苹果树病虫害不但威胁到产品的产量及品质,而且对于果农的经济收益和生产效益也会造成不同程度的影响。因此,采取有效的措施防治苹果树病害是果农面临的技术问题。
期刊
[摘 要]本文从三个方面论述了热处理工艺在提高金属零件的制造水平中的作用。  [关键词]金属零件的制造 热处理工艺 提高  中图分类号:V262.3+4 文献标识码:V 文章编号:1009―914X(2013)34―0571―01  引言  在现代工业生产中,金属零件的制造是一个重要的环节,具有举足轻重的作用,因此提高金属零件的制造水平成为一项不可缺少的工作。而在金属零件的制造过程中,热处理工作又
期刊
[摘 要]原子吸收分光光度计作為能定量分析多种金属元素的仪器,由于灵敏度高、干扰少、分析复合快速,现已广泛应用于工业、农业、生化、地质、冶金、食品、环保等领域。同时由于其技术的发展,衡量其技术性能优劣的指标也在变化。线性误差作为一个新指标写入新版检定规程中,本文对线性误差检定结果的不确定度进行详细分析。  [关键词]原子吸收分光光度计 线性误差 不确定度 分析  中图分类号:TP802+.2 文献
期刊
[摘 要]互联网技术给我们带来很大的方便,同时也带来了许多的网络安全隐患,诸如陷门、网络数据窃密、木马挂马、黑客侵袭、病毒攻击之类的网络安全隐患一直都威胁着我们。计算机网络信息管理工作面临着巨大的挑战,如何在计算机网络这个大环境之下,确保其安全运行,完善安全防护策略,已经成为了相关工作人员最亟待解决的问题之一。该文首先分析了计算机网络信息管理工作中的安全问题,其次,从多个方面就如何有效加强计算机网
期刊
[摘 要]本文主要针对唐钢热轧带钢生产线现有1的平直度检测手段不能满足薄规格产品生产的需要,通过引进比利时IRM公司的平直度仪检测系统,实现了板型的实时控制。使板带的平直度检测精度更高;一级的控制程序优化,使得实际检测的带钢平直度能够投入到FBK-ASC控制中,以改善产品板型;二级控制系统与平直度设定数据报文通讯的建立,板型所需平直度数据挖掘,模型自适应系统的优化。  [关键词]系统优化 平直度
期刊
[摘 要]随着科学技术的快速发展,市场的竞争也变得越来越激烈,在我国的许多制造业开始将大量的精力和财力投入到先进的制造技术和制造模式的研究中,机电自动化就是其追求的目标之一。机械自动化技术对传统的机械制造的改革,机械自动化技术推动了社会的进步,创造了极大的经济效益,促使机械制造业由劳动密集型产业向技术密集型产业和信息密集型产业转变。数字环境下机械自动化的实现对于机械制造有着十分重要的意义,本文从机
期刊
[摘 要]最近几年人们对财务和法律关系的研究愈发深入,不管是对法律和经济发展之间关系的研究,还是对公司财务和投资人法律保护关系,在某种程度上都对公司财务与投资者之间的法律保护关系处理有帮助,从而使公司的财务系统得到进一步的完善。文章就公司财务和投资者之间的法律保护相关问题进行了一番分析,从而为处理投资者和公司财务之间的关系提供可供参考的意见和建议。  [关键词]公司财物 投资者法律保护 分析  中
期刊
[摘 要]为了提高城市信号交叉口车辆运行效率,本文分析了直行车道饱和流率的影响因素。本文主要针对车道宽度、车道位置、车道交通组成、进口道坡度和右转车等相关因素进行研究,探讨它们对车道饱和流率的影响,并给出相应的修正系数。  中图分类号:TP202+.4 文献标识码:TP 文章编号:1009―914X(2013)34―0581―01  0.引言  饱和流率是指在一次的绿灯时间内,某进口道或冲突点上连
期刊
[摘 要]本文针对达拉特发电厂三期化学水处理系统,微滤改造为超滤的反渗透预处理系统的工艺进行了介绍,主要从用于原水的黄河水和循环水的水质特点、超滤膜的特点、超滤膜的选择等方面进行了阐述。  [关键词]水处理 反渗透预处理 沙滤 超滤 选择  中图分类号:TK282 文献标识码:TK 文章编号:1009―914X(2013)34―0551―02  1.问题背景  达拉特发电厂主要以黄河水作为生产用水
期刊