面向地质勘查的多源异构数据集成关键技术研究

被引量 : 0次 | 上传用户:yifanjiawei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着国家《关于进一步加强地质勘查行业服务与管理的若干意见》、《关于促进国有地勘单位改革发展的指导意见》、《找矿突破战略行动纲要(2011-2020年)》等相关政策文件的相继出台,我国地质勘查单位(企业)在市场浪潮中正经历着一次深刻的转型变革,彼此之间的竞争环境已由封闭环境下的竞争,转变为开放环境下的竞争,是一个在国内外开放环境下由外企、民企、国企等不同性质、不同规模的企业参与的大竞争,竞争比以往更为激烈。这对地质勘查单位来说,既是巨大挑战,也是发展的战略机遇。地质勘查单位要想在激烈的竞争中保持优势,信息化手段的辅助必不可少。通过信息系统的建设,地质勘查单位可以加快信息的流转、提高生产力、辅助管理决策;在日常工作中,有信息系统的支持,可以有效减少人为的失误,提高业务流程的正确性和数据的精确性;在市场竞争中,借助信息系统可以分析历史数据、收集现有信息、挖掘商机,提高企业的市场反应能力和竞争力。目前,各个地质勘查单位在长期的地质勘查工作中积累了大量宝贵的地质勘查数据,现在进入转型时期,每年接受地质勘查项目的数据更多,例如:项目数据、地质资料数据、槽井坑钻数据、物化遥数据、过程监管数据等等。这些数据大多零散地存放于各个地方,多年下来,积累的数据量十分巨大,给管理和利用带来不少麻烦。同时,随着地质勘查单位信息化的不断深入发展,企业所使用的管理系统越来越多。由于部分企业中的相关人员对信息系统的搭建和实施缺少系统全面的认识和把握,使信息化建设缺乏整体一致性和系统协调性,系统之间相对独立,在信息需要共享时无法进行高效的互操作。在地质勘查数据集成过程中,一般还面临如下问题:(1)数据有较复杂的表达方式存在。地质勘查数据来源丰富,获取手段多样,各类数据有明显的异构性,特别是存在多语义性;由于地质勘查项目实施周期长,数据也具有明显的多时空性、多尺度性。(2)数据交换方式复杂。随着地质勘查单位的深入改革、市场竞争的激烈,各个单位之间的合作关系越来越紧密,数据交换的范围也在逐步扩大,涉及到的交换方式也越来越多样化,比如离线交互手段、广域网互联互通等方式。(3)数据升级更新同步问题。由于地质勘查单位存在的系统繁多,每个系统软件在一定时期内都存在着更新升级的问题,如果在升级过程中,对数据结构进行了修改,那么必然会导致基于原数据结构开发的交换系统发生故障。(4)非结构化数据的有效利用问题。由于在勘探工作中,会产生大量的图片、音视频、文档、图件数据,这类数据自成一体,很难用结构化的信息系统对其进行有效管理,然而,这些数据又包含了丰富的信息,对矿产评价、项目管理、成果管理等都具有重要意义。从理论角度看,目前针对地质勘查行业数据集成方面的研究并不多见,至今没有形成一个统一的系统建设理论架构,特别是针对我国特定的经济环境、管理制度,如何利用数据更好的为地质勘查行业服务,理论与现实还存在较严重的脱节。当前地质勘查行业专业软件应用偏多,缺少覆盖地质勘查项目主要业务工作的数据集成系统的研究。面对以上问题,本文通过开展对地质勘查行业多源异构数据集成技术的研究,在全面覆盖地质勘查主流程业务的基础上,构建了基于数据中心的而向服务架构的数据集成理论,为地质勘查行业数据集成研究做了有益探索,对企事业单位多源异构地质勘查数据集成管理、挖掘分析应用等方面具有重要的指导意义。通过本研究,可以整合地质勘查单位的各类数据,实行一体化存储、管理与利用,提供各个系统之间数据的共享与交互,为地质勘查业务管理、辅助决策分析提供数据支撑,为地质勘查业单位制定发展战略、提高管理效率、防范项目风险都具有深远的现实意义。具体的研究工作如下:(1)回顾并分析了多源异构数据集成技术以及地质勘查行业数据集成技术的研究现状。从地质勘查业务活动模型和结构模型的角度,分析了业务与数据的关联关系,阐明了地质勘查数据的多种来源性。按照数据业务类型和结构类型的划分,对地质勘查数据资源进行分析,阐述了地质勘查数据的系统异构、结构异构、语法异构、语义异构等方面的区别。针对多源异构地质勘查数据,分析并提出了对其进行数据集成所应满足的需求,以便指导设计出符合地质勘查单位工作所需的数据集成系统。(2)研究了多源异构地质勘查数据本体建模方式。为了解决数据集成中语义异构的问题,需要在数据表达阶段定义好数据模型。本文将本体建模方式引入地质勘查数据集成领域,构建了地质勘查领域本体,对地质勘查数据进行形式化概念分析,定义了地质勘查本体GeoExploration-ontology,并对其进行语义分析与形式化描述,建立起了地质勘查信息本体分类框架,并采用OWL i语言进行形式化表达。最后将本体与数据源进行关联,研究了西者的映射关系,为后文数据交换中的语义匹配奠定了基础。(3)研究了多源异构地质勘查数据集成模型。在分析现有的数据集成模式的基础之上,结合面向服务架构理论,提出基于数据中心模式的、适合多源异构地质勘查数据的集成模型,并在此基础上展开阐述基于中间件技术的数据仓库服务和可灵活订制的功能仓库服务:深入分析集成系统的层次结构,对地质勘查数据进行三级信息分类与处理;为增强系统的扩展性与互操作性,制定地质勘查数据共享与互操作机制,提高系统的通用性,为数据集成应用阶段数据的显示、查询、分析等提供底层支持。(4)研究了多源异构地质勘查数据交换技术。首先分析地质勘查数据交换体系,对各个系统中的数据交换需求进行分析,提出基于XML的数据交换模型,并制定适用于地质勘查行业的数据交换中间文件,配合数据检查、映射、清洗、加载等流程,实现数据的交换;然后研究并制定了数据检查规则,提出基于本体模式的数据映射方法,采用语义相似度匹配技术对本体映射关系进行计算,并结合XML Schema和XSLT技术,实现了语义标注与数据转换生成;最后对数据清洗与加载进行了研究,提出并制定了相应的规则。(5)研究了多源异构地质勘查数据集成可视化表达的技术。在结合Flex技术在多媒体、在线地图、在线文档等方面的集成展现优势,将超媒体数据模型引入地质勘查领域进行研究;针对行业应用中地质勘查数据丰富,难于表现的问题,结合地理超媒体数据模型,提出地质勘查超媒体数据模型,并在此模型的基础上,综合Flex富表现技术,对地质勘查数据的集成展现进行了研究。(6)原型实现与在有色地调中心的应用。在基于已有研究成果的基础上,搭建地质勘查多源异构数据集成原型系统,扩展并增强系统的数据集成应用功能,融入了门户系统、办公系统等,并以建设“有色地调中心地勘业务工作平台”为应用案例,实现了对前文研究成果的综合应用,验证了理论与技术的可行性,体现了面向地质勘查的多源异构数据集成技术的有效性、可扩展性和实用性。本文的创新点在于:(1)将本体建模方式引入地质勘查数据集成领域,构建了地质勘查领域本体,定义了地质勘查本体GeoExploration-ontology,并对其进行了形式化概念分析和语义分析,建立了本体与数据源的映射关系。(2)提出了基于数据中心模式的多源异构地质勘查数据集成模型,分析了该模型的组成和特点,并对其进行层次化数据分析,提出了数据共享和互操作机制,增强了系统的适用性与可扩展性。(3)在多源异构地质勘查数据交换技术研究中,提出了地质勘查数据交换中间文件格式,制定了数据检查规则,构建了基于本体的数据映射技术。(4)提出了地质勘查超媒体数据模型,并结合Flex富表现技术,实现了地质勘查数据可视化的综合表达。
其他文献
检索癌症患者恐惧疾病进展相关文献,将癌症患者恐惧疾病进展的定义、评估工具、现状、影响、影响因素及干预进行综述。为癌症患者恐惧疾病进展的研究提供参考。
给出了动平台的速度、加速度与各个构件的速度、加速度之间的关系,以牛顿—欧拉法为基础,对6-PSS并联机构各个杆件和动平台分别建立牛顿—欧拉方程,并消去其内力,以动平台为
当前.我国正处在一个由计划经济向市场经济转轨的变革时代,依社会学的观点看,社会转型期人们更容易出现心理障碍问题。因此,关注学生心理健康的问题更显得极为重要。处在青春期的
犯罪中止是犯罪未完成形态的一种,以制度的形式普遍存在于大陆法系国家和地区的刑法中,并且明确规定中止犯应承担的刑事责任明显要轻于未遂犯。目前,基于不同国家和地区社会和历
延安是陕西优质苹果主产地之一,2009年苹果面积18.7万hm2,产量199万t。主要分布在南部和北部丘陵山地,其中北部丘陵山地面积7.79万hm2,产量42.2万t。面积和产量分别占全市总
堪称“中国文坛祖母”的冰心,经受了历史的考验,她的文学作品之所以能够在历史上永远占据一席之地,是伴随着她笔下有知识、有才华、思想前卫的新一代女性形象的构建及其本人独具
绕组的绕制是电机非常重要的一个环节。通过对绕组绕制工艺过程的分析,找出导致导线变形的问题所在,并提出解决方案。将原有的绕线机进行改装,能很好地解决绕线机传动过程中
无线射频识别技术(Radio Frequency Identification简称RFID)作为时下先进的信息采集技术,近年来广泛应用于物流、供应链等领域。在RFID技术应用的推动下RFID公共服务网络的概
结合贵州大学土木学院开设的土木工程CAD课程教学实践情况,分析了目前的教学现状;采用穿插式的讲授方式,通过以兴趣为主导的教学模式及与学号相关联的个性化考核模式两个方面
基坑工程是随着地下铁道工程、城市地下空间应用以及建筑基础工程的发展而不断创新和提高的岩土工程分支。近年来随着我国西部大开发的进程日益加快,黄土地区的高层建筑物和构