论文部分内容阅读
随着政府信息化发展和电子政务全方位覆盖的要求,当今信息技术的普及和数据库技术的高速发展,电子政务面临构建海量数据管理,集成多种异构数据源和为决策层提供决策支持的需求。目前政府信息资源管理系统比较独立,各个信息系统各自为政,资源的共享和调用无法有效进行,政府信息资源中没有一套统一的信息资源管理系统,出现“信息孤岛”现象。因此,元数据管理体系应运而生。本文提出基于CWM标准,运用J2EE体系结构和三层应用框架的方式,结合数据集市,采用页面元数据自动抽取技术和改进的元数据编辑器技术,通过E-Government数据交换平台设计,实现了针对浦东新区各委办局信息系统的统一元数据管理系统。本课题建设主要包括四个方面的工作内容:即数据集市划分与数据主题分析、数据网页信息自动抽取技术和服务器端整合抽取技术,数据交换平台和元数据管理系统。本课题的主要特点体现在以下两个方面:第一,设计和实现了元数据自动抽取功能,对浦东新区各委办局类页面文件进行数据抽取工作;设计服务器数据抽取模型,采集来自新区各委办局业务应用系统数据。第二,课题采用改进的元数据编辑器模型,在电子政务元数据模型的统一指导下,实现了元数据管理系统。与现有的元数据管理系统相比,本课题不仅体现了元数据管理系统与电子政务的有机结合,还使元数据自动抽取,元数据编辑器管理和数据交换平台三者融合在一起。本文的主要研究成果归纳为:一、提出了一个兼顾电子政务领域需求并满足合规性要求的元数据主题划分的模型并完成分类主题划分。二、提出了一种网页元数据自动抽取技术,一种服务器端的数据抽取技术,一项元数据知识管理技术和一个高效的数据交换平台,最终实现了元数据管理系统。三、在元数据知识管理技术中,设计和实现了具有元数据一致性检测和语义验证的功能。四、在数据交换平台中,设计了数据交换协议和消息中间件,解决分布式系统数据传输的需求。通过本课题的建设大大提升浦东新区的整体信息化管理水平,提高政府部门间数据共享和交互,从根本提高数据利用率,为进一步的数据仓库和数据挖掘打下基础。