论文部分内容阅读
一、数字信息资源管理系统的功能与特点
数字信息资源管理主要包括数字信息管理、信息环境管理、信息服务与用户管理等(见图1)。基于此,本文提出一套数字信息资源管理系统的设计方
数字信息资源管理系统面对的是信息化环境下多种数字资源,采取了当前较先进的数据推送拄术、数据挖掘、人工智能技术等。一般而言,一个功能完善的数字信息资源管理系统应具有以下主要功能和特点:
1.向系统管理员提供高效、便利的数字信息(包括文本信息、视频、音频、图像和各种标准电子文档)的收集、组织和发布工具平台,并提供数据挖掘、推送技术等系统管理功能。
2.数据模型的建立应遵守行业规范并形成规范的流程,支持数字资源的标准化表示和传送;最大限度地使用和确立规范标准,包括支持基于XML的数字资源管理。
3.支持多种智能化的资源检索,为最大限度地支持用户发现和使用数字信息,管理系统应支持全文检索、智能检索、图像音频等检索以及二次检索等,应支持统一友好的用户界面并把各种数字信息资源整合成统一的结构平台,以实现各种资源的统一检索和跨数字信息资源库的检索。
4.系统具有开放性和适应性,向用户提供数字信息资源的宏观和微观视图以及相应的访问方式。
5.支持数字信息的安全性管理,保证系统的安全、可靠,系统还应支持知识产权管理、合理使用机制等。
二、系统总体设计
明确了数字信息资源管理系统的功能与特点后,在进行用户需求分析及技术、管理的可行性分析之基础上,笔者采用数字图书馆有关数据挖掘技术和推送技术进行构架,设计出数字信息资源管理系统的逻辑体系结构(见图2)。
由图2可以看出,系统总体逻辑结构包括数字资源管理系统界面、数字资源整合系统、系统管理员管理和维护模块、元数据服务器、多媒体资源管理器、用户管理模块等。系统管理员权限最大,负责整个系统的管理和维护,如管理数字信息管理员和用户的属性信息、网络资源导航等,数字信息管理员负责数字信息资源的整合,包括分布式的收集、标引、组织和发布数字信息资源,还审查由用户推荐的资源。元数据服务器用来存放描述各信息对象的元数据(一般是相对集中存放),并支持多种数字资源的融合和提供基于XML的快速全文信息检索;多媒体资源管理器支持音频、视频等多媒体信息的流式播放。各个子系统均能与Intemet网有效链接,整个系统按分布式数据库原则构建。
三、系统实现的关键问题
1.网络系统构架
数字信息资源管理系统是典型的B/S层结构设计,将用户平台、应用平台、数据库分开处理,用户端不用安装任何数据库连接软件,较好地体现了数据处理性能和安全性能。此外,需要注重多媒体信息的搜集加工和传播,需要大容量且高速的存储器,需要高速的网络设备。建议最低硬件配置如下:
(1)服务器 应用服务器PentiumlG以上CPU,1G以上内存,1000M网卡,数据库服务器为Pen·tiumlG以上CPU,内存1G以上,光盘镜像服务器采用清华同方CDS一3500一A—DVD,可在服务器内置硬盘中存放640片光盘镜像,可以轻易地取代光盘库。磁盘阵列须支持Raid5,通道传输速率为160M/秒,硬盘容量至少73G/块,至少6块硬盘。
(2)网络设备:10M/100M自适应网卡,100M/1000M交换机和100M集线器,DU2603型外置式Modem,美国CISCO防火墙。
(3)客户端,PⅢ500以上CPU,128M内存,硬盘60G以上,显存32M以上。
(4)多媒体设备扫描仪,数码相机,语音录入设备,视频采集设备。
2.信息资源管理元数据体系的构建
元数据就是关于数据的数据。元数据体系是数字信息资源管理系统中信息的描述方法,它决定了系统的特征、运行模式和系统运行的总体性能。逻辑体系图示中的“数字信息管理员”就是利用元数据来标引和揭示数字资源。因此,元数据体系是数字资源管理系统和网络导航系统的管理和控制层,在数据挖掘、信息检索和信息组织方面都有着重要的作用。
元数据体系的制订是提供合理著录规则以描述、搜索并处理数字信息资源的核心问题。在系统实现时,通过XML对元数据进行标引表示,各种资源元数据的设计基于DC。以数字图书馆为例,数字图书资源主要包括如下元素,题名、副题名、作者、主题、内容简介、出版单位、出版日期、类型、格式、ISBN号、来源、覆盖范围、关联、权限(版权)等。另外,还可根据需要增加对资源的主观评价、对资源的监测周期、资源的社会点击次数、推荐人等元素,以使元数据体系更趋完善。
3.数字信息资源的整合
数字信息资源表现的形式多种多样,各种数据格式千差万别。因此,在系统实现时,需要对不同格式的数字信息进行整合,从而通过统一的接口为用户服务,用户可以同时访问和检索各种数字资源和各种数据库。下面是基于数字图书馆的数字信息资源整合系统结构图(见图3)。
4.数字信息的存储管理和Web服务
随着数字信息资源的不断增多,用户迫切需要对海量数据进行压缩存储管理,对内容实施快捷、全面、准确的检索,实现智能化、个性化、自动化Web服务。该系统采用分布式的系统结构,通过网络文件系统对分布在不同服务器上、不同目录下的发布文件进行读取、设置,建立索引并实现索引的自动建立、更新、合并等操作,实现系统数字化信息资源的分布式存放,从而对用户提供统一的查询入口。系统提供统一的系统管理与定制界面,系统管理员可定义用户、用户组、索引文档类型、索引字段(属性)、存储组,设备和生命周期及用户安全配置文件等。系统具有较强的监控能力和安全信任机制,提供运行日志、Web访问用户等的分析功能,针对不同的用户身份设置不同的使用权限和不同的开放程度。
另外,系统支持电子图书阅览,基于人工智能检索(语义检索),全面支持流行的XML格式数据,从而实现全文检索及组合检索。还支持跨信息库检索、音频视频多媒体信息发布和服务。这样就方便用户精确定位信息,从而提高查全率、查准率。