论文部分内容阅读
摘 要:军事高等教育特色数据库建设对于提高军事高等教育学科发展和科学研究水平具有重要意义。本文介绍了利用清华同方TPI系统进行军事高等教育特色数据库建设的实际情况,详细阐述了整个系统的构成与功能。本文可为大学以及科技情报界建设具有单位特色的数字资源提供参考。
关键词:TPI 军事高等教育特色数据库 数据库建设
中图分类号:G250.74 文献标识码:A 文章编号:1673-8454(2008)17-0023-03
一、军事高等教育特色数据库建设的意义与目的
随着现代科学技术特别是信息技术的发展,世界新军事变革将在更大范围和更深层次上加速推进。军事教育与训练转型既是新军事变革的重要组成部分,也是新军事变革深入发展的动力之一,其本质是围绕建设信息化军队、打赢信息化战争的根本目标,全面变革军事教育与训练的观念、体制、内容和方式方法,提高人才培养质量和军队作战能力。加强军事高等教育研究,对于科学谋划我军军事高等教育的发展,促进人才战略工程的实施,培养高素质的新型军事人才具有重要而深远的意义。
目前,世界高等教育研究与政策咨询正逐渐由定性向定性与定量相结合的方向发展,日益重视定量研究,不断加强高水平教育研究数据库及其相应网络设施的建设,提升高等教育研究品质。信息化时代的到来,使高等教育数据库建设已成为科学研究的必需,是提高科学研究水平的重要保障。
现阶段我军所使用的教育训练数据库还比较单一,主要是一些教学内容数据库(如课件、电子教案、WEB教材等)和教学管理信息系统(教员档案管理系统、学员学籍管理系统、成绩管理系统、考试系统、排课系统、教学质量评估系统、日常办公自动化系统等),尤其是缺乏与军事高等教育研究相关的数据库资源,给从事军事高等教育工作的广大教学科研人员带来极大不便。
因此,军事高等教育特色数据库的建设,将为教学科研人员提供丰富的高等教育学科领域的信息资源和先进的研究手段,促进军事高等教育学科的发展和研究水平的提高,对于军队院校的建设与发展和高素质新型军事人才培养具有重要的意义。
本文介绍了利用清华同方图书馆建设平台TPI系统建设军事高等教育特色数据库的实际情况和使用体会。
二、军事高等教育特色数据库建设的内容
军事高等教育特色数据库主要由以下部分组成:高等教育数据库(包括与高等教育理论、高等教育管理、高等教育评估、综合大学研究相关的硕博学位论文、学术期刊论文);外军院校教育数据库(包括外军院校研究、外军院校资料、外军院校网站镜像);军事高等教育学科数据库(包括军事教育硕博学位论文,军事教育学术期刊论文,教育理论创新、任职教育、研究生教育等军事教育论文集、军事教育理论创新与发展等学术会议论文集、我校高等教育学硕士点学位论文、发表的文章、课题研究报告、教学课件及网络课程等);学校专题研究数据库(包括学校教学管理、科研管理、人才培养、学科建设等专题研究数据)。
近年来随着网络技术和现代通讯技术的迅猛发展,特别是Internet网络的发展,网上信息资源已经成为情报资源的重要来源。Internet网络是世界上规模最大、用户最多、影响最广泛的网络互联系统,它给我们创造了一个崭新的信息网络环境,提供了便利的信息获取与传输的渠道和工具,是信息资源查询和共享的最大的信息超级市场。在特色数据库建设中,还考虑从Internet网上实时采集高等教育和军事高等教育相关的信息,并存储在本地数据库,及时提高数据库信息资源的容量和保证研究人员及时跟踪与掌握最新的高等教育研究动态与政策变化。
三、利用TPI系统建设军事高等教育特色数据库
军事高等教育特色数据库必须具备以下功能:(1)高性能的全文数据库服务器、检索服务器以及管理系统。(2)先进的传统信息采集、加工工具。(3)高效、准确的信息检索系统。(4)Internet网络情报采集系统。(5)先进的内容发布系统。(6)支持标准的检索协议,可以实现资源共享。因此选择优秀的制作平台就显得尤为关键。
在经过对各个软件制作平台的考察和评价之后,清华同方TPI软件制作平台被选择作为军事高等教育特色数据库的管理系统。其优势表现在:(1)它是一套集数据预处理、数据装载、索引建立、检索、用户管理和资源管理于一体的通用信息管理系统,用户可以方便地使用建库工具建立一个空数据库结构后装入数据、建立索引,无须二次开发即可直接使用,检索界面和管理界面均以浏览器方式进行;(2)该系统针对数字信息资源建设中的三个基本要素提出了全面解决的方案。如制成的电子图书,利用网络或光盘、磁盘载体进行发布,实现资源共享;(3) TPI为高效地完成全文检索及分类标引,方便读者并向读者提供原文副本等,提供了一条方便快捷的解决途径,同时能够实现军事高等教育数据库各库之间的相互关联,最终达到跨库检索的目的;(4)它同时还可以和清华同方的《中国期刊全文数据库》兼容。(5)可同时采用TPI同一个公司开发的网络情报采集与监控系统进行网络信息采集,能较好实现与TPI系统的兼容,并不需要再单独购买数据库管理系统,节省费用。
整个系统总体结构如图1所示。
系统将由数据库建设子系统、数据库管理子系统、网络情报采集与监控子系统、内容发布与管理子系统四个子系统组成。整个系统由清华同方的TPI系统和网络情报与监控系统搭建完成。
1.数据库建设子系统
该子系统完成数据库资源的建设。主要包括采用电子图书制作工具实现对纸质文档的数字化;对各种现有数据库电子资源的数据转换;把各种通用文档转换成统一格式;最后实现对数字对象的分类、标引,把这些数字对象加工成数据库电子资源。
2.数据库管理子系统
该子系统以管理大容量非结构化数据对象为主,具备智能信息处理能力,支持高速全文检索,可以统一访问和管理各种异构资源。数据库管理子系统主要包括两个方面的内核,一个是数据库内核(包括数据字典、查询分析、查询优化等);另一个是智能文本挖掘内核(包括文本分类、文本聚类、自动文摘等)。
3.网络情报采集与监控子系统
该子系统监视与军事高等教育相关的重点网站,获得最新的信息资源。它可根据用户需求,及时、准确地从互联网上定向采集用户需要的信息,并存储在本地,向用户提供服务。该子系统的模块包括:①信息采集:通过网络蜘蛛,可以多线程地抓起多个相关网站的内容;可以实现灵活的采集策略,实时动态监控特定目标,实现信息的自动采集。②智能代理模块:进行浅层语义分析,对所有抓取的网络数据进行全面的分析过滤,识别出所需要的信息;系统将采集到的有用信息导入到底层数据库中,并可通过内容管理与发布子系统将相关的内容展现给用户。
4.内容管理与发布子系统
内容管理与发布子系统完成数据的分布式采编入库,实现网站信息的发布与管理,实现动态实时发布,及时生效。方便管理员对数据库进行远程维护;为用户提供统一的全文检索、数据下载、数据分析等功能,帮助研究人员更好地使用信息资源。系统提供不同层面的数据安全控制,对不同的用户组赋予不同的权限,使得不同的用户有不同的视图,不同级别的管理员有不同的操作权限,从而保证系统的安全和使用的方便性。
四、本系统的使用和体会
1.系统运行平台
整个系统的硬件结构如图2所示。
系统采用如下的硬件配置:(1)采集服务器IBM3650:在一台IBM服务器上部署信息采集系统,并与Internet网相连接,负责对重点网站进行监视和信息搜集;(2)数据库服务器IBM3650:在一台IBM服务器部署数据库管理系统,并通过两台交换机分别与军网和本单位局域网连接,通过设置不同权限供军网和本单位人员使用特色数据库资源;(3)安全机:使用一台PC机,该机不与任何网络相连接。对采集的资源,使用非保密移动硬盘,将互联网上采集的系统导入到安全机,并进行查毒、杀毒等操作;然后使用一个保密移动硬盘,将这些资料存储到内网的特色数据库服务器上。
2.系统使用与体会
目前,系统的期刊全文数据库已录入数据4万多条、硕士博士论文全文数据库已录入数据近千条,并从网络下载相关数据1万多条。系统已经与本单位局域网相连,本单位研究人员在使用过程中系统运行良好,界面友好易使用,通过从各种资料数据库中搜索需要的资料,真正方便了研究人员。但在使用过程中也发现一些问题,如元数据的标引中对文件的质量要求较高,尤其在标引过程中就会出现乱码,错误较多;网络监控下载的信息也存在一些无关冗余信息等等。相信在今后软件开发过程中这些问题与不足将会得到解决。
参考文献:
[1]清华同方数字图书馆管理与建设平台—TPI技术白皮书, 2006.
[2]吴旭. TPI与公安文献数据库的建设[J]. 中国人民公安大学学报(自然科学版),2005(4):87-89.
[3]孙书平. 清华同方数字图书馆管理与建设平台TPI试用报告[J].图书馆学研究,2004(3):14-16.
[4]吴涛,李锋. 基于TPI的特色数据库建设实践[J]. 现代情报,2005(7):165-168.
[5]刘东玉. 应用TPI系统建设特色型数字图书馆[J]. 现代图书情报技术, 2003(105):6-7.
关键词:TPI 军事高等教育特色数据库 数据库建设
中图分类号:G250.74 文献标识码:A 文章编号:1673-8454(2008)17-0023-03
一、军事高等教育特色数据库建设的意义与目的
随着现代科学技术特别是信息技术的发展,世界新军事变革将在更大范围和更深层次上加速推进。军事教育与训练转型既是新军事变革的重要组成部分,也是新军事变革深入发展的动力之一,其本质是围绕建设信息化军队、打赢信息化战争的根本目标,全面变革军事教育与训练的观念、体制、内容和方式方法,提高人才培养质量和军队作战能力。加强军事高等教育研究,对于科学谋划我军军事高等教育的发展,促进人才战略工程的实施,培养高素质的新型军事人才具有重要而深远的意义。
目前,世界高等教育研究与政策咨询正逐渐由定性向定性与定量相结合的方向发展,日益重视定量研究,不断加强高水平教育研究数据库及其相应网络设施的建设,提升高等教育研究品质。信息化时代的到来,使高等教育数据库建设已成为科学研究的必需,是提高科学研究水平的重要保障。
现阶段我军所使用的教育训练数据库还比较单一,主要是一些教学内容数据库(如课件、电子教案、WEB教材等)和教学管理信息系统(教员档案管理系统、学员学籍管理系统、成绩管理系统、考试系统、排课系统、教学质量评估系统、日常办公自动化系统等),尤其是缺乏与军事高等教育研究相关的数据库资源,给从事军事高等教育工作的广大教学科研人员带来极大不便。
因此,军事高等教育特色数据库的建设,将为教学科研人员提供丰富的高等教育学科领域的信息资源和先进的研究手段,促进军事高等教育学科的发展和研究水平的提高,对于军队院校的建设与发展和高素质新型军事人才培养具有重要的意义。
本文介绍了利用清华同方图书馆建设平台TPI系统建设军事高等教育特色数据库的实际情况和使用体会。
二、军事高等教育特色数据库建设的内容
军事高等教育特色数据库主要由以下部分组成:高等教育数据库(包括与高等教育理论、高等教育管理、高等教育评估、综合大学研究相关的硕博学位论文、学术期刊论文);外军院校教育数据库(包括外军院校研究、外军院校资料、外军院校网站镜像);军事高等教育学科数据库(包括军事教育硕博学位论文,军事教育学术期刊论文,教育理论创新、任职教育、研究生教育等军事教育论文集、军事教育理论创新与发展等学术会议论文集、我校高等教育学硕士点学位论文、发表的文章、课题研究报告、教学课件及网络课程等);学校专题研究数据库(包括学校教学管理、科研管理、人才培养、学科建设等专题研究数据)。
近年来随着网络技术和现代通讯技术的迅猛发展,特别是Internet网络的发展,网上信息资源已经成为情报资源的重要来源。Internet网络是世界上规模最大、用户最多、影响最广泛的网络互联系统,它给我们创造了一个崭新的信息网络环境,提供了便利的信息获取与传输的渠道和工具,是信息资源查询和共享的最大的信息超级市场。在特色数据库建设中,还考虑从Internet网上实时采集高等教育和军事高等教育相关的信息,并存储在本地数据库,及时提高数据库信息资源的容量和保证研究人员及时跟踪与掌握最新的高等教育研究动态与政策变化。
三、利用TPI系统建设军事高等教育特色数据库
军事高等教育特色数据库必须具备以下功能:(1)高性能的全文数据库服务器、检索服务器以及管理系统。(2)先进的传统信息采集、加工工具。(3)高效、准确的信息检索系统。(4)Internet网络情报采集系统。(5)先进的内容发布系统。(6)支持标准的检索协议,可以实现资源共享。因此选择优秀的制作平台就显得尤为关键。
在经过对各个软件制作平台的考察和评价之后,清华同方TPI软件制作平台被选择作为军事高等教育特色数据库的管理系统。其优势表现在:(1)它是一套集数据预处理、数据装载、索引建立、检索、用户管理和资源管理于一体的通用信息管理系统,用户可以方便地使用建库工具建立一个空数据库结构后装入数据、建立索引,无须二次开发即可直接使用,检索界面和管理界面均以浏览器方式进行;(2)该系统针对数字信息资源建设中的三个基本要素提出了全面解决的方案。如制成的电子图书,利用网络或光盘、磁盘载体进行发布,实现资源共享;(3) TPI为高效地完成全文检索及分类标引,方便读者并向读者提供原文副本等,提供了一条方便快捷的解决途径,同时能够实现军事高等教育数据库各库之间的相互关联,最终达到跨库检索的目的;(4)它同时还可以和清华同方的《中国期刊全文数据库》兼容。(5)可同时采用TPI同一个公司开发的网络情报采集与监控系统进行网络信息采集,能较好实现与TPI系统的兼容,并不需要再单独购买数据库管理系统,节省费用。
整个系统总体结构如图1所示。
系统将由数据库建设子系统、数据库管理子系统、网络情报采集与监控子系统、内容发布与管理子系统四个子系统组成。整个系统由清华同方的TPI系统和网络情报与监控系统搭建完成。
1.数据库建设子系统
该子系统完成数据库资源的建设。主要包括采用电子图书制作工具实现对纸质文档的数字化;对各种现有数据库电子资源的数据转换;把各种通用文档转换成统一格式;最后实现对数字对象的分类、标引,把这些数字对象加工成数据库电子资源。
2.数据库管理子系统
该子系统以管理大容量非结构化数据对象为主,具备智能信息处理能力,支持高速全文检索,可以统一访问和管理各种异构资源。数据库管理子系统主要包括两个方面的内核,一个是数据库内核(包括数据字典、查询分析、查询优化等);另一个是智能文本挖掘内核(包括文本分类、文本聚类、自动文摘等)。
3.网络情报采集与监控子系统
该子系统监视与军事高等教育相关的重点网站,获得最新的信息资源。它可根据用户需求,及时、准确地从互联网上定向采集用户需要的信息,并存储在本地,向用户提供服务。该子系统的模块包括:①信息采集:通过网络蜘蛛,可以多线程地抓起多个相关网站的内容;可以实现灵活的采集策略,实时动态监控特定目标,实现信息的自动采集。②智能代理模块:进行浅层语义分析,对所有抓取的网络数据进行全面的分析过滤,识别出所需要的信息;系统将采集到的有用信息导入到底层数据库中,并可通过内容管理与发布子系统将相关的内容展现给用户。
4.内容管理与发布子系统
内容管理与发布子系统完成数据的分布式采编入库,实现网站信息的发布与管理,实现动态实时发布,及时生效。方便管理员对数据库进行远程维护;为用户提供统一的全文检索、数据下载、数据分析等功能,帮助研究人员更好地使用信息资源。系统提供不同层面的数据安全控制,对不同的用户组赋予不同的权限,使得不同的用户有不同的视图,不同级别的管理员有不同的操作权限,从而保证系统的安全和使用的方便性。
四、本系统的使用和体会
1.系统运行平台
整个系统的硬件结构如图2所示。
系统采用如下的硬件配置:(1)采集服务器IBM3650:在一台IBM服务器上部署信息采集系统,并与Internet网相连接,负责对重点网站进行监视和信息搜集;(2)数据库服务器IBM3650:在一台IBM服务器部署数据库管理系统,并通过两台交换机分别与军网和本单位局域网连接,通过设置不同权限供军网和本单位人员使用特色数据库资源;(3)安全机:使用一台PC机,该机不与任何网络相连接。对采集的资源,使用非保密移动硬盘,将互联网上采集的系统导入到安全机,并进行查毒、杀毒等操作;然后使用一个保密移动硬盘,将这些资料存储到内网的特色数据库服务器上。
2.系统使用与体会
目前,系统的期刊全文数据库已录入数据4万多条、硕士博士论文全文数据库已录入数据近千条,并从网络下载相关数据1万多条。系统已经与本单位局域网相连,本单位研究人员在使用过程中系统运行良好,界面友好易使用,通过从各种资料数据库中搜索需要的资料,真正方便了研究人员。但在使用过程中也发现一些问题,如元数据的标引中对文件的质量要求较高,尤其在标引过程中就会出现乱码,错误较多;网络监控下载的信息也存在一些无关冗余信息等等。相信在今后软件开发过程中这些问题与不足将会得到解决。
参考文献:
[1]清华同方数字图书馆管理与建设平台—TPI技术白皮书, 2006.
[2]吴旭. TPI与公安文献数据库的建设[J]. 中国人民公安大学学报(自然科学版),2005(4):87-89.
[3]孙书平. 清华同方数字图书馆管理与建设平台TPI试用报告[J].图书馆学研究,2004(3):14-16.
[4]吴涛,李锋. 基于TPI的特色数据库建设实践[J]. 现代情报,2005(7):165-168.
[5]刘东玉. 应用TPI系统建设特色型数字图书馆[J]. 现代图书情报技术, 2003(105):6-7.