论文部分内容阅读
[摘 要]数字资源的创建、加工和应用是一项艰巨、复杂并极具挑战性的工作,其原因在于数字资源本身以及应用环境与需求的多样性。CADAL项目为全世界用户提供服务,促进了中外文化交流,也为学术研究者提供了一个权威的信息检索平台。从其官方网站可以看出,至今已有10年之久的CADAL项目,数字资源得到了不断丰富和发展,内容和服务也日臻完善。同时,中国、美国和印度等国家的参建单位将具有重大参考价值的数字化资源存放在该网站上,也给全世界进一步了解中国悠久历史的机会。
[关键词]CADAL 数字化加工 标准规范
[中图分类号] G250.76 [文献标识码] A [文章编号] 2095-3437(2015)03-0165-02
一、CADAL项目简介
大学数字图书馆国际合作计划(CADAL:China Academic Digital Associative Library)前身为高等学校中英文图书数字化国际合作计划(CADAL:China America Digital Academic Library)[1],与中国高等教育文献保障系统(CALIS:China Academic Library & Information System)一起,共同构成中国高等教育数字化图书馆的框架。[2]CADAL项目为国家重点建设项目,由浙江大学联合清华大学、北京大学、武汉大学、华中科技大学等60余所国内知名高校,美国互联网档案馆,卡内基·梅隆大学,伊利诺伊大学,哈佛燕京学社,哥伦比亚大学以及印度科学院,安那大学,阿鲁密工程学院等20余所国外著名学府或科研机构共同承担。
该项目从2003年开始启动,经过一期和二期建设,截止2014年2月底,累计入库数据超过274万册,其中,中文现代图书近60万册,英文图书超55万册,中文古籍25.6万册、民国书刊43.6万册。[3]项目建设的总体目标是:构建拥有多学科、多类型、多语种海量数字资源,由国内外图书馆、学术组织、学科专业人员广泛参与建设与服务,具有高技术水平的学术数字图书馆,成为国家创新体系信息基础设施之一。[1]
二、数字化加工流程与标准规范
数字资源建设是数字图书馆的一项核心工作,而数字资源标准化加工流程又是数字资源建设的基础,因此,统一数字资源的加工流程与标准规范将有效推动和保障数字图书馆建设的顺利推进。[4]然而,数字资源的创建、加工和应用是一项艰巨、复杂并极具挑战性的工作,其原因在于数字资源本身以及应用环境与需求的多样性。限于篇幅的考虑,本文仅介绍笔参与武汉大学图书馆CADAL项目二期建设期间,中、英文现代图书和民国图书的数字化加工流程及标准规范。
首先,武汉大学图书馆向CADAL项目管理中心提交数字资源参建申请,由CADAL项目组进行评估,并从申报资源中选择CADAL项目所需的资源类型,待资源查重、审核通过后方可进行数字化加工制作。然后,合作单位按照如图1所示的加工流程对其进行数字化加工。数字图书资源加工可大致分为5个步骤:①纸质图书通过扫描仪或数码相机获取黑白、灰度或彩色图像;②图像处理环节,主要包括页面旋转、版面切割、文字纠偏、内容居中、图像去污等一系列操作;③以单本图书为著录单位,保持其目录章节结构及层次在排版上基本与原图书一致,主要包括图书目录的OCR识别及内容导向链接;④以单本图书为著录单位,参照《元数据著录规范》[5]进行图书元数据编辑;⑤将图书页面数据、目录数据、元数据对象按照指定格式封装,并进行数据质检,确保无误后提交给CADAL项目管理中心。图书数字化加工的标准规范如表1所示。
三、结束语
CADAL项目为全世界用户提供服务,促进了中外文化交流,也为学术研究者提供了一个权威的信息检索平台。从其官方网站可以看出,至今已有10年之久的CADAL项目,数字资源得到了不断丰富和发展,内容和服务也日臻完善。同时,中国、美国和印度等国家的参建单位将具有重大参考价值的数字化资源存放在该网站上,也给全世界进一步了解中国悠久历史的机会。
[ 注 释 ]
[1] CADAL项目简介[EB/OL].http://www.cadal.cn / xmjj / [2014-05-19].
[2] 马选利,魏青山.CADAL项目在西安交通大学数字图书馆建设中应用实践[J].晋图学刊,2013(6):22-24.
[3] CADAL资源介绍[EB / OL].http://www.cadal.cn / xmjj / zyjs.htm[2014-06-06].
[4] 刘聪明,姜爱蓉.CADAL项目资源数字化对比研究——以清华大学图书馆为例[J].内蒙古师范大学学报(哲学社会科学版),2012(6):125-128.
[5] CADAL项目管理中心.CADAL数字化文本:元数据著录细则(第2版)[S / OL],http://www.cadal.cn / softdown / CADAL_metadata_2004.pdf[2012-02-05].
[责任编辑:钟 岚]
[关键词]CADAL 数字化加工 标准规范
[中图分类号] G250.76 [文献标识码] A [文章编号] 2095-3437(2015)03-0165-02
一、CADAL项目简介
大学数字图书馆国际合作计划(CADAL:China Academic Digital Associative Library)前身为高等学校中英文图书数字化国际合作计划(CADAL:China America Digital Academic Library)[1],与中国高等教育文献保障系统(CALIS:China Academic Library & Information System)一起,共同构成中国高等教育数字化图书馆的框架。[2]CADAL项目为国家重点建设项目,由浙江大学联合清华大学、北京大学、武汉大学、华中科技大学等60余所国内知名高校,美国互联网档案馆,卡内基·梅隆大学,伊利诺伊大学,哈佛燕京学社,哥伦比亚大学以及印度科学院,安那大学,阿鲁密工程学院等20余所国外著名学府或科研机构共同承担。
该项目从2003年开始启动,经过一期和二期建设,截止2014年2月底,累计入库数据超过274万册,其中,中文现代图书近60万册,英文图书超55万册,中文古籍25.6万册、民国书刊43.6万册。[3]项目建设的总体目标是:构建拥有多学科、多类型、多语种海量数字资源,由国内外图书馆、学术组织、学科专业人员广泛参与建设与服务,具有高技术水平的学术数字图书馆,成为国家创新体系信息基础设施之一。[1]
二、数字化加工流程与标准规范
数字资源建设是数字图书馆的一项核心工作,而数字资源标准化加工流程又是数字资源建设的基础,因此,统一数字资源的加工流程与标准规范将有效推动和保障数字图书馆建设的顺利推进。[4]然而,数字资源的创建、加工和应用是一项艰巨、复杂并极具挑战性的工作,其原因在于数字资源本身以及应用环境与需求的多样性。限于篇幅的考虑,本文仅介绍笔参与武汉大学图书馆CADAL项目二期建设期间,中、英文现代图书和民国图书的数字化加工流程及标准规范。
首先,武汉大学图书馆向CADAL项目管理中心提交数字资源参建申请,由CADAL项目组进行评估,并从申报资源中选择CADAL项目所需的资源类型,待资源查重、审核通过后方可进行数字化加工制作。然后,合作单位按照如图1所示的加工流程对其进行数字化加工。数字图书资源加工可大致分为5个步骤:①纸质图书通过扫描仪或数码相机获取黑白、灰度或彩色图像;②图像处理环节,主要包括页面旋转、版面切割、文字纠偏、内容居中、图像去污等一系列操作;③以单本图书为著录单位,保持其目录章节结构及层次在排版上基本与原图书一致,主要包括图书目录的OCR识别及内容导向链接;④以单本图书为著录单位,参照《元数据著录规范》[5]进行图书元数据编辑;⑤将图书页面数据、目录数据、元数据对象按照指定格式封装,并进行数据质检,确保无误后提交给CADAL项目管理中心。图书数字化加工的标准规范如表1所示。
三、结束语
CADAL项目为全世界用户提供服务,促进了中外文化交流,也为学术研究者提供了一个权威的信息检索平台。从其官方网站可以看出,至今已有10年之久的CADAL项目,数字资源得到了不断丰富和发展,内容和服务也日臻完善。同时,中国、美国和印度等国家的参建单位将具有重大参考价值的数字化资源存放在该网站上,也给全世界进一步了解中国悠久历史的机会。
[ 注 释 ]
[1] CADAL项目简介[EB/OL].http://www.cadal.cn / xmjj / [2014-05-19].
[2] 马选利,魏青山.CADAL项目在西安交通大学数字图书馆建设中应用实践[J].晋图学刊,2013(6):22-24.
[3] CADAL资源介绍[EB / OL].http://www.cadal.cn / xmjj / zyjs.htm[2014-06-06].
[4] 刘聪明,姜爱蓉.CADAL项目资源数字化对比研究——以清华大学图书馆为例[J].内蒙古师范大学学报(哲学社会科学版),2012(6):125-128.
[5] CADAL项目管理中心.CADAL数字化文本:元数据著录细则(第2版)[S / OL],http://www.cadal.cn / softdown / CADAL_metadata_2004.pdf[2012-02-05].
[责任编辑:钟 岚]