论文部分内容阅读
摘 要 论文介绍了民国图书文献的开发整理现状,进一步分析了当前民国文献整理研究中存在的问题,并提出了通过制定著录标准、收藏单位联合系统整理民国文献、编制专题索引、搭建智能检索平台等进行深度开发研究的方法。
关键词 民国文献 文献整理 文献开发
分类号G257
A Systematic Organization and In-depth Development Research on Literatures of the Republic of China
Liu Li, Wang Shu
Abstract This paper introduces the current status of the development and organization of literatures of the Republic of China. It further analyzes the problems in the current organization and researches of literatures of the Republic of China and presents methods of to enacting record standards, systematically organizing literatures of the Republic of China with the collection entities, enacting subject indexes and building intelligent retrieval platforms.
Keywords Literatures of the Republic of China. Literature arrangement. Literature development.
引言
近年來,民国文献的开发和整理越来越受到重视,民国文献收藏单位开始民国文献整理出版,编制联合目录,开发数字化全文,各种关于民国文献的数据库也应运而生,为民国史各学科的研究提供了丰富的数据支持。但是由于整理工作各自为政,整理的标准不统一,深度不够,看似繁荣的整理工作经费投入不少,实际效果却不理想。很多研究者仍然无法简单高效地找到全面、正确的民国文献相关资料。因此如何整合各方力量,有效地开展整理工作,为研究者提供更好的资源服务,值得思考和研究。
1 民国文献整理现状分析
民国文献包括图书、期刊、报纸、档案、图片、政府出版物等类型,本文将着重讨论图书的整理情况。
1.1民国文献联合目录
1949年以来,全国文献存藏机构编制的民国文献联合目录共计16种,图书书目仅为3种,其中《民国时期总书目》由北京图书馆编辑,由书目文献出版社于1986年-1997年陆续出版。它主要以国家图书馆、上海图书馆、重庆图书馆的馆藏为基础编撰,主要收录了民国时期(1911年至1949年9月间)中国出版的中文图书124000余种,基本反映了民国时期出版的图书全貌,是收入图书书目数量最多,也是最具权威的民国图书联合书目。另外两种图书书目《解放区根据地图书书目》以及《抗日战争时期出版图书联合目录》为专题联合图书书目[1]。
1.2 民国文献数据库
民国文献由于分布广、纸张酸化严重等问题,导致用户在查阅时诸多不便,因此民国文献数据库是现代民国文献保护的重要手段。一些数据出版公司也重点开发了民国文献数据库,如尚品大成的“大成故纸堆”,收录民国图书4万多种;《民国文献大全数据库》由北京时代瀚堂科技有限公司整合提供民国图书逾13万册;《维库民国电子资源数据库》目前推出131229种全文影像资源,其中图书文献近8万种;《典海民国图书资源平台》收录民国年间出版的各类图书10万余种。这些数据库重视用户体验,在功能检索方面能提供较好的体验[2],但只对付费用户开放。
与此同时,各大公共图书馆纷纷将本馆的民国文献进行数字化,建立本馆的民国文献数据库。国家图书馆策划了“民国时期文献保护计划”项目,联合国内文献收藏单位制作了《民国图书数据库》,其中国家图书馆所藏占到全国民国文献的大部分,以官方文件、内部资料等珍稀文献为特色,分为三期建设,每期收录民国图书5万种。截止到目前为止,民国时期文献联合目录已汇聚书目数据30余万条,超过《民国时期总书目》著录的12万种[3]。重庆图书馆于2013年建成“重庆中国抗战大后方历史文献中心”,全面收集抗战文献,目前已形成纸质文献、缩微文献、图书期刊数据库、3D数字图书馆等为一体的全方位抗战文献中心[4]。上海图书馆建有《民国图书数据库》,收录1911年-1949年间出版的各类中文图书,收录内容为图书全文影像,种类齐全,数据库以《民国总书目》为依据,收录图书15万种[5]。
这些整理工作的完成为开展民国相关学科和专业研究工作打下了很好的基础,但在实际使用这些资源时也发现一些问题:由于加工深度不够以及技术上的限制,研究资料的查全率不高,还有部分馆藏书目不对外开放,导致无法查询等。
2 民国图书整理工作存在的问题
2.1 《民国时期总书目》
《民国时期总书目》是回溯性国家书目,全书按《中文普通图书统一著录条例》著录,按《中国图书馆图书分类法》分类编排,共计17卷21册约12万种,基本反映了民国时期出版的图书全貌[6],其收录的书目多数都有内容提要。尽管如此,《民国时期总书目》由于其所在年代的历史原因,也存在一些遗憾。
2.1.1书目整理不全面
《民国时期总书目》根据国家图书馆、上海图书馆、重庆图书馆的藏书收录,少量补充其他图书馆的馆藏目录,对于有目无书者未能收录,线装书、国内出版的外文书、少数民族文字图书也未收录。由于当时人力物力的限制,难免有所遗漏,并不能全面的反应全国民国图书的收录情况,例如南京图书馆的前身是国民党的中央图书馆和江苏省国学图书馆。解放后,这两个馆的藏书除少部分运往台湾外,大部分保留了下来,同时许多政府机关、团体及中央政治学校所存文献也存放在南京图书馆[7]。此外,总书目主要以公共图书馆的馆藏目录为主,而民国图书在各地的档案馆、博物馆、研究机构、外事机构以及收藏者中也有一定数量和规模的藏书并未收录与此。 2.1.2书目信息不完整
由于民国时期处于中国历史的变革期,不仅与现代图书在出版、印刷、装帧等方面有着巨大的差异,即便是民国初期图书与民国后期图书相比,不同时间、不同区域的书籍也存在着巨大的差异,再加上当时没有统一的出版格式和出版标准,作为总书目的数据制作人员只能如实记录,从而导致书目信息不完整。此外,由于处在战乱时期,信息交流的不通畅也可能导致同一种书的作者、出版年代、发行者、印刷者等项目出现误差。再加上当时的印刷、储存条件有限,很多书籍会出现缺页、损毁现象,也导致著录的书目信息不完整。
2.1.3索引编制单一
《民国时期总书目》按《中文普通图书统一著录条例》著录,按《中国图书馆图书分类法》分类编排,各分册附书名音序索引和笔划检索表。整个书目共计12万条,在进行书目检索时,只能通过书名对书目进行检索,要求检索者了解书籍的详细题名,按题目拼音或者笔画进行检索。如果通过分类进行查找,则需要在所选分类中进行逐条查找,这样也大大降低了使用效率。在编制时,如能加入要目索引、作者索引,相信能节省检索时间,方便读者。
《民国时期总书目》自出版之日起至今也有三十余年,岁月变迁,随着民国图书收藏馆的搬迁、合并、整理,现有的民国图书收藏馆和馆藏地也发生了巨大的变化。笔者在使用过程中发现,大量的书目信息在对应馆藏地的网上数字检索系统中并未检索到,通过电话调查,有些图书在搬迁过程中或已遗失,有些图书或因存放不当已经损毁。《民国时期总书目》亟需重新进行编纂。
2.2 民国时期文献联合目录
民国时期文献联合目录现有数据30多万条,由14个成员馆的近50万条馆藏数据进行查重后汇集到该平台发布,为相关研究人员提供了很大的便利,但是在使用时也存在一些问题。
2.2.1系统检索效率低
民国时期文献联合目录提供简单检索和高级检索。简单检索可以通过题名、责任者、出版年代等选项进行检索。当通过明确的图书信息进行检索时,平台能够以较快的速度响应,并给出检索结果,但是扩大检索范围时,搜索结果反而减少。以检索词“保”和“保甲”通过题名进行检索为例,搜索结果同样都为237条。这种情况的出现说明该平台在检索功能的开发和设计上并没有能够让平台内部的数据信息得到充分的挖掘,检索数据的使用效率也受到了影响,降低了系统的鲁棒性。
2.2.2文献著录项目标准不一
在具体使用民国时期文献联合目录的过程中,由于联合目录的数据是由不同成员馆进行加工提交的,往往会存在各馆之间信息交流不够通畅,导致各成员馆对同一本书的著录标准不一。例如,张恨水在1943年出版的《丹凤街》,有的记录是在题名项中注明“原名:负贩列传”,有的则是在一般性附注项中注明“原名:负贩列传”。不同于其他时代的古籍图书,民国图书数据信息比较复杂,再者如出版地项,就会出现印刷地、发行地等特殊信息,这些都需要各成员馆之间有一个统一的著录标准,如果著录标准不统一,就会导致系统数据重复,影响使用效果。
2.2.3缺乏必要信息
现有的联合目录中能查询到的数据都是由各个成员馆提交并汇总的,馆藏地一项代表此条数据在对应的成员馆有纸本书目,便于研究人员进行查找,但是笔者发现有一些记录没有馆藏地项,也就意味此条书目的馆藏或已不存在,不存在的原因不得而知,如果能在详细信息中注明此条记录的信息来源,相信会更加有利于读者进行查询。
3 民国文献目录整理思路
3.1编制一部完整的民国文献联合目录
由国家图书馆牵头,联合各級各类收藏单位乃至个人收藏家,系统收集整理,厘清家底,编制一个能反映民国时期珍稀文献的精品目录为社会公众和学术研究服务,意义非常重大。
目前已面世的民国时期总书目和当前由国家图书馆主持的民国时期文献目录系统已投入使用,有着很好的应用前景,但也存在不少问题,我们希望在此基础上有进一步的提高,为此提出如下设想:
3.1.1扩大联合目录的收藏馆范围
目前国图主持的联合目录仅限国家文化系统的公共图书馆,建议加入全国教育系统的高校图书馆。国内北京大学等多所高校图书馆均有民国文献收藏,台湾地区和国外大学图书馆也有较多的收藏,如哈佛大学燕京图书馆、哥伦比亚大学东亚图书馆等,还有全国档案馆系统、研究院所的资料室等。在当前国家重视民国文献整理开发的形势下,建议由国家图书馆馆牵头,从县、市、省、国家分四级,从县级开始逐层开展文献调查和整理工作,统一标准开展人员培训。此项工作同时也在高校系统和档案馆系统开展,并鼓励个人收藏者参与。他们多年来在旧书市场以及个人手中收购交换的民国文献很有特色,个别文献的专题性、系统性、独特性甚至超越了图书馆、档案馆。
3.1.2加大联合目录的开发深度
现有标准下的民国文献目录比较简单,在查找民国文献时造成很高的漏检率,因此建议图书目录应详细著录文献篇章节各级目次和内容摘要、 关键词等。同时应增加特征项目的描述,对每种民国文献的收藏机构、文献品相都应有明确的著录。有一些特征细节在没有主要著录字段的情况下有辨别图书、区别版本的作用,这些特征往往存在于文献的内容之中,需在著录时加以注意,使民国文献目录不仅拥有揭示馆藏,保存文化的功能,更兼有实用性,在提高检索效率,开展学术研究方面发挥更大的作用。
3.1.3制定统一和兼容的民国书目著录标准
现有的印刷本民国书目和收藏馆的在线目录均存在著录项目不全的问题,造成不全的原因既可能是文献本身不完整,也可能是民国时期图书出版的标准与现在的不一致,导致很难分辨不同收藏馆的藏书是否是同一种书,还是不同版本。如果一味强调按照现行的国家标准著录,民国图书将进一步面临着著录不全问题和使用方面的困难。所以必须制定一个统一的著录标准,便于不同收藏馆目录的整合和对接。 例如,民国《出版法》规定的发行人即主办出版品之人,是发行所的代表人和直接责任人,发行所即相当于现在的“出版者”,承担着出版兼发行两种职能,发行人即相当于现在的“出版者”的代表人[8]。民国时期的图书,个人出版发行的情况很多,这类民国书的版权页一般只列有发行者个人,且发行者与该书的编著者多为同一人[8]。民国文献封面、题名页、版权页缺损较多,在著录标准规定的页上无法找到著录信息的,可在序、前言、后记中找出作者、出版地、出版时间等。此外,还应留意封底的出版标记,在民国时期,上海知名出版机构所出版的书籍的封底大多印有自己的出版标记,不要仅以不详简单著录。
在民国文献中还有一类较为常见的是单位的工作报告,没有记载出版者、发行者、发行所任何一项。这类工作报告尽管没有明确记载出版发行者的信息,但因其通常由本单位编写,介绍本单位的工作概况、且一般作为内部刊物不对外发行,将编辑单位作为出版者著录比著录为出版者不详对读者来说更有检索意义[8]。
目前国家馆的民国时期文献保护办公室制定了《民国图书联合目录数据暂行标准》,这个标准可进一步完善,加强推广力度,使民国文献的整理在一个统一的标准下开展,便于今后的合作交流,更方便用户的使用。
3.3 以服务学科研究为目标编制专题书目和索引
目前的民国文献数据库由于标引深度不够加上全文是图像版,存在某一主题资料查找不全的情况。其次,历史文献 (包括史料文献和研究文献)是多种类型并存和交织的。例如史料文献,有普通印刷本、影印本、记录影像和缩微胶片等文献类型;研究文献,除普通印刷本外,还有专题片、访谈 (包括电视访谈和网站访谈)、博客、电子文档等多种媒体形式。这些丰富的记录和表现形式有利于人们从多角度认识历史,但目前尚未有一个民国文献数据库能够多文献类型揭示某一主题文献[9]。对于民国史相关领域的研究人员来说,专题目录的编制非常必要。专题目录可充分利用现有的民国文献联合书目和民国文献数据库,在此基础上进行拓展深入,在选题方面要体现馆藏特色和学科需求,并围绕这一特色收集相对完整的文献资源。
3.4 以民国文献智能检索平台的开发和建设为未来发展目标
民国文献整理的趋势是数字化,在新技术背景下,民国文献目录已经从简单的汇集过渡到对文献的深度挖掘,目录数据库和拥有电子全文的民国文献数据库建设成为文献整理的主要方式。
在数据库的建设过程中,应注意提高收藏馆在线目录的质量以及开放共享的程度,改变目前部分馆和收藏单位书目不共享的现状,方便用户就近使用和免费获取。
其次,应加强指导,减少无序开发和低层次开发。随着民国文献重视程度的加强,当前民国文献数据库也层出不穷,同质化现象比较严重,相互交叉重复单又不完整,这样既造成浪费,又没有实现完整揭示的目标,并且数据库价格较高,对于个人用户和小单位来说无法支付。建议加强民国文献开发的控制和合作,降低开发成本,提供更大范围的使用。
此外,建设具有以下功能的智能化检索平台,提高用户体验质量水平。
(1)全文检索功能。目前许多民国文献数据库处于文本仅有图像格式文件,只能浏览而无法实现全文检索的状态,加上标引深度不够,数据漏检现象比较严重。新的智能平台不再是简单的书目或文本的数字化,而是保存文献信息源的影像资料,同时转化成能够被计算机网络所处理数字化的符号,对所有的文献实现全文检索。数据库能够提供原版图片格式和文字识别后的对照版本,供用户查考。
(2)自动断句和自动标引。海量数据单靠人工整理耗时耗力,系统在实现全文数字化的基础上,对于民国早期文献自动断句添加标点,方便用户阅读,同时实现自动提取和编制刊名、篇名、主题词、摘要、学科分类、出版时间、出版单位、作者等较为全面的检索点,使史料实现数据化管理。
(3)自动编撰功能。对于收集整理的海量数据,单靠人力无法按需进行专题整理,让计算机模拟人脑从大量史料文本中判断、选择出与编纂主题相关的资料,实现专题资料的自动编纂工作。
(4)建成开放式公共交流平台。该平台不仅能够实现文献的数字化智能整理,还为专家学者提供查询检索、校核比勘以及数据统计分析等信息处理功能服务,同时开展学术交流互动,成为兼有文献查询、学术研究、普及教育、读者互动功能的知识服务平台。
民国文献的应用需求越来越多,文献整理工作需要加快步伐,科学有序地开发整理,为研究工作创造更好的条件。
参考文献
[1]蔡迎春, 段晓林. 民国文献目录编制沿革及其趋势[J]. 图书馆论坛, 2017(8): 119-124.
[2]段晓林. 民国文献数据库开发现状研究[J]. 图书馆学研究, 2016(20): 42-45.
[3]民国图书数据库[EB/OL].[2018-03-23].http://www.lib.sjtu.edu.cn/index.php?m=content&c=index&a=show&catid=223&id=1475.
[4]重庆图书馆.民国文献[EB/OL].[2018-03-23].http://www.cqlib.cn/?q=-literature.
[5]上海图书馆资源导航库[EB/OL].[2018-04-06].http://db.idoc.sh.cn/.
[6]民國时期总书目[EB/OL].[2018-04-13].https://baike.baidu.com/item/%E6%B0%91%E5%9B%BD%E6%97%B6%E6%9C%9F%E6%80%BB%E4%B9%A6%E7%9B%AE/9109114?fr=aladdin.
[7]南京图书馆[EB/OL].[2018-04-13].http://www.jslib.org.cn/.
[8]李丽芳, 宋晶晶. 民国图书出版发行信息的CNMARC格式著录[J]. 国家图书馆学刊, 2013(5): 74-77.
[9]杨树. 网络环境下编制专题史目的意义和方法:编纂《近十年辛亥革命史料和研究文献书目索引》的探索[J]. 图书情报论坛, 2012(3): 38-40.
刘莉 江苏警官学院图书馆馆长、民国警察史料研究中心副主任、研究馆员。江苏南京,210031。
王姝 江苏警官学院图书馆读者服务部副主任、馆员。江苏南京,210031。
(收稿日期:2018-06-25 编校:陈安琪)
关键词 民国文献 文献整理 文献开发
分类号G257
A Systematic Organization and In-depth Development Research on Literatures of the Republic of China
Liu Li, Wang Shu
Abstract This paper introduces the current status of the development and organization of literatures of the Republic of China. It further analyzes the problems in the current organization and researches of literatures of the Republic of China and presents methods of to enacting record standards, systematically organizing literatures of the Republic of China with the collection entities, enacting subject indexes and building intelligent retrieval platforms.
Keywords Literatures of the Republic of China. Literature arrangement. Literature development.
引言
近年來,民国文献的开发和整理越来越受到重视,民国文献收藏单位开始民国文献整理出版,编制联合目录,开发数字化全文,各种关于民国文献的数据库也应运而生,为民国史各学科的研究提供了丰富的数据支持。但是由于整理工作各自为政,整理的标准不统一,深度不够,看似繁荣的整理工作经费投入不少,实际效果却不理想。很多研究者仍然无法简单高效地找到全面、正确的民国文献相关资料。因此如何整合各方力量,有效地开展整理工作,为研究者提供更好的资源服务,值得思考和研究。
1 民国文献整理现状分析
民国文献包括图书、期刊、报纸、档案、图片、政府出版物等类型,本文将着重讨论图书的整理情况。
1.1民国文献联合目录
1949年以来,全国文献存藏机构编制的民国文献联合目录共计16种,图书书目仅为3种,其中《民国时期总书目》由北京图书馆编辑,由书目文献出版社于1986年-1997年陆续出版。它主要以国家图书馆、上海图书馆、重庆图书馆的馆藏为基础编撰,主要收录了民国时期(1911年至1949年9月间)中国出版的中文图书124000余种,基本反映了民国时期出版的图书全貌,是收入图书书目数量最多,也是最具权威的民国图书联合书目。另外两种图书书目《解放区根据地图书书目》以及《抗日战争时期出版图书联合目录》为专题联合图书书目[1]。
1.2 民国文献数据库
民国文献由于分布广、纸张酸化严重等问题,导致用户在查阅时诸多不便,因此民国文献数据库是现代民国文献保护的重要手段。一些数据出版公司也重点开发了民国文献数据库,如尚品大成的“大成故纸堆”,收录民国图书4万多种;《民国文献大全数据库》由北京时代瀚堂科技有限公司整合提供民国图书逾13万册;《维库民国电子资源数据库》目前推出131229种全文影像资源,其中图书文献近8万种;《典海民国图书资源平台》收录民国年间出版的各类图书10万余种。这些数据库重视用户体验,在功能检索方面能提供较好的体验[2],但只对付费用户开放。
与此同时,各大公共图书馆纷纷将本馆的民国文献进行数字化,建立本馆的民国文献数据库。国家图书馆策划了“民国时期文献保护计划”项目,联合国内文献收藏单位制作了《民国图书数据库》,其中国家图书馆所藏占到全国民国文献的大部分,以官方文件、内部资料等珍稀文献为特色,分为三期建设,每期收录民国图书5万种。截止到目前为止,民国时期文献联合目录已汇聚书目数据30余万条,超过《民国时期总书目》著录的12万种[3]。重庆图书馆于2013年建成“重庆中国抗战大后方历史文献中心”,全面收集抗战文献,目前已形成纸质文献、缩微文献、图书期刊数据库、3D数字图书馆等为一体的全方位抗战文献中心[4]。上海图书馆建有《民国图书数据库》,收录1911年-1949年间出版的各类中文图书,收录内容为图书全文影像,种类齐全,数据库以《民国总书目》为依据,收录图书15万种[5]。
这些整理工作的完成为开展民国相关学科和专业研究工作打下了很好的基础,但在实际使用这些资源时也发现一些问题:由于加工深度不够以及技术上的限制,研究资料的查全率不高,还有部分馆藏书目不对外开放,导致无法查询等。
2 民国图书整理工作存在的问题
2.1 《民国时期总书目》
《民国时期总书目》是回溯性国家书目,全书按《中文普通图书统一著录条例》著录,按《中国图书馆图书分类法》分类编排,共计17卷21册约12万种,基本反映了民国时期出版的图书全貌[6],其收录的书目多数都有内容提要。尽管如此,《民国时期总书目》由于其所在年代的历史原因,也存在一些遗憾。
2.1.1书目整理不全面
《民国时期总书目》根据国家图书馆、上海图书馆、重庆图书馆的藏书收录,少量补充其他图书馆的馆藏目录,对于有目无书者未能收录,线装书、国内出版的外文书、少数民族文字图书也未收录。由于当时人力物力的限制,难免有所遗漏,并不能全面的反应全国民国图书的收录情况,例如南京图书馆的前身是国民党的中央图书馆和江苏省国学图书馆。解放后,这两个馆的藏书除少部分运往台湾外,大部分保留了下来,同时许多政府机关、团体及中央政治学校所存文献也存放在南京图书馆[7]。此外,总书目主要以公共图书馆的馆藏目录为主,而民国图书在各地的档案馆、博物馆、研究机构、外事机构以及收藏者中也有一定数量和规模的藏书并未收录与此。 2.1.2书目信息不完整
由于民国时期处于中国历史的变革期,不仅与现代图书在出版、印刷、装帧等方面有着巨大的差异,即便是民国初期图书与民国后期图书相比,不同时间、不同区域的书籍也存在着巨大的差异,再加上当时没有统一的出版格式和出版标准,作为总书目的数据制作人员只能如实记录,从而导致书目信息不完整。此外,由于处在战乱时期,信息交流的不通畅也可能导致同一种书的作者、出版年代、发行者、印刷者等项目出现误差。再加上当时的印刷、储存条件有限,很多书籍会出现缺页、损毁现象,也导致著录的书目信息不完整。
2.1.3索引编制单一
《民国时期总书目》按《中文普通图书统一著录条例》著录,按《中国图书馆图书分类法》分类编排,各分册附书名音序索引和笔划检索表。整个书目共计12万条,在进行书目检索时,只能通过书名对书目进行检索,要求检索者了解书籍的详细题名,按题目拼音或者笔画进行检索。如果通过分类进行查找,则需要在所选分类中进行逐条查找,这样也大大降低了使用效率。在编制时,如能加入要目索引、作者索引,相信能节省检索时间,方便读者。
《民国时期总书目》自出版之日起至今也有三十余年,岁月变迁,随着民国图书收藏馆的搬迁、合并、整理,现有的民国图书收藏馆和馆藏地也发生了巨大的变化。笔者在使用过程中发现,大量的书目信息在对应馆藏地的网上数字检索系统中并未检索到,通过电话调查,有些图书在搬迁过程中或已遗失,有些图书或因存放不当已经损毁。《民国时期总书目》亟需重新进行编纂。
2.2 民国时期文献联合目录
民国时期文献联合目录现有数据30多万条,由14个成员馆的近50万条馆藏数据进行查重后汇集到该平台发布,为相关研究人员提供了很大的便利,但是在使用时也存在一些问题。
2.2.1系统检索效率低
民国时期文献联合目录提供简单检索和高级检索。简单检索可以通过题名、责任者、出版年代等选项进行检索。当通过明确的图书信息进行检索时,平台能够以较快的速度响应,并给出检索结果,但是扩大检索范围时,搜索结果反而减少。以检索词“保”和“保甲”通过题名进行检索为例,搜索结果同样都为237条。这种情况的出现说明该平台在检索功能的开发和设计上并没有能够让平台内部的数据信息得到充分的挖掘,检索数据的使用效率也受到了影响,降低了系统的鲁棒性。
2.2.2文献著录项目标准不一
在具体使用民国时期文献联合目录的过程中,由于联合目录的数据是由不同成员馆进行加工提交的,往往会存在各馆之间信息交流不够通畅,导致各成员馆对同一本书的著录标准不一。例如,张恨水在1943年出版的《丹凤街》,有的记录是在题名项中注明“原名:负贩列传”,有的则是在一般性附注项中注明“原名:负贩列传”。不同于其他时代的古籍图书,民国图书数据信息比较复杂,再者如出版地项,就会出现印刷地、发行地等特殊信息,这些都需要各成员馆之间有一个统一的著录标准,如果著录标准不统一,就会导致系统数据重复,影响使用效果。
2.2.3缺乏必要信息
现有的联合目录中能查询到的数据都是由各个成员馆提交并汇总的,馆藏地一项代表此条数据在对应的成员馆有纸本书目,便于研究人员进行查找,但是笔者发现有一些记录没有馆藏地项,也就意味此条书目的馆藏或已不存在,不存在的原因不得而知,如果能在详细信息中注明此条记录的信息来源,相信会更加有利于读者进行查询。
3 民国文献目录整理思路
3.1编制一部完整的民国文献联合目录
由国家图书馆牵头,联合各級各类收藏单位乃至个人收藏家,系统收集整理,厘清家底,编制一个能反映民国时期珍稀文献的精品目录为社会公众和学术研究服务,意义非常重大。
目前已面世的民国时期总书目和当前由国家图书馆主持的民国时期文献目录系统已投入使用,有着很好的应用前景,但也存在不少问题,我们希望在此基础上有进一步的提高,为此提出如下设想:
3.1.1扩大联合目录的收藏馆范围
目前国图主持的联合目录仅限国家文化系统的公共图书馆,建议加入全国教育系统的高校图书馆。国内北京大学等多所高校图书馆均有民国文献收藏,台湾地区和国外大学图书馆也有较多的收藏,如哈佛大学燕京图书馆、哥伦比亚大学东亚图书馆等,还有全国档案馆系统、研究院所的资料室等。在当前国家重视民国文献整理开发的形势下,建议由国家图书馆馆牵头,从县、市、省、国家分四级,从县级开始逐层开展文献调查和整理工作,统一标准开展人员培训。此项工作同时也在高校系统和档案馆系统开展,并鼓励个人收藏者参与。他们多年来在旧书市场以及个人手中收购交换的民国文献很有特色,个别文献的专题性、系统性、独特性甚至超越了图书馆、档案馆。
3.1.2加大联合目录的开发深度
现有标准下的民国文献目录比较简单,在查找民国文献时造成很高的漏检率,因此建议图书目录应详细著录文献篇章节各级目次和内容摘要、 关键词等。同时应增加特征项目的描述,对每种民国文献的收藏机构、文献品相都应有明确的著录。有一些特征细节在没有主要著录字段的情况下有辨别图书、区别版本的作用,这些特征往往存在于文献的内容之中,需在著录时加以注意,使民国文献目录不仅拥有揭示馆藏,保存文化的功能,更兼有实用性,在提高检索效率,开展学术研究方面发挥更大的作用。
3.1.3制定统一和兼容的民国书目著录标准
现有的印刷本民国书目和收藏馆的在线目录均存在著录项目不全的问题,造成不全的原因既可能是文献本身不完整,也可能是民国时期图书出版的标准与现在的不一致,导致很难分辨不同收藏馆的藏书是否是同一种书,还是不同版本。如果一味强调按照现行的国家标准著录,民国图书将进一步面临着著录不全问题和使用方面的困难。所以必须制定一个统一的著录标准,便于不同收藏馆目录的整合和对接。 例如,民国《出版法》规定的发行人即主办出版品之人,是发行所的代表人和直接责任人,发行所即相当于现在的“出版者”,承担着出版兼发行两种职能,发行人即相当于现在的“出版者”的代表人[8]。民国时期的图书,个人出版发行的情况很多,这类民国书的版权页一般只列有发行者个人,且发行者与该书的编著者多为同一人[8]。民国文献封面、题名页、版权页缺损较多,在著录标准规定的页上无法找到著录信息的,可在序、前言、后记中找出作者、出版地、出版时间等。此外,还应留意封底的出版标记,在民国时期,上海知名出版机构所出版的书籍的封底大多印有自己的出版标记,不要仅以不详简单著录。
在民国文献中还有一类较为常见的是单位的工作报告,没有记载出版者、发行者、发行所任何一项。这类工作报告尽管没有明确记载出版发行者的信息,但因其通常由本单位编写,介绍本单位的工作概况、且一般作为内部刊物不对外发行,将编辑单位作为出版者著录比著录为出版者不详对读者来说更有检索意义[8]。
目前国家馆的民国时期文献保护办公室制定了《民国图书联合目录数据暂行标准》,这个标准可进一步完善,加强推广力度,使民国文献的整理在一个统一的标准下开展,便于今后的合作交流,更方便用户的使用。
3.3 以服务学科研究为目标编制专题书目和索引
目前的民国文献数据库由于标引深度不够加上全文是图像版,存在某一主题资料查找不全的情况。其次,历史文献 (包括史料文献和研究文献)是多种类型并存和交织的。例如史料文献,有普通印刷本、影印本、记录影像和缩微胶片等文献类型;研究文献,除普通印刷本外,还有专题片、访谈 (包括电视访谈和网站访谈)、博客、电子文档等多种媒体形式。这些丰富的记录和表现形式有利于人们从多角度认识历史,但目前尚未有一个民国文献数据库能够多文献类型揭示某一主题文献[9]。对于民国史相关领域的研究人员来说,专题目录的编制非常必要。专题目录可充分利用现有的民国文献联合书目和民国文献数据库,在此基础上进行拓展深入,在选题方面要体现馆藏特色和学科需求,并围绕这一特色收集相对完整的文献资源。
3.4 以民国文献智能检索平台的开发和建设为未来发展目标
民国文献整理的趋势是数字化,在新技术背景下,民国文献目录已经从简单的汇集过渡到对文献的深度挖掘,目录数据库和拥有电子全文的民国文献数据库建设成为文献整理的主要方式。
在数据库的建设过程中,应注意提高收藏馆在线目录的质量以及开放共享的程度,改变目前部分馆和收藏单位书目不共享的现状,方便用户就近使用和免费获取。
其次,应加强指导,减少无序开发和低层次开发。随着民国文献重视程度的加强,当前民国文献数据库也层出不穷,同质化现象比较严重,相互交叉重复单又不完整,这样既造成浪费,又没有实现完整揭示的目标,并且数据库价格较高,对于个人用户和小单位来说无法支付。建议加强民国文献开发的控制和合作,降低开发成本,提供更大范围的使用。
此外,建设具有以下功能的智能化检索平台,提高用户体验质量水平。
(1)全文检索功能。目前许多民国文献数据库处于文本仅有图像格式文件,只能浏览而无法实现全文检索的状态,加上标引深度不够,数据漏检现象比较严重。新的智能平台不再是简单的书目或文本的数字化,而是保存文献信息源的影像资料,同时转化成能够被计算机网络所处理数字化的符号,对所有的文献实现全文检索。数据库能够提供原版图片格式和文字识别后的对照版本,供用户查考。
(2)自动断句和自动标引。海量数据单靠人工整理耗时耗力,系统在实现全文数字化的基础上,对于民国早期文献自动断句添加标点,方便用户阅读,同时实现自动提取和编制刊名、篇名、主题词、摘要、学科分类、出版时间、出版单位、作者等较为全面的检索点,使史料实现数据化管理。
(3)自动编撰功能。对于收集整理的海量数据,单靠人力无法按需进行专题整理,让计算机模拟人脑从大量史料文本中判断、选择出与编纂主题相关的资料,实现专题资料的自动编纂工作。
(4)建成开放式公共交流平台。该平台不仅能够实现文献的数字化智能整理,还为专家学者提供查询检索、校核比勘以及数据统计分析等信息处理功能服务,同时开展学术交流互动,成为兼有文献查询、学术研究、普及教育、读者互动功能的知识服务平台。
民国文献的应用需求越来越多,文献整理工作需要加快步伐,科学有序地开发整理,为研究工作创造更好的条件。
参考文献
[1]蔡迎春, 段晓林. 民国文献目录编制沿革及其趋势[J]. 图书馆论坛, 2017(8): 119-124.
[2]段晓林. 民国文献数据库开发现状研究[J]. 图书馆学研究, 2016(20): 42-45.
[3]民国图书数据库[EB/OL].[2018-03-23].http://www.lib.sjtu.edu.cn/index.php?m=content&c=index&a=show&catid=223&id=1475.
[4]重庆图书馆.民国文献[EB/OL].[2018-03-23].http://www.cqlib.cn/?q=-literature.
[5]上海图书馆资源导航库[EB/OL].[2018-04-06].http://db.idoc.sh.cn/.
[6]民國时期总书目[EB/OL].[2018-04-13].https://baike.baidu.com/item/%E6%B0%91%E5%9B%BD%E6%97%B6%E6%9C%9F%E6%80%BB%E4%B9%A6%E7%9B%AE/9109114?fr=aladdin.
[7]南京图书馆[EB/OL].[2018-04-13].http://www.jslib.org.cn/.
[8]李丽芳, 宋晶晶. 民国图书出版发行信息的CNMARC格式著录[J]. 国家图书馆学刊, 2013(5): 74-77.
[9]杨树. 网络环境下编制专题史目的意义和方法:编纂《近十年辛亥革命史料和研究文献书目索引》的探索[J]. 图书情报论坛, 2012(3): 38-40.
刘莉 江苏警官学院图书馆馆长、民国警察史料研究中心副主任、研究馆员。江苏南京,210031。
王姝 江苏警官学院图书馆读者服务部副主任、馆员。江苏南京,210031。
(收稿日期:2018-06-25 编校:陈安琪)