论文部分内容阅读
[摘要]20世纪60—90年代,人文学科掀起了跨学科研究的风潮,于是史学研究也引入了其他学科的研究方法,形成了计量史学和历史信息学这两个跨学科的研究领域。20世纪60年代,计量史学的先驱对历史学的认识发生了质变,将各个学科的研究方法、模型和理论引入到历史研究的各个领域,尤其是将数学的计量方法引入到历史研究中,通过计量的方法对承载历史信息的数据进行统计分析。随后史学界形成了以科瓦里钦科为代表的实力雄厚的计量史学派。计量史学派善于运用多维的统计分析方法,这种方法十分复杂,必然要借助计算机处理。随着20世纪70年代计算机技术的应用和推广,历史学家借助计量方法和计算机技术来研究历史文献,取得了显著的成果。一个新的研究领域历史信息学应运而生。而历史信息学起初在计量史学的范围内发展。20世纪70年代末,许多国家官方机构都开始运用计算机技术以电子形式保存和传输文件。引申到历史学领域,计量史学家最初将纸质文献资料转化为电子形式,创建文献电子阅读器和文献资料数据库,由此产生了相应的文献检索模式。这不仅对传统的纸质文献进行了优化,而且为史料学研究提供了便利。20世纪80年代,历史信息学脱离了计量史学成为独立的研究领域。以德国学者泰勒为代表的历史信息学家主张建立数据库管理系统,完善数据检索系统和数据更新系统将历史信息学发展推向了新阶段。
[关键词]历史信息学;史料学;计量史学
[中图分类号]K05 [文献标志码]A [文章编号]1000-3541(2015)02-0025-06
[收稿日期]2015-01-05
① 这可以解释这个事实,计量史学的正反双方争论的焦点不是方法和技术问题,而是历史认知方面理论与方法相互关系的理论问题。
近年来,史学研究中新的信息环境的形成提高了史学家对于历史信息学理论问题研究的兴趣:阐述它的规律及其发展阶段、与其他学科领域之间的相互关系及其发展前景,其中尤为重要的问题是历史信息学与计量史学之间的相互关系。尽管二者之间存在着巨大的交集,且长期以来一直相互交融,但两个跨学科的领域间仍然存在着明显的各自的特点,本文讨论的是历史信息学中的史料学问题,这对于理解其特点具有非常重要的作用。
要研究这些问题,不仅必须要分析这个跨学科的学术领域的现今状况,还要厘清它的形成和发展进程。这个过程是以20世纪下半期历史学发展的内在规律和对所有学科的强大影响力的计算机信息技术,以及学科知识综合化趋势发展为前提条件的[1](pp.310-315)。20世纪60—90年代,大部分人文学科中掀起了跨学科研究的风潮绝非偶然。正是在这些年,国内计量史学的主要流派应运而生。
史学家首先研究处理大规模文献资料的新方法,然后广泛吸收其他学科的研究方法和方式,采用系统的方法和模拟的方法。总而言之,将它们统一到新方法的概念中,相当好地阐释了本国的历史编纂学[2]。这些方法造就了一些研究流派,例如,新经济史、新社会史、新政治史等等。在这些新的研究方向的代表作中,诞生了这样一个概念,它在各种社会人文科学的研究中都在使用。假定这些经济学家、社会学家、政治学家及其他人文科学的学者,他们使用的史料信息具有相似性,那么,事实表明,他们必须借助于这一新诞生的研究的方法,然后通过它,再采用数学的方法。计量史学整合了这些跨学科历史研究的不同的思路,将其转向为准确的、可核实的信息,以便进行后来的(统计)分析。这标志着历史学作为一门发达的科学的质的转变,它在研究中不仅系统地使用了其他学科的方法和模型,还运用了相关学科的理论①。
史学研究中采用计量的方法有很多积极的影响,方便找寻规律、精确地做出评价和验证结论。最成功的表现是在研究中可以提出新的问题,并作出更高层次的诠释。这标志着历史研究从课题导向、史料导向向问题导向的转变[2](p.375)。在此,必须提及ИД科瓦里钦科及其同事的集体专著,这些集体专著阐述了19—20世纪之交,地主和农民经济的社会经济体制;此外还有俄罗斯农业市场研究、欧俄各省农业类型学和农业结构研究类型等等一系列著作[3]。这些作品堪称经典,不仅是因为其提出问题的重要性,还因为在其研究中使用的方法和数据。他们在很多研究中都采用了多元统计分析的复杂方法,这些方法原则上只能借助于计算机技术才能实现意思是不关注计算机技术借助简单的方法也可以进行计量研究,只是收集数据会受到一定限制。吸收复杂方法(例如,多维统计分析),特别是处理浩繁数据的趋势,导致20世纪70年代计算机技术成为计量研究不可分割的一部分。。另一方面,上述学者强调了跨学科的计量分析方法和计算机信息技术,这成为了分析问题的首要方法,它们将原来研究史料的特点及其对于处理数据中选择适当的方法的影响,排挤到了第二位。
应该指出,在我国史料学中,由于存在以科瓦里钦科[4]为代表的享有盛誉的计量史学学派,继续研究与历史信息学的特点和计算机处理信息的概念关系密切的理论和实用问题[5]。深入研究史料学的信息观点,尤其是从符号学[6]的角度研究分析大量史料[7]的方案和方法属于这一时期著名的理论成果。科瓦里钦科的专著中全面地分析了计量史学的理论问题[8]。
20世纪70年代末,计量史学的研究方法得到了极大扩展,除了统计方法外,越来越多地采用了侧重于文献的研究方法。其中,文献电子档案(在现代术语中称为“电子资料” 或“ 数字资料”)的发展具有重要地位,然后是数据库系统几乎与人文科学研究中新方法同步诞生的是在60年代出现的建立文献电子档案数据库的想法。最著名的是1962年在安阿伯(美国)成立了政治和社会学研究大学联盟和1961年在科隆(德国)成立了社会学研究中心档案资料库。后来,1994年在德国哥根廷又成立了历史研究数据库和资料库。。该工作的重要内容是从史料中提取相关信息,将其转化为电子形式。在此期间,为保留史料,创建了很多专门的电子档案,这些对于历史研究来说新的史料的出现,具有重要意义。从70年代开始,很多国家的官方机构开始大规模的将史料文献复印、存储转化为电子的形式。 在历史研究过程中,那些年创建的电子档案有哪些特点呢?第一,在评价史料信息时以实用角度为主导,当然,这些电子档案库是以问题为导向建立的。但是,在处理档案时并没有将把所有的史料都完全转化为电子形式作为自己的目标[9]。第二个显著特点,通常也是电子数据的特点问题导向或者方法导向的术语意思是依据研究任务从文献资料中有明确目的将数据挑选出来,借助一定的方法来解决具体的研究问题。这个术语与文献资料导向术语相比较,文献资料导向术语保存了文献资料信息。,这与以下因素有关,对于解决任何一个具体的历史问题,并不存在专门的理想的文献,即囊括所有必要的信息。因此,研究人员必须从浩如烟海的史料中筛选资料,从中找寻部分的或是片段的需要的信息。除此之外,原始的资料在转化为电子档案的过程中往往经过了一系列的转换,文本信息被译成了代码,以个体形式存在的信息被汇总,原始的文件被整合,原始的特征被转变为相对的或是总体的特征。
这样一来,这些以问题为导向的史料,并不是传统的纸质文献完全意义上的电子副本,而是或者是有著作者的原始资料的电子版,或是事实上成为了一种在历史研究中新的史料应该专门强调,文献资料的电子副本和电子样本在上下文中没有进行书籍扫描,信息容量改革,可以进行信息搜索和分析处理(例如,表格或全文的数据库大小)。。相对于前面的原始纸质文献而言,它们可以被称为新一代的史料,它可以是原始文献的一部分,或是一些原始文献的电子版整合汇编。如果这种史料的作者非常详细且认真地记录了他整合的过程,那么就可以查询其中的所有文献的出处。进而言之,这种史料也可以是对其他文献的补充、修改和汇编。此时,这种以电子形式出现的计算机处理后的结果非常重要,因为可以允许重复使用。因此,正是在这一时期,历史学家在自己的职业活动中不仅是信息的消费者,同时还是信息的创造者,并积极地发挥着作用[9]。所以,计量史学家开始采用一种复杂的方法,这种方法没有计算机技术,还有信息库技术是无法实现的,这成为了历史信息学形成的前提条件,起初,它局限于计量史学的内部,后来扩展到了其外部。
在一定程度上,历史信息学仍发展于计量史学的内部。通常情况下,计量史学家对于历史研究中的计量方法,首先是数据统计方法的地位和作用,并无意见分歧,在对史料进行计算机处理的目标和任务的认识上也无矛盾,史料处理中的信息技术被看成是计量研究的有机组成部分[10]。 但是,当20世纪80年代历史信息学出现了新的领域时,情况发生了改变,史学家开始出现了对信息学理论的特点、内容和方法的讨论。正是在此期间,著名的德国学者、“历史与计算机”国际协会的创始人之一泰勒,在明确正常史料处理与被加工过的资料处理,以及历史研究中使用计算机技术带来的方法导向和史料导向之间存在着根本性的差别的基础上,深入地研究了历史信息学的概念[11]。
泰勒强调历史学科和其他广泛使用统计方法的学科之间存在的重大差异;这些方法在判断和评价不确定性的不清楚的历史数据时具有局限性;历史信息形式化使现有程序的无效性日益凸显。实际上,与历史学和其他学科观点、方法、手段相似性和相互渗透的跨学科论题相反,确定了关于历史研究和历史文献资料信息工作方法特点的反命题。
对于历史资料及计算机化史料问题特殊性的深切关注,标志着20世纪80—90年代成为以史料为导向的史学研究的重要发展阶段。
泰勒认为,以史料为导向的数据处理方式具体方法是,尝试在计算机上存储各种各样史料信息,以便它能在更广阔的范围内得到使用。它为做各种不同类型的分析准备了条件,历史学家在创建电子资源数据库阶段,不用考虑以后怎样去运用它。这一思想的具体实现是以史料为导向的数据库管理系统κλειω的建立。κλειω管理系统是数据库经典结构、全文检索系统和文献检索系统的综合体,可以提供语义检索和数据检索,拥有知识库和结论推理系统[12]。除了众多其他功能外,还能提供例如从事统计分析所需要的所有的转换数据。
应着重指出,在当时首次提出了形成覆盖全部历史的电子资源数据库的任务,这就需要深入研究对史料信息进行描述和分类的标准,以及与创建知识库和在不同的研究领域的数据交换相关的研究方向。必须考虑到,史料要素之一的语义因素,这既是描述资料的类型和结构的需要,也是执行数据转换和交换程序的必须之举[13]。知识库的概念,不仅使史料的考证有了更充分的论据,还极大地扩展了史料整合的能力。
然而,κλειω数据库系统不仅接近于知识库的概念,还接近电子出版物的概念,因为该系统中有众多的史料信息的表现,如它的数字化图像、它的转录和非史料文献的存储功能。κλειω数据库系统对于史料的处理是通过将文章的片段与数据库内的各别内容进行比对来实现的。数字化的图像史料也可以保存在数据库系统中。在此过程中,文章的各个片段将由专门的管理程序在系统内部单独处理。用户的任何请求、任何对于数据的访问都可以与存储在计算机中的数据相连接。 因此,泰勒方法的目的是将已出版的史料与准备将其转化为计算机处理格式结合起来。很明显,史料的搜集、它的外部和内部的考证,包括对非史料的甄别,在这种方法下,则成为首要任务。
赢来普遍喝彩的κλειω数据库系统的很多设想,在21世纪初得到了发展。与此同时,以史料为导向的研究方法也受到了一些研究人员的批评。他们认为,过度的依赖由计算机的史料库提供的问题(其中包括数据库),将关注的重点从对史料评论的实用角度转移到了语义的角度,这对研究中的分析带来了损害。对于传统的纸质史料电子版本的关注和建立数据库的兴趣,超过了在这一阶段对于分析的兴趣,这是非常自然的现象。事实上,这是新兴学科的共同特点。可靠的、有效的史料的电子版在数量上积累的越快,数据研究中复杂的方法在实际研究过程中占有重要地位的步伐就越迅速。在此之前,新的形式的史料在数量上的增长会正常发展。因此,历史信息中很多研究以史料为导向,在特定的阶段具有较为积极的意义,至少是正常现象М泰勒的方案和他对史料学问题的研究在研究这个领域的我国专家中得到了广泛认同,可以解释为俄罗斯历史学发展的过程中存在一支强大的史料学研究力量。。 我们注意到,关于泰勒的建议的讨论,或多或少还有术语方面的原因。他正确地指出了数据处理方面史料导向和问题导向对于分析问题的影响。所以,这些术语指的应是历史学家不同的研究阶段,两者之间并不矛盾。因为划分史料导向和问题导向,只能靠推测,即使是研究人员,任务的提出也不可能完全避开对于某种范围内史料的考证,即该范围内的资料是否有助于问题的解决。同样,在选择电子出版物时也不可能不对它对于所解决问题的重要性不加以考察。
是否可以通过不同的角度提出问题?对于同样的史料采取这种或那种不同的方法?例如,20世纪60—70年代的计量史学家采用的是以问题为导向的研究方法,研究的领域主要集中于社会经济史问题,使用的是有清晰结构的统计性质的史料。当研究人员对于一些结构不甚清晰的史料进行研究,开始运用计算机技术和信息技术的时候,就出现了以史料为导向的研究方法,该方法考虑到了史料没有规律,且结构模糊的特点。
最后,再对这种方法做比较时应考虑到传统的纸质史料远离于真实,因为其中包含着一些他的著作者添加的注释。那么在涉及研究人员创建的电子版史料时,这种失真的可能性倍增。这些史料两次疏远于事实,即它的原始出处和它的电子副本(在电子副本中又加入了研究人员新的注释)。因此,以史料为导向的研究方法其优点之一是,试图消除对于史料的二次注释的问题,保存了史料的完整副本及其注释[14]。
在我国历史编纂学中文献资料的问题导向法引起了许多研究者的关注。尤其是在1993年出现了“计算机史料学”这个术语(不太恰当并且备受争议)。该术语反映了这个阶段历史信息学发展的趋势。在20世纪90年代的许多刊物对历史信息学的史料学问题看法不一,从完全把计算机史料与纸质史料等量齐观,计算机史料学被理解为创建电子文献资料阅读器的方法和技术综合体[15],到将历史信息学列入新史料学[16],或者将计算机史料学作为历史信息学和传统史料学的衔接领域,借助计算机技术解决创建(或处理)机器阅读的文献资料的史料学任务[17]。
尽管不是所有的术语问题都得到了解决,但是,更深思熟虑的观点在1996年历史信息学教科书中已有所体现[18]。探索更相符的术语与解决史料学问题的关系密切。史料学问题不只限于利用历史文献资料的机器阅读副本。还是在20世纪70年代末,ВИ鲍维金写道,历史文献资料信息研究任务超出了标准史料学的范围,并且为了与历史文献资料研究方法相称,提出了“信息史料学”这一术语,它很久以前就成为现存的信息系统的一部分[19],其中划分各种信息层次,通过对文献资料中确定的信息进行同步地回溯[20],评价文献资料反应信息的可靠性。今天对这个问题的讨论仍在继续:2008年12月,“历史与计算机”学会第十一届代表大会上的圆桌会议介绍了历史信息学的史料学问题和21世纪信息技术下,解决这些问题的前景。
必须提到20世纪末至21世纪初,一些刊物在网络信息空间中提出了与电子文件的特性、它们的准确性和技术鉴定价值、历史文献资料的电子刊物的古文献研究原则关系密切的问题。需要借助历史文献资料的形式和类型研究档案学、古文献学和其他问题[21]。
20世纪末21世纪初历史信息学的发展产生了一个结果,它可以被描述为以问题和史料为导向的新型研究分析方法的综合体。在这个发展阶段,历史信息学发展的未来方向与数据库的建设、电子史料的出版和科研成果密切相关,应不断完善信息检索的程序,用现代的方法创建并分析历史资料的汇编[22]。尤其跨学科研究和协作趋势不断增强,不仅与利用信息和网络技术的其他人文学科的同事们协作,而且和信息技术领域以及档案馆、博物馆、图书馆的专家进行合作。
创造和利用历史学的学科教育(专题)资源[23]的问题,是现阶段历史信息学发展最显著的特点,其中包括大量政治专题的文献资料集互联网网站“1812年”可以作为一个例子,它是最大的关于1812年卫国战争的俄语文献资料汇编。。根据理论的、技术的、系统的处理特点,这个阶段应该称为资源导向阶段:互联网成为了信息的最重要的来源之一,需求它的不仅有大学生及那些对历史感兴趣的人,还有那些历史学家,这极大地增强了史料信息中研究的实效性。
现阶段,对历史信息学的特殊史料学问题的兴趣不仅没有降低,还补充了新内容:历史信息资源的处理需要根据问题适用新标准。这些问题与创立专题网站、讨论电子刊物的标准、在网络信息空间深入研究历史文献资料的古文献学原则关系密切。
可以作为这些标准之一的就是莫斯科国立罗蒙诺索夫大学历史系历史信息学教研室的以史料为导向的专题网站(ИОТС),该网站的内容是在专业的基础上就一些历史专题提供相关的信息[24]。 正是这样的专业资源才能成为史料内容考证的标准。史料问题的特殊性在于,首先是保证使用者可以访问该资源,在此基础上,才可实现从不同的角度进行综合性的跨学科的专题研究,以及形成关于专题资料的虚拟的电子数据的集合,最后统一到一个网站上,这样的问题在传统的纸质史料学中是未曾遇见的。
这样的资源还应该包括以下几部分:相关专题的一些最重要的史料,就该专题的一些最重要的作品的汇编,专题数据库,提供其他网站的一些相关资源的链接。这些原则在莫斯科大学历史系历史信息教研室建立的专题网站上得到了实现,即从改革前工业向苏联工业的转变中俄国劳动关系的演变(www.hist.msu.ru/Labour/)。该资源在19世纪下半期和20世纪初俄国产业工人社会历史研究方面,于数量和质量上,在俄国互联网上都是最具代表性的一个。它成为了用更加广阔的视角研究俄国工人社会史的信息库,即1880—1930年俄国劳动关系的演变过程,其中包括:劳动法的资料、工人的工资、工人的保险和社会保障,以及劳资矛盾问题等。这种多角度的信息资源库的建立,既有利于研究者了解工人历史的史实材料和背景资料,也有助于涉及该领域问题的教学工作。
这样的专业电子资源信息库的创建是建立在甄别和选择文献和已公布的档案并将它们转变为了电子版本基础上的。显而易见,这个工作没有解决史料学分析的那些核心问题是不可能做到的。例如,评价文献资料所含信息的真实性和代表性。此外,文献资料集也包括以电子形式存在的文献。考虑到这个情况,随着电子形式的信息容量不断增加,文献综合体多样化的要求也变得越来越重要。 如果面对那些能符合历史文件出版所有标准的出版物[25],在利用已经公布的文献资料集和文献汇编时解决一些问题相当简单。在这种情况下,史料学研究的许多问题都被传统刊物的出版者解决了(文献的来历、注明日期、作者身份、参考文献和原文的注释)。
通常,在互联网上建立专业的专题资源网站时,网站上主要是这样的一些出版物,即可称之为再次出版物,是对现有的文献集或个别的文献进行电子版的再版,这种工作在法律文书、公文处理和统计资料时最为有效。再版的一个重要区别是电子文档的创建者可以对文章自由地发表评论,甚至可以改正原来纸质文本中的错误[26]。很遗憾,在这种情况下,缺乏鉴定出版者干涉原出版文件水平的信息。
专题网站的另外一种形式是首次出版物,包括亲自参与选题、系统化加工及准备传统的纸制文献资料等。在这种情况下,电子版出版物具有一定的优势,例如,出版物在数量上没有限制。所以,在存在各个版本的情况下,文章的选择问题通常并不存在,因为出现了拥有众多版本的电子出版物的可能,而这就在安排创建过程和出版资料原文的情况下为史料学的分析和综合提供了新的机会。
在将纸质文献资料转换成电子出版物时,最重要的是原文出版的方法和技术选择。在电子出版物中,应有对原文转换进行科学评论的方法。编码在原文献转化为电子版的过程中发挥了巧妙的作用。在电子出版物文本形成的过程中存在文献资料出版的一些方法:真迹复制,依照专门的尺寸逐页将原文变成电子版,使它可以在计算机屏幕上阅读并且保存文献资料的表面特点;改编,依照正文的尺寸改变内容,失去了原文表面特点;最后,依照不同的尺寸提交原文。真迹复制原文件对电子出版物而言是毫无疑问的长处,它保留了文献资料的表面特征也能在选播屏上改善文件显示的质量。它的创建工艺十分简单。它保留了原文的逐页编码,在援引互联网文献资料时解决了引用问题。旧拼写法转换文本的复杂性有时要求建立相应的信息资源。这种信息资源包括不仅要研究史料学问题,还要专门的计算方法和出版技术以及对文献资料信息进行注释[27]。
一般情况下,专题电子资源数据库具有多方位、超级文库的基本特点,在各个信息模块和个别文献之间存在着密切的联系。电子资源超级文库的特点,使得使用者可以充分利用文献中上下文信息检索的功能,在通过语义片段连接起来的文献间自由的切换,不仅能看到电子文献,还能看到数字化的图像。
历史信息学现阶段发展的综合性的特点还表现在,可以提供相关的资料、展现一些科研的成果,对于其他的研究者来说,是一种潜在的资料。创建和再利用这些信息资源在科研中尤为重要,尤其是在近现代史的研究中[28](pp.18-20)。这些创造出来的资源,不仅积累了包含各种来源的信息(如出版物或文献),从归档记录到文献出处,还阐述了数据处理的方法。可以说,这些资料的出版复兴了在新的水平上传统的以问题为导向的史料处理方法,那些曾是计量史学的研究方法,导致了在历史研究中大量的二次信息资源的形成。
最后,专业专题资源的重要组成部分是史料集,它在史料信息中扮演着双重角色。第一,史料集提供了史料信息研究和分析的方法,对历史信息进行了最合理的提炼和解读,这是史料分析的任务之一,揭示了史料的信息潜力;第二,史料集是考证史料的合集,没有它史料学术评价中的很多问题都不可能得到解决。 未来史学信息库的研究应建立在特别是史料文献的基础上,以及描述史料综合语义的元数据和按照专题目录和词汇分配的专题史料的基础上。
事实上,我们是历史研究的基础——历史信息环境变化的见证者,在这一过程中,阐述历史信息学的概念、方法和建设专业的专题资源具有日益重要的地位,总之,这有利于完善民族历史文化遗产的保存。
[参 考 文 献]
[1]Ковальченко И. Д. Методы исторического исследования. М., 2003.
[2]Соколов А. К. О применении новых методов в исследованиях историков США // Математические методы в социально-экономических и археологических исследованиях. М., 1981.
[3]Ковальченко И. Д., Милов Л. В. Всероссийский аграрный рынок XVIII - начала XX века: Опыт количественного анализа. М., 1974;Ковальченко И. Д., Бородкин Л. И. Аграрная типология губерний Европейской России на рубеже XIX-XX вв.: (Опыт многомерного количественного анализа) // История СССР. 1979. N 1. ;Ковальченко И. Д., Бородкин Л. И. Структура и уровень аграрного развития районов Европейской России на рубеже XIX-XX вв. //История СССР. 1981. N 1;Ковальченко И. Д., Селунская Н. Б., Литваков Б. М. Социально-экономический строй помещичьего хозяйства Европейской России в эпоху капитализма. М., 1982;Ковальченко И. Д., Моисеенко Т. Л., Селунская Н. Б. Социально-экономический строй крестьянского хозяйства Европейской России в эпоху капитализма (источники и методы исследования). М., 1988. [4]Бородкин Л. И. И. Д. Ковальченко и отечественная школа квантитативной истории // Мат-лы науч. чтений памяти академика И. Д. Ковальченко. М., 1997.
[5]Ковальченко И. Д. О применении математико-статистических методов в исторических исследованиях // Источниковедение. Теоретические и методические проблемы. М., 1969;Кахк Ю. Ю., Ковальченко И. Д. Методологические проблемы применения количественных методов в исторических исследованиях // История СССР. 1974. N 5; и др.
[6]Ковальченко И. Д. Исторический источник в свете учения об информации (к постановке вопроса) // Актуальные проблемы источниковедения истории СССР, специальных исторических дисциплин и их преподавание в вузах / Тез. докл. III Всесоюзной конф. М., 1979.
[7]Массовые источники по истории советского рабочего класса периода развитого социализма. М., 1981.
[8]Массовые источники по социально-экономической истории периода капитализма. М., 1979;Ковальченко И. Д. Методы исторического исследования. М., 1987.
[9]Гарскова И. М. Базы и банки данных в исторических исследованиях. Гёттинген, 1994.
[10]Бородшн Л. И. Методологические проблемы исторической информатики и квантитативной истории // Новая и новейшая история. 1997. N 3, 5;Бородшн Л. И.. Квантитативная история в системе координат модернизма и постмодернизма // Новая и новейшая история. 1998. N 5.;Гарскова И. М. Историческая информатика и квантитативная история: преемственность и взаимодействие // Анализ и моделирование социально-исторических процессов. М., 2006;Гарскова И. М.К вопросу об истории исторической информатики // Информационный бюллетень ассоциации “История и компьютер”. 2008. N 35.
[11]Thaller M, The Need of a Theory of Historical Computing // History and Computing II. Manchester; New York, 1989;Талер М. Что такое “источнико-ориентированная обработка данных”; что такое“историческая информационная наука”? // История и компьютер: новые информационные технологии в исторических исследованиях и образовании. Гёттинген, 1993.
[12]Boonstra O., Berure L., Doom P. Past, Present and Future of Historical Information Science. Amsterdam, 2004.
[13]Thaller M. On the Conception, Training and Employment of Historical Data and Knowledge Daemons // Eden or Babylon? On Future Software for Highly Structured Historical Sources. St. Katharinen, 1992.
[14]Гарскова И. М. Выступление на “круглом столе” “Методологические проблемы исторической информатики и квантитативной истории” // Информационный бюллетень ассоциации “История и компьютер”. 1996. N 19. [15]Моисеенко Т. Н., Свищев М. А. Изучение аграрной истории России последних десятилетий: перспективы “компьютерного источниковедения” // История и компьютер: новые информационные технологии в исторических исследованиях и образовании. St. Katharinen, 1993.
[16]Соколов А. К. Социальная история России новейшего времени: проблемы источниковедения и архивоведения // Социальная история. Ежегодник. 1998/99. М., 1999.;Соколов А. К.. Источниковедение и проблемы исторического синтеза // Проблемы методологии и источниковедения. Мат-лы III науч. чтений памяти академика И. Д. Ковальченко. М., 2006;Подгаецкий В. В. “Историческая информатика” как источниковедение XX и/или XXI века? Pro et contra: Ad nominem // Круг идей: историческая информатика в информационном обществе. М., 2001.
[17]Тяжельникова В. С. Компьютерное источниковедение: к постановке проблемы // Круг идей: развитие исторической информатики. М., 1995;Владимиров В. Н., Цыб С. В. Источниковедение в век компьютера (вместо предисловия) // Источник, метод, компьютер. Барнаул, 1996;Владимиров В. Н. Историческая информатика: пути развития // Вестник ТГПУ. 2006. Вып. 1 (52).
[18]Бородкин Л. И. Историческая информатика: этапы развития // Новая и новейшая история. 1997. N 1.
[19]Бовыкин В. И. Проблемы изучения исторической информации. (Квопросу об информационном источниковедении) // Информационный бюллетень ассоциации “История и компьютер”. 1998. N 23. 1998.
[20]Бовыкин В. И. К вопросу о закономерностях фиксирования исторической информации в письменных источниках // Круг идей: историческая информатика на пороге XXI века. М.; Чебоксары, 1999,Кругляков Э. П. Лженаука. Чем она угрожает науке и обществу? Доклад на Президиуме РАН 27 мая 2003 г. // www.atheismru.narod.ru/Pseudo_science/Officials/Krugljakov.htm..
[21]Гельман-Виноградов К. Б. Глобальная трансформация документальных источников на рубеже тысячелетий // Источниковедение XX столетия: тезисы докладов и сообщений научной конференции. М., 1993;Киселев И. Н. Электронные документы: основные направления исследований // Вестник архивиста. 2000. N 3 – 4;Тихонов В. И. Аутентичность и целостность электронных документов при долговременном хранении // Вестник архивиста. 2002. N 4 – 5;Юшин И. Ф. Электронные документы как исторический источник // Круг идей: электронные ресурсы исторической информатики. Барнаул; М., 2003. С. 37 – 51;Грум-Гржимайло Ю. В., Сабенникова И. В. Некоторые проблемы публикации архивных документов в электронных изданиях // Вестник архивиста. 2006. N 2 – 3. [22]Бородкин Л. И. Историческая информатика в точке бифуркации: движение к Historical Information Science // Круг идей: алгоритмы и технологии исторической информатики. М.; Барнаул, 2005.
[23]Бородкин Л. И., Владимиров В. Н., Гарскова И. М. Новые тенденции развития исторической информатики. По материалам XV международной конференции “История и компьютер”// Новая и новейшая история. 2003. N 1.
[24]Бородкин Л. И., Гарскова И. М. Трудовые отношения в период социалистической индустриализации // Экономическая история. Обозрение. 2006. Вып. 12.
[25]Правила издания исторических документов в СССР. М., 1999.
[26]Боброва Е. В. Анализ археографического уровня подготовки документальных публикаций в российском сегменте Интернет // Информационный бюллетень ассоциации "История и компьютер". 2001. N 3.
[27]Варфоломеев А. Г., Иванов А. С. Технология XML: современная реализация источнико-ориентированного подхода в работе с комплексами исторических документов // Информационный бюллетень ассоциации “История и компьютер”. 2006. N 34;Иванов А. С. Работа с XML-документом как воспроизведение основных этапов источниковедческой критики: новые технологии и возможность коррекции традиционных подходов //Информационный бюллетень ассоциации “История и компьютер”. 2006. N 34.
[28]Соколов А. К., Бонюшкина Л. Е., Мякушев С. Л. БД как путь к источниковедческому синтезу // Информационный бюллетень ассоциации “История и компьютер”. 1996. N 17.
(И. М.佳尔斯科娃:莫斯科大学历史系历史信息教研室副教授,历史学副博士;张广翔:吉林大学教授,博士研究生导师,历史学博士)
[责任编辑 张晓校]
[关键词]历史信息学;史料学;计量史学
[中图分类号]K05 [文献标志码]A [文章编号]1000-3541(2015)02-0025-06
[收稿日期]2015-01-05
① 这可以解释这个事实,计量史学的正反双方争论的焦点不是方法和技术问题,而是历史认知方面理论与方法相互关系的理论问题。
近年来,史学研究中新的信息环境的形成提高了史学家对于历史信息学理论问题研究的兴趣:阐述它的规律及其发展阶段、与其他学科领域之间的相互关系及其发展前景,其中尤为重要的问题是历史信息学与计量史学之间的相互关系。尽管二者之间存在着巨大的交集,且长期以来一直相互交融,但两个跨学科的领域间仍然存在着明显的各自的特点,本文讨论的是历史信息学中的史料学问题,这对于理解其特点具有非常重要的作用。
要研究这些问题,不仅必须要分析这个跨学科的学术领域的现今状况,还要厘清它的形成和发展进程。这个过程是以20世纪下半期历史学发展的内在规律和对所有学科的强大影响力的计算机信息技术,以及学科知识综合化趋势发展为前提条件的[1](pp.310-315)。20世纪60—90年代,大部分人文学科中掀起了跨学科研究的风潮绝非偶然。正是在这些年,国内计量史学的主要流派应运而生。
史学家首先研究处理大规模文献资料的新方法,然后广泛吸收其他学科的研究方法和方式,采用系统的方法和模拟的方法。总而言之,将它们统一到新方法的概念中,相当好地阐释了本国的历史编纂学[2]。这些方法造就了一些研究流派,例如,新经济史、新社会史、新政治史等等。在这些新的研究方向的代表作中,诞生了这样一个概念,它在各种社会人文科学的研究中都在使用。假定这些经济学家、社会学家、政治学家及其他人文科学的学者,他们使用的史料信息具有相似性,那么,事实表明,他们必须借助于这一新诞生的研究的方法,然后通过它,再采用数学的方法。计量史学整合了这些跨学科历史研究的不同的思路,将其转向为准确的、可核实的信息,以便进行后来的(统计)分析。这标志着历史学作为一门发达的科学的质的转变,它在研究中不仅系统地使用了其他学科的方法和模型,还运用了相关学科的理论①。
史学研究中采用计量的方法有很多积极的影响,方便找寻规律、精确地做出评价和验证结论。最成功的表现是在研究中可以提出新的问题,并作出更高层次的诠释。这标志着历史研究从课题导向、史料导向向问题导向的转变[2](p.375)。在此,必须提及ИД科瓦里钦科及其同事的集体专著,这些集体专著阐述了19—20世纪之交,地主和农民经济的社会经济体制;此外还有俄罗斯农业市场研究、欧俄各省农业类型学和农业结构研究类型等等一系列著作[3]。这些作品堪称经典,不仅是因为其提出问题的重要性,还因为在其研究中使用的方法和数据。他们在很多研究中都采用了多元统计分析的复杂方法,这些方法原则上只能借助于计算机技术才能实现意思是不关注计算机技术借助简单的方法也可以进行计量研究,只是收集数据会受到一定限制。吸收复杂方法(例如,多维统计分析),特别是处理浩繁数据的趋势,导致20世纪70年代计算机技术成为计量研究不可分割的一部分。。另一方面,上述学者强调了跨学科的计量分析方法和计算机信息技术,这成为了分析问题的首要方法,它们将原来研究史料的特点及其对于处理数据中选择适当的方法的影响,排挤到了第二位。
应该指出,在我国史料学中,由于存在以科瓦里钦科[4]为代表的享有盛誉的计量史学学派,继续研究与历史信息学的特点和计算机处理信息的概念关系密切的理论和实用问题[5]。深入研究史料学的信息观点,尤其是从符号学[6]的角度研究分析大量史料[7]的方案和方法属于这一时期著名的理论成果。科瓦里钦科的专著中全面地分析了计量史学的理论问题[8]。
20世纪70年代末,计量史学的研究方法得到了极大扩展,除了统计方法外,越来越多地采用了侧重于文献的研究方法。其中,文献电子档案(在现代术语中称为“电子资料” 或“ 数字资料”)的发展具有重要地位,然后是数据库系统几乎与人文科学研究中新方法同步诞生的是在60年代出现的建立文献电子档案数据库的想法。最著名的是1962年在安阿伯(美国)成立了政治和社会学研究大学联盟和1961年在科隆(德国)成立了社会学研究中心档案资料库。后来,1994年在德国哥根廷又成立了历史研究数据库和资料库。。该工作的重要内容是从史料中提取相关信息,将其转化为电子形式。在此期间,为保留史料,创建了很多专门的电子档案,这些对于历史研究来说新的史料的出现,具有重要意义。从70年代开始,很多国家的官方机构开始大规模的将史料文献复印、存储转化为电子的形式。 在历史研究过程中,那些年创建的电子档案有哪些特点呢?第一,在评价史料信息时以实用角度为主导,当然,这些电子档案库是以问题为导向建立的。但是,在处理档案时并没有将把所有的史料都完全转化为电子形式作为自己的目标[9]。第二个显著特点,通常也是电子数据的特点问题导向或者方法导向的术语意思是依据研究任务从文献资料中有明确目的将数据挑选出来,借助一定的方法来解决具体的研究问题。这个术语与文献资料导向术语相比较,文献资料导向术语保存了文献资料信息。,这与以下因素有关,对于解决任何一个具体的历史问题,并不存在专门的理想的文献,即囊括所有必要的信息。因此,研究人员必须从浩如烟海的史料中筛选资料,从中找寻部分的或是片段的需要的信息。除此之外,原始的资料在转化为电子档案的过程中往往经过了一系列的转换,文本信息被译成了代码,以个体形式存在的信息被汇总,原始的文件被整合,原始的特征被转变为相对的或是总体的特征。
这样一来,这些以问题为导向的史料,并不是传统的纸质文献完全意义上的电子副本,而是或者是有著作者的原始资料的电子版,或是事实上成为了一种在历史研究中新的史料应该专门强调,文献资料的电子副本和电子样本在上下文中没有进行书籍扫描,信息容量改革,可以进行信息搜索和分析处理(例如,表格或全文的数据库大小)。。相对于前面的原始纸质文献而言,它们可以被称为新一代的史料,它可以是原始文献的一部分,或是一些原始文献的电子版整合汇编。如果这种史料的作者非常详细且认真地记录了他整合的过程,那么就可以查询其中的所有文献的出处。进而言之,这种史料也可以是对其他文献的补充、修改和汇编。此时,这种以电子形式出现的计算机处理后的结果非常重要,因为可以允许重复使用。因此,正是在这一时期,历史学家在自己的职业活动中不仅是信息的消费者,同时还是信息的创造者,并积极地发挥着作用[9]。所以,计量史学家开始采用一种复杂的方法,这种方法没有计算机技术,还有信息库技术是无法实现的,这成为了历史信息学形成的前提条件,起初,它局限于计量史学的内部,后来扩展到了其外部。
在一定程度上,历史信息学仍发展于计量史学的内部。通常情况下,计量史学家对于历史研究中的计量方法,首先是数据统计方法的地位和作用,并无意见分歧,在对史料进行计算机处理的目标和任务的认识上也无矛盾,史料处理中的信息技术被看成是计量研究的有机组成部分[10]。 但是,当20世纪80年代历史信息学出现了新的领域时,情况发生了改变,史学家开始出现了对信息学理论的特点、内容和方法的讨论。正是在此期间,著名的德国学者、“历史与计算机”国际协会的创始人之一泰勒,在明确正常史料处理与被加工过的资料处理,以及历史研究中使用计算机技术带来的方法导向和史料导向之间存在着根本性的差别的基础上,深入地研究了历史信息学的概念[11]。
泰勒强调历史学科和其他广泛使用统计方法的学科之间存在的重大差异;这些方法在判断和评价不确定性的不清楚的历史数据时具有局限性;历史信息形式化使现有程序的无效性日益凸显。实际上,与历史学和其他学科观点、方法、手段相似性和相互渗透的跨学科论题相反,确定了关于历史研究和历史文献资料信息工作方法特点的反命题。
对于历史资料及计算机化史料问题特殊性的深切关注,标志着20世纪80—90年代成为以史料为导向的史学研究的重要发展阶段。
泰勒认为,以史料为导向的数据处理方式具体方法是,尝试在计算机上存储各种各样史料信息,以便它能在更广阔的范围内得到使用。它为做各种不同类型的分析准备了条件,历史学家在创建电子资源数据库阶段,不用考虑以后怎样去运用它。这一思想的具体实现是以史料为导向的数据库管理系统κλειω的建立。κλειω管理系统是数据库经典结构、全文检索系统和文献检索系统的综合体,可以提供语义检索和数据检索,拥有知识库和结论推理系统[12]。除了众多其他功能外,还能提供例如从事统计分析所需要的所有的转换数据。
应着重指出,在当时首次提出了形成覆盖全部历史的电子资源数据库的任务,这就需要深入研究对史料信息进行描述和分类的标准,以及与创建知识库和在不同的研究领域的数据交换相关的研究方向。必须考虑到,史料要素之一的语义因素,这既是描述资料的类型和结构的需要,也是执行数据转换和交换程序的必须之举[13]。知识库的概念,不仅使史料的考证有了更充分的论据,还极大地扩展了史料整合的能力。
然而,κλειω数据库系统不仅接近于知识库的概念,还接近电子出版物的概念,因为该系统中有众多的史料信息的表现,如它的数字化图像、它的转录和非史料文献的存储功能。κλειω数据库系统对于史料的处理是通过将文章的片段与数据库内的各别内容进行比对来实现的。数字化的图像史料也可以保存在数据库系统中。在此过程中,文章的各个片段将由专门的管理程序在系统内部单独处理。用户的任何请求、任何对于数据的访问都可以与存储在计算机中的数据相连接。 因此,泰勒方法的目的是将已出版的史料与准备将其转化为计算机处理格式结合起来。很明显,史料的搜集、它的外部和内部的考证,包括对非史料的甄别,在这种方法下,则成为首要任务。
赢来普遍喝彩的κλειω数据库系统的很多设想,在21世纪初得到了发展。与此同时,以史料为导向的研究方法也受到了一些研究人员的批评。他们认为,过度的依赖由计算机的史料库提供的问题(其中包括数据库),将关注的重点从对史料评论的实用角度转移到了语义的角度,这对研究中的分析带来了损害。对于传统的纸质史料电子版本的关注和建立数据库的兴趣,超过了在这一阶段对于分析的兴趣,这是非常自然的现象。事实上,这是新兴学科的共同特点。可靠的、有效的史料的电子版在数量上积累的越快,数据研究中复杂的方法在实际研究过程中占有重要地位的步伐就越迅速。在此之前,新的形式的史料在数量上的增长会正常发展。因此,历史信息中很多研究以史料为导向,在特定的阶段具有较为积极的意义,至少是正常现象М泰勒的方案和他对史料学问题的研究在研究这个领域的我国专家中得到了广泛认同,可以解释为俄罗斯历史学发展的过程中存在一支强大的史料学研究力量。。 我们注意到,关于泰勒的建议的讨论,或多或少还有术语方面的原因。他正确地指出了数据处理方面史料导向和问题导向对于分析问题的影响。所以,这些术语指的应是历史学家不同的研究阶段,两者之间并不矛盾。因为划分史料导向和问题导向,只能靠推测,即使是研究人员,任务的提出也不可能完全避开对于某种范围内史料的考证,即该范围内的资料是否有助于问题的解决。同样,在选择电子出版物时也不可能不对它对于所解决问题的重要性不加以考察。
是否可以通过不同的角度提出问题?对于同样的史料采取这种或那种不同的方法?例如,20世纪60—70年代的计量史学家采用的是以问题为导向的研究方法,研究的领域主要集中于社会经济史问题,使用的是有清晰结构的统计性质的史料。当研究人员对于一些结构不甚清晰的史料进行研究,开始运用计算机技术和信息技术的时候,就出现了以史料为导向的研究方法,该方法考虑到了史料没有规律,且结构模糊的特点。
最后,再对这种方法做比较时应考虑到传统的纸质史料远离于真实,因为其中包含着一些他的著作者添加的注释。那么在涉及研究人员创建的电子版史料时,这种失真的可能性倍增。这些史料两次疏远于事实,即它的原始出处和它的电子副本(在电子副本中又加入了研究人员新的注释)。因此,以史料为导向的研究方法其优点之一是,试图消除对于史料的二次注释的问题,保存了史料的完整副本及其注释[14]。
在我国历史编纂学中文献资料的问题导向法引起了许多研究者的关注。尤其是在1993年出现了“计算机史料学”这个术语(不太恰当并且备受争议)。该术语反映了这个阶段历史信息学发展的趋势。在20世纪90年代的许多刊物对历史信息学的史料学问题看法不一,从完全把计算机史料与纸质史料等量齐观,计算机史料学被理解为创建电子文献资料阅读器的方法和技术综合体[15],到将历史信息学列入新史料学[16],或者将计算机史料学作为历史信息学和传统史料学的衔接领域,借助计算机技术解决创建(或处理)机器阅读的文献资料的史料学任务[17]。
尽管不是所有的术语问题都得到了解决,但是,更深思熟虑的观点在1996年历史信息学教科书中已有所体现[18]。探索更相符的术语与解决史料学问题的关系密切。史料学问题不只限于利用历史文献资料的机器阅读副本。还是在20世纪70年代末,ВИ鲍维金写道,历史文献资料信息研究任务超出了标准史料学的范围,并且为了与历史文献资料研究方法相称,提出了“信息史料学”这一术语,它很久以前就成为现存的信息系统的一部分[19],其中划分各种信息层次,通过对文献资料中确定的信息进行同步地回溯[20],评价文献资料反应信息的可靠性。今天对这个问题的讨论仍在继续:2008年12月,“历史与计算机”学会第十一届代表大会上的圆桌会议介绍了历史信息学的史料学问题和21世纪信息技术下,解决这些问题的前景。
必须提到20世纪末至21世纪初,一些刊物在网络信息空间中提出了与电子文件的特性、它们的准确性和技术鉴定价值、历史文献资料的电子刊物的古文献研究原则关系密切的问题。需要借助历史文献资料的形式和类型研究档案学、古文献学和其他问题[21]。
20世纪末21世纪初历史信息学的发展产生了一个结果,它可以被描述为以问题和史料为导向的新型研究分析方法的综合体。在这个发展阶段,历史信息学发展的未来方向与数据库的建设、电子史料的出版和科研成果密切相关,应不断完善信息检索的程序,用现代的方法创建并分析历史资料的汇编[22]。尤其跨学科研究和协作趋势不断增强,不仅与利用信息和网络技术的其他人文学科的同事们协作,而且和信息技术领域以及档案馆、博物馆、图书馆的专家进行合作。
创造和利用历史学的学科教育(专题)资源[23]的问题,是现阶段历史信息学发展最显著的特点,其中包括大量政治专题的文献资料集互联网网站“1812年”可以作为一个例子,它是最大的关于1812年卫国战争的俄语文献资料汇编。。根据理论的、技术的、系统的处理特点,这个阶段应该称为资源导向阶段:互联网成为了信息的最重要的来源之一,需求它的不仅有大学生及那些对历史感兴趣的人,还有那些历史学家,这极大地增强了史料信息中研究的实效性。
现阶段,对历史信息学的特殊史料学问题的兴趣不仅没有降低,还补充了新内容:历史信息资源的处理需要根据问题适用新标准。这些问题与创立专题网站、讨论电子刊物的标准、在网络信息空间深入研究历史文献资料的古文献学原则关系密切。
可以作为这些标准之一的就是莫斯科国立罗蒙诺索夫大学历史系历史信息学教研室的以史料为导向的专题网站(ИОТС),该网站的内容是在专业的基础上就一些历史专题提供相关的信息[24]。 正是这样的专业资源才能成为史料内容考证的标准。史料问题的特殊性在于,首先是保证使用者可以访问该资源,在此基础上,才可实现从不同的角度进行综合性的跨学科的专题研究,以及形成关于专题资料的虚拟的电子数据的集合,最后统一到一个网站上,这样的问题在传统的纸质史料学中是未曾遇见的。
这样的资源还应该包括以下几部分:相关专题的一些最重要的史料,就该专题的一些最重要的作品的汇编,专题数据库,提供其他网站的一些相关资源的链接。这些原则在莫斯科大学历史系历史信息教研室建立的专题网站上得到了实现,即从改革前工业向苏联工业的转变中俄国劳动关系的演变(www.hist.msu.ru/Labour/)。该资源在19世纪下半期和20世纪初俄国产业工人社会历史研究方面,于数量和质量上,在俄国互联网上都是最具代表性的一个。它成为了用更加广阔的视角研究俄国工人社会史的信息库,即1880—1930年俄国劳动关系的演变过程,其中包括:劳动法的资料、工人的工资、工人的保险和社会保障,以及劳资矛盾问题等。这种多角度的信息资源库的建立,既有利于研究者了解工人历史的史实材料和背景资料,也有助于涉及该领域问题的教学工作。
这样的专业电子资源信息库的创建是建立在甄别和选择文献和已公布的档案并将它们转变为了电子版本基础上的。显而易见,这个工作没有解决史料学分析的那些核心问题是不可能做到的。例如,评价文献资料所含信息的真实性和代表性。此外,文献资料集也包括以电子形式存在的文献。考虑到这个情况,随着电子形式的信息容量不断增加,文献综合体多样化的要求也变得越来越重要。 如果面对那些能符合历史文件出版所有标准的出版物[25],在利用已经公布的文献资料集和文献汇编时解决一些问题相当简单。在这种情况下,史料学研究的许多问题都被传统刊物的出版者解决了(文献的来历、注明日期、作者身份、参考文献和原文的注释)。
通常,在互联网上建立专业的专题资源网站时,网站上主要是这样的一些出版物,即可称之为再次出版物,是对现有的文献集或个别的文献进行电子版的再版,这种工作在法律文书、公文处理和统计资料时最为有效。再版的一个重要区别是电子文档的创建者可以对文章自由地发表评论,甚至可以改正原来纸质文本中的错误[26]。很遗憾,在这种情况下,缺乏鉴定出版者干涉原出版文件水平的信息。
专题网站的另外一种形式是首次出版物,包括亲自参与选题、系统化加工及准备传统的纸制文献资料等。在这种情况下,电子版出版物具有一定的优势,例如,出版物在数量上没有限制。所以,在存在各个版本的情况下,文章的选择问题通常并不存在,因为出现了拥有众多版本的电子出版物的可能,而这就在安排创建过程和出版资料原文的情况下为史料学的分析和综合提供了新的机会。
在将纸质文献资料转换成电子出版物时,最重要的是原文出版的方法和技术选择。在电子出版物中,应有对原文转换进行科学评论的方法。编码在原文献转化为电子版的过程中发挥了巧妙的作用。在电子出版物文本形成的过程中存在文献资料出版的一些方法:真迹复制,依照专门的尺寸逐页将原文变成电子版,使它可以在计算机屏幕上阅读并且保存文献资料的表面特点;改编,依照正文的尺寸改变内容,失去了原文表面特点;最后,依照不同的尺寸提交原文。真迹复制原文件对电子出版物而言是毫无疑问的长处,它保留了文献资料的表面特征也能在选播屏上改善文件显示的质量。它的创建工艺十分简单。它保留了原文的逐页编码,在援引互联网文献资料时解决了引用问题。旧拼写法转换文本的复杂性有时要求建立相应的信息资源。这种信息资源包括不仅要研究史料学问题,还要专门的计算方法和出版技术以及对文献资料信息进行注释[27]。
一般情况下,专题电子资源数据库具有多方位、超级文库的基本特点,在各个信息模块和个别文献之间存在着密切的联系。电子资源超级文库的特点,使得使用者可以充分利用文献中上下文信息检索的功能,在通过语义片段连接起来的文献间自由的切换,不仅能看到电子文献,还能看到数字化的图像。
历史信息学现阶段发展的综合性的特点还表现在,可以提供相关的资料、展现一些科研的成果,对于其他的研究者来说,是一种潜在的资料。创建和再利用这些信息资源在科研中尤为重要,尤其是在近现代史的研究中[28](pp.18-20)。这些创造出来的资源,不仅积累了包含各种来源的信息(如出版物或文献),从归档记录到文献出处,还阐述了数据处理的方法。可以说,这些资料的出版复兴了在新的水平上传统的以问题为导向的史料处理方法,那些曾是计量史学的研究方法,导致了在历史研究中大量的二次信息资源的形成。
最后,专业专题资源的重要组成部分是史料集,它在史料信息中扮演着双重角色。第一,史料集提供了史料信息研究和分析的方法,对历史信息进行了最合理的提炼和解读,这是史料分析的任务之一,揭示了史料的信息潜力;第二,史料集是考证史料的合集,没有它史料学术评价中的很多问题都不可能得到解决。 未来史学信息库的研究应建立在特别是史料文献的基础上,以及描述史料综合语义的元数据和按照专题目录和词汇分配的专题史料的基础上。
事实上,我们是历史研究的基础——历史信息环境变化的见证者,在这一过程中,阐述历史信息学的概念、方法和建设专业的专题资源具有日益重要的地位,总之,这有利于完善民族历史文化遗产的保存。
[参 考 文 献]
[1]Ковальченко И. Д. Методы исторического исследования. М., 2003.
[2]Соколов А. К. О применении новых методов в исследованиях историков США // Математические методы в социально-экономических и археологических исследованиях. М., 1981.
[3]Ковальченко И. Д., Милов Л. В. Всероссийский аграрный рынок XVIII - начала XX века: Опыт количественного анализа. М., 1974;Ковальченко И. Д., Бородкин Л. И. Аграрная типология губерний Европейской России на рубеже XIX-XX вв.: (Опыт многомерного количественного анализа) // История СССР. 1979. N 1. ;Ковальченко И. Д., Бородкин Л. И. Структура и уровень аграрного развития районов Европейской России на рубеже XIX-XX вв. //История СССР. 1981. N 1;Ковальченко И. Д., Селунская Н. Б., Литваков Б. М. Социально-экономический строй помещичьего хозяйства Европейской России в эпоху капитализма. М., 1982;Ковальченко И. Д., Моисеенко Т. Л., Селунская Н. Б. Социально-экономический строй крестьянского хозяйства Европейской России в эпоху капитализма (источники и методы исследования). М., 1988. [4]Бородкин Л. И. И. Д. Ковальченко и отечественная школа квантитативной истории // Мат-лы науч. чтений памяти академика И. Д. Ковальченко. М., 1997.
[5]Ковальченко И. Д. О применении математико-статистических методов в исторических исследованиях // Источниковедение. Теоретические и методические проблемы. М., 1969;Кахк Ю. Ю., Ковальченко И. Д. Методологические проблемы применения количественных методов в исторических исследованиях // История СССР. 1974. N 5; и др.
[6]Ковальченко И. Д. Исторический источник в свете учения об информации (к постановке вопроса) // Актуальные проблемы источниковедения истории СССР, специальных исторических дисциплин и их преподавание в вузах / Тез. докл. III Всесоюзной конф. М., 1979.
[7]Массовые источники по истории советского рабочего класса периода развитого социализма. М., 1981.
[8]Массовые источники по социально-экономической истории периода капитализма. М., 1979;Ковальченко И. Д. Методы исторического исследования. М., 1987.
[9]Гарскова И. М. Базы и банки данных в исторических исследованиях. Гёттинген, 1994.
[10]Бородшн Л. И. Методологические проблемы исторической информатики и квантитативной истории // Новая и новейшая история. 1997. N 3, 5;Бородшн Л. И.. Квантитативная история в системе координат модернизма и постмодернизма // Новая и новейшая история. 1998. N 5.;Гарскова И. М. Историческая информатика и квантитативная история: преемственность и взаимодействие // Анализ и моделирование социально-исторических процессов. М., 2006;Гарскова И. М.К вопросу об истории исторической информатики // Информационный бюллетень ассоциации “История и компьютер”. 2008. N 35.
[11]Thaller M, The Need of a Theory of Historical Computing // History and Computing II. Manchester; New York, 1989;Талер М. Что такое “источнико-ориентированная обработка данных”; что такое“историческая информационная наука”? // История и компьютер: новые информационные технологии в исторических исследованиях и образовании. Гёттинген, 1993.
[12]Boonstra O., Berure L., Doom P. Past, Present and Future of Historical Information Science. Amsterdam, 2004.
[13]Thaller M. On the Conception, Training and Employment of Historical Data and Knowledge Daemons // Eden or Babylon? On Future Software for Highly Structured Historical Sources. St. Katharinen, 1992.
[14]Гарскова И. М. Выступление на “круглом столе” “Методологические проблемы исторической информатики и квантитативной истории” // Информационный бюллетень ассоциации “История и компьютер”. 1996. N 19. [15]Моисеенко Т. Н., Свищев М. А. Изучение аграрной истории России последних десятилетий: перспективы “компьютерного источниковедения” // История и компьютер: новые информационные технологии в исторических исследованиях и образовании. St. Katharinen, 1993.
[16]Соколов А. К. Социальная история России новейшего времени: проблемы источниковедения и архивоведения // Социальная история. Ежегодник. 1998/99. М., 1999.;Соколов А. К.. Источниковедение и проблемы исторического синтеза // Проблемы методологии и источниковедения. Мат-лы III науч. чтений памяти академика И. Д. Ковальченко. М., 2006;Подгаецкий В. В. “Историческая информатика” как источниковедение XX и/или XXI века? Pro et contra: Ad nominem // Круг идей: историческая информатика в информационном обществе. М., 2001.
[17]Тяжельникова В. С. Компьютерное источниковедение: к постановке проблемы // Круг идей: развитие исторической информатики. М., 1995;Владимиров В. Н., Цыб С. В. Источниковедение в век компьютера (вместо предисловия) // Источник, метод, компьютер. Барнаул, 1996;Владимиров В. Н. Историческая информатика: пути развития // Вестник ТГПУ. 2006. Вып. 1 (52).
[18]Бородкин Л. И. Историческая информатика: этапы развития // Новая и новейшая история. 1997. N 1.
[19]Бовыкин В. И. Проблемы изучения исторической информации. (Квопросу об информационном источниковедении) // Информационный бюллетень ассоциации “История и компьютер”. 1998. N 23. 1998.
[20]Бовыкин В. И. К вопросу о закономерностях фиксирования исторической информации в письменных источниках // Круг идей: историческая информатика на пороге XXI века. М.; Чебоксары, 1999,Кругляков Э. П. Лженаука. Чем она угрожает науке и обществу? Доклад на Президиуме РАН 27 мая 2003 г. // www.atheismru.narod.ru/Pseudo_science/Officials/Krugljakov.htm..
[21]Гельман-Виноградов К. Б. Глобальная трансформация документальных источников на рубеже тысячелетий // Источниковедение XX столетия: тезисы докладов и сообщений научной конференции. М., 1993;Киселев И. Н. Электронные документы: основные направления исследований // Вестник архивиста. 2000. N 3 – 4;Тихонов В. И. Аутентичность и целостность электронных документов при долговременном хранении // Вестник архивиста. 2002. N 4 – 5;Юшин И. Ф. Электронные документы как исторический источник // Круг идей: электронные ресурсы исторической информатики. Барнаул; М., 2003. С. 37 – 51;Грум-Гржимайло Ю. В., Сабенникова И. В. Некоторые проблемы публикации архивных документов в электронных изданиях // Вестник архивиста. 2006. N 2 – 3. [22]Бородкин Л. И. Историческая информатика в точке бифуркации: движение к Historical Information Science // Круг идей: алгоритмы и технологии исторической информатики. М.; Барнаул, 2005.
[23]Бородкин Л. И., Владимиров В. Н., Гарскова И. М. Новые тенденции развития исторической информатики. По материалам XV международной конференции “История и компьютер”// Новая и новейшая история. 2003. N 1.
[24]Бородкин Л. И., Гарскова И. М. Трудовые отношения в период социалистической индустриализации // Экономическая история. Обозрение. 2006. Вып. 12.
[25]Правила издания исторических документов в СССР. М., 1999.
[26]Боброва Е. В. Анализ археографического уровня подготовки документальных публикаций в российском сегменте Интернет // Информационный бюллетень ассоциации "История и компьютер". 2001. N 3.
[27]Варфоломеев А. Г., Иванов А. С. Технология XML: современная реализация источнико-ориентированного подхода в работе с комплексами исторических документов // Информационный бюллетень ассоциации “История и компьютер”. 2006. N 34;Иванов А. С. Работа с XML-документом как воспроизведение основных этапов источниковедческой критики: новые технологии и возможность коррекции традиционных подходов //Информационный бюллетень ассоциации “История и компьютер”. 2006. N 34.
[28]Соколов А. К., Бонюшкина Л. Е., Мякушев С. Л. БД как путь к источниковедческому синтезу // Информационный бюллетень ассоциации “История и компьютер”. 1996. N 17.
(И. М.佳尔斯科娃:莫斯科大学历史系历史信息教研室副教授,历史学副博士;张广翔:吉林大学教授,博士研究生导师,历史学博士)
[责任编辑 张晓校]