论文部分内容阅读
摘要:通过对数字图书馆元数据和对象数据的介绍,提出了856字段在其中所起的作用,对856字段的应用、实现方式作了详细的介绍。
关键词:数字图书馆 元数据 对象数据 856字段
一、传统图书馆向数字图书馆的过渡
随着计算机网络技术及应用的发展和普及,读者获取信息和交流信息的方式发生了极大的变化。在数字化图书馆的构建中,数据资源应当包括两个基本组成部分:元数据和对象数据。
元数据包包含的内容是对原始信息资源(即对象数据)的描述,其作用是使用数据用户能够通过检索对相关原始信息资源进行选择和定位,并提供调取对象数据的手段,例如以ISO2709格式存放的各种文献信息和非文献信息。对象数据包括印刷文献的数字化图像、各种含有输出格式控制信息的数字化文档、其它图像、声音、录像信息。
二、856字段在元数据中的应用
在数字图书馆中,如何把元数据与对象数据进行有机的结合呢?其结合点又在哪里呢?我们知道,数据格式的标准化是数据得以交流和共享的基础,图书馆所积累的数据资源能否跨平台迁移,关键要解决标准的问题,因此,扩充机读目录格式,增加856电子资源定位字段以连接元数据和对象数据,就是解决这一问题的关键。
856字段,电子资源定位与检索(Electronic Location and Access)包括定位与检索电子资源所需要的信息。当文献资源或其子集可以通过电子方式获取时,可在书目记录中启用856字段。另外,该字段也可用于定位与检索书目记录中著录的非电子资源的电子版或其相关的电子资源。856字段应当属于元数据,在CNMARC中,没有关于此字段的定义,但我们可以根据UNIMARC进行扩充,以满足对电子资源访问的需要。
对于856字段,具体定义如下:
指示符1:用来定义电子资源的检索方法。如果电子资源可以通过多种检索方法获取,那么该字段可以重复。
#无信息提供
指没有提供关于检索方法的信息。
0电子邮件 (Email)
指通过“邮件传输协议”(Mail Transfer Protocol,简称MAIL TP)检索电子资源。
1文件传输协议 (FTP)
指通过“文件传输协议”(File Transfer Protocol,简称FTP)方式检索电子资源。
2远程登录(Telnet)
指应用Telnet等远程登录方式检索电子资源。
3拨号入网(Dial-up)
指通过传统的电话拨号入网方式检索电子资源。
4超文本传输协议(HTTP)
指通过超文本传输协议(Hypertext Transfer Protocol,简称HTTP)检索电子资源。
5检索方法在$y中说明
电子资源的检索方法不是通过定义的指示符值来表示,而是通过记录在子字段$2的标识性代码识别。
指示符2:未定义,空位现就一些常用字段应用作以介绍。
$b检索号码 (有则必备,可重复)
包含与主机相关的检索号码。如果文献是Internet资源,它指的是互联网协议地址(Internet Protocol,简称IP);如果用电话拨号上网,它指的可能是电话号码。这一数据不是静态地存储在某一地方,而是经常变化且可以由系统自动生成。
例 856 3#[email protected]$t3270$tline mo
de (e.g.,vt100)$vM-F 06:00-21:30 USA EST, Sat. 08:30-17:00 USA EST, Sun.13:00-17:00 USA EST
注:本字段是利用电话拨号入网方式获取电子资源的实例。包含主机域名($a)、IP地址($b)、用户可以和资源提供者联系的email地址($m)、仿真终端($t)和检索时间($v)等信息。
$d路径 (有则必备,可重复)
$d包含的路径信息用于说明文件存储位置的逻辑目录与子目录名称的序列。
$f电子文件名称 (有则必备,可重复)
$f包含存储在子字段$d指定的目录/子目录下的电子文件名称。
例856 1#$d/pub/EIS/vol*no*/adobe$f*.pdf$lanonymous$qapplication/pdf
注:$d记录路径,$f记录文件名称,$o记录操作系统,$i记录登录信息,此处为匿名登录,$q记录文件的格式类型。
三、856字段的实现方式
以MARC记录格式为基础,通过856字段描述网络化电子资源的特性、连接方式和提取操作要求。MARC是图书馆描述、存储、交换、处理以及检索信息的基础,经过不断发展已被图书馆用来描述和存取电子信息资源, 856字段可利用MARC记录描述网络化电子资源(包括网页、电子期刊、telnet系统、FTP站点等)的特征、连接方式和提取要求。网络用户通过浏览器各种元数据输出结果,都将采用动态页面方式产生,传送到用户端的信息格式符合HTML语言的基本规范。为改善显示效果而嵌入的特殊内容,可以采用三种方式:ASP、JAVA SCRIPT或ACTIVE X控件。
对于各种数字资源,目前比较成熟的技术解决办法是:
数字视频文件:各种视频信息采集,并通过在页面文件中嵌入ActiveMovie对象定义,实现以Web页面方式实时传输,实时播放视频流式文件。
数字音频文件:各种音频信息采集,并通过页面文件中嵌入ActiveMovie对象定义,实现以Web页面方式实时传输,实时播放音频流式文件。
连续多幅图像文件:各种图像信息采集,并通过页面文件中嵌入Java Script定义信息,以Web页面方式分页(帧)传输图像,并可翻页或查看指定页(帧)。
电子图书:利用快速扫描仪,将多页图书正文打包形成PDF文件。
通过这种处理,图书馆就能够在原有元数据的基础上,通过856字段这个切入点,把相关的对象数据(电子资源)连接起来,并且,在查找到相关的元数据信息(例如书目信息)之后,就可进入相关链接,访问其数字资源,一步到位地满足读者的信息需求。
参考文献:
[1]《中国机读目录格式使用手册》,北京图书馆,华艺出版社.
[2]《丹诚数字图书馆解决方案》,丹诚软件有限公司.
关键词:数字图书馆 元数据 对象数据 856字段
一、传统图书馆向数字图书馆的过渡
随着计算机网络技术及应用的发展和普及,读者获取信息和交流信息的方式发生了极大的变化。在数字化图书馆的构建中,数据资源应当包括两个基本组成部分:元数据和对象数据。
元数据包包含的内容是对原始信息资源(即对象数据)的描述,其作用是使用数据用户能够通过检索对相关原始信息资源进行选择和定位,并提供调取对象数据的手段,例如以ISO2709格式存放的各种文献信息和非文献信息。对象数据包括印刷文献的数字化图像、各种含有输出格式控制信息的数字化文档、其它图像、声音、录像信息。
二、856字段在元数据中的应用
在数字图书馆中,如何把元数据与对象数据进行有机的结合呢?其结合点又在哪里呢?我们知道,数据格式的标准化是数据得以交流和共享的基础,图书馆所积累的数据资源能否跨平台迁移,关键要解决标准的问题,因此,扩充机读目录格式,增加856电子资源定位字段以连接元数据和对象数据,就是解决这一问题的关键。
856字段,电子资源定位与检索(Electronic Location and Access)包括定位与检索电子资源所需要的信息。当文献资源或其子集可以通过电子方式获取时,可在书目记录中启用856字段。另外,该字段也可用于定位与检索书目记录中著录的非电子资源的电子版或其相关的电子资源。856字段应当属于元数据,在CNMARC中,没有关于此字段的定义,但我们可以根据UNIMARC进行扩充,以满足对电子资源访问的需要。
对于856字段,具体定义如下:
指示符1:用来定义电子资源的检索方法。如果电子资源可以通过多种检索方法获取,那么该字段可以重复。
#无信息提供
指没有提供关于检索方法的信息。
0电子邮件 (Email)
指通过“邮件传输协议”(Mail Transfer Protocol,简称MAIL TP)检索电子资源。
1文件传输协议 (FTP)
指通过“文件传输协议”(File Transfer Protocol,简称FTP)方式检索电子资源。
2远程登录(Telnet)
指应用Telnet等远程登录方式检索电子资源。
3拨号入网(Dial-up)
指通过传统的电话拨号入网方式检索电子资源。
4超文本传输协议(HTTP)
指通过超文本传输协议(Hypertext Transfer Protocol,简称HTTP)检索电子资源。
5检索方法在$y中说明
电子资源的检索方法不是通过定义的指示符值来表示,而是通过记录在子字段$2的标识性代码识别。
指示符2:未定义,空位现就一些常用字段应用作以介绍。
$b检索号码 (有则必备,可重复)
包含与主机相关的检索号码。如果文献是Internet资源,它指的是互联网协议地址(Internet Protocol,简称IP);如果用电话拨号上网,它指的可能是电话号码。这一数据不是静态地存储在某一地方,而是经常变化且可以由系统自动生成。
例 856 3#[email protected]$t3270$tline mo
de (e.g.,vt100)$vM-F 06:00-21:30 USA EST, Sat. 08:30-17:00 USA EST, Sun.13:00-17:00 USA EST
注:本字段是利用电话拨号入网方式获取电子资源的实例。包含主机域名($a)、IP地址($b)、用户可以和资源提供者联系的email地址($m)、仿真终端($t)和检索时间($v)等信息。
$d路径 (有则必备,可重复)
$d包含的路径信息用于说明文件存储位置的逻辑目录与子目录名称的序列。
$f电子文件名称 (有则必备,可重复)
$f包含存储在子字段$d指定的目录/子目录下的电子文件名称。
例856 1#$d/pub/EIS/vol*no*/adobe$f*.pdf$lanonymous$qapplication/pdf
注:$d记录路径,$f记录文件名称,$o记录操作系统,$i记录登录信息,此处为匿名登录,$q记录文件的格式类型。
三、856字段的实现方式
以MARC记录格式为基础,通过856字段描述网络化电子资源的特性、连接方式和提取操作要求。MARC是图书馆描述、存储、交换、处理以及检索信息的基础,经过不断发展已被图书馆用来描述和存取电子信息资源, 856字段可利用MARC记录描述网络化电子资源(包括网页、电子期刊、telnet系统、FTP站点等)的特征、连接方式和提取要求。网络用户通过浏览器各种元数据输出结果,都将采用动态页面方式产生,传送到用户端的信息格式符合HTML语言的基本规范。为改善显示效果而嵌入的特殊内容,可以采用三种方式:ASP、JAVA SCRIPT或ACTIVE X控件。
对于各种数字资源,目前比较成熟的技术解决办法是:
数字视频文件:各种视频信息采集,并通过在页面文件中嵌入ActiveMovie对象定义,实现以Web页面方式实时传输,实时播放视频流式文件。
数字音频文件:各种音频信息采集,并通过页面文件中嵌入ActiveMovie对象定义,实现以Web页面方式实时传输,实时播放音频流式文件。
连续多幅图像文件:各种图像信息采集,并通过页面文件中嵌入Java Script定义信息,以Web页面方式分页(帧)传输图像,并可翻页或查看指定页(帧)。
电子图书:利用快速扫描仪,将多页图书正文打包形成PDF文件。
通过这种处理,图书馆就能够在原有元数据的基础上,通过856字段这个切入点,把相关的对象数据(电子资源)连接起来,并且,在查找到相关的元数据信息(例如书目信息)之后,就可进入相关链接,访问其数字资源,一步到位地满足读者的信息需求。
参考文献:
[1]《中国机读目录格式使用手册》,北京图书馆,华艺出版社.
[2]《丹诚数字图书馆解决方案》,丹诚软件有限公司.