【摘 要】
:
词表和分类法是传统纸质文献环境下最重要的知识组织工具。它的更新和维护一直依靠手工进行。这限制了它在数字图书馆和网络信息环境下的应用。本文介绍了一项基于统计的、从
【基金项目】
:
国家自然科学基金资助项目(70303002);国家社会科学基金资助项目(03BTQ001)
论文部分内容阅读
词表和分类法是传统纸质文献环境下最重要的知识组织工具。它的更新和维护一直依靠手工进行。这限制了它在数字图书馆和网络信息环境下的应用。本文介绍了一项基于统计的、从元数据的标题中抽取关键词并定位在词表中的方法。定位的依据是抽取出的关键词所对应的标引词集的收敛性质。标引词是用于标引文献主题的、来自于词表的受控词汇,即主题词。在《中国分类主题词表》和北京大学图书馆提供的5千余条计算机科技领域的书目数据上所进行实验证明了文中所述的方法是可行的、有效的。这一方法可以直接用来实现基于已标引语料库的自动编目和元数据自动生成。
其他文献
随着Web的迅速发展 ,网上信息资源越来越丰富 ,网络已经成为了一个全球最大的信息库。而用户要从中得到所需的信息一般是通过各种信息检索工具。但是现有的信息检索工具都存
随着博物馆事业的蓬勃发展,博物馆在儿童教育中发挥着越来越重要的作用,博物馆教育类文化产品作为展览的延伸,是博物馆社会教育功能的拓展,它具有广阔的前景,对儿童教育的作
随着加快完善现代市场体系,充分发挥市场在资源配置中的决定性作用的改革,我国建筑业将走上快速发展的道路。但是,在建筑业快速发展的同时,行业中的竞争也在不断加剧,因此,社
近年来,"女汉子"成为热词被大家争相追捧。最早从网络流行起来的"女汉子"一词成了许多女孩自我调侃的词汇,也日益成为对女性的一种新的评价方式。本文从社会心理学角度着眼,
《高居翰中国美术史文集》即将由中国美术学院出版社出版,本期卷首刊登的三篇文章,就是范景中、洪再新、曹意强分别为该文集所写的序、跋或导言,它们从不同的角度勾画了高居
本文就户外区域运动中幼儿自主性减弱的原因进行分析,并提出了户外区域运动中幼儿自主性增强的策略,最后就策略效果进行评价。
应用Solidworks API二次开发函数及VC++编程语言,开发了Solidworks环境下运行的工业机器人离线编程系统,实现了FANUC M-900iA/350型工业机器人位姿坐标计算、机器人逆运算及
目前电力特种机器人的研究主要集中在巡线机器人方面,用于巡检电力铁塔的机器人还鲜有成果。攀爬电力铁塔机器人爬行方案的设计,是研制攀爬电力铁塔机器人的基础。本文通过分
本文分析探讨了物流信息平台建设的现实意义,构建了整合企业、货主、港口、银行、海关、工商税务等多个系统的物流信息平台,采用各种先进的数据分析、统计、挖掘和关联等技术