基于超链分析的Web资源自动发现技术

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:LanceXulei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的Web资源自动发现是基于Web页面内容实现的。本文试图从超链分析的角度探讨Web资源的自动发现技术。超链分析技术起源于社会网络分析和科学引文分析理论,它只分析页面之间的关系,而不关心页面本身的属性。通过试验证明,单纯使用超链,根据用户提供的网页实例,我们能够自动发现与学科资源相关的网站。该技术可以有效的减少网络爬行器的无谓爬行,提高采集效率,减轻网络负担,在学科资源建设中起了重要的作用。 Traditional automatic discovery of Web resources is based on Web page content. This paper attempts to explore the automatic discovery of Web resources from the perspective of hyperlink analysis. Hyperlink analysis originated in social network analysis and scientific citation analysis theory, it only analyzes the relationship between pages, and does not care about the properties of the page itself. Experiments show that simply by using hyperlinks, we can automatically discover sites related to academic resources based on user-provided examples of web pages. The technology can effectively reduce the unnecessary crawling of crawler, improve the collection efficiency and reduce the network burden, which plays an important role in the construction of disciplinary resources.
其他文献
引用比尔·盖茨的数字神经系统的概念,以香港浸会大学图书馆Intranet为例,分析和论述图书馆数字神经系统建构的一个重要组成部分——图书馆内部管理资源的数字化及网络化在数
在分析我国中小企业信息环境现状的基础上,论述为了改善我国中小企业生长的信息环境,政府、IT以及咨询等行业应当注意的问题及采取的措施.
随着“互联网+教育”在课堂改革中的不断深入,许多学校、教师都认识到了教育界最新青睐的慕课、翻转课堂等.近年来,随着教育体制的改革,农村数学教师的专业水平有了明显提高,
简要回顾现代图书馆学研究对象的种种观点,指出现代图书馆学的研究对象是知识信息的组织、传播与利用,并从知识管理与现代图书馆学研究对象创新这个视角对此论点进行论述。
这里讲述的是一位老师和她的学生(儿子)的共同成长经历:  手记一:  儿子11岁,有些学坏。  那天,本村林强家摆酒,我和儿子去他家吃完饭,儿子对我说:"妈妈,我不回家,我就和奶奶在一起
台湾“财政部关务署”为台湾关务政策规划、推动、督导及关务法规拟订机关,掌理关税稽征、查缉走私、保税、贸易统计及接受其他机关委托代征税费、执行管制。近年来,其不断积
通过对EDI的简单介绍,对在图书馆采访自动化系统中应用EDI进行可行性分析,并在此基础上提出基于EDI的采访业务流程。 Through a brief introduction to EDI, this paper ana
在分析影响中国科学院外文网络保障体系因素的基础上,探讨中国科学院外文网络数据库保障体系的构架。 Based on the analysis of the factors influencing the foreign lang
通过对Dialog SciSearch文档的剖析,介绍该文档的特点和检索技巧,并通过案例分析介绍SCI收录、引用检索的步骤。 Through the analysis of Dialog SciSearch document, this
期刊