基于网络爬虫的文献检索系统的研究和实现

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:gengyuefeng009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文中系统基于网络爬虫技术实现了文献资源的智能搜索和关键信息的抓取功能,把采集到的信息采用本体论的方法进行分类识别,并自动存储文献资源到本地服务器。下载子系统采用负载均衡的方法把下载任务分配到多个服务器。系统采用高效的Protobuf socket通信手段,提供高效准确的内部下载服务。通过对内提供统一门户入口的方式对检索和下载行为进行记录,有效避免了同一资源的重复下载,也使得文献检索和下载行为变得可追溯,为图书文献情报管理和研究工作提供了数据支撑。该系统可有效减少科研机构获取学术资源所需的资金投入并减少网络
其他文献
能否以高概率正确重建稀疏信号是压缩感知理论中的重要研究内容。信号的稀疏度及冗余字典原子间的相关特性是研究该内容的关键因素。文中运用累积增量的概念,提出了一种基于截
摘要:新媒体与传统的媒体分别具有自己独特的特点,这两方面媒体传播途径和方式的交融是融媒体发展的基础与核心。融媒体就是利用网络传播思维方法,将新媒体与传统媒体进行相互的交融,对信息传播的方法和内容都有一个非常好的扩充作用,进而增加媒体的信息传播力量,提高影响因素。本文就融媒体时代对传统的广播电视媒体产生的影响为方向进行探究,研究广播电视节目如何在融媒体的新时代中实现创优与创收的共赢,来给之后的群众进
介绍高校科研平台开放实验室教学的意义与研究现状。从理论基础、教学目标、操作程序、实现条件、教学评价5个方面阐述了高校科研平台开放实验室教学模式。
现阶段的电视节目中,后期剪辑包裟作为改善电视节目视觉体验的重要部分,被电视工作者不断重视起来,它不仅能够让电视节目的内容变得美观,还能帮助电视节目更好地被观众所理解
随着互联网上数据的增长,如何更有效地利用数据成为了一个亟待人们解决的问题。为此语义网被提出,使得机器可以帮助人们处理这些数据。语义网的核心是本体,因此语义网的发展和人
媒体公信力是指媒体基于自身属性,在长期与受众进行互动反馈过程中所形成的、被社会公众所信赖所认可的能力。鄂州广播电视台新闻综合广播《新闻纵横》,作为一档以新闻为主的
摘要:新媒体时代,带来挑战的同时,也带来创新发展有效转型的新机遇。就电视媒体来看,电视节目主持人为了更好地适应时代发展的主旋律,则需要在日常生活中不断学习和自省,重视自身专业素养的提升以及相关意识的形成。本文主要就新媒体环境下电视节目主持人发展现状以及应具备的意识进行分析,主要就电视节目主持人的整合力、主持风格等方面进行阐述,希望对相关工作者有所帮助。  关键词:新媒体;电视节目主持人;专业素养;
目的探讨磷酸肌酸钠联合辅酶Q10治疗小儿心肌损害的疗效与价值。方法 60例患有心肌损害的儿童,随机分为观察组和对照组,各30例。其中对照组单独使用磷酸肌酸钠进行常规治疗,
有这样一部美国影片,在中国不同历史时期上映,每一次都引起轰动;尽管它讲述的是一于悲伤苦涩的爱情故事;影片中的男女主演从未到过中国,却在中国拥有大量影迷;它是一部典型的
摘要:融媒体时代,需要对媒体平台中的新闻编辑工作进行不断地提升,对新闻的敏感度也要加强。此外,还需要扩大新闻的来源途径,最后也是最重要的就是要注重关注受众的阅读习惯。那么本文就从如何做好融媒体时代的新闻编辑工作进行论述。  关键词:融媒体时代;新闻;编辑工作  融媒体时代,媒体平台遇到了新的挑战和机遇,将视音频和文字以及图片等融合在一起,全方面地实现了资源通融和内容兼容以及利益共融,不但为广大受众