科技文献信息系统中检索服务的研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:linux_secway
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图书馆拥有大量的电子资源,包括各种电子期刊数据库、电子图书数据库、自建特色数据库等,在给读者带来丰富信息的同时,也带来了检索的不便。目前各个图书馆还在不断购进各种数据库资源,仅CNKI的数据更新就达数万条/天,要想全面快捷的获取信息变得更加不易。因此,提供对各种数据库的统一检索服务是一个亟待解决的问题。 科技文献信息系统的检索服务以描述文献信息的元数据为基础,构建摘要数据库,采用基于B/S的结构模式,给用户提供统一高效的检索入口,并为数字信息的整合提供标准的访问接口。检索服务参考DC元数据标准对接收的科技文献元数据信息进行整理,主要包括信息过滤和标准化、重要缺失信息补充、不同格式信息转换、重复元数据信息处理等;对整理过的元数据信息进行存储,在摘要数据库的设计中提出一种基于主题的数据分片策略,根据所接收的科技文献元数据信息和用户需求的特点,按照类别和年份进行片段的划分,采用静态启发式的分配方法进行数据的分配;对文献元数据信息进行查询,主要通过对用户输入的查询语句进行资源定位,将用户的查询请求转换为多个SQL语句序列,分发到多个局部数据库进行局部查询,同时把查询结果进行汇总并返回用户;对检索服务的数据库进行优化,在数据库连接时采用连接池技术提高数据库的连接速度。 基于Windows平台,利用Java和SQL Server 2000实现了系统的检索服务,对每台存储文献元数据信息的服务器进行了优化,并通过性能测试说明系统的查询效率明显提高。
其他文献
流感是一种传播速度快、变异频繁及影响范围广的重大传染病,也是第一个实行全球监测的呼吸道传染病。流感病毒不断地通过基因序列的变异来躲避机体免疫系统对它的防控,一旦具备合适的条件,它就会随时暴发。据WHO(WorldHealthOrganization,世界卫生组织)报道,全球每年有300~500万人感染流感病毒,而其中25~50万人因此而死亡。流感给人类造成了巨大的社会危害和经济损失。近年来,随着生
学位
众多公司与个人都将数据存储于云端的各种数据管理系统中,以获得更低的成本、更高的可扩展性、更方便的部署和无处不在的服务。然而,数据的外包也意味着随时可能泄漏。尽管云服务商声称能够保护好用户隐私,实际上存在大量个人隐私泄露事件。如,2013年雅虎30亿用户数据被盗,2014年支付宝20GB用户资料泄露等。保护数据隐私的简单办法就是对数据进行加密,但数据加密后会带来一系列问题:不仅难以查询、难以更新,而
学位
在高速发展的现代社会,终身学习知识的重要性越来越凸显,大规模网络公开课程(MOOC)在如今的信息化的时代背景下,结合互联网高效、免费、便捷的特点,给人们提供了很大的学习便利。基于MOOC环境下的在线学习也越来越被接受和认可,然而这种学习方式也存在着许多值得研究和分析的问题,比如学生在学习的没有强制性的约束,使得学习过程很难从一而终,即高流失率的问题,学习效率特别低等。了解学生在MOOC环境下的学习
学位
随着科技的发展,无人机技术越来越成熟,应用也越来越广泛。其中旋翼无人机(主流的有:三旋翼,四旋翼和六旋翼)由于其自身的灵活性而受到广泛的关注。其主要应用于航拍,快递和农业植保。而无人机在应用过程中会遇到定位问题,目前无人机一般都是使用GPS来进行定位,然而在室内情况下由于受建筑物的影响无法使用GPS。因此,需要另外一种定位技术-室内定位。目前主流的室内定位技术有:红外定位,超声波定位,射频识别(R
在万物互联的物联网时代,低功耗广域网(LPWAN)技术是物联网的关键技术,而LoRa作为一种新兴的LPWAN技术备受关注。在LoRa无线网络中,由于接入网络的终端节点数目众多,如何减少通信冲突、降低功耗、提高网络通信可靠性及实用性是设计MAC层协议需要考虑到的重要实际问题。本文主要研究与实现LoRa无线网络MAC层TDMA时隙分配协议,旨在解决上述问题,具体工作如下:  首先介绍了LoRa无线网络
传统Top-N查询处理技术尚未融合实体解析,对于具有重复元组的脏数据集,这些技术可能失效。本文给出融合Top-N查询处理和实体解析的五种算法:具有顺序访问和随机访问的TAER算法、限制顺序访问的TAZER算法、仅支持顺序访问的NRAER算法,以及基于学习的LeDer算法和LeMer算法。另外,给出朴素算法作为实验的基准,比较和分析这些算法的性能。  前三种算法不依赖于数据库管理系统(DBMS),而
学位
知识融合是知识管理与知识工程的核心环节。对于多源文本知识,由于作者描述的角度和侧重点不同,文本知识描述的完整性、知识粒度和精度往往不同,进而导致知识的不一致。因此,如何消除不一致是研究知识融合的重要课题。  知识融合有三种不同类型的方法:简单组合、初级融合以及高级融合。本论文针对文本知识和数据集,主要研究的融合类型为简单组合类型和初级融合类型。所谓的简单组合类型是将知识的对象与属性进行修正与结合,
学位
信息物理融合系统(Cyber Physical Systems,CPSs)是一个综合计算系统、网络系统与物理系统的多维度复杂系统,其核心是通过计算、通信与控制能力的深度融合与紧密协作,实现网络化物理设备系统的高效、可靠、精确的管理与调控。在当今万物互联时代,其具有广泛的应用前景。但是CPS本质上的复杂性使得其设计与实现遇到了不少挑战。首先,CPS中存在着数量庞大、种类繁多、异构性很强的物理实体,使
故事分割(Story Segmentation)任务旨在将视频、音频或文本等多媒体流自动切分成若干个具有独立主题的片段,每一个片段表达特定主题的故事。它是多媒体信息检索、文挡摘要、主题提取和分类等任务的基础。  语音文档(Spoken Documents)是一种常见的多媒体数据,包括广播新闻、演讲与报告、对话等丰富的内容。对语音文档进行故事分割可以从声学(Acoustics)和文本抄本(Trans
学位
J2EE平台为企业应用的设计、开发、集成以及部署提供了一条基于组件的实现途径。J2EE的核心是EJB。EJB定义了如何编写服务器端组件,提供了组件与管理组件的应用服务器之间的标准约定,基于这种标准的所有EJB组件或服务器可以轻易的做到互操作和移植。EJB是一种组件架构,使得开发人员能够快速开发出具有伸缩性的企业级应用。EJB最大的好处是,EJB组件封装了业务对象及其概念,让开发人员可以把关注点集中
学位