面向中医药的分布式语义搜索系统

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:xxssdd55
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的快速发展以及信息技术在各个科学领域的普及,在同一科学领域的不同机构,数据的表现方式呈现出不同的特点,数据之间的共享以及集成成为对数据资源进行有效利用的难题。针对目前的这一需求,在实验室原有DartSearchV3的基础上,提出了新的分布式语义搜索系统的解决方案。本文主要介绍了该系统的具体设计以及详细实现。首先,本文首先简要回顾了目前搜索引擎技术的发展现状以及面临的难题,并对实验室的原有相关工作DartGrid和DartSearchV3进行了简单介绍;随之介绍了在分布式语义搜索系统中将应用到的两个开源软件工具Lucene和Hadoop。最后,通过分析中医药领域数据集成及搜索的新需求以及原DartSearchV3存在的缺陷,提出了分布式语义搜索系统的解决方案,并介绍了该系统的具体设计以及详细实现。本文的核心内容在于对新的分布式语义搜索系统的总体设计,混合语义索引的构造算法,多个数据中心数据的语义集成技术以及如何利用Hadoop进行分布式索引以及搜索技术等进行了详细分析与设计,并着重对混合语义索引的构建过程,以及在Hadoop集群中,分布式索引的管理以及搜索任务的调度分发进行详细介绍。最后,本文还简要分析了在未来的工作中,新的分布式语义搜索系统将要前进的几个方向。
其他文献
21世纪是信息和科技的世纪。信息技术的进步在促进时代发展的同时,也给残疾人带来了前所未有的机遇和极大的挑战。数字图书馆是残疾人获取信息的一种重要的途径和手段。结构
无线传感器网络是由大量低成本的传感器节点组成的无线自组织网络,能够随时随地搜集物理数据,实现人与物理世界的自然交流。无线传感器网络采用在一定区域内布置大量具有感知和
进入新世纪,在宽带无线接入领域,无线网络技术的发展日新月异,一种新的无线网络技术——无线Mesh网(WMN,Wireless Mesh Networks)逐渐发展起来,显示出其巨大的发展潜力,引起
移动机器人的研究开始上个世纪60年代末期,是人工智能、机器人学、仿生学、控制理论和电子技术等多种技术学科交叉的产物。随着科技的发展和社会的进步,机器人已经走出实验室
位置感知的服务(LBS:Location Based Service)是一种通过定位用户的位置信息,从而为用户提供空间位置相关的相应服务的技术。目前LBS的应用以GPS导航为主,个人移动设备上的LB
农业信息化、数字化是21世纪世界农业发展的必然趋势,是农业现代化的重要内容之一。加强农业信息系统化建设是推进农业信息化的基础性工作。农业专家系统经过几十年的发展,其
现在第四代移动通信已趋于成熟,人们更加关注移动宽带网络传输的服务质量(QoS),尤其在多输入多输出(Multiple-Input-Multiple-Output,MIMO)系统下的视频多播方面。随着第五代
互联网、移动互联网等技术的发展,使得服务器上的Web日志急剧膨胀。Web日志记录了上网用户访问Web页面的浏览行为,对网站建设和提供精准服务具有重要的指导意义。但是,原始We
在当前国内配电网信息系统中,管理信息系统重复建设问题严重,这不仅浪费了巨大的财力和时间,而且大量的信息资源不能充分发挥应有的作用。本文提出了构建基于面向服务体系架
图像半色调化是一种广泛应用在图像处理领域中的影印技术。近年来随着高分辨率、大尺寸规模图像的应用,传统的图像半色调化串行算法已不能满足实时处理的需求。异构众核处理