智慧搜索引擎软件体系结构设计及其关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:hfyou588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据应用系统发展如火如荼,从互联网、物联网获取数据,提炼成信息或知识服务于各类用户。网页、感知数据集、数据集、各类结构化数据、语义数据的查询搜索是所有应用系统的一项基本功能,而爬取、抽取、索引是其中的关键功能。本文围绕以上几点进行了如下工作:1、提出了智慧搜索引擎的软件体系结构。借鉴传统搜索引擎模型的设计方法,分析智慧领域应用,确定领域边界、角色模型、业务模型、领域本体模型等,完成领域分析。在此基础上,完成实体构件、任务管理构件、实体管理构件、任务执行构件的设计。2、提出了基于本体的信息抽取方法。首先分析了各类网页数据的异同,针对各自的特点选择有针对性的方法进行网页信息的抽取。重点研究使用基于统计的方法抽取自由文本中的领域知识,扩充本体实例库。3、完成智慧搜索引擎原型系统的开发。以智慧安全领域为背景,利用已有的设计及数据资源,进行搜索引擎功能、界面的设计与实现。本文针对由互联网与物联网带来的海量数据,设计出能够满足智慧领域用户多种需求的搜索引擎软件体系结构,整合异构数据,提升搜索服务效果,支撑领域应用。
其他文献
近年来,随着虚拟现实技术和计算机图形学的不断发展,高逼真度、高真实感以及高智能化已经成为人们对虚拟现实平台好坏的重要评判标准,同时也一定程度上引导了虚拟现实平台的发展
人脸检测技术是模式识别领域的重要研究课题之一。在实际应用中,采集到的人脸图像往往会受到周围环境的影响,造成人脸检测中的姿态变化、遮挡和复杂背景等问题,导致人脸检测
发音过程可视化是指将发音过程中发音器官的运动情况形象的展示出来。发音过程可视化可以应用在很多领域,例如语言学习领域,向世界各国传播汉语符合国家的战略需求,是增强国家“
我国青年占国民总数的比例大大低于发达国家平均水平,但近几年来青年就业形势却很严峻。增加青年就业机会和青年收入的一个重要途径就是增加创业,当前,大力发展中小型企业,积极推
全局光照对提升虚拟世界中场景的真实性至关重要。全局光照的离线渲染技术已经发展的非常成熟了,实时渲染技术在近几年也得到了快速的发展,尤其是在游戏领域发展。全局光照实时
目标跟踪作为计算机视觉领域的一个不断发展的研究方向,涉及了模式识别、人工智能、图像处理以及机器视觉等诸多领域相关技术。由于目标跟踪领域的不断研究,它在诸多领域得到
本论文研究的是航班着陆调度问题,即在满足安全着陆的约束条件下,对到达终端区,等待着陆的航班以一定优化目标进行合理调度,最终达到航班安全、高效降落的目的。该问题的解决不仅
近年来,因特网应用程序的性质、用户需求和使用模式的变化使得互联网显著地表现出自身的缺陷。NDN(Named Data Networking,NDN)是以内容为中心网络研究的杰出代表,其在安全性
随着云计算的迅速发展,越来越多的用户开始使用云计算平台的服务随着用户数据的逐渐增多,如何保证云计算平台资源能够安全高效的被用户所应用,也已经成为云计算平台安全研究方面
并行计算指在并行计算机上,将一个任务分解成多个子任务,然后将这些子任务分配给不同的处理器,每个处理器之间相互协同并行的执行子任务,从而达到加快任务求解速度,或者提高求解应