加入传略信息的专家搜索研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:tower2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对特定实体搜索的研究是一个正在兴起的研究热点。本文研究了专家搜索问题,专家搜索隶属于实体搜索研究领域。目前专家搜索研究中,专家搜索主要是指给定一个主题或领域,搜索在这一主题或研究领域内的专家,即返回给用户一个有序的领域相关专家列表。这种定义和研究方法不能提供更多有关专家信息,限制了专家搜索的使用价值。针对上述问题,本文提出了加入传略信息的专家搜索研究工作,主要工作如下:   (1)设计有关算法实现从一个庞大组织内部网络的异构语料库中自动获取所有专家研究主题及排序列表,同时结合抽取所得专家其它信息(如专家联系方式、个人简介等)形成专家的个人传略,并将相关结构化数据映射到专家传略信息库。本文通过把专家传略的概念引入到专家搜索定义中,扩展了专家搜索中专家实体内涵,使专家搜索系统返回的有关专家实体信息更为丰富。其中,设计实现专家主要研究主题排序算法将排序问题转化为概率估计问题,并设计利用三类不同的相关度度量来估计专家与研究主题相关度。   (2)发现专家实体之间的相关性,并把这种相关性用于专家排序算法。基于实体相关性的专家排序模型是在两阶段语言模型的基础上,利用实体相关性对专家排序结果进行调整。同时,本文利用专家传略中的研究主题排序列表,将这部分信息与已有专家排序结果相融合,实现对专家排序结果的优化。   (3)设计开发专家搜索原型系统。专家搜索是一个应用性很强的研究领域。因此本文在进行算法研究的同时,设计、开发出一个原型系统,支持实验分析和算法验证。通过基于大规模真实异构数据集合的实验,验证算法在现实大规模企业级信息检索应用上的有效性。   实验表明,本文提出的专家搜索有关算法有效地解决了企业级应用中的专家搜索问题,显著提升了专家搜索系统的性能。
其他文献
针对目前太阳能路灯监控系统存在的技术问题,本文研究了太阳能路灯系统中,太阳能电池及蓄电池工作的基本原理、太阳能电池对蓄电池的充电特点、蓄电池的容量检测技术、LED光
最优化问题是一类最常遇到的问题,因为最优化问题的解决通常是某个问题得到解决之前的最后也是最关键的步骤。近些年来,随着科学技术的发展和工程应用的不断的增多,很多问题
建筑目标检测与识别是ATR(Automatic Target Recognition)技术的重要组成部分,是目前尚未很好解决的一个重要问题。本文主要研究在可见光的航拍建筑目标图像中,位于中远距离
视频监控产品是目前的热点产品之一,应用十分广泛。而AVS(先进音视频编码标准)是中国具有自主知识产权的数字音视频编解码技术标准。在便携设备上实现AVS的软件实时编码,对于
随着计算机处理器向多核技术发展,如何提高核与核之间的通信效率是提高多核技术性能的关键问题之一。从上个世纪九十年代中期到本世纪初,半导体集成电路芯片制造工艺先后经历从
在实际工业控制中要想获得被控对象的精确数学模型是非常困难甚至是不可能的。同时,外部工作环境的变化,控制系统中元器件的老化或损坏和各种不可测干扰,所有这些因素使得描述被
随着网络技术的迅速发展和互联网规模的不断扩大,互联网成了全球最大、最广泛使用的信息库,如何有效检索这些海量信息成为当前重要的研究课题,因而信息检索技术越来越受到人们的
随着经济和科技的发展,生物医学、天气预报、高能物理等领域的计算任务越来越多,其特点是计算数据多、算法复杂、计算规模大、难度高。因此,计算机的可靠性和可用性变得越来越重
无线传感器网络(WSN)作为传感器、计算机和无线通信三项技术相结合的产物,是一种全新的信息获取、处理和传输技术。它能够协作地实时监测、感知和采集网络分布区域内的各种环
近几年,在信号处理领域出现了一种新的数据理论压缩感知CS,该理论在数据采集的同时实现压缩,突破了传统奈奎采集斯特采样定理的限制,为数据采集技术带来了革命性的变化,使得