生物医学领域的专家寻找研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:woaipsjz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虽然现在网上有海量的信息,例如Google能检索出成千上万的网页,但是仍然有很多信息没有办法被搜索到。很多知识不能存储于文档或者数据库中,而仅存在于人的脑子中,这些知识被称为隐性的知识(Tacit Knowledge)。正是由于有很多知识并不能用书面形式表达,所以我们需要一种方法,能找到掌握这些知识的专家。通过与专家面对面的交流或者发送电子邮件询问的方式,得到更多原本不可能得到的知识。专家主要分成两类,一类是企业内部的,还有一类是学术界。本文关注的重点是学术界的专家寻找。虽然都是寻找专家,但是在学术界和在企业里,寻找的方式还是有些不同的。在企业,寻找专家主要通过每个人在企业内公开的资料,个人简介,通信的邮件等,并且寻找的范围也相对小且固定,都是集中在一个企业内部。而在学术界,主要通过每个学者的主页(Homepage),发表过的论文,参加过的会议等信息来寻找专家,并且寻找的范围更广,几乎涉及全世界所有的大学和研究所。本文提出了一个专家寻找的通用模型框架,可以将很多模型融合到框架中并结合不同的方法,提高专家寻找的精确度和鲁棒性。该框架通过文档作为中间参数对查询主题与候选专家之间的关联度进行打分。我们将专家寻找的过程分为三部分,分别是文档重要性打分,文档与查询主题关联性打分和文档与候选专家间关联性的打分。每一部分都可以使用不同的方法对其进行打分,并且还能有效的结合多种打分方法。接着我们在实验中使用了多种方法为专家寻找模型框架的各部分进行打分,并且使用了不同类型的数据集,例如计算机数据集DBLP与生物医学数据集MEDLINE。以此证明我们框架的通用性与鲁棒性基于上述方法,本文完成了一个生物医学领域的专家寻找系统BMExpert,其功能是通过对MEDLINE数据集的挖掘,寻找与用户输入查询主题相关的生物医学领域的专家。BMExpert是基于一种改进过的语言‘模型,这种改进过的语言模型能够同时考虑文章内容和文章所属杂志影响因子的影响。根据我们的实验,BMExpert的表现要优于同类网站。
其他文献
未知环境的建模,是机器人感知能力和智能水平的一种体现。因此移动机器人的自主环境构建(通常称为地图创建)问题越来越受到各国研究者的重视。 本文首先介绍了地图构建的基
需求工程是软件工程领域的重要研究内容之一.自上世纪60年代软件危机出现以来,人们都致力于研究解决软件危机的办法.随着研究的逐步深入,人们意识到使用工程化的方法从事软件
计算机病毒对计算机安全和网络安全构成极大的威胁,随着变形病毒在网络上的飞速蔓延,传统防御病毒的手段和工具显示出越来越多的缺陷。其中最关键的问题是传统方法无法准确检
数据仓库技术是在数据模型、数据库和应用开发等技术不断进步的基础上发展起来的,其目的主要是对巨量数据进行分析处理进而提供决策支持。本质上,数据仓库是一个使用其自身数据
我们生活中使用的智能卡只有很少的硬件平台.它的存储空间也许只相当于1 K的RAM,16K的EEPROM和24K的ROM.所以Java卡技术设计的最大挑战是在保留足够的应用空间后将Java系统软
近年来,针对传统企业和关键部门的计算机应用仅停留在诸如文档处理、公文流转以及信息发布等简单业务层面上,越来越多的企业或部门要求将信息技术的应用扩展到工作流系统,本文研
人工智能是当下的热门主题,实现对图像智能化的理解与分析是其中一个重要领域。图像智能包括图像分类,图像分割,目标检测等。目标检测是进行场景内容理解等高级视觉任务的前
数据挖掘是一种通用的技术,它是从大量的数据中提取人们感兴趣的模式的过程。将数据挖掘技术应用到网络安全当中,建立网络入侵检测系统模型,就是通过建立我们所需要的网络行
本文重点是对VLAN相关技术的研究.具体包括局域网与交换技术,VLAN技术,VLAN相关协议分析及其中继技术.特别是对2层交换、3层交换、IEEE802.1Q协议,以及以太网通道技术进行了
计算机网络和多媒体技术的发展,尤其是近几年基于TCP/IP的宽带网络的迅速发展和普及,基于IP网络的多媒体应用--MoIP(Multimedia over IP)成为一个备受关注的领域。社区宽带网的