基于主题模型的专家检索及应用挖掘

来源 :云南大学 | 被引量 : 0次 | 上传用户:weiandlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
入21世纪,人类社会正在由信息社会迈向知识社会,掌握知识、勇于创新的人才成为企业和组织中最有价值的资源。无论是科学研究机构,还是社会生产部门(如企业、工厂),都需要那些拥有丰富专业知识、技能与经验的领域专家来组织团队,指导研发,攻关技术,以此来提高工作或生产效率,而如何通过有效的手段发现这些专家就日渐成为一个重要的科学问题。作为一项检索工作,专家检索近年来受到了很多的关注,成为信息处理领域的研究热点。本文先回顾了专家检索的研究背景、现状,阐述了其研究进展,并就其研究方法如专家建模、链接分析、查询扩展、专家证据识别、隐含主题分析等作了分析和总结,还统计分析了各类测试集,展望了该领域未来的研究方向。针对特定的主题查询已提出了很多排序候选专家的策略。其中最有效的方法是基于支持文档的专家建模,但是这种方法建模查询和候选专家关系时缺少捕获查询和候选专家的隐含语义联系。本文提出潜在主题模型和支持文档相结合的方法。该方法建模查询和支持文档为单词-主题-文档关系,而不是用语言模型建模单词-文档关系,另外,支持文档的先验知识也被考虑来排序专家。在元数据语料库上的实验结果显示潜在主题模型能有效的捕获查询和候选专家的语义关系,因此提高了专家检索的性能。文中给出了评审专家自动分配策略和多类型指标条件下的专家排名,实现了评审专家自动化推荐,并公平可靠地分配候选专家。潜在主题模型的应用研究越来越多,本文所述在生物信息学领域的应用就是一个很好的实例。生物信息学已经发展了大约30年的时间,特别是在过去10年里,该领域的发展一日千里,也出现了许多研究工作。这一领域的无论是一个新手,还是著名学者,都希望能够一睹这一领域的研究现状,并对该领域获得一个直观和量化的了解。本文将利用潜在主题模型,挖掘出生物信息学领域的文献来发现重要的研究课题,量化这些主题的演变来显示这一领域的发展趋势。
其他文献
近年来,随着分布式数据库的应用越来越广泛,分布式数据库查询优化方法的研究一度成为分布式数据库领域的研究热点。然而其中的多连接查询优化问题却一直都没有得到很好的解决
汽车发动机的工作状况直接影响汽车的动力性、可靠性以及安全性。现有的汽车发动机综合故障诊断技术依赖于多种传感系统和专家的先验知识,不利于在车载系统上使用。因此,探索
空间环境科学数据共享平台来源于子午工程项目。该平台充分利用最新的网络技术,建立基于互联网环境的在线数据共享技术系统,及时收集、整理、整合空间环境数据资源,为空间环
目标检测算法的目标是在没有人工干预的情况下,利用计算机视觉的方法,从摄像机拍摄下来的视频图像序列中快速、准确的检测出前景运动目标,并对目标进行定位和识别。目标检测