论文部分内容阅读
专家检索作为信息处理领域的应用基础研究,在科学研究和企业管理等场合具有重要的应用价值,是当前获取专家信息最有效的手段。专家在复杂社会网络中不是孤立存在的,他们由错综复杂的关系联系在一起,构成具备相同领域共享知识的专家关系网络,这种关系网络是支撑专家检索的重要资源,其可靠性直接影响专家检索精度。由于具有关系的专家往往具备相同的领域共享知识,且领域共享知识可以用专家隐式主题表征,因此,本文围绕专家隐式主题提取、隐式主题层面的专家关系提取以及构建基于主题特征的专家关系网络等重要科研问题开展了深入的研究探讨,取得了以下几个方面的研究成果:(1)提出了一种融合专家合作网络和概率主题模型的专家主题模型构建方法。该方法针对专家合作网络进行分析,充分利用专家合作网络中相邻节点之间具备相近主题分布的特点,在概率主题模型进行吉布斯采样的过程当中对专家主题分布进行约束,从而提升专家主题聚类效果。在NIPS数据集上进行专家主题提取实验,实验结果表明提出的融合专家合作网络和概率主题模型的专家主题模型能够有效提取专家主题,专家合作网络对专家主题提取有一定的支撑作用,模型具有较强的推广性。(2)提出了一种基于Markov网络的专家关系提取模型构建方法。考虑到传统的人物实体关系抽取方法不能完全适用于专家关系抽取任务,该方法借助专家相关资源分析专家之间的朋友关系、同事关系和指导关系特点,并融合专家的主题关系特征和关联关系特征,构建基于Markov网络的专家关系提取模型。实验结果表明提出的基于Markov网络的专家关系提取模型在识别专家的朋友关系、同事关系和指导关系方面取得了较好效果,专家主题对于专家关系识别有很好的支撑作用。(3)提出了一种基于随机游走策略的专家关系网络构建方法。该方法首先根据提取出的专家关系构建专家关系矩阵,然后借助随机游走策略思想,将若干表征专家关系的简单无向图进行有机组合,从而构建出复杂专家关系网络。实验结果验证了提出的基于随机游走策略的专家关系网络构建方法的有效性。(4)设计并实现了基于主题特征的专家关系网络构建原型系统,构建出的专家关系网络为进一步研究该课题提供了实验平台,为专家检索任务提供了专家的相关资源。