论文部分内容阅读
目前,微博社区已经成为人们交流、分享信息的热点平台。每天都有海量的文本信息在微博中产生,因此提取人物关系,对构建人物知识图谱有着重要意义。介绍原始依赖三元核的基本原理和思想,然后根据微博特点,用How Net语义词典工具对三元组词语语义相似度的计算方式进行改进,并且提出POS-GR(词性标注-语义角色)来衡量三元组中句法相似度,最后用互信息熵来权衡词语语义和句法结构对三元组相似度的贡献。实验证明,该方法在微博中比原始方法更有效。