论文部分内容阅读
本文针对人名消歧任务中,由于歧义人名处于相近领域而区分困难的情况,提出了基于人物属性互斥与非互斥的两阶段人名消歧义方法。该方法的第一阶段,利用领域知识库和启发式规则抽取人物相关属性,包括职业领域、职务、相关实体等,利用这些属性进行人物的初步的聚合与划分,并识别出互斥与非互斥的人物;第二阶段则是在第一阶段的基础上,再进行一次基于主题聚类的人名消歧的过程,得到最终结果。在SIGHAN 2010训练数据上的对比实验中,本文提出的方法,较于单纯基于主题聚类算法的人名消歧,在Purity评价方法中,F 值平均提高了2个百分点,在B-Cubed 评价方法中,F值平均提高了3个百分点。