一种基于LDA和上下文摘要的Web人名消歧方法

来源 :计算机应用与软件 | 被引量 : 13次 | 上传用户:Yxiaowanzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对人物搜索的核心问题Web人名消歧进行了研究。根据网页的主题相关性和名字上下文噪音小等特性,提出一种基于主题模型LDA和上下文摘要相结合的Web人名消歧方法。实验证明该方法比一般的聚类方法具有更加良好的性能。
其他文献
命名实体、术语的翻译对自然语言处理,机器翻译性能的影响越来越得到重视,但是这些翻译很难从现有的翻译词典中获得充足的信息。提出了一种从网页中自动获取高质量命名实体短语翻译对的方法,首次探索了对双语文本中对齐缺失部分自动补充的方法。该方法利用网页双语翻译对的特点,使用统计判别模型,融合多种识别特征自动挖掘网站中存在的双语短语翻译三元对。实验结果表明,采用该模型能高效处理命名实体双语翻译对,正确率达到9