论文部分内容阅读
关键词在文本聚类/分类,自动摘要,信息检索等领域占据着重要地位,然而人工对已有的文章生成关键词的代价巨大,并且大多数已有的自动关键词提取算法都需要建立在人工标注的训练集之上。该文提出一种基于聚类的关键词提取算法,根据词语之间的语义相似性,对网页分词后的词语进行聚类,在分析词语语义联系基础上提取出反映主题的关键词。