论文部分内容阅读
为了保证抽取信息的全面性,主题划分成了不可或缺的工作.借助同义词词林,从词语的语义角度计算文本中各个段落间的相似度,建立段落文本关系图.基于文本关系图对归一化割分割准则中权值矩阵的构建做出调整,使之更能体现出段落间的相似程度,并使用该准则对文本进行主题划分.结果表明,该方法无论是对连续段落还是跨段落表达同一主题的主题划分均较为有效.