论文部分内容阅读
本文采用数据挖掘技术和情报语言学方法,构建了一个可以用于从因特网上提取信息、进行自动标引和自动分类的系统,提供了一种创建自动分类知识库的新方法;提出了一种用于主题抽取的位置加权算法,研制了一种改进汉语同义词识别性能的新方法,并在自动分类时运用了这种语义相似度识别算法.最后还对该系统性能进行了测试.