论文部分内容阅读
针对当前Web文本挖掘工具的不足之处,提出了一种基于层次结构、面向主题挖掘的模型,即文本层次模型TLM,给出该模型中各层次含义、层间关系及实现方法,描述了各层中所包含的噪声及过滤方法,介绍了利用该模型进行基于概念语义网络的自动标引和自动分类的研究情况,总结了TLM模型的优点和有待改进的地方.