论文部分内容阅读
针对特定领域文本特点,提出了一种基于层次特征词权重的文本分类方法.该方法首先通过对特定领域内的语料统计,构建一个具有层次结构的专业概念树图,领域词汇被分类到不同的层次节点上,具有不同的权重,然后根据这些领域词汇在真实文本中出现的情况计算文本类别权重实现分类.分类对比实验结果说明,提出的方法优于KNN方法,在特定领域内具有很好的分类效果。