论文部分内容阅读
文本相似度的检测是文本分类的基础,根据文本与各类的相似度运用检测理论,将其自动归到一个或者几个类别中去.本文改进了传统方法,将夹角离散度引入文本相似度的检测,提出新的分类算法.针对中文文本开放测试集测试结果表明该分类算法查全率和准确率均有所提高,而且新分类算法的实施有效地改善了分类性能,证明了其有效性和可行性.