论文部分内容阅读
近年来,各种短文本数据已经源源不断地大量涌现,如文章摘要、电子邮件、网上即时消息等,虽然文本分类技术在一些领域已经得到了很好的研究应用,但针对这些长度比较短、结构各异的短文本数据的分类研究则比较少。实际上,为方便用户使用对它们进行分类研究应用已经非常必要。本文在现有研究基础上,对目前几种常用的文本分类算法进行了分析研究,依据实验数据,分析比较出SVM算法在对短文本数据分类时具有良好的分类性能,并提出改进意见,以供参考。