论文部分内容阅读
由于网上信息的迅速增长,文本分类已经成为网上信息管理中的热点研究课题.现今流行方法的重要基础是传统的统计学,前提是要有足够的样本,当样本数目有限时容易出现过学习的问题,导致分类效果不理想。本文首先从理论上分析了这种出现过学习的原因,然后介绍了出现过学习现象的条件和解决办法,最后介绍了一种研究小样本情况下机器学习规律、可以较好地克服过学习问题的分类方法--支持向量机方法。