论文部分内容阅读
采用少量已标记和大量未标记文档进行文本分类已成为一种重要研究趋势.在分析了EM和联合训练 (Co-training)两类算法的基础上,提出一种新的协同训练算法.该算法利用Bayes和TFIDF两种分类器结合少量已标记和大量未标记文档协同增量训练.实验结果表明,协同训练算法正确率较高,平均错误率较EM和联合训练低,具有较好的性能.