论文部分内容阅读
自动文本分类是计算机自然语言处理领域的一个重要应用。本文立足于基本的朴素贝叶斯理论,在应用于自动文本分类领域,提出了一些提高其机器学习模型分类精确度的方法,包括特征权重的互信息计算、零概率的拉普拉斯平滑、加入自然对数提高计算稳定性等。最后采用Python编程语言设计并实现改进前后文本分类模型性能的测试评估结果对比。