论文部分内容阅读
Web语气挖掘是一项具有较大实用价值的挖掘技术,这种技术对于消费者和商家作出决策都是很有帮助的。该技术的核心主要涉及语气分类问题,即判别一篇网页评论的观点倾向是肯定还是否定。本文主要研究五种常用的监督学习方法在语气挖掘中的应用,并在中文数据集上进行了实验。实验结果表明:采用N-gram特征表示方法、信息增益特征选择方法和SVM分类方法的情况下,语气挖掘能取得较好的效果。