论文部分内容阅读
情感分析是对文本中关于某个实体情感态度的计算研究,情感分类是其中的主要研究领域。传统的情感分类方法方法多依赖人工设计的特征,而当前较流行的深度学习方法可自动提取文本特征,在解决短文本情感分类问题上表现优异。深度学习方法需提供足够多的监督数据方能训练出好的模型。然而监督数据需要大量人工标注,不易获取。为解决这一问题,提出了使用大规模弱监督数据训练深度学习情感分类模型的方法,并通过实验证明模型的有效性以及使用弱监督数据在一定程度上替代监督数据训练深度学习模型的可行性。具体工作如下:1.提出了基于弱监督的CNN-BiGRU模型的短文本情感分类方法。使用互联网上带有评分数据的评论信息作为大规模弱监督训练数据集,建立了CNN-BiGRU深度学习模型,并采用“弱监督预训练-监督微调整”策略训练模型。实验证明弱监督数据可以在监督数据缺乏时作为一种有效的替代,并验证了CNN-BiGRU模型和“弱监督-微调整”策略的有效性。2.为进一步降低弱监督数据中噪声对深度学习模型的影响,不直接使用弱监督数据训练目标预测函数,而是采用三元组损失函数预训练模型,防止深度学习模型过度拟合噪声。并尝试使用ConvLSTM作为新的深度学习模型,实验证明在预训练阶段采用三元组损失函数能有效提高模型效果。