论文部分内容阅读
针对网络评论中普遍存在的负面评论较少而影响力却较大的类不平衡问题,提出一种基于类不平衡学习的情感分析方法.该方法利用深度学习训练过程中的概率输出,以计算样例的信息熵作为影响因子构建交叉信息熵损失函数.在IMDB公开数据集上进行实验验证的结果表明,基于集成信息熵损失函数的双向长短期记忆网络能处理类不平衡问题;对数据的统计分析结果表明,该策略能提升基于双向长短期记忆网络的评论情感极性分类性能.针对AUC(area under curve)指标,使用集成信息熵损失函数的双向长短期记忆网络模型比未考虑类不平衡的深度学习模型在中位数上最多提升15.3%.