论文部分内容阅读
短文本广泛地出现在微博、评论等实际应用领域,其特征的高稀疏性给跨领域学习过程中共享信息的提取带来极大的挑战.为此,本文提出了面向短文本的跨领域情感分类算法.该算法基于谱图理论和特征间的共现,采用两层谱聚类依次对两个领域的共享特征和特有特征进行相似极性的特征扩展并补充到文本中,以降低短文本数据的特征稀疏性以及领域间数据分布的差异性.最后,在扩展后的数据集上训练分类器进行情感分类.实验表明,该算法可以有效提高跨领域短文本的情感分类准确率.