论文部分内容阅读
将在一个场景中学习到的知识迁移到另一个场景进行应用一直是人工智能研究领域的热点问题。迁移学习的目的是将已有的知识进行迁移来解决目标领域中仅有少量有标注数据甚至没有的学习问题。本文面向评论文本中评论者和评论内容两方面的迁移学习研究任务开展工作,具体内容包括:1、针对评论者声誉度度量问题,本文提出基于情感距离和领域自适应的评论者声誉度评估方法。为解决评论者发表评论的跨领域情感倾向性分析问题,本文首先提出一种基于两层卷积神经网络的情感分类迁移学习框架。该框架比较适合后续领域种类繁多且随机、需实时处理的情感倾向一致性分析工作。其次,通过度量待评估评论者发表的商品评论与该商品其他评论者的情感距离、情感倾向一致性,从而衡量该消费评论者在评价商品时的客观性以及与大众情感极性的一致性。在亚马逊产品评论语料上的实验结果表明了本文方法的有效性,该方法为评论者声誉度研究提供了定量分析的新思路,对评论文本有效性研究以及规范电商平台消费评论者行为具有重要意义。2、针对评论内容情感分类迁移学习的特征不匹配问题,本文提出对应不同领域相似语义特征的迁移学习方法。将形容词作为特征,通过词向量和枢纽特征,构建不同领域之间语义相似但表达形式不同的相似枢纽特征对。最后,通过枢纽特征对对齐不同领域之间的相似情感特征。该项工作从词语语义角度减小了领域间的特征不匹配和情感表达差异,通过在亚马逊产品评论上进行实验表明,本文提出的方法适用于面向产品评论文本的情感分类迁移学习任务,并能在一定程度上提高迁移准确率。3、针对评论内容中表达的疑惑、疑惑亟待关注的紧急程度以及情感倾向三方面的迁移学习问题,本文提出了一种基于卷积-长短期记忆模型的深度神经网络迁移学习框架。卷积操作可以学习到考虑了局部上下文特征的特征表达,然后将其作为输入,输入到能够捕获长期依赖语义关系的长短期记忆模型。最后,再将源领域课程训练得到的模型参数迁移到目标领域课程并进行微调。通过在斯坦福大学的慕课论坛评论上进行实验表明,本文提出的迁移学习框架可以有效的学习对分类任务有用的特征表达并在不同课程之间迁移。该项研究能够解决大规模在线课程论坛评论有标注数据缺失以及不同课程论坛评论数据存在偏差的问题,有利于提高慕课论坛的实时监测能力。