论文部分内容阅读
情感分析是自然语言处理的一个重要研究方向,应用情感分析技术对网络上大量的非结构化数据进行处理和分析变得越来越重要。已有的情感分析研究成果,大多都是关于旅游、消费产品、社会舆情和股票市场预测等,由于没有公开整理好的教育数据,对教育领域课程评论的情感分析研究比较少。随着大规模在线课程(MOOCs)的兴起,众多的学习者开始在MOOCs上学习,平台的评论区存储着许多学习者发表的课程评论,通过对课程评论进行情感分析,可以了解到学习者的学习感受、学习动机以及学习者对平台和课程的建议,因此对课程评论进行情感分析有重要的实用价值。本学位论文通过对其他领域的情感分析进行研究,探索通过课程评论对MOOCs课程进行评价的方法,从教育者角度、学习者角度和平台三方面对课程进行评分,为教育者、学习者和平台管理者提供客观合理的课程评价参考。首先,收集MOOCs上多门学科的课程评论,对评论进行去重、删除无效的和非自然语言表达的文本后,整理18000多条有效评论构成了课程评论语料库。其次,利用条件随机场对显式评价对象进行抽取,用词、词性、情感词和本体4个方面作为特征选择。由于不能直接抽取出隐式评价对象,所以利用文本分类的方法对隐式评价对象进行识别,利用评价词和显式评价对象的关联性构造训练集,从而根据评价词推断出评价词所对应的隐式评价对象。最后,利用卷积神经网络的局部感知性对评论进行属性分类,再基于情感词典进行极性计算。提出基于属性权重的评分方法,通过属性与课程评论在网页中检索共同出现的命中数与全部属性命中数的比重作为在教育者角度、学习者角度和平台角度评分的权重值,将权重与属性得分的乘积之和作为课程评论的总体得分。本文提出的情感分析方法应用于课程评论,将评论结果经某高校教学主管部门分析,认为情感分析结果客观、合理。本文提出的本体特征,可以有效地提高显式评价对象抽取的准确率和召回率。基于文档分类的隐式评价对象识别相比其他文献,分类准确率提高了 4%。基于网页命中数的属性权重和基于情感词典的极性计算方法,可以从教育者、学习者和平台3个研究角度对课程进行评分。