MOOC评论的细粒度情感分析研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:hejianfeng05
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展,给人们提供了在线学习的条件和机会,很多希望提高自身知识水平和专业技能的人都选择参与在线教育来达到目的,而不论是线上还是线下教育,都产生了大量的学习互动数据,这些数据真实地反应了学习者的兴趣话题、情感态度、学习体验等特征,因此对于教育交互数据分析的成果,可以更好地帮助学习者定位学习资源,帮助教师组织教学内容,还能帮助课程平台加强基础建设。中国大学MOOC平台是国内提供众多开放式网络课程的大型平台之一。本文利用爬虫技术获取MOOC上学生的课程评论,为了分析评论的细粒度情感,提出模型(Graph Convolutional Network for Aspect Based Sentiment Analysis,GCN_ABSA)分析课程评论的细粒度情感,主要工作总结如下:(1)细粒度情感分析的方面词提取子任务,实际上就是命名实体识别这一自然语言处理问题,从文本中学习到的词嵌入是否合理,是决定标注效果的关键,鉴于动态词嵌入能学习到词语间的语义关系,本文使用Bert预训练模型初始化文本的向量表示,再在小型的MOOC评论数据集上对参数微调,使其更适用于所研究的领域。进行命名实体识别时,我们不再关注局部的特征标注,而是从全局出发,使用条件随机场探寻最优的标注序列。(2)细粒度情感分析的方面词情感分类子任务,即在已经提取出方面词的基础之上,分析方面词所具有的情感极性,鉴于已有的各类深度学习模型,单纯依靠从大量语料中学习到的情感特征规律来辨别方面词的情感类别,本文利用句法依赖树树获取到文本的句法信息,并通过图卷积神经网络将其融入到深度学习模型中,建立方面词与情感词之间的联系,使深度学习模型更具有可解释性。在聚焦方面词的局部上下文时,本文还提出了基于方面词的上下文掩盖层,依据距离设置权重,对学习到的情感特征进行加权处理。连接两个子任务学习到的文本特征,通过多头注意力机制进行编码学习,最后获取第一个位置的隐藏状态使用softmax函数进行情感分类。(3)爬取MOOC上真实的课程评论数据,对本文提出的GCN_ABSA模型进行实验评估,并使用无监督词聚类方法挖掘评论中隐含的情感主题,将GCN_ABSA模型提取出的方面词集合作为情感话题群,并建立“文本-方面词-情感话题群”到“情感话题群-主题”的映射。
其他文献
5G的发展和AI应用场景的增加,将会对人们的工作生活方式产生巨大的影响,企业应该抓住这次机遇,创造出更好的产品、提供更好的服务。近年来,由于移动智能的兴起,对话服务成为了一个热门的研究方向。智能助理将在这个变革中扮演重要角色,用户通过语言和计算机进行交互,将大大提高人机交互的效率,通过对话就可以完成问题咨询、流程办理将极大的提高用户的使用体验。在商业应用中,企业的目的是在特定场景为用户提供服务,因
学位
阅读教学有很多目标,其中引导学生梳理文本意义、感知与运用文本语言、分析与评价作者写作意图以及情感态度价值观是占据阅读课最多时间的一项,而实现这一目标的重要途径则是教师提问。然而,仅仅关注单个问题的形式、内容层次是远远不够的,我们需要新的研究视角,即从宏观、整体的视角来研究课堂提问,关注教师能否实施连贯的、有逻辑递进的提问序列,推动学生对文本意义进行深度、开放的理解。有鉴于此,本研究以上海市不同类型
学位
近年来,由于区块链技术的迅速推广和数字货币的快速发展,数字货币投资逐渐进入人们的生活,与此同时,伴随着近日来数字货币市场的利好行情,全球投资者的情绪日益高涨,人们纷纷开始关注其涨跌趋势。短文本社交平台作为人们发表个人观点的媒介,在很大程度上表达了投资者的情绪态度。对于市场中的信息,人们往往会关注各类主流资讯平台来作为其投资依据。本文以数字货币的代表比特币(Bicoin,BTC)为例,研究其历史价格
学位
在英语成为“国际通用语”、“中国文化走出去”战略的国内外背景下,我国英语教学不仅需要关注世界优秀文明成果,也应当充分关注本土文化意识的培养,重视优秀传统文化的传承,提高学生用英语表达中华文化的能力。教材是教师实施教学活动的依据,教材中文化内容的呈现及文化活动的设计影响着英语教学中文化教学的内容、方式及学习效果。本文对中日两套高中英语教材的本土文化活动展开比较研究,旨在对两套教材在本土文化活动设计上
学位
多智能体系统是由多个通过与环境动态交互来优化策略的智能体组成,其目的是通过系统内的多个智能体间的高效协作来完成复杂的全局目标。现有研究表明,深度强化学习可以有效增强每个智能体的学习和决策能力。然而,多智能体强化学习的研究还面临环境动态变化和维度灾难导致的协作不充分问题。本文针对多机器人系统这一典型的多智能体系统,面向动态环境下多机器人协同导航和多机器人无线通信资源资源分配任务需求,研究了基于多智能
学位
当下汽车工业正经历百年未有之大变局,电动化、智能化引领的汽车工业变革,正在催生不断变革的新一代电子电气架构,深刻影响全球汽车产业格局和汽车工业研发体系。不断突破的先进电化学技术提升了电池可靠性和续航能力,推动了整车动力系统从内燃机向电动化转型,同时也提高了对电池状态精准监控和电池管理系统功能安全的要求。本文针对实验室与某电池制造商合作的电池管理系统基础软件功能安全展开研究。本文依照ISO 2626
学位
在过去数十年,全球范围内的皮肤病患者数量一直在急速增加,但相应的医疗设施和就诊意识却没有同步得到提高,患者普遍无法接受到足够的治疗。与此同时,使用人工智能算法进行辅助诊治的研究成果日益斐然,但普遍缺少直接提供辅助诊断服务的能力。因此本文研究旨在实现色素性皮肤病的自主辅助诊断系统,提供自主疾病监测服务,另一方面,医疗领域本身也存在着标注数据成本高、难度大的问题,这也使得研究解决少量数据集训练的问题成
学位
图像语义分割旨在实现像素级的标签分类,是人工智能的热门研究方向之一。语义分割作为一项基础的视觉感知任务,其可以被广泛的应用于多种场景下,如无人驾驶、视频监控以及智能医疗等。由于卷积神经网络拥有较高的可迁移性和鲁棒性,基于卷积神经网络的语义分割方法被广泛使用。注意力机制通过模拟人类视觉机制的原理可以使模型有选择性地关注图像中的重要区域,以此提升分割效果。因此本文主要对基于注意力机制的图像语义分割方法
学位
随着虚拟现实、物联网和智能制造等新技术的日趋成熟,广泛使用的云计算无法满足海量连接下的数据传输和处理。为了得到即时的反馈,边缘计算通过把计算节点迁移至移动接入网的边缘来降低传输时延。受硬件限制,边缘节点可能达到满载从而影响计算响应的时延,降低服务质量,策略路由可以实现边缘计算下的任务调度,为了减小任务调度带来的额外时延等影响,强化学习能够使策略路由具有资源感知和负载均衡的能力。本文对边缘计算下基于
学位
随着软件产品变得越来越庞大,越来越复杂,第三方库已经成为大多数软件的必要组成部分。开发人员通常需要用另一个库替换一个库,同时维护库的相同功能。用不同的库替换一个库,这个变动的过程就称为库迁移。库迁移是一项非常乏味并且枯燥的任务,同时,迁移往往意味着非常大的工作量。迁移过程被广泛认为是一个困难的、容易出错的和耗时的过程。这种手工流程很复杂,而且对公司来说成本很高。为了解决上述库迁移过程中的问题,本文
学位