情感指数对MOOC学生成绩的预测研究

来源 :中国大学教学 | 被引量 : 0次 | 上传用户:langfenggw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:MOOC学生情感状态与学习成绩间的关系有助于教师了解学生学习状况并优化教学设计,但少有深入研究。本文用文本分析法定义并计算了一门中文MOOC课程学生的“快乐指数”和“痛苦指数”,发现“快乐指数”与成绩无显著关联,而“痛苦指数”能显著、正向地预测成绩,是MOOC课程的挑战度指数。MOOC平台可设置实时反馈机制,将“痛苦指数”等数据提供给教师,方便及时、针对性优化教學或者提供翻转。同时,“痛苦指数”有潜力成为鉴别MOOC中“水课”的指标。
  关键词:情感指数;学业表现;MOOC;文本分析;挑战度;水课
  MOOC(Massive Open Online Course)全称为大规模开放式在线课程。自2012年MOOC元年后[1],MOOC发展迅猛,三大平台Coursera、Udacity、edX与世界高校合作,使MOOC席卷全球。在中国,2013年前MOOC相关论文在国内期刊上仅发表5篇,但到了2016年,这一数字变为2420篇[2]。与传统课堂相比,MOOC的核心优势是跨越了空间局限,也使学习时间更加灵活,因而促进了优质教育资源共享。MOOC也面临许多问题,高辍学率①
  是其中最严峻的一项。根据美国宾夕法尼亚大学统计,MOOC平均辍学率高达90%[3],这不免让人对其教学效果产生疑问。因此,优化课程设计以提高学生学习动机、增加学习主动性并通过考核,成为MOOC发展的当务之急。
  课程设计优化需要清楚地知道哪些变量影响学生学业表现。蒋卓轩等发现,学生观看课程视频及提交小测验的次数能预测课程完成
  率[4];Yang等证实学生论坛发帖数与辍学率关系密切[5];Ramesh等的研究表明,学生参与课程的行为类型能显著预测成绩[6]。
  目前,少有研究关注MOOC学生的情感状态是否能预测成绩。按照维果斯基“最近发展区”理论,学生的发展水平有两种,一种是学生自身所能达到的水平,另一种是通过教育所能达到的潜在水平,两者间差异即为最近发展区。教育应向学生提供有难度、有挑战的教学内容和教学要求以激发学生潜能,使学生到达或超越最近发展区。MOOC课程为高等教育课程,本质上属于高深学问。学生要想在期末考核中取得好成绩,需在学习过程中迎接挑战、投入更多精力,也因此体验更多痛苦情感。本文假设:在MOOC学习过程中学生体验的痛苦情感越强,越可能取得较高成绩。
  传统课堂中,教师潜意识中通过观察学生面部表情、肢体语言了解学生情感状态反馈,并据此调整语速、讲解重点及改变提问策略,其过程异常迅速。越有教学经验的教师对课堂中学生情绪反应的判断越迅速和准确,后续教学调整也更有针对性和效率。相比传统课堂,MOOC中教师授课主要是提前录制视频并上传平台,学生通过观看视频学习,教师讲授过程相对固定。此外,MOOC并不能全面、广泛提供翻转课堂以方便线下讨论,师生间少有后期面对面交流。除课程视频外,教师与学生、学生与学生之间唯一可以交流的场景为在线课程论坛。学习越投入、越期待通过考试的学生,越可能就学习中遇到的问题参与讨论,于是论坛发帖成为实时分析MOOC学生情感的一个可靠数据源。
  本文基于一门中文MOOC的论坛数据,以大数据分析中的文本分析法提取学生情感信息,基于选定的情感词典统计论坛讨论中学生发布的积极、消极情感词语及词频,据此计算“痛苦指数”和“快乐指数”,通过回归分析检验情感指数是否能有效预测成绩。
  一、研究数据及方法
  1.数据
  本文数据源自北京大学在Coursera上开设的MOOC课程“计算概论A”,该课程开始于2014年9月,截止于2015年1月,共14 855名学生注册。所有学生中90.9%辍学(没有期末成绩);9.1% 的未辍学学生中,仅1%及格,0.5%成绩超过85分。在课程论坛上,450名学生参与讨论,发布了3 864条帖子,共526 083字;平均每名学生发帖9条,共826字,其中最活跃学生发帖201条,共25 239字。在所有辍学学生中,仅2名在论坛上发言;在所有未辍学学生(共1 347名)中,434名在论坛上发言,其中及格学生有116名,占所有及格学生(共148名)的78.4%。
  2.方法
  (1)文本分析中的情感信息挖掘
  人的情感与行为紧密联系,情感因素因而逐渐被金融、教育等领域学者关注[7-10]。随着大数据时代来临,互联网上积累了大量文本,如新闻稿、论坛发帖、微博等,这些文本成为分析情感信息的良好数据源,利用文本分析进行情感挖掘逐渐成为热点。与教育研究中衡量学生情感状态的问卷法相比,文本分析优势有两点[7]:首先避开了问卷法中学生自我评估的缺陷。自我评估一般事后完成,并非即时,其过程与结果受诸多不确定因素干扰,所得出的情感信息可信度较低;其次,基于积累的文本可以灵活分析一段时间内学生的情感信息,而问卷法仅能评估学生填写问卷时对学习过程情感的回忆,且掺杂填写问卷时的个人情感状态。
  文本分析进行情感信息挖掘的方法主要有两类。
  第一类是机器学习法。应用时可分三步:第一步,准备好一组打好情感标签的文本。第二步,对文本量化处理。量化过程视不同语言而定,若分析中文文档,需首先运用自然语言处理的分词模型对文档分词;若分析英文文档,因文字自然被空格隔开而无须分词处理。之后,应用文本量化模型将文档转换成向量,常用模型为词包模型(bag-of-words)。假设文档集合对应的词汇表中包含m个词语,运用词包模型将每篇文档转换为一个m维向量,每个分量的值对应一个词语权重。计算词语权重的方法主要有三种。第一种,将词语权重赋值为0或1,指代词语是否在文档中出现;第二种,将词语在文档中出现的频次设为权重,强调频繁出现词语的重要性;第三种,按照词频—逆文档频率(term frequency-inverse document frequency)计算词语权重,权重为两部分乘积:一部分是词语出现频率,即词频除以文档长度;另一部分是逆文档频率,即计算总文档数与包含具体词语的文档数之商,再取对数得出。词包模型仅考虑词语自身而忽略词语顺序(即语境信息),在一些文本分析中表现不尽如人意。为弥补缺陷,有许多更全面的文本量化模型被提出,其中最为直观的是n-grams词包模型(bag-of-n-grams),该模型将n个连续词语组成的词组视作分析单元,并基于词包模型的权重计算方法计算词组权重。第三步,基于量化后的文本训练机器学习分类器,并利用训练好的分类器识别新文本中的情感信息。早期研究中,传统机器学习模型常被用作情感分类器,如林江豪等[11]通过朴素贝叶斯模型实现了微博情感分类。随着深度学习技术崛起,学者发现深度神经网络在情感分类上的表现优于传统模型,如Lai等证实:相比于逻辑回归与支持向量机,递归神经网络、卷积神经网络在文本数据集上的情感分类准确率较高[12]。机器学习法能识别否定、反问等特殊情感表达,准确判断较细颗粒文本的情感,但所需数据量较大,且需耗费人工为文本打情感标签,成本较高。   第二类是情感词典法。首先准备一个情感词典,包含与各种情感相关的关键词集合;之后基于词典识别文本中的情感词并统计词频;最后基于统计数据计算情感变量值。已有研究中,O'Connor等基于文本分析工具OpinionFinder中的情感词典从tweets中挖掘了用户的积极、消极情感[13]。Bollen等利用GPOMS工具中的情感词典从微博中抽取了“平静”“警觉”等情感序列[14]。相比机器学习法,情感词典法无法识别反问等特殊情感表达句式,无法准确判断细颗粒文本情感,但能有效分析长篇文档中的情感信息[13]。应用情感词典法不需要人工标记情感标签,所需数据量较少,运算效率高。
  基于数据量考虑,本文选用情感词典法分析MOOC学生的两类情感指数——“痛苦指数”和“快乐指数”,对应消极和积极情感,选用词典为提升版NTU情感词典(Augmented NTU Sentiment Dictionary,简称ANTUSD)[15]。
  ANTUSD涵盖了ACIBiMA[16]等五个大型中文语料库信息,包含9 527个积极情感词、
  11 278个消极情感词,该词典优于多数情感词典之处在于其为每个情感词标记了情感强度,积极情感词的情感强度值为正,消极情感词的情感强度值为负。情感强度的绝对值越大,对应词语表达的情感越强。已有研究表明,基于ANTUSD的情感分类F值达98.2%,可靠性较高[15]。
  (2)情感指数定义及计算方法
  情感指数定义与计算方法如下:
  第一步,将每位学生发帖整合成为一篇文档;第二步,利用Python语言的“jieba”软件包对文档分词处理,删除其中的停用词②。本研究中有15位学生的文档仅包含停用词,后续分析基于其余435名学生的文档展开;第三步,基于ANTUSD匹配每篇文档中的积极、消极情感词语并统计词频。本研究对ANTUSD有所扩展,增加了66个独特情感词语和符号,其中31个反映积极情感,35个反映消极情感,并在ANTUSD中寻找其近义词,将近义词的情感强度赋予它们。表1列举了一些人工选取的情感符号及其近义词、情感强度。
  二、结果及分析
  参与论坛发帖的学生是否比其他学生取得了更好成绩?表4列出了两类学生的未及格、及格及辍学比例,表5列出了两类学生中未辍学学生的平均成绩及t检验P值。结果显示,参与论坛发帖的学生未辍学比例、及格比例及成绩显著更高,学习更投入。
  三、结论及未来工作
  MOOC学生的情感状态与学业表现间的关系有助于教師了解学生学习状况。本研究以文本分析中的情感词典法为一门中文MOOC课程每位参与论坛讨论的学生计算了“痛苦指数”和“快乐指数”,构建了回归模型以检验情感指数与期末成绩间的关系。研究显示:相比于辍学、未及格学生,及格学生的“痛苦指数”较高、“快乐指数”较低;“痛苦指数”更高的学生有更积极的学习动机;“快乐指数”与成绩无显著关联,“痛苦指数”能显著、正向地预测成绩。
  本研究定义的情感指数及其计算是对MOOC发展的原创贡献,对于完善MOOC平台的授课反馈机制具有启发意义。MOOC平台可针对课程论坛添加信息收集功能,实时收集学生发帖数、发帖内容等数据并生成“痛苦指数”“快乐指数”,供教师及时了解学生动态,并据此优化教学。
  情感指数对于识别MOOC平台上的“水课”也具启发意义。2018年8月,教育部印发《关于狠抓新时代全国高等学校本科教育工作会议精神落实的通知》[18],要求整顿本科教育教学秩序,严格过程管理,提出高校要全面梳理课程的教学内容,淘汰“水课”、打造“金课。所谓“水课”,是内容平淡、枯燥、肤浅且考试非常易通过的课程。学生为轻易到手的学分一般很喜欢选修“水课”,并不关注是否能通过这些课程获取知识和能力。应通过科学规范的课程评价体系及调研、组织学生讨论等方式,挖掘学生的真正需求,提升学业挑战度,加强学习过程考核以激发学生的学习动力和专业志趣,把“水课”变成有高阶性、创新性和有挑战度的“金课”。MOOC“脱水”也值得研究。MOOC平台上是否存在“水课”?根据北京某高校发布的数据,有学生在一个学年内就完成了28门MOOC课程,课程涉及科学、艺术等多个领域,该学生在90%的课程中都取得了90分以上的考试成绩。这当然会引发如下疑问:这些课程考试成绩评判标准是怎样的?课程的学术要求足够严格吗?学生在一学年内的精力是有限的,在学习本校面授课程的同时还能完成28门MOOC课程并取得优秀成绩,这是不是有些不切实际?抑或是这些MOOC是否或多或少掺杂了“水分”?据教育部高教司初步估计,目前我国上线MOOC课程约8 100门,高校学生和社会学习者选课人数突破1.4亿人次,超过4 300万人次获得了MOOC学分。虽然MOOC的确让很多人受益,但其中的“水课”问题在MOOC发展进程中特别值得重视。
  如何识别MOOC中的“水课”?通过分析MOOC学生的“痛苦指数”与通过率、期末成绩等指标可初步判断课程是否“注水”。若一门课程对应的“痛苦指数”或论坛参与度较低,但通过率与期末成绩较高,则表明多数学生在较少参与课程讨论情况下顺利结课且成绩优异,该课程即有“水课”嫌疑。设计开发切实可行的MOOC“水课”识别系统成为本研究未来的拓展方向之一。
  本研究仅分析了一门中文MOOC数据,这是研究局限。对于其余学科、其余语言MOOC来说,学生参与论坛讨论是否会有不同行为模式和情感表现?研究结论是否仍适用于这些MOOC?此类问题有待后续研究。假设本文结论具普适性,将来即可通过软件开发建立实时情感指数生成系统以促进MOOC教学设计与改进。本研究挖掘情感信息所用方法为情感词典法。未来分析多课程数据时,可先用人工方式准备一组带有情感标签的数据集,之后利用多任务学习框架[19]、深度学习模型等机器学习法抽取情感信息,以准确识别每一条帖子中表达的情感,使后续精细分析成为可能。例如,帖子中有些与课程内容相关,有些则无关,无关发帖中的情感信息对后续分析可能造成负面影响,机器学习法可探查仅与课程内容相关发帖的情感信息,更准确揭示学生情感与学业成就间的关系。   注释:
  ① 辍学在MOOC中指学生期末成绩为0,与实体学校中学生停止学习并放弃学籍的概念有所不同。
  ② 停用词即无实际意义的词语,如“哦”“啊”“呢”等。本文使用的停用词列表请见:https://github.com/chdd/weibo/blob/master/stopwords/%E5%93%88%E5%B7%A5%E5%A4%A7%E5%81%9C%E7%94%A8%E8%AF%8D%E8%A1%A8.txt。
  参考文献:
  [1]Pappano, L. The Year of the MOOC[Z]. 2012.
  [2]何艳君, 马炅. 近两年国内 MOOC 研究现状及发展趋势分析[J]. 中国教育技术装备, 2017(20): 73-75.
  [3]Koller, D. MOOCs on the move: How coursera is disrupting the traditional classroom [J]. Knowledge@ Wharton Podcast, 2012.
  [4]蒋卓轩, 张岩, 李晓明. 基于MOOC数据的学习行为分析与预测[J]. 计算机研究与发展, 2015(3): 614-628.
  [5]Yang, D., et al. Turn on, tune in, drop out: Anticipating student dropouts in massive open online courses[C]. Proceedings of the 2013 NIPS Data-driven education workshop, 2013.
  [6]Ramesh, A., et al. Modeling learner engagement in MOOCs using probabilistic soft logic[C]. Proceedings of the NIPS Workshop on Data Driven Education, 2013.
  [7]Villavicencio, F.T., Bernardo, A.B. Positive academic emotions moderate the relationship between self‐regulation and academic achievement[J]. British Journal of Educational Psychology, 2013(83): 329-340.
  [8]Mega, C., Ronconi, L., De Beni, R. What makes a good student? How emotions, self-regulated learning, and motivation contribute to academic achievement[J]. Journal of Educational Psychology, 2014(106): 121-131.
  [9]Gilbert, E., Karahalios, K. Widespread Worry and the Stock Market[C]. Proceedings of the ICWSM, 2010.
  [10]Hanoch, Y. “Neither an angel nor an ant”: Emotion as an aid to bounded rationality[J]. Journal of Economic Psychology, 2002(23): 1-25.
  [11]林江豪, 等. 一種基于朴素贝叶斯的微博情感分类[J]. 计算机工程与科学, 2012(34): 160-165.
  [12]Lai, S., et al. Recurrent Convolutional Neural Networks for Text Classification[C]. Proceedings of the AAAI, 2015.
  [13]O'connor, B., et al. From tweets to polls: Linking text sentiment to public opinion time series [J]. Icwsm, 2010(11): 1-2.
  [14]Bollen, J., Mao, H., Zeng, X. Twitter mood predicts the stock market[J]. Journal of computational science, 2011(2): 1-8.
  [15]Wang, S-M., Ku, L-W. ANTUSD: A Large Chinese Sentiment Dictionary[C]. Proceedings of the LREC, 2016.
  [16]Huang, T-H., Chen, Y-N., Kong, L. Acbima: Advanced chinese bi-character word morphological analyzer[C]. Proceedings of the Eighth SIGHAN Workshop on Chinese Language Processing, 2015.
  [17]贾积有, 缪静敏, 汪琼. MOOC 学习行为及效果的大数据分析——以北大 6 门 MOOC 为例[J]. 工业和信息化教育, 2014 (9): 23-29.
  [18] 中华人民共和国教育部. 教育部关于狠抓新时代全国高等学校本科教育工作会议精神落实的通知[Z]. 教高函〔2018〕8号, 2018.
  [19]Liu, P., Qiu, X., Huang, X. Recurrent neural network for text classification with multi-task learning[J]. arXiv preprint arXiv:160505101, 2016.
  [基金项目:本文是教育部人文社会科学重点研究基地重大项目“经济新常态下的教育财政研究”(编号16JJD880002)的阶段性成果]
  [责任编辑:周 杨]
其他文献
摘 要:新一代信息技术引发了人类社会的巨大变革,新技术、新经济与新业态不断涌现,人们的学习、交流与合作方式正发生新的变化,高等工程教育也在不断改革,致力于培养具有可持续竞争力的人才。在未来社会,高校的使命不仅是培养合格毕业生,更要努力保持和提升学生在其终身职业生涯中的竞争力。为此,高校现有的学历教育模式将逐步向自定义节奏的服务型教育转变,为学生的终身学习与发展提供相应的教育服务,未来工程教育形态将
期刊
摘 要:中国大学通识教育建设的基本目标已经完成,主要表现为明确通识教育理念、形成通识教育基本规范、建立通识教育组织管理机构。与此同时,中国大学通识教育仍面临诸多挑战。复旦大学通过设立基本课程单元、组建教学共同体、落实“以学为中心”的教学改革、建立“学术与行政紧密协作”的管理机制等举措,建设具有复旦大学特色的中国大学通识教育体系。  关键词:通识教育;中国大学;人才培养  中国大学通识教育是自身教育
期刊
摘 要:影视艺术是复杂的专业学科,尤其制作需要有大量实践。综合性大学影视艺术专业师资与生源大多都缺乏实践能力,其电影场景设计课程有必要进行相应的创新和改革,以体现出综合性大学的优势。电影场景的风格化教学是相对实践性教学而言的,它要求学生在场景设计上具有宏观的视野和丰富的想象,对电影场景的商业设计、氛围意象设计、象征道具设计进行清晰又富有深度的表述,以形成电影的整体风格。综合性研究型大学的影视艺术专
期刊
摘 要:本文以兰州财经大学为例,分析了智能化时代该校财经类本科人才培养模式改革中存在的问题和面临的挑战;以172名教师为样本,运用logistic回归模型对该校教师智能化人才培养模式改革的意愿及其影响因素进行了研究。研究发现:高校教师对智能化时代新技术在课堂教学方法和实践教学中作用的接受程度对其智能化改革意愿具有正向关联;高校教师对智能化新技术的认知程度与其智能化改革意愿具有显著的正向关系;让教师
期刊
摘 要:以工程为研究对象的工程哲学对工程教育具有重要的指導意义和应用价值。本文结合合肥工业大学“卓越工程师教育培养计划”改革试点和新工科建设的初步实践,就工程哲学视域下卓越工程人才“五重”(重系统、重创新、重实践、重人文、重质量)培养体系的构建进行了研究和探讨。  关键词:工程哲学;卓越工程人才;培养体系  工程哲学是对人类依靠自然、适应自然、认识自然和合理改造自然的工程活动的总体性思考,是关乎工
期刊
摘 要:“马工程”教材《区域经济学》凝聚了国内众多学者的心血,大致可以代表国内区域经济学教学研究的最高水平,应该得到尊重和推广使用。区域经济学是实践性很强的学科,必须紧密结合中国具体实践讲好、学好区域经济学。区域经济学是一门交叉性、综合性的科学,区域经济学教学过程中要注意与相关学科衔接协调。而在具体教学过程中,则要注意因材施教、因需施教,最好采取灵活多样的授课方式如与当地发改委、规划部门联合办学,
期刊
摘 要:慕课作为一种新型在线教育模式,为高等教育带来了挑战和机遇。为提升学时相对较少的工科物理化学课程的教学效果,我们依托“物理化学”中国大学慕课,采用翻转课堂与传统讲授相融合的混合教学方式,实现优势互补。根据知识点的难易程度,构建不同层次、不同形式的翻转课堂教学模式,增强了学生主动获取知识的能力,有效提高了课程教学质量。  关键词:物理化学;慕课(MOOC);混合教学;翻转课堂  物理化学是一门
期刊
“党中央让我们去哪里,我们就要去哪里,而且会饱含热情”。如同其他西迁教授一样,西安交通大学理学院西迁教师吴百诗先生在谈到西迁时,一样的义无反顾,一样的铮铮誓言溢于言表。在吴老眼里,交通大学的“西迁精神”,不仅体现在当年的师生响应党的号召,舍弃大上海优越的生活条件随校西迁,更体现为交大人优秀的教育教学传统的传承与发扬。  一、教育教学中的西迁风骨  正如武林高手,老一代“西迁人”自成风骨,用他们的脊
期刊
王守仁,男,1955年1月生,江苏苏州人,南京大学人文社会科学资深教授、博士生导师,兼任中国外国文学学会副会长(2007—)、英语文学研究分会会长(2011—2015)、教育部高等学校外语专业教学指导委员会英语组副组长(2002—2006)、大学外语教学指导委员会主任委员(2006—2017)。1983年本科毕业于南京大学外文系英语专业,后考取硕士研究生,师从我国英语界著名学者范存忠先生。1984
期刊
摘 要:课程建设为来华留学生教育提供基础保障与支撑,也是“双一流”建设的一项基础性工作。本文以面向理工科来华留学生“大学物理”英文课程为例,分析来华留学生群体的特点,并针对其特点提出了课程内容选择、教学方法运用、学生考核评价和教学效果反馈等对策与措施。  关键词:来华留学生;课程建设;英文大学物理  随着我国高等教育水平和国际化程度的不断提高,越来越多的留学生选择来华留学。据统计,我国已成为世界第
期刊