基于BERT的短文本问题回答的误解检测与修复研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:frigate999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的快速发展,在线学习成为越来越多学生的选择,目前,在国内外存在大量的在线学习平台,例如国内的腾讯课堂、慕课网等,国外的OpenStax Tutor、Coursera等,这些平台可以让学生更方便地接触到各种各样的知识,同时也有利于老师展开教学工作。学习分析[1]是指通过研究学习者的学习行为习惯,给不同的学习者推荐一个合适的学习方案。为了更好地对学习者产生干预,需要有高质量的学习者行为数据,如何获取到这些数据就是一个非常值得研究的问题,其中针对短文本问题回答的误解检测与修复就是一个亟待解决的问题。这些短文本问题回答的误解会降低学生的学习效率,同时也会降低老师的教学效率,不利于老师展开相关的教学工作,并且使学习分析的结果与实际情况之间产生较大的偏差,因此检测并修复短文本问题回答的误解是一项十分有意义的工作。本文针对在线学习社区中可能出现的短文本问题回答的误解,提出了以下两种在线学习社区短文本问题回答的误解检测与修复框架,这两种框架定义了两种短文本问题回答的误解检测与修复体系结构,第二种框架是第一种框架的改进,这两种框架均能独立自动检测与修复在线学习社区中存在的误解。本文的主要工作如下:首先,本文提出了一种基于BERT的短文本问题回答的误解检测与修复框架。该框架包括三个步骤,首先,通过三种嵌入方式拼接得到BERT输入层向量矩阵;其次,将预处理得到的向量矩阵输入到BERT预训练模型中;再次,使用Softmax进行归一化处理,并对模型端到端的进行调整,使之拟合成可以识别短文本是否存在误解的误解检测模型;最后,采用正确答案标注误解并推送的方法修复误解,即如果模型在数据集上发现某个存在误解的答案,就通过这个答案的编号找到该问题编号,并通过该问题编号找到该问题的正确答案,用正确答案标注这个存在误解的答案,同时把该问题和该问题的正确答案推送给回答者。然后,本文提出了一种基于BERT-LSTM的短文本问题回答的误解检测与修复框架。该框架分为三个步骤,首先,通过BERT预训练模型将短文本转换成充分提取了上下文信息的词嵌入向量;其次,将得到的向量输入到LSTM模型中进行训练,得到一种短文本问题回答的误解检测模型;最后,采用正确答案标注误解并推送的方法修复误解。最后,本文通过OpenStax Tutor上真实的在线学习社区数据集进行了实验,并将本文提出的方法与其他研究者提出的方法作对比,实验结果表明,本文提出的两种方法在一定程度上可以检测并修复在线学习社区中存在的短文本问题回答的误解,对学习分析研究具有一定的指导意义。
其他文献
随着科技的发展,互联网也在不断地革新,随之而来的病理性网络使用(又称网络成瘾)也逐渐成为备受瞩目的社会性问题。研究表明,病理性网络使用行为对个体的认知加工能力尤其是工作记忆能力会产生消极影响,可能对其工作记忆造成一定程度的损伤。但也有研究表明网络游戏高手由于长期的网络经验,锻炼了其手眼协调能力,因此工作记忆能力较常人来说表现更好。那么病理性网络使用者是否也会像网络游戏玩家一样,由于长期的上网经验而
学位
多元利益主体博弈导致城市存量工业用地更新实践的困难,亟需促进存量工业用地更新中多主体协同行动以适应城市存量发展趋势。借鉴利益相关者理论和协同治理理论,按照“利益诉求—协同行动—协调重点”的城市存量工业用地协同治理分析框架,对北京市S老工业区和Q老工业区进行案例研究。研究发现,自上而下和自下而上两种更新模式均以土地高效利用为整体性共同目标,虽然在相关城市土地政策框架下不同主体有差异化的利益诉求,但最
《仿生人会梦见电子羊吗?》(Do Androids Dream of Electric Sheep?,1968)是美国著名科幻作家菲利普·迪克(Philip K Dick,1928—1982)的代表作之一,曾获“星云奖”提名,受到世界各国科幻爱好者的青睐,有“赛博朋克奠基之作”的美誉。该小说成为世界科幻文学经典之作的原因在于创造性地使用了“仿生人”这一角色,将仿生人设定为外形与人类无异的人工智能机
学位
受欺负是指个体遭受他人故意的重复攻击,且个体没有自我保护能力的经历。它有一定的普及率,并伴随着严重危害,但相关研究主要集中在受欺负者的情绪问题,对认知机制的研究数量较少。注意偏向指个体将注意更多地分配到特定类型的刺激上,过度的注意偏向会使得个体产生不良适应。拒绝敏感性模型认为来自社交的伤害会使个体通过回避社交拒绝线索保护自己;而社交重构假设理论主张来自社交的伤害会使个体提高对社交接纳线索的警觉试图
我国《教育信息化2.0行动计划》中强调,要积极发展“互联网+教育”这一新型教育形式,加快建立智能化、个性化、终身化的教育体系,满足个性化学习和终身化学习的人才培养需求,促进教育可持续化发展。个性化学习资源推荐、个性化学习路径规划、个性化教学指导和干预已成为当今教育发展的重要议题。知识属性,即测验项目中考察的知识点或者技能。认知诊断理论依据学生的历史作答行为,诊断学生的知识属性掌握状态,对了解学生的
随着云计算技术和互联网技术的不断发展与完善,网络安全已经逐渐的上升为人们所要关注的焦点问题。在目前信息化时代的快速更替中,网络攻击的方法已经多种多样,其本身攻击规模大、变化快、复杂性强以及种类多的问题急剧上升。分布式拒绝服务(DDoS)攻击就是要让合法的使用者不能正常的去访问所想要的目标资源。那么在这样迅猛发展的信息时代的大背景下,怎么才能有效地防止这样的DDoS攻击和如何解决云计算里面与安全有关
美国职业篮球联赛(NBA)是全世界影响力最大,最受大众关注的篮球联赛。NBA代表着世界篮球的最高水平。在已经结束的2018-2019赛季NBA总决赛中,多伦多猛龙队以总比分4:2战胜卫冕冠军金州勇士队,夺得了队史的第一座NBA总冠军奖杯。本文运用秩和比综合分析法先对猛龙队和勇士队在2018-2019赛季NBA季后赛的攻防能力进行评级,再把2018-2019赛季NBA总决赛猛龙队与勇士队的六场比赛的