【摘 要】
:
写作是语言学习的过程中非常重要的一个环节。国内外设置了各种大型考试检测学生的语言综合运用能力。作文评分通常是一件耗时长、主观性强的任务,同时也需要阅卷者在短时间内迅速的给出评分结果。为了减轻教师的负担,同时提高评分的客观性,机器学习方法被引入到了作文自动评分任务中。本文针对作文自动评分过程中的两个关键问题进行了深入研究,并且提出两个新的方法进行改进。主要工作如下:针对当前作文自动评分方法中,由于作
论文部分内容阅读
写作是语言学习的过程中非常重要的一个环节。国内外设置了各种大型考试检测学生的语言综合运用能力。作文评分通常是一件耗时长、主观性强的任务,同时也需要阅卷者在短时间内迅速的给出评分结果。为了减轻教师的负担,同时提高评分的客观性,机器学习方法被引入到了作文自动评分任务中。本文针对作文自动评分过程中的两个关键问题进行了深入研究,并且提出两个新的方法进行改进。主要工作如下:针对当前作文自动评分方法中,由于作文评分规则抽象导致难以准确评分的问题,提出了基于样例学习的作文自动评分方法。在这个方法中,一共有三个模块,分别是主题相关性模块、语义连贯性模块和样例学习模块。前两个模块通过注意力机制提取作文的相关性和连贯性特征,在样例学习模块中,本文设计了一个动态语义匹配模块。通过在已有的样本中选取经典的文章作为样例,利用动态语义匹配模块进行相似度计算,能够利用已有的文章进行辅助评分。本文在国际公认的ASAP数据集上进行了对比实验,通过实验表明,本文提出的样例学习方法能够优于基线模型。针对实际应用中,新的主题下已有的评分样本数量较少的问题。本文提出使用预训练语言模型和多任务学习的方法解决这个问题。本文提出了一个基于多任务学习的作文自动评分框架。在这个评分框架中,骨干网络采用预训练的BERT模型,将骨干网络的输出送入其他任务层中。本文设计了两个辅助任务:逻辑性判断任务和主题分类任务。通过逻辑性判断任务增强模型对句子顺序的感知能力,通过主题分类任务提高模型对主题相关知识的提取能力。通过这两个辅助任务,能够利用其他主题的样本对模型的特征提取能力进行增强,让模型能够在少样本的情况下也能很好的对作文进行评分。最后本文在少样本的条件下进行了实验,实验结果表明本文提出的多任务学习方法能够有效地在样本数量较少的情况下对作文进行评分。在极端情况下,训练样本仅有原样本数的10%的情况下,模型的准确度仅下降了13%。与传统方法相比,本文提出的基于多任务学习的作文自动评分方法在少样本条件下具有显著的优势。
其他文献
汽车保有量的快速增长给人们的生活带来了巨大的便利,但同时也造成了道路安全事故频发以及严重的交通堵塞等问题。近年来,智能汽车的快速发展为解决这些问题带来了希望。汽车主动避撞系统是汽车主动安全系统的重要组成部分,在紧急情况下通过控制车辆减速或转向以避免与前车发生碰撞,能够有效减少碰撞类交通事故的发生,提高车辆行驶的安全性。论文主要对智能汽车的主动避撞控制方法展开研究,分别从纵向制动、跟车、转向变道和转
运用抑郁、焦虑自评量表对技校生群体进行抑郁焦虑情绪调查,结果表明技校生群体抑郁焦虑水平较高。本文结合对技校生抑郁焦虑情绪的调查结果,在分析技校班主任工作特点和面临问题的基础上,厘清学生抑郁焦虑情绪产生的相关影响因素,对技校班主任工作提出了建议。
二氧化钛(TiO2)纳米颗粒由于其独特的物理化学性能,具有广泛的应用领域。TiO2材料性能主要受到晶粒尺寸、微观结构和致密度等影响,而这又受到TiO2粉末制备和致密化工艺等影响。烧结是常用的粉末成型技术,烧结工艺参数(如烧结温度和保温时间等),以及颗粒属性(如颗粒尺寸和晶相等)将极大地影响致密化过程,并最终影响材料性能。分子动力学(Molecular Dynamics,MD)模拟可用于研究纳米颗粒
聚落空间是精神文化的载体,也是文明延续发展的标志。全球化的浪潮带来了高速的发展,也带来传统文化的断层,在城镇建设中体现为城镇空间形态特色的衰微。由此,深入研究传统聚落的形态特征,提炼空间形态基因,分析其生成与发展演化的规律,对于地域文脉延续,以及地域特色的保护与传承具有十分重要的意义。文章以巴蜀地区国家级历史文化名镇为研究对象,解析巴蜀传统聚落在建筑肌理层级的空间形态特征和影响因素。一方面通过形态
共享出行是新一轮科技革命和产业变革大背景下出现的交通新业态,其发展受到诸多因素的影响。在全球经济化、消费结构转型升级、交通出行供给市场竞争日益激烈的影响下,共享出行作为城市交通出行的重要抓手,是公共交通系统的重要补充,对于以创新驱动供给侧改革、培育新经济增长点、建设交通强国等方面具有重要的现实意义。目前,针对共享出行方式选择的研究多聚焦于我国一线城市,对滇中区域的关注较少,因此对滇中区域的共享出行
随着互联网及新一代信息技术与制造业的不断深入融合,出现了MFG.com、淘工厂、航天云网、海智在线等一批制造业第三方平台。此类平台提供信息交流、供需匹配等服务支持制造企业间的采购、生产等多条价值链业务的协同,有效提高了企业之间的交易效率,对促进制造业和平台经济的发展具有重要推动作用。然而,作为典型的双边市场,第三方平台上的制造商和供应商群体之间以及内部具有多种错综复杂的正向和负向网络效应,特别是由
车道级高精度横向定位,是自动驾驶车辆中非常重要的一个模块。车辆横向定位的精度直接影响到下游规划控制模块的准确性。单一传感器定位都有其自身适用场景的局限性,IMU存在较大的累计误差,GPS定位误差较大,基于雷达,摄像头的地图匹配技术计算量大、实时性差,多传感器融合的定位方案还亟待研究和完善。本文基于高精地图和多传感器融合方案进行研究,主要研究内容如下:(1)基于卡尔曼滤波器融合GPS/IMU信号,来
近年来各地政府实行公共租赁住房政策收效甚好,极大解决了新时代下大城市中部分困难群体的住房需求,居民安居问题得到妥善解决。但随着政策不断落实,诸多问题随之暴露,其中就包括公租房居民的乐业问题。公租房选址偏僻、公共配套设施不完善等问题的显现造成了居民生活和工作空间的割裂,公租房群体职住分离愈演愈烈,严重影响了居民生活质量与幸福感的提升。同时根据相关研究显示,城市中低收入群体入住保障性住房后形成了更为不
感应加热技术是一种非接触式的加热方式,具有加热速度快,表面氧化程度低等优点,在工业上得到了广泛的应用。随着我国重工业进入去产能阶段,面对稍纵即逝的市场需求,企业对工业设备的柔性即“一机多用”能力有了更高的要求,希望设备能根据更多工艺宽范围输出功率。此外,还希望设备能灵活地加热不同材料尺寸的负载,这对设备跟踪谐振频率的能力有了更高的要求。相比经典的串联LC谐振结构和并联LC谐振结构,LLC串并联谐振
微生物引起的感染给人类和动物的健康带来了严重威胁,并造成了巨大的经济损失。因此,研制出一种具有优异的抗菌效果和良好的生物安全性的生物材料就成了当前的热点。金属有机框架(Metal-Organic Frameworks,MOFs)材料是近几十年来快速发展的一种由有机配体和金属离子组成的配位聚合物。该材料具有比表面积大,孔隙率高,易修饰等特点,在化工催化、气体的吸附和分离、生物传感和载药等领域有广泛的