【摘 要】
:
近年来,人们在开放式问答评估任务上进行了大量研究,尤其在人工神经网络加持下,评估效果达到了一个新的高度。开放式问题没有标准答案,回答者根据对问题的理解组织答案,常用于政治历史等主观论述题中。在开放式问答评估中,常依赖人工主观判断来评分,存在主观性强、效率低、无法大规模同时进行等限制,因此对开放式问答的自动评估显得尤为迫切。在开放式问答自动评估过程中存在两个难点,首先是开放式问答间存在对应关系,自动
论文部分内容阅读
近年来,人们在开放式问答评估任务上进行了大量研究,尤其在人工神经网络加持下,评估效果达到了一个新的高度。开放式问题没有标准答案,回答者根据对问题的理解组织答案,常用于政治历史等主观论述题中。在开放式问答评估中,常依赖人工主观判断来评分,存在主观性强、效率低、无法大规模同时进行等限制,因此对开放式问答的自动评估显得尤为迫切。在开放式问答自动评估过程中存在两个难点,首先是开放式问答间存在对应关系,自动评估需要考虑回答对应问题的哪部分,即问答交互问题;其次,开放式回答为了对问题进行完整阐述,通常比较长,即长回答表示问题。而现有开放式问答评估方法通常对回答本身建模而忽视问题的影响,且较少关注长回答的内在结构关系,较难解决长回答表示问题。为解决上述问题,本文使用真实场景的问答数据集研究开放式问答评估。首先,为了研究开放式问答中每句话的作用,以挖掘问答交互关系以及潜在回答结构信息,本文对开放式回答进行分解,并建立起一套开放式回答话语要素标签体系,请专业人员标注,得到开放式回答话语要素数据集。之后在该数据集上研究话语要素识别方法,提出结合位置信息与标签信息的话语要素识别模型,实验结果显示,该方法相比基线模型在Micro-F1值上有1.87%的提升,为研究开放式问答自动评估打下坚实基础。在此基础上,本文研究基于异构图神经网络的开放式问答评估方法。首先将开放式问答切分成句,通过话语要素识别模型提取句子中的话语要素标签,之后基于话语要素标签构建异构图神经网络,用于建模问答间的交互以及长回答内部结构信息,从而对开放式问答更好地表征。之后使用聚合函数将问答异构图网络聚合成单一向量用于表示问答对,并使用该向量进行“差”、“中”、“好”三分类预测以实现开放式问答自动评估。此外,为解决样本不均衡问题以及分类中评分存在差异问题,本文提出使用CBSA Loss在训练时动态改变样例loss权重,起到对少量样本以及难分样本的关注。本文所提出的HQAG模型相比基线最优模型在QWK指标上提升了3.26%,通过对比消融实验,也验证了基于话语要素构建异构图神经网络方法的有效性。
其他文献
历史文化街区对文化传承及历史文脉保护有至关重要的作用,目前国家和地方政府出台了一系列文件,旨在加强和规范历史文化街区的保护。街区整体和街道是历史文化街区的重要组成部分,街区格局和街道环境与现代街区有很大不同。其内部以胡同和夹道为主,道路狭窄,胡同中的交通方式多为步行,但是由于更新和管理的问题,步行环境存在步行空间破碎,环境品质较差等问题,导致可步行性堪忧。目前历史文化街区的保护越发受到重视,北京近
在我国老龄化现象严重的社会背景下,人居环境与老年人身心健康的关联性越来越受到社会各界的重视。由于老年健康是动态变化的,身体机能和周边环境发生的细微变化都有可能对老年人的健康产生长期的影响。因而作为老年人亲近自然、锻炼身体、情感交流、缓解压力的重要场所,养老设施户外空间环境的恢复性与老年人身心健康的关联性值得我们关注。然而,既有养老设施的户外空间普遍存在环境质量差、空间功能性不足、场地适应性较低等弊
目的:小肠腺癌是一种极其少见的恶性肿瘤,在消化道恶性肿瘤占比约为3%。由于小肠腺癌发病率低,临床数据少,目前关于小肠腺癌的治疗、预后因素研究较少。本研究收集300例小肠腺癌患者的相关资料,回顾性分析了小肠腺癌患者的临床病理特征及预后相关因素,以期为临床提供帮助。方法:收集2003年1月至2020年7月在安徽医科大学第一附属医院、安徽医科大学第二附属医院及安徽省立医院三家医院中行手术治疗的患者共30
背景:子宫内膜癌(uterine corpus endometrial carcinoma,UCEC)是女性生殖系统常见的恶性肿瘤,近年来其发病率呈上升趋势,发病年龄趋向低龄化。UCEC起源于子宫内膜腺体,其中子宫内膜样腺癌(uterine endometrioid adenocarcinoma,UTEA)是其最常见的病理类型,2009年FIGO标准根据组织结构及细胞核特征将其分为3级,即高分化(
目的探讨CD117在肺神经内分泌癌的病例中的表达。给临床病理诊断及治疗开拓新的方向。方法收集2014.01-2021.01在XX医院接受肺癌根治术并经病理证实为肺神经内分泌肿瘤的病例共60例。所有病例中典型类癌、非典型类癌、肺大细胞神经内分泌癌及肺小细胞癌的病例数分别是14例、10例、20例、36例。应用免疫组化En Vision法检测CD117在肺神经内分泌肿瘤组织及周围组织中的表达情况,通过卡
目的:骨转移作为一种常见的肺癌远处转移,其严重影响着病人的生活质量。开展对肺癌患者发生骨转移的风险预测,对于临床医生早期发现并预防、指导治疗和延长肺癌患者的生存期具有重要意义。本研究旨在探讨导致肺癌患者发生骨转移的危险因素,同时,基于这些危险因素构建肺癌患者发生骨转移的可视化风险预测模型。方法:本研究回顾性收集了2020年1月1日至2021年9月1日首次在安徽医科大学第一附属医院住院并经病理确诊肺
目的:SOCS3基因启动子的高甲基化区域已在大多数恶性肿瘤中被发现,但SOCS3甲基化与急性淋巴细胞白血病(ALL)之间的相关性却很少被研究。本研究比较分析了在不同基因甲基化程度下的ALL患儿的临床特点,并且在体外实验进一步验证了SOCS3基因甲基化对ALL细胞功能的影响。方法:本研究通过对临床资料的归纳整理,将纳入儿童分为康复对照组和研究组,BSP技术检测不同治疗阶段的急性淋巴细胞白血病患儿的S
随着互联网的蓬勃发展,各种各样的APP雨后春笋般地出现在广大人民的日常生活中。几乎每一款APP中都有推荐功能,需要快速从庞大的数据库中选出符合用户需求的信息,为用户提供个性化服务。这类数据存在不规则、无序等特点,即每一位用户交互的信息数目不一样,用户间不存在排列顺序,给传统的深度学习模型带来挑战。因此,本文以物品推荐为例,从异质图神经网络的角度对个性化的推荐方法展开研究。为了解决现有推荐方法仅聚焦
如今移动设备与物联网设备收集了大量数据用于学习模型以改进用户体验,由于这些数据通常隐私敏感,或规模巨大,因而很难将这些数据全部发送到数据中心,随后联邦学习被提出来解决这一问题。联邦学习实现了跨设备场景下的协同学习,同时保持了客户端数据的本地存储从而保护隐私。但联邦学习也面临非独立同分布数据问题。为解决非独立同分布数据问题,各种方法被提出。但其中在模型准确度与收敛速度与的提升不足,或者违背了联邦学习