开放性问题的答案评估方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：douzixia

【摘要】

：

文本评估属于自然语言处理研究领域的任务之一,面对海量的文本数据,实现端到端的自动化文本处理和评估能够节省大量人力物力成本,极大提高工作效率。与此同时,通过计算机的深

【作者】

：

俞奕斐

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

开放性文本评估注意力机制预训练语言模型数据增强

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本评估属于自然语言处理研究领域的任务之一,面对海量的文本数据,实现端到端的自动化文本处理和评估能够节省大量人力物力成本,极大提高工作效率。与此同时,通过计算机的深度学习能力从全新的角度去挖掘文本内容特征,实现非结构化文本的智能解析、理解与评估,有利于辅助决策、推进高级人机交互。开放性问题的答案文本评估,其开放性决定了答案在内容上的多样化和不可穷举,面对开放性的答案,在传统的人工评估过程中,更依赖于评估者的专业性、经验和学识积累,评估结果不能保证绝对的客观和公平;而已有的、达到不亚于专家评估水平的系统大多依赖于特征知识库或标准参考答案的支持,没有达到真正意义上的开放性。因此本论文着眼于自然语言理解,基于深度学习模型对开放性问题的答案智能评估展开研究,专注探索问题与答案的内在联系,提高模型对问题下不同答案优劣的判断力。本文将具体任务抽象为构建一个能够针对问题下的文本回答进行自动评估的系统,即输入一个问题和回答的文本对,系统能够判断该回答是否扣题、回答语句是否通顺流畅、回答内容是否具备一定的逻辑条理性等,然后输出对回答质量优劣的综合评估结果。针对扣题的评估要求,本文提出基于分类的评估方法,利用注意力机制来使问题和回答文本有充分的交互融合以便判断,在中文场景数据集上的准确率优于普通分类模型1.22%-2.64%。针对开放性的评估要求,本文提出基于排序的方法,利用基于大数据的预训练语言模型提高系统的基础稳定性和泛化性,利用正负样例比较学习的方式和损失函数的优化提高系统对问题下答案好坏的辨别判断能力,在多个数据集上的性能优于近期的先进模型结果,与基于分类的评估方法相比,准确率提高了0.6%。针对真实应用中标注语料数量有限、质量不高的问题,本文提出了在原语料基础上进行负例扩充以实现数据增强的解决方法。论文所提出的方法在真实应用场景提供的语料上进行了实验和性能评估,实验结果表明,该方法能够有效完成开放性问题的答案评估,论文模型已获得上线应用。

其他文献

基于无监督和单样本的行人重识别算法

行人重识别指的是,采用计算机视觉的技术,判断在视角不重叠的区域内不同摄像头捕捉到的行人图像是否来自同一个行人的过程。由于行人重识别中用于训练的数据集需要跨多个摄像

学位

行人重识别深度学习无监督学习单样本学习

基于隐含相似度和度量学习的社会化推荐算法研究

传统的推荐系统通常主要专注于充分利用用户-项目的评分信息,而随着推荐系统应用场景的不断扩展,仅仅依据用户-项目间的二元评分关系进行相关推荐,往往无法获得令人满意的推

学位

社会化推荐隐含相似度度量学习评分预测项目排序

湖南省猪伪狂犬病免疫程序优化与应用

猪伪狂犬病(Porcine pseudorabies,PR)是由伪狂犬病毒(Pseudorabies virus,PRV)所引起的一种高度传染性疾病,可导致怀孕母猪流产、木乃伊胎、弱仔及死胎,新生仔猪急性死亡,伴

学位

猪伪狂犬病免疫程序优化推广与应用

轴型复合组织瓣在修复唇癌术后缺损中的应用

目的:探讨轴型复合组织瓣在修复唇癌术后缺损中的应用。方法:2012年7月~2019年2月在吉林大学第二医院皮肤科收集8例唇癌患者,唇癌扩大切除术后全层缺损占唇总长度的1/3~1/2,

学位

唇肿瘤修复外科手术轴型皮瓣

基于融合全局和局部特征的人脸部分遮挡算法研究

随着深度学习、计算机视觉等相关技术的日益成熟,人脸识别已然成为全球在视频智能应用领域的主流,很多车站与机场已经大量使用基于人脸识别实现的通关检查系统,使得这项技术

学位

部分遮挡人脸识别局部特征误差图像改进的LRC算法(ILRC)

基于3D打印技术的模拟油藏储层微流控仿真与实验研究

石油是不可再生资源,石油持续稳产增产涉及国家的能源安全。随着油田开发难度逐年增大,第三次采油技术即提高采收率(EOR)技术不断涌现。然而许多EOR技术难以大规模推广是由于

学位

微流控器件亲水和疏水改性EOR技术3D打印提高采收率

关键技术领域外资并购国家安全审查制度及其完善

随着新科技革命的迅猛发展,科技的第一生产力作用日益彰显,一国的综合国力主要取决于科技创新能力和发展潜力。很多国家都把关键技术的研发作为国家战略,重视通过吸引外资来

学位

外资并购关键技术国家安全审查外资监管

基于可验证随机函数的拜占庭容错共识算法的改进与实现

区块链技术是下一代云计算的雏形,有望像互联网一样彻底重塑人类社会活动形态,并实现从目前的信息互联网向价值互联网的转变。共识算法是区块链技术的核心,使得区块链可以在

学位

区块链可验证随机函数拜占庭容错以太坊

现实学者社区发现系统设计与实现

产学研合作促进了创新网络的形成,然而在推进产学研合作过程中,企业却很难获取高校学术团队信息。其中,学者群体数量庞大、企业与高校的信息不对称是导致问题产生的主要原因

学位

学术网络网络表示学习node2vec社区发现

极性分子表面滤波、聚束与存储的理论研究

冷分子领域经过二十年的发展,取得了很多令人瞩目的成就,并在物理、化学等诸多学科中有非常重要的应用。一系列制备和操控冷分子的技术也应运而生,例如分子的静电速度滤波、

学位

冷分子速度滤波器聚束器存储环蒙特卡罗模拟

开放性问题的答案评估方法

其他学术论文