英语人体隐喻的自动识别模型构建

被引量 : 3次 | 上传用户:olivia2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐喻自动识别研究开始于20世纪八十年代,研究方法由起初基于规则构建知识库的方法,过渡到基于统计的机器学习方法。隐喻识别的准确率虽然得到了提升,但是研究多见于计算语言学领域,学者们聚焦于统计算法的优化,对隐喻的语言学特征探究较少,隐喻识别的准确度仍有较大提升空间。本研究以英语人体隐喻为研究对象,在分析人体隐喻语言特征的基础上构建人体隐喻自动识别模型,目的在于探索隐喻自动识别的优化途径。本研究依据概念隐喻理论对人体隐喻类型展开细致分类,同时借鉴已有人体隐喻研究在语言层面的发现,以语言学思想为指引构建隐喻自动识别模型。研究重点回答以下两个研究问题:1)英语人体隐喻语义分布及语言表达形式有哪些基本特征?2)如何应用人体隐喻语言特征构建人体隐喻自动识别模型?模型识别效果如何?本研究大致分为以下三个阶段:(1)语料收集与隐喻人工标注。本研究从WordNet知识库中选取49个人体域代表性词语,然后从BNC语料库中随机抽取3000个包含人体词的句子,对其中涉及的人体隐喻基本类型进行了划分和人工标注;(2)对人工标注语料展开语言特征分析。研究中对人体词的语义分布情况进行了分析,并对各类型人体隐喻对应的主要语言表达形式进行了概括和总结;(3)人体隐喻自动识别模型构建与验证。针对人体隐喻的不同语言表达形式,本研究构建的隐喻自动识别模型包括两个模块,即人体隐喻语言特征知识库模块与机器学习模块,最后使用验证集数据对模型的性能进行了分析。本研究的主要发现包括以下三点:(1)常规隐喻是人体隐喻的最常见类型,以固定结构与半固定结构用法为主。(2)人体隐喻语言特征知识库可以显著提高机器学习的召回率,提升隐喻自动识别模型的性能。(3)基于语言特征知识库和机器学习的隐喻自动识别模具具有较高的性能,模型识别的精准率达到0.984,召回率达到0.755,F值达到0.854。与前人构建的模型相比,本研究中构建的人体隐喻自动识别模型效果有一定程度提高,且在稳定性与适用性上有较大保证。
其他文献
论文是以红地球葡萄为试验材料,研究在0℃左右果实成熟衰老和褐变机理,以及不同的可食性膜处理对鲜切葡萄成熟衰老和褐变相关因子的影响,提出了适合鲜切葡萄生理特性的可食性
根据现代激励理论,股权激励是一种有效的长期激励方式,是适合现代企业长期发展的激励手段。从国外经验和实践情况来看,通过股权激励的实施很大程度上促进了企业发展与股东价
<正> 当前,全国邮电系统正在开展端正局风的活动。在这个活动中除了要坚决纠正行业性的特殊性歪风,打击贪污盗窃、破坏通信等犯罪活动以外,主要工作应当是对职工进行服务思想
期刊
某港区护岸工程区域的地质条件较差,软土层较厚,岸坡整体稳定性不满足要求,采用抗滑桩进行加固处理。基于MIDAS GTS NX软件,建立三维有限元模型,根据边坡不打抗滑桩情况下的
本文对潘西煤矿19煤底板突水机理及预测预报进行了研究。在分析潘西煤矿地质、水文地质条件及以往突水资料的基础上,概括出了影响煤层底板突水的六个影响因素;对采场煤层底板
如何才能做成一个成功的自媒体?通过中介胜经的案例,我们可以得到一些启示。微信已经成为当代人际交流的一种重要手段,尤其是比较适合年轻的人口群体。它所具有的便捷性、互
随着人民生活水平的不断提高以及全球能源危机的日益加剧,人们对居住环境,尤其是室内空气环境提出了越来越高的要求,同时也对空调设备的节能高效也提出了严格的要求,这很大程
随着我国西部地区经济的发展,虽然铁路和公路的建设在不断增加,但目前公路和铁路等基础设施的运输能力已远远不能满足需求。西部山区存在很多煤田和油气田,油气田瓦斯具有随节理
文章通过文献资料、调研、问卷调查等方法梳理出近年来和田地区化学教育和化学双语教育的现状,该现状主要表现在:和田地区双语教学各种机制不健全、地区少数民族学生双语学习
本文试图引用一个较新的绩效评价指标—EVA指标来对我国上市公司变更募集资金投向前后经营绩效进行实证研究,研究表明:在中国现有的公司治理结构和政府监管制度下,平均来讲,