基于形式概念分析理论的英语情态动词can知识发现研究

被引量 : 0次 | 上传用户:klose123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歧义是在自然语言中普遍存在的现象,在特定语境中找到歧义词语表达的特定含义对于句子意义的正确理解非常重要。因此语义排歧对于自然语言处理,机器翻译,文献检索,语音识别,语言学等领域具有重要意义。基于语料库语言学和机器学习的方法建立英语情态动词排歧模型的研究已经取得了丰硕成果,但是对于影响语义分类的语言特征关系的知识发现和可视化研究却甚少。因此,本文应用形式概念分析理论和方法,在对英语情态动词can进行语义排歧的基础上,对影响语义分类的语言特征之间的深层关系进行可视化表达知识发现研究,分析各语言学特征对于语义排歧中的普遍性作用和特异性作用以及特征之间的上下层次关系。本文建立了一个120万字的语料库,从英语情态动词can在语料库中出现的实际例句中提取了六个语言特征,包括两个语义特征,四个句法特征,应用形式概念分析的方法建立了can的语义排歧模型。此模型的自检排歧正确率为94.66%,用检验集检验的正确率为92.66%。此结果证明了形式概念分析的方法对于英语情态动词排歧的有效性。本文应用形式概念分析方法采用训练集数据生成Hasse图,对其中的特征分布进行了观察、对比和知识发现,找出了特征的上下层次关系,发现了不同特征对于语义排歧的普遍性作用和特异性作用。另外,本文用形式概念分析的方法分别对can的三种主要词义进行特征关系可视化研究。在此基础上,进一步实验分析了所选的六个语言特征对于can的排歧贡献度。实验结果表明,语义特征对于英语情态动词can的语义分类具有普遍性作用,而句法特征则具有特异性意义;当can=ability以及can=possibility时,句法特征中的时间基准特征对can的语义分类贡献度相对其它特征更大;而对于can=permission而言,语义特征比句法特征贡献度大。本文应用形式概念分析的理论和方法对英语情态动词can建立的语义排歧模型和对影响can的语义分类的语言特征的层次关系可视化分析,不仅对于英语情态动词的语义排歧研究提供了一种新的、有效方法,而且对于影响其语义分类的特征关系知识发现,以及为机器翻译的特征识别提供了有效的实际应用案例。同时,本文的研究结果为自然语言处理中的特征提取和情态动词的语义研究提供了科学、有效的依据。
其他文献
植物蛋白饮料花生乳含有丰富的脂肪、蛋白质,但由于原料品质的差异及饮料本身为热力学不稳定胶体体系,易发生品质变化,因此国标要求花生乳中脂肪含量需≥1.0%,蛋白质含量需≥0.8%
目的:观察铝碳酸镁联合多潘立酮治疗胆汁反流性胃炎的临床疗效。方法:142例胆汁反流性胃炎患者,随机分为两组各71例,对照组给予多潘立酮治疗,观察组在对照组的基础上加用铝碳
调理肉制品营养物质丰富,使用方便、快捷,深受广大消费者青睐。但是,在其贮存、运输和销售环节面临着很严重的问题,主要表现在易受微生物污染和脂肪氧化等方面,进而会导致变
水库调度系统,作为一种能有效的减轻洪灾危害程度和降低洪灾所造成的损失的非工程措施,在近几年来的防洪减灾工作中发挥着越来越重要的作用。随着三峡水库的建成运行,大坝对上、
作为高功率固体激光器的热门发展方向之一,碟片激光器以其热效应小、输出功率高、光束质量好、光光效率高、功率可扩展等优良特性,自诞生以来就受到人们的普遍关注。尽管碟片晶
多轴数控机床的刀具在加工空间具有任意可达性,有利于提高加工质量和加工效率。近年来,加工大型螺旋桨、风电叶片等零件的大型多轴联动数控机床应用越来越广泛。机床由于制造、
目的:探讨CD4+CD25+调节性T细胞以及Th17细胞与Graves病的关系。方法:检测GD患者和对照组外周血单个核细胞CD4+CD25+Tregs、Th17细胞的数量,PBMC中TGF-β、IL-10和Fox P3 m R
人民法院作为维护社会公平正义的最后一道防线,是社会主义法治社会的中流砥柱。可以说,做好基层法院的思想政治建设其意义是非常深远的,其不仅关系到基层法院的进一步发展,从长远
在经济全球化背景下,证券公司作为资本市场重要中介、创新主体和推动力量,其竞争的关键因素即为人力资源的竞争。人力资源已经成为证券企业赖以生存和发展最重要的资产,是否具有
低盐低脂肉制品是肉类产品的一个重要发展方向。本研究以低盐低脂猪肉凝胶(LPMG)为对象,通过单因素试验和响应面试验,考察脂肪添加量(0-20%)、氯化血红素(HM)添加量(0-60mg/100g)和乳酸