基于语义范畴扩展的词义消歧的研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:steve0309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧是自然语言处理中亟待解决的一个关键问题,词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,也是近些年来是计算语言学和自然语言处理领域一个重要的研究课题。本文对词义消歧的相关研究方法和词义消歧的知识源进行了综合评述。针对当前词义消歧常见的问题采用了一种新的解决方法。近年来计算机的运算速度成倍增长及存储设备容量的增加也使得基于统计的方法能够发展下去,所以近年来基于统计的方法也得到了较快的发展。词典资源和语料库是基于统计方法消歧消歧常用的资源,基于有指导的词义消歧需要语料库来进行训练,为消歧提供判断词义的信息。本文根据实际需要选择了扩充的词典资源,使之更符合词义消歧的需要。数据稀疏及小概率词义的问题一直是词义消歧领域很难解决的问题。为了缓解有导词义消歧方法中人工标注语料的繁重劳动以及数据稀疏问题,我们分别对歧义词和歧义词的指示词进行了同义词扩展和同范畴扩展,以此来提高现有语料的使用效率,解决数据稀疏的问题。通过设计实验,验证了本文方法是有效的,该方法能够较有效的缓解有导词义消歧方法中数据稀疏问题及小概率词义问题。本文的方法使词义消歧的正确率有了一定的提高,对词义消歧的方法的研究具有一定的参考价值。
其他文献
信息化是当今社会发展的趋势,随着计算机、通讯技术与医疗影像科学在医疗行业的进一步应用,我国医院信息化管理进程得到不断深入和拓展。国内部分医院已经建立起了独立的医院
高温物体的温度实时测量一直是理论界和工业界探索和研究的一个重要课题,它广泛应用在航空航天、军事和工业生产领域中。研发基于图像处理的示温漆图像识别系统目的在于实现
随着服务的兴起,越来越多的服务被不同的开发商发布到网络上,完成相似功能的服务也越来越多。为了使提供给用户的服务更满足用户的需求,需要进行服务评价。服务评价作为服务
乳腺癌是危害人类健康的恶性疾病之一。目前,超声因对人体无放射、价格相对低廉等优势被广泛用于乳腺癌的诊断。计算机辅助的乳腺癌早期诊断能够改善原始乳腺影像的质量,辅助
非平稳信号的分析是信号处理领域中的重要内容之一,但是目前用于分析非平稳的处理方法,都是基于傅立叶分析理论,因而同样受到傅立叶分析理论的制约。语音信号是一个复杂的非
目标跟踪技术是计算机视觉领域的一个研究热点,在很多领域有非常广泛的应用,例如军事、智能监控系统、智能人机交互系统、运动分析、交通检测、智能摄像头等等。但是在近岸海
计算机视觉领域中的三维重建广泛应用于虚拟现实、数字城市、艺术创作、文物重建等众多领域。表面重建是三维重建过程中的一个重要环节。本文是以泊松重建方法为基础,该算法
作为现代人工智能技术的典型代表,Agent和多Agent系统(Multi-agentSystems,简称MAS)成为人工智能研究实用化和分布计算环境下软件智能化的重要技术。Agent及人工智能技术的研究
软件复用是一种重复使用软件资产或过程的软件开发方法,目的是要提高软件质量和开发效率。目前,基于组件的软件开发成为软件资产复用的主流技术。基于组件的软件开发要求有足
计算机辅助审计改变了原有手工审计的对象和内容,提出了新的审计方法和审计模式,提高了审计效率。但是在许多的审计项目中都是审计专家与计算机专家的紧密结合才能够完成任务