基于语义的中文词义消歧技术研究

被引量 : 0次 | 上传用户:jovkin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文中的词语灵活性造成了一词多义现象的大量存在,这对自然语言处理来说是一个难点,许多自然语言处理领域中的问题最终都是处理词语的歧义问题。如何让计算机能够根据特定的语言环境对一词多义现象进行处理是词义消歧需要解决的首要问题。词义消歧对于许多自然语言处理领域的应用都有非常重要的作用。本文的研究内容主要是基于统计学习理论中有监督的词义消歧方法,这种方法是现今词义消歧领域中较为主流的方法之一。这种方法可扩展性、灵活性较好,可以适应语言的变化和发展,得到了国内外相关研究领域的广泛应用。本文的研究内容主要由以下几个部分组成:首先,本文对词义消歧领域中具有指导意义的方法做了列举和比较,介绍了词义消歧准确率的评判方法和权威评价体系,阐述了仍待解决的影响词义消歧研究的问题。其次,研究了词义消歧的特征提取方法,其中包括语料的解析过程、特征的选择和特征的提取。深入研究了基于语义的特征提取方法,主要包括单层语义信息、三层语义信息、词形信息三种不同的语义信息的提取。同时通过这三种不同的特征提取手段建立特征向量集。利用特征提取中的三种不同的向量集来构建基于语义信息的贝叶斯词义消歧分类器,通过对比实验来验证新方法的词义消歧性能。最后,针对词义消歧在其他自然语言处理分支中的扩展应用做了举例。在机器翻译系统中增加词义消歧模块,来提高机器翻译实际应用中的准确率。虽然研究并不完善,但是也给词义消歧在实际中的应用提供了一些现实意义。
其他文献
目前,我国装备制造业的制造模式处于由松散型管理向集中管控的发展阶段,而测试系统则处在由专用向通用的转变过程中,对比国际先进水平,从理念到技术上还存在着较大差距。通过
精准预约可以切实缩短患者的候诊时间,从而改善患者就医体验。要做到精准预约,与规范出诊医师管理及合理设置预约号源密不可分。浙江省丽水市中心医院结合实际,首先规范医师
在移动设备不断发展的前提下,大众媒体行业中移动媒体逐渐兴起,它不同于传统媒体,可以满足流动性人群视听需求。随着科学技术的不断发展,以手机为代表的移动媒体所占的产业比
目的:建立微乳液相色谱同时测定夏天无中药根碱、巴马汀、小檗碱、延胡索乙素、原阿片碱含量的方法。方法:以微乳为流动相,通过对影响分离度和保留时间的因素进行考察,优化微
<正>本文通过对藏鸡在完全放养、平养和笼养等三种不同饲养方式下生长发育、生产性能等进行的试验,进一步揭示生活在高海拔地区家禽的一些生物学特性,以寻求藏鸡较佳效果的饲
本文依据国际审计和鉴证准则理事会(IAASB)发布的鉴证业务概念框架,分析了财务报告内部控制审计作为鉴证业务的五个构成要素,并通过与内部控制审核的比较,得出该业务是合理保
从1997年我国第一份否定类型的审计意见出现以来,证券市场的审计服务发生着很大的变化,上市公司变更审计师的现象越来越普遍,且变更比率也逐年提高,这种现象成为社会各界普遍关注
以长沙市望城区乔口镇周边农田土壤为研究对象,利用单因子评价法和潜在生态危害指数法对其土壤中Pb、Cd的含量进行生态风险评价。研究结果表明,乔口镇研究区域重金属Pb污染在
凸轮轴位置传感器是发动机电子控制系统中最重要的传感器之一,其功用是向行车电脑ECU提供确认活塞位置的信号,以此来决定发动机的点火时刻和顺序喷油。发动机缺少或收不到其