构建面向中文信息处理的名量搭配词典

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:taiyangkaimen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文设计了一个带有语义信息的名量搭配词典.名量搭配的枚举和扩充,分析语言学家和现有机器词典对量词的分类并为搭配词典引入语法语义信息以帮助进行句法分析,是该文所研究的两个主要问题.名量搭配的枚举和扩充方面,该文利用现有的人工录入的量词名词搭配词典,借助于数据挖掘技术,挖掘量词名词搭配的关联信息,对初加工的大规模语料进行量词名词搭配的统计分析,并通过基于互信息的过滤机制对原有搭配词典进行验证和扩充.在语法分类方面,由于语言学家对量词的分类不是以汉语自动分析为目标,现有机器词典又存在着分类不完善的不足,该文在分析二者的优缺点后,从机器处理的需要出发,建立量词的语法分类.鉴于目前自然语言处理技术的发展对语义信息又提出了越来越多的需求,所以该文系统地分析了量词的语义知识,基于量词的对义、近义等语义关系,从句法分析对名量搭配中的缺省、冗余求解的需要出发,提取名词和量词匹配的语义特征,建立量词的语义分类,以帮助实现对名量搭配短语的自动分析.
其他文献
该文工作以超市管理为背景,对数据仓库在决策的智能化方面进行研究和开发.由于该文中IDW的关键环节在于分析规则(Analysis Rules)的引入,因而提出了"基于分析规则的数据仓库
组件对象模型(COM)是Microsoft为实现应用软件的集成而制定的规范,现已成为Windows应用开发的事实上的标准.本文深入的研究了COM技术并在实际的系统中加以应用.本文首先介绍
在当前崇尚自由以及信息量日益剧增的Internet网络中,P2P对等网络打破了传统的C/S模式,通过直接交换来共享资源与服务,使所有节点享有平等,自由互联的权利,基于P2P的应用正在快速
该文通过对传统呼叫中心的研究和分析,提出了一套改进的呼叫中心解决方案,该方案可以达到屏蔽底层硬件差异的作用,使开发人员专注于软件、功能的开发,忽略底层硬件差异带来的
该文首先介绍了视频分析技术研究的背景及该项课题的研究意义,并讨论了视频数据的特点及视频分析中的镜头分割和相关技术研究的发展状况.其次提出了一种将Fuzzy C-Means聚类
该论文首先以特定业务应用背景为基础,结合计算机应用领域的相关知识,定义了一种基于数据库的小型非严格实时处理系统.然后围绕这种特殊的系统定义,结合实际应用经验,对系统
知识管理是近年来学术界和IT界研究的热点之一.知识管理过程一般包括四步:知识获取,知识存储,知识分发共享和知识应用.通过这四个步骤,企业使员工能够接受到企业内的各种经验
人们早就设想过利用移动终端,通过无线方式来接入Internet,以获取自己需要的信息及服务。但直接这样做在技术实现上有一些困难。这主要是因为现有的移动终端受其移动性和便携性
在近几十年中,CPU的速度每18个月到2年就增加一倍,而磁盘访问的延迟只是提高了一点点。磁盘访问的速度是内存访问速度的5到6倍。能够完全装载在内存中的运行的程序能够能从CPU
该文在分析了分组交换网络中影响语音质量的几种因素之后,探讨了如何对网络延迟进行统计与分析.并以支持静音消除功能的编码解码器G729AB为例,在分析了网络抖动的基础之上,设