中文概念分类体系的构建与应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:xiaoquan1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,从互联网中获取有用信息、提炼相关知识的难度越来越大。尽管现有的搜索引擎能够检索几乎全部的网页,但它们对信息的整合与再现去口难以令人满意。具体到某个行业或者机构,长时间的信息化积累了大量的项目文档、服务资源。融合新旧资源,规范术语,提高利用率成为新型信息化的典型需求。信息过载对人们理解信息造成的困扰越来越大。为此,需要利用本体对海量信息进行理解和处理。  本体是全部知识的形式化表达。英文本体的应用已经日趋成熟,但大型中文本体的研究工作还在实验阶段。本文的研究对象为中文本体中最基础的部分——中文概念分类体系。本文从认知学的角度探讨了概念以及概念之间的关系。结合现代汉语语法和使用习惯,分析了概念的获取途径,概念与词性、概念与标点符号的关系,以及概念之间类属关系所在语句的各种模式。综合利用类属关系的语言学特征和上下文特征构造贝叶斯分类器,有效提高了识别类属关系的准确性。在具体应用方面,本文展示了一个军事领域概念分类体系的构建过程及其在服务匹配方面的应用。本文的主要创新点有四个:1.提出“顿等模式”,利用其中的对义词构造概念图来刻画概念的分布规律;2.在利用模式匹配从语句中提取类属关系时提出保留上下文名词作为类属关系的特征;3.提出一个融合语言学特征和上下文特征的贝叶斯分类器来识别类属关系;4.提出一种基于分类体系的语义匹配算法,达到了优化服务匹配的目的。
其他文献
随着云计算、面向服务的体系结构以及软件即服务的流行和发展,Web软件系统的使用越来越普遍。这类系统往往运行在复杂、多变的网络环境中,面临着大量的不确定性,因此其运行时质
移动Agent是一种新型的分布式计算技术,具有良好的应用前景。作为一种能够在异构网络中自主迁移的分布式计算实体,移动Agent具有减轻网络负载、支持断连操作、动态适应网络等优
随着我国农业信息化的发展,农业相关信息也呈现出了信息资源海量化的特征,如何才能在信息的海洋中获取到适时、准确、有价值的信息是农业信息化亟待解决的问题。把各种信息进行
随着信息技术的进一步发展,计算机越来越多应用于企业计算和多媒体教学等领域。目前这些应用大多仍采用以传统内置磁盘计算机为主体的分散计算模式,这种模式虽然在一定程度上
在计算机科学中多年的研究与实践后,我们发现依据稳定性的传统定义是很难使得计算机系统获得稳定性的,因为单一的一个计算机系统显然是不可能对在其中运行的所有进程都保持稳定
虚拟专用网(VPN)是一种应用广泛的网络服务方式,随着互联网技术和无线网络技术的迅速发展,远程访问VPN技术在网络应用中扮演着越来越重要的角色。VPN技术为企业用户带来了更
神经网络的研究自从上世纪80年代起引起了人们的高度重视,其应用范围广泛,涉及模式识别、函数逼近、智能控制、数据挖掘和知识发现等诸多领域,取得了可喜的成绩。但在应用中,尤其
Ad Hoc 网络是一种无线、多跳、自组织、无中心的对等式网络。安全是Ad}toc网络研究中的重要内容,Ad Hoc网络安全的研究主要涉及证书管理、密钥管理、安全路由、入侵检测等几
本文主要研究中文词性标注中异构数据问题。中文分词和词性标注是中文自然语言处理的基础任务,句法分析和语义分析建立在这些基础任务之上,大量的系统也依赖于这些基础任务的
随着医学、生物技术、宽带网络、地理信息等的不断发展,支持多维数据管理的数据库系统的研究正在逐步深入。多维索引方法就是对多维空间中的特征向量进行索引的方法。根据数