基于条件随机场的兼语结构自动识别

来源 :情报科学 | 被引量 : 0次 | 上传用户：plm0plm

【摘要】

：

本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计

【作者】

：

陈静王东波谢靖郑建明

【机构】

：

南京大学信息管理系,南京医科大学图书馆,

【出处】

：

情报科学

【发表日期】

：

2012年03期

【关键词】

：

条件随机场兼语结构语言特征特征模板结构识别随机场模型自动识别应用水平构建条件训练结果分布方法标记

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计算机自动识别提供语言学支持。基于这些特征建立模板,从而构建条件随机场模型,对兼语结构进行自动识别。在开放训练中,F值最高可达85.71%,这个结果表明条件随机场在兼语结构识别中已经接近应用水平,可以作为兼语结构识别的有效方法。 The research object of this thesis is the more complicated Chinese-language concurrent structure. Through the observation of the distribution of Chinese-English concurrent structures in large-scale corpus, the internal language features and external language features are analyzed. The first is to provide the data support for the structure research from quantitative perspective, The second is to provide linguistic support for computer automatic identification. Based on these characteristics, a template is established to construct the conditional random field model, which can automatically recognize the concurrent structure. In open training, the F value can reach as high as 85.71%. This result shows that the conditional random field is close to the application level in the CJ structure recognition, which can be used as an effective method for CJ structure recognition.

其他文献

建设工程防雷设计图纸技术审查探讨

当前,建筑工程设计防雷审查是履行防雷社会监督工作的一项重要内容,是预防雷击灾害的根本措施.本文就建设工程防雷图纸审查方法进行探讨.

期刊

建设工程防雷设计图纸技术审查探讨

基于XCP的虚拟化云平台建设研究

以北京第二外国语学院图书馆虚拟化云平台建设为例,通过对几种虚拟化云平台方案分析与比较,提出基于Xen Cloud Platform(XCP)的虚拟化云平台建设的完整解决方案。该方案包括

会议

XCP虚拟化平台建设解决方案学院图书馆应用前景技术问题方案分析处理方法管理服务底层北京XenWeb

农村饮水安全工程施工技术及质量控制对策分析与探讨

文章从农村饮水安全工程的主要特点及施工中常见的质量问题分析入手，对农村饮水安全工程施工技术及质量控制对策进行论述。期望通过本文的研究能够对提高农村饮水安全工程的整

期刊

农村饮水安全工程施工技术质量

利用开源软件实现关系数据库与关联数据的语义模式映射

关系型数据库和关联数据的概念模型都基于现实世界的实体、属性及其关系而构建，具备建立映射和实现转换的可能性。两者语义模式映射的重点是关联关系的构建与表达。开源软件D2

会议

D2R关联数据语义模式映射

分布式环境下的文档相似度研究与实现

针对传统的相似度计算方法在海量信息处理过程中暴露出的数据处理规模限制和性能不足等方面的瓶颈问题,以非结构化文档为研究对象,提出一种基于Hadoop分布式环境,结合Hive数

会议

地质矿产勘查的技术分析

矿产资源是国民经济和社会发展的重要物质基础，因此矿产地质勘查具有紧迫性、重要性。“同位成矿”理论可以解决找矿的重大问题，同时配套新的技术方法可望找到大型、超大型矿床

期刊

找矿法同位成矿勘查工作

Web系统多级分布式缓存机制设计与实现

提出一种Web系统多级分布式缓存机制的设计方案,以及基于主流开源软件的实现方法。本方案包含多粒度组织、多物理层级存储的缓存数据管理方法,以及键名生成机制等关键技术。

会议

Web系统多级分布式分布式缓存效率评价模型实现方法设计方案开源软件缓存机制测试实验有效性证明陈述

城市建筑设计的美学分析

建筑美学是一门新兴学科，很好融合了建筑设计和美学，并且对建筑艺术的基本特点进行了把握。本文主要分析了形式美内涵，城市建筑美学特征，城市建筑设计中美学的实施。

期刊

城市建筑设计美学

建筑工程施工技术及其现场施工管理措施

建筑行业在我国日益的壮大，数量也越来越多，市场的竞争也更加的激烈，如果一个施工企业要想在市场上占有重要的地位，那么成熟而完整的施工技术是尤为重要的。建筑工程是一个很特殊

期刊

施工技术现场管理措施

渐行渐近的移动云图书馆

移动图书馆打破了物理图书馆服务时间、空间和地域的限制。但移动图书馆真正的内容阅读受限于技术、成本和版权等诸多的瓶颈，而加入云服务的要素，则使移动图书馆如虎添翼，达到

会议

渐行渐近移动公共图书馆意义和价值最高形态数字鸿沟服务时间大社会阅读限制物理内容空间技术构建地域成本版权

基于条件随机场的兼语结构自动识别

与本文相关的学术论文