基于条件随机场的兼语结构自动识别

来源 :情报科学 | 被引量 : 0次 | 上传用户:plm0plm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计算机自动识别提供语言学支持。基于这些特征建立模板,从而构建条件随机场模型,对兼语结构进行自动识别。在开放训练中,F值最高可达85.71%,这个结果表明条件随机场在兼语结构识别中已经接近应用水平,可以作为兼语结构识别的有效方法。 The research object of this thesis is the more complicated Chinese-language concurrent structure. Through the observation of the distribution of Chinese-English concurrent structures in large-scale corpus, the internal language features and external language features are analyzed. The first is to provide the data support for the structure research from quantitative perspective, The second is to provide linguistic support for computer automatic identification. Based on these characteristics, a template is established to construct the conditional random field model, which can automatically recognize the concurrent structure. In open training, the F value can reach as high as 85.71%. This result shows that the conditional random field is close to the application level in the CJ structure recognition, which can be used as an effective method for CJ structure recognition.
其他文献
当前,建筑工程设计防雷审查是履行防雷社会监督工作的一项重要内容,是预防雷击灾害的根本措施.本文就建设工程防雷图纸审查方法进行探讨.
以北京第二外国语学院图书馆虚拟化云平台建设为例,通过对几种虚拟化云平台方案分析与比较,提出基于Xen Cloud Platform(XCP)的虚拟化云平台建设的完整解决方案。该方案包括
文章从农村饮水安全工程的主要特点及施工中常见的质量问题分析入手,对农村饮水安全工程施工技术及质量控制对策进行论述。期望通过本文的研究能够对提高农村饮水安全工程的整
关系型数据库和关联数据的概念模型都基于现实世界的实体、属性及其关系而构建,具备建立映射和实现转换的可能性。两者语义模式映射的重点是关联关系的构建与表达。开源软件D2
针对传统的相似度计算方法在海量信息处理过程中暴露出的数据处理规模限制和性能不足等方面的瓶颈问题,以非结构化文档为研究对象,提出一种基于Hadoop分布式环境,结合Hive数
会议
矿产资源是国民经济和社会发展的重要物质基础,因此矿产地质勘查具有紧迫性、重要性。“同位成矿”理论可以解决找矿的重大问题,同时配套新的技术方法可望找到大型、超大型矿床
提出一种Web系统多级分布式缓存机制的设计方案,以及基于主流开源软件的实现方法。本方案包含多粒度组织、多物理层级存储的缓存数据管理方法,以及键名生成机制等关键技术。
建筑美学是一门新兴学科,很好融合了建筑设计和美学,并且对建筑艺术的基本特点进行了把握。本文主要分析了形式美内涵,城市建筑美学特征,城市建筑设计中美学的实施。
建筑行业在我国日益的壮大,数量也越来越多,市场的竞争也更加的激烈,如果一个施工企业要想在市场上占有重要的地位,那么成熟而完整的施工技术是尤为重要的。建筑工程是一个很特殊
移动图书馆打破了物理图书馆服务时间、空间和地域的限制。但移动图书馆真 正的内容阅读受限于技术、成本和版权等诸多的瓶颈,而加入云服务的要素,则使移动图书 馆如虎添翼,达到