基于ＮＡＡ的词性自动标注模型

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户：glamour269

【摘要】

：

该文提出了一种基于ＮＡ假设的词性自动标注方法。该方法采用基于ＮＡ假设自动从无标注语料库中抽取性三元组数据，训练词性标注统计模型所需参数，对稀疏数据进行平滑处理。对词典中未登

【作者】

：

朱靖波姚天顺

【机构】

：

大学信息学院计算机系(沈阳)

【出处】

：

全国第五届计算机语言联合学术会议

【发表日期】

：

1999年期

【关键词】

：

词性标注未登录词标注语料库最大概率稀疏数据统计模型平滑处理标注方法测试结果准确率上下文三元组开放性训练评估词典抽取参数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文提出了一种基于ＮＡ假设的词性自动标注方法。该方法采用基于ＮＡ假设自动从无标注语料库中抽取性三元组数据，训练词性标注统计模型所需参数，对稀疏数据进行平滑处理。对词典中未登录词的词性进行猜测。根据未登词的上下文评估各种词性的概率，最终选陂最大概率词性作为未登录词词性。两万词次的开放性测试，三个模型的测试结果的准确率分别为８０．２℅，９３．１℅和８５．４℅。

其他文献

可拓语言研究初探

会议

基于词典的汉语名词语义信息的自动分析与获取

针对词汇语义研究和计算词典方法的兴起及汉语信息处理中名词语义研究与其所占重要地位很不相称的现状，我们立足于《现代汉语名词机读词典》，主要采用基于规则的语义分析策略和

会议

词汇语义计算词典方法机读词典机用词典

防盗自动电话语音报警器

该文叙述了以MC68HC908JL3为核心的技术先进、运行可靠、成本低廉、操作简单和易于构成住宅小区电子防盗系统的自动电话语音报警器。

会议

电子防盗系统自动电话语音报警器住宅小区运行可靠叙述技术构成成本操作

基于组合实例的双向优化聚类

该文探讨根据组合实例对不同词性的词同时进行聚类的问题，在聚类过程中，不同词性的词的聚类相互影响。首先将该问题转化为一个基于组合实例的优化聚类问题，以类内平均距离为基础

会议

词的组合优化聚类汉语形容词算法平均距离目标函数名词聚类问题基础构造词性词的聚类转化应用

维语自然语言理角及处理研究的应用成果

该文主要介绍了维语自然语言理解及处理研究领域的一些重要应用成果。主要包括维语语音识别，语语法识别及维语句法分析的自动处理，维语文／语转换等方面的应用。论述了中心语驱动

会议

维语自然语言理解自动处理句法分析器语音合成技术语音识别语法识别应用成果研究领域实验系统驱动方法中心语方法及转换语文结构

RXR在心血管疾病中的作用机制及中医药调控研究进展

视黄醇X受体(RXR)是一种核激素受体,可与体内约1/3的多种核受体形成异源二聚体或者同源二聚体,调控体内生长发育过程,同时与糖脂代谢平衡及许多疾病的病理过程密切相关.RXR作

期刊

心血管疾病视黄醇X受体配体作用机制综述

舒肝解郁胶囊对心肌梗死后抑郁大鼠行为学表现及心室电生理的影响

目的研究舒肝解郁胶囊对心肌梗死后抑郁大鼠行为学及心室电生理的作用.方法通过结扎冠状动脉前降支制备急性心肌梗死模型以及慢性不可预见性温和应激建立抑郁模型,将65只SD

期刊

心肌梗死后抑郁行为学心室电生理舒肝解郁胶囊实验研究

汉语组块分析算法

该文提出了一种高效的汉语组块分析算法，它通过采用基于规则的有限状态成分组分极和基于统计的界块界定预测相结合的处理策略以及多个有限状态成分组转换器相互配合的处理机制

会议

汉语组块有限状态处理机制自动识别真实文本汉语句子分组分析算法处理策略转换器组分预测统计实验规则

词性标注中难归类词语分析

该文依据２００万了字经过人工校对的分词和词性标注的语料，对其中的词性标记不一致但不属于兼类或同形的词语进行分析，文章根据这些标记不一致的词语的产生原因将它们分成三大类，并具

会议

词性标注人工校对词语词性标记语料分词

汉语词性标注中兼类词排歧算法探讨

该文对词性标注的几种算法：ＣＬＡＷＳ算法、ＶＯＬＳＵＮＧＡ算法、遗传算法做了比较，分析各自的时间复杂度，并针对文本中的每个ＳＰＡＮ用遗传算法算法对其兼类词进行词性标注，实验结果证明此方法是可行的。

会议

汉语词性标注兼类词遗传算法复杂度证明文本实验方法

基于ＮＡＡ的词性自动标注模型

与本文相关的学术论文