基于NAA的词性自动标注模型

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户:glamour269
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一种基于NA假设的词性自动标注方法。该方法采用基于NA假设自动从无标注语料库中抽取性三元组数据,训练词性标注统计模型所需参数,对稀疏数据进行平滑处理。对词典中未登录词的词性进行猜测。根据未登词的上下文评估各种词性的概率,最终选陂最大概率词性作为未登录词词性。两万词次的开放性测试,三个模型的测试结果的准确率分别为80.2℅,93.1℅和85.4℅。
其他文献
会议
针对词汇语义研究和计算词典方法的兴起及汉语信息处理中名词语义研究与其所占重要地位很不相称的现状,我们立足于《现代汉语名词机读词典》,主要采用基于规则的语义分析策略和
该文叙述了以MC68HC908JL3为核心的技术先进、运行可靠、成本低廉、操作简单和易于构成住宅小区电子防盗系统的自动电话语音报警器。
该文探讨根据组合实例对不同词性的词同时进行聚类的问题,在聚类过程中,不同词性的词的聚类相互影响。首先将该问题转化为一个基于组合实例的优化聚类问题,以类内平均距离为基础
该文主要介绍了维语自然语言理解及处理研究领域的一些重要应用成果。主要包括维语语音识别,语语法识别及维语句法分析的自动处理,维语文/语转换等方面的应用。论述了中心语驱动
视黄醇X受体(RXR)是一种核激素受体,可与体内约1/3的多种核受体形成异源二聚体或者同源二聚体,调控体内生长发育过程,同时与糖脂代谢平衡及许多疾病的病理过程密切相关.RXR作
目的 研究舒肝解郁胶囊对心肌梗死后抑郁大鼠行为学及心室电生理的作用.方法 通过结扎冠状动脉前降支制备急性心肌梗死模型以及慢性不可预见性温和应激建立抑郁模型,将65只SD
该文提出了一种高效的汉语组块分析算法,它通过采用基于规则的有限状态成分组分极和基于统计的界块界定预测相结合的处理策略以及多个有限状态成分组转换器相互配合的处理机制
该文依据200万了字经过人工校对的分词和词性标注的语料,对其中的词性标记不一致但不属于兼类或同形的词语进行分析,文章根据这些标记不一致的词语的产生原因将它们分成三大类,并具
该文对词性标注的几种算法:CLAWS算法、VOLSUNGA算法、遗传算法做了比较,分析各自的时间复杂度,并针对文本中的每个SPAN用遗传算法算法对其兼类词进行词性标注,实验结果证明此方法是可行的。