最大熵和规则相结合的藏文句子边界识别方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:dengyq2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利用藏语边界词表识别歧义的句子边界,最后采用最大熵模型识别规则无法识别的歧义句子边界。该方法有效利用藏语句子边界规则减少了最大熵模型因训练语料稀疏或低劣而导致对句子边界的误判。实验表明,该文提出的方法具有较好的性能,F1值可达97.78%。
其他文献
贫血是青少年的常见病之一.为了解我校学生贫血的患病率,笔者利用实验诊断学"血常规检查"实验课,对我校98、99级大、中专生进行血红蛋白检测,现报告如下,并对防治贫血的对策