基于贝叶斯分类的中文物种描述文本的语义标注研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:wanyuequn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究从《中国植物志》中随机采集1000个文档作为数据集,采用基于先导词的朴素贝叶斯算法实现中文物种描述文本的自动语义标注。通过实验性研究,实验数据表明,先导词能够有效提升朴素贝叶斯的标注效率。采用先导词后,F平均值提高0.048~0.107,尤以Fr为2时效果最好,整体标注性能F平均值高达0.902。各元素的标注性能也较为理想。Fr分别取1、2、3时,大部分元素的F值为0.730~0.964。
其他文献
个性化网络学习是现代信息检索技术的新形式。快速高效地获得所需要的信息是每个用户的迫切要求,个性化信息检索技术则是实现高质量信息服务的前提。本文提出了一种网络学习环
基于标签进行个性化推荐是目前的一个研究热点,不同的推荐算法对标签进行了不同的处理。用户使用的标签之间存在着某种内在联系,由此可构建用户标签网络。根据这一启示,本文提出
专题信息采集通常是指基于专题内容概念从海量网络信息资源里获取专门所需信息的过程,专题内容概念主要通过系统的领域知识体系来表达。但依据领域知识体系进行信息采集,需要人
进入21世纪,特别是最近10年以来,社会发展和科技进步对矿床学研究提出了严峻的挑战和新的要求,具体表现在3个方面:学科发展前沿的挑战、国家战略布局需求和社会重大需求。其中学科发展前沿的挑战主要包括成矿模式创新研究不足、学科交叉融合程度不够、应用基础研究相对薄弱;国家战略布局需求则主要体现在"一带一路"、海洋强国和关键金属等方面;社会发展重大需求主要包括深部勘查、智能高效勘查和绿色生态勘查等方面。为
信息技术的高速发展,使我国第一产业与互联网的融合更加深入,并且产生了一种新经济形态,即农村电商。农村电商的出现推动了农村产业的转型,加快了农村消费升级的进度。关注农
[摘要]目的 通过回顾性分析总结在常规病理检查中诊断性刮宫中存在的一些问题。方法 对我科近10个月来的内膜活检的332例病例进行分析,结合 文献复习,总结存在的问题。结果最常见的问题是取材过少病史不详,其次是内膜息肉容易漏诊及存在各种诊断中的陷阱。结论详细的临床病史,恰当的内膜量,制片质量及全面分析形态学特征结合临床综合分析,能够减少误诊及漏诊的发生。  [关键词]内膜活检;病理诊断;良性病变;问