中文科技文献切分的领域适应技术研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:xiaoxi21175
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以生物医学文献为实例对象,研究科技文献切分中的领域适应技术,通过以词典特征、领域词汇特征、子串标注和使用词典切分的粗切分语料作为训练语料等方法,实现基于序列标注的中文切分方法由新闻领域到科技领域的适应,并取得了较好的效果.研究表明,在科技文献切分中,充分利用领域知识获取领域相关特征,对于提高科技文献切分的准确率具有重要的作用.
其他文献
在信息资源不断丰富,甚至已经称之为“信息爆炸”的今天,获取有用的信息或者知识却越来越难;拥有如此丰富的知识财富,让我们越来越迷失在知识的海洋中。目前的信息检索系统返回检
本文以文本数字水印为主要研究对象,着重研究文本数字水印在版权保护中的应用问题,在介绍文本数字水印的定义、功能和实现方法的基础上,分析比较了已有的文本数字水印算法和
针对当前电子资源授权许可协议中普遍存在的国内用户适用中国法律的要求不被尊重、故意排除中国法律适用、过度使用国际商事仲裁、混淆相关概念的现实问题,从宏观层面根据相
科学技术飞速发展,科技信息资源成为了各国重要的战略资源,科技资源的开发与利用受到各国政府的高度关注,科技信息服务被纳入到政府部门的电子政务中来。目前我国政府网站科技信
认为已有科研合作网络分析研究成果多是基于某文献数据库单一数据源,无法全面完整地反映真实的科研合作状态。基于多数据源,从作者贡献、合著次数、合著强度和合著效果等角度
针对近年企业中的信息过剩以及知识资源凌乱分散、利用率不高的现象,提出一种基于知识地图的企业知识组织设计方法,包括业务流程分析、知识收集、知识分析、知识关联、知识索
认为批量编目是促进电子资源获取的有效手段。针对国内电子资源批量编目的实践进行调研,涉及数据质量、相关工具、对书目系统质量的影响、面临的挑战、发现系统对电子资源批
用户和服务是图书馆的基本核心价值及生存之基。所谓“个性化信息服务”是指面向不同用户开展的有针对性的信息服务,是一种以用户为中心的主动服务。现代大学信息用户需求的日
本文通过对荣华二采区10
多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的