科技查新中检索词智能抽取系统的设计与实现

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户：jianjfs

【摘要】

：

【目的】解决科技查新领域检索词选择时的主观性强、手工工作量大、不规范、费时费力的问题。【应用背景】为了实现检索词抽取过程的自动化、智能化、规范化,本文提出利用科

【作者】

：

王培霞余海陈力王永吉

【机构】

：

中国科学院软件研究所,中国科学院大学,

【出处】

：

现代图书情报技术

【发表日期】

：

2016年11期

【关键词】

：

科技查新检索词关键词抽取网络爬虫

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

【目的】解决科技查新领域检索词选择时的主观性强、手工工作量大、不规范、费时费力的问题。【应用背景】为了实现检索词抽取过程的自动化、智能化、规范化,本文提出利用科技查新过程检出的实时相关语料作为领域知识的来源,并对语料组成类型与关键词抽取效果之间的关系进行讨论。【方法】通过关键词抽取、领域特征扩展相结合的递进式迭代抽取方式实现科技查新领域检索词的智能抽取。【结果】通过与实际查新案例所采用的检索词对比,发现使用本方法两次迭代后抽取10个检索词,召回率达到80%。【结论】基于查新过程中检出文献构成的动态相关语料进行检索词的迭代抽取有助于快速、准确锁定绝大部分检索词,提高检索的效率和效果。 [Objective] To solve the problem of subjectivity, manual workload, non-standard, time-consuming and labor-intensive when choosing search terms in the field of scientific and technological research. [Background] In order to automate, intelligently and standardize the process of word retrieval, this paper proposes to use real-time related corpus detected by the technology search process as the source of domain knowledge and to analyze the relationship between corpus composition types and keyword extraction Relationship to discuss. 【Method】 By means of progressive iterative extraction combined with keyword extraction and domain feature expansion, the intelligent extraction of search terms in science and technology search area was realized. [Results] By comparing with the search terms used in the actual case search, we found that using this method to extract 10 terms after two iterations, the recall rate reached 80%. 【Conclusion】 The iterative extraction of the search terms based on the dynamic corpora formed by the detected documents during the search process helps to quickly and accurately lock up most of the search terms and improve the retrieval efficiency and effectiveness.

其他文献

论民间舞蹈的艺术特征及它的社会功能和作用

本文通过对四川地区民间舞蹈元素的研究,旨在探讨民间舞蹈的元素提炼、再创造及它所起到的社会功能和作用,为民间舞蹈的文化精髓得以发扬及传承尽微薄之力。

期刊

民间舞蹈保护传承

虾虎鱼和黄颡鱼CPT Ⅰ的克隆、表达、动力学性质及对锌的响应研究

肉碱棕榈酰转移酶I (CPT I)是线粒体脂肪酸β-氧化的一种“限速酶”,它在脊椎动物中控制长链脂肪酸的β氧化,在降解脂肪过程中发挥着重要作用。近年来,哺乳动物中对于CPT I基

学位

矛尾复虾虎鱼黄颡鱼肉碱棕榈酰转移酶I动力学脂肪代谢锌锌缺乏锌过量

全固态模拟电视发射机功放单元数字化改造

针对我国目前存在大量模拟发射机的现状，通过对河南省7个骨干台模拟发射机数字化改造实验，总结了在数字化过程中功放单元改造需要注意的问题，详细分析了地面数字电视发射中几个

期刊

功率放大器调制误差率非线性失真

授权教育对2型糖尿病患者自我管理干预效果的研究进展

糖尿病常并发高血压、冠心病、脑血管意外等严重并发症,给个人和国家造成沉重的经济负担。授权教育对改善糖尿病患者自我管理行为,降低糖化血红蛋白水平,提高患者生活质量具

期刊

授权教育2型糖尿病自我管理干预效果

基于变维交互作用的IMM-CKF算法

为了对非线性情况下的机动目标进行跟踪,提出一种变维交互作用的交互多模型容积卡尔曼滤波（IMM-CKF）算法。该算法结合变维交互作用多模型滤波方法和容积卡尔曼滤波方法,对使用

期刊

容积卡尔曼滤波变维交互作用交互多模型算法机动目标跟踪

安检专业学生安全意识培养方案研究

美国“911”恐怖袭击事件之后,民航空防安全问题成为世人关注的焦点。航空港安全检查作为保障空防安全的第一道防线,处于十分重要的位置。恐怖事件的频频出现,一定程度上暴露

期刊

安全意识航空港安全检查学习情境

基于视觉显著性的目标识别

移动机器人的目标识别以图像处理、分析和理解为基础，是一项多学科综合的复杂技术，现在已经参透到军事、空间探索、医学、工业等各个领域，作为室外移动机器人自主导航和环境认知

学位

目标识别视觉显著性机器人视觉图像分割支持向量机

程国彭中医临床思维特点探要

辨证是中医学的基本特点之一,也是中医临床的难点。程国彭是清代康乾时名医,在中医辨证方面积累了丰富的经验。故从以下6个方面论述了程国彭的临证思维特点：以人为本,重视禀赋

期刊

临床思维辨证程国彭

日光温室蔬菜绿色生产技术

随着经济社会的高速发展和人们生活水平的不断提高,我国城乡居民越来越重视自身的健康,对鲜活农产品特别是鲜活蔬菜产品的需求不仅在数量上有了较大的提高,而且在质量上更重

期刊

日光温室蔬菜日光温室蔬菜生产高垄栽培人工辅助授粉绿色生产

企业孵化器能力演化的系统动力学考察

企业孵化在提升创业存活率,助推企业成长方面发挥重要作用。在国家创新系统的创新转化过程中发挥关键作用。但是目前关于企业孵化器能力新的研究尚未引起学术界的足够重视。

期刊

企业孵化器能力演化系统动力学仿真模型

科技查新中检索词智能抽取系统的设计与实现

其他学术论文