【摘 要】
:
【目的】目前,科技文献大数据中存在着主题词不规范、不统一的情况,因此在构建检索式时很难既满足查全要求,又满足查准要求。针对这一问题,本文提出了一种基于词向量的检索扩
【机 构】
:
中国农业科学院农业信息研究所,中国铁道科学研究院集团有限公司电子计算技术研究所
【基金项目】
:
国家社科基金青年项目“基于图模型的农业领域多源知识迁移研究”(项目编号:18CTQ028),国家自科基金面上项目“农业大数据环境下多粒度知识融合方法研究”(项目编号:31671588),中央科研院所基本科研业务费项目“农业重点学科领域发展态势分析”(项目编号:Y2017ZK05).
论文部分内容阅读
【目的】目前,科技文献大数据中存在着主题词不规范、不统一的情况,因此在构建检索式时很难既满足查全要求,又满足查准要求。针对这一问题,本文提出了一种基于词向量的检索扩展方法,并在“基于多组学大数据的功能基因挖掘与辅助育种技术”领域进行了实验验证。【方法】首先清洗数据集,并将文本映射成词向量,一篇文章可以用其所有词向量的平均向量表示;然后用训练集中文章的平均词向量训练随机森林分类器;最后在测试集中对文本进行分类,从而得到正例数据即检索数据集。【结果】针对“基于多组学大数据的功能基因挖掘与辅助育种技术”领域构建
其他文献
国家农业科学数据中心是2019年6月中华人民共和国科学技术部(以下简称“科技部”)和中华人民共和国财政部(以下简称“财政部”)联合发文(国科发基〔2019〕194号)认定的20个国
作为超立方体网络的变形,n维变形超立方体VQn是Cheng和Chuang于1994年提出来的,它具有许多超立方体所具有的优良性质,比如正则性和递归结构.证明了:VQn的连通度和边连通度都等于扎
藏族天文历算是在青藏高原独特的地理环境和文化背景中产生和发展起来的,是随着社会的发展,不断吸收和融合国内外其他民族的相关文化而形成的独具民族特色和富含科技知识的一门
清末西藏新政改革是清中央政府在内忧外患、统治基础摇摇欲坠的情况下,为巩固其在西藏的统治和主权、抵制英帝国进一步入侵西藏,而开展的一场自上而下的改革运动。其力图从经济
微软每月发布一次安全公告,我们也跟着每月安装几个补丁。有人就不耐烦了,怎么这么多补丁啊,安装也麻烦,它们都是干什么的? 更新补丁省心省力 用Windows Update打上的补丁,会在安装后自动删除,系统重装后还得重头再来,实在浪费我的青春,而且安装更新的速度奇慢。基于上述原因,Windows Update被我一脚踹开,新聘Wutool来担此重任,它能自动保存更新程序,方便我们日后离线