基于时间序列的学科热点主题预测

来源 :中国农业科学院 | 被引量 : 0次 | 上传用户:hddyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在特定学科研究领域中,从科技文献中快速和正确地识别研究热点主题是了解该学科研究领域发展状况的重要手段,也是推动科技政策制定的重要环节。本文采用Relim算法从“动物遗传与育种”领域文献中识别出研究热点主题,并采用了四种机器学习算法对研究热点主题进行预测,发现集成后的预测模型对时间序列预测效果较好,选择提前两步的预测效果最好。实验结果表明热点主题预测有助于了解未来一段时间内的研究热点主题状况。本文的主要研究工作:(1)基于Relim算法的研究热点主题识别。主要通过对若干个识别主题算法的对比研究,在前人研究基础上确定将Relim算法作为识别主题的核心算法,实现了从动物遗传与育种领域的科技文献中对研究热点主题的自动挖掘。本文从实验数据中共挖掘了“animal”、“association”、“behavior”、“animal_association_behavior”、“breed”等283个热点主题。为了去除冗余的数据,对研究热点主题进行精简,精简后为“animal_association_behavior”和“breed”等250个热点主题。将2000-2017年精简的主题的频数按年份顺序排列得到时间序列。(2)基于机器学习算法对热点主题的演变趋势预测。本文采用了线性回归、支持向量机、径向基函数回归、径向基函数神经网络四种机器学习算法,对单个主题“breed”进行预测。对比发现对于同一时间序列,由于不同算法彼此间的多样化或独立性的本质,导致四个单个预测模型的均方误差、均方根误差、平均绝对误差值之间存在着巨大的差异。通过将单个预测模型的预测值进行综合加权(集成预测)作为对热点主题演变趋势的预测模型。在集成预测模型中,将性能表现不好的预测模型与性能较好的预测模型进行加权组合,最终可以得到性能更加稳定的集成预测模型。通过对主题“weight body”提前五步的预测实验,发现提前2步的预测方案是最优的。最后,利用集成预测模型对主题“ability”、“acid”、“activation”进行提前2步的预测。主题“ability”在2017年之后,主题的频数有下降的趋势;主题“acid”在2017年到2018年频数有下降的趋势,但是2019年,主题的频数有所回升;主题“activation”在2017年之后主题的频数保持平稳的状态。实验结果表明,该方法能够较为准确地从动物遗传与育种领域的文献集合中预测该领域热点主题,特别是对未来2年的热点主题预测具有较好的预测结果。该方法也同样适合基于科技文献的其他学科或领域的热点主题预测,帮助用户快速了解未来一段时间内的研究热点主题状况。
其他文献
目的:耳鸣为最常见的耳科疾病之一,其病因繁杂不一,确切发病机制尚未完全阐明,虽然诸多研究证实耳鸣与听力损失关系密切,且多认为听力损失为耳鸣的启动因素,但临床上存在相当比例的耳鸣患者其常规纯音测听显示听力正常。由于耳鸣常规听力学检测的测定频率间隔及测定响度间隔较大,对耳鸣患者的听觉评估存在一定的失误率,因而近两年来一种新的针对耳鸣的精细化检测方法开始逐渐应用于临床。本研究即通过对正常听力耳鸣患者的精
实验目的:采用与临床近似的分次治疗模式,对荷B16黑色素瘤的C57BL/6小鼠进行RT、MHT和rmhTNF-α治疗的单独或联合应用,比较经不同治疗后肿瘤组织内MVD和VEGF表达阳性率的变化
目的:通过生长抑素类似物奥曲肽联合5-FU对体外培养的大肠癌细胞作用及对p53蛋白的影响为大肠癌的临床治疗提供一定的理论依据,试图为大肠癌的治疗提供一条新的途径。方法:采
随着产业的转型升级和机器人相关技术的发展,机器人技术的应用已经从制造业领域扩展到医疗服务业领域。下肢康复外骨骼机器人作为一种典型的医疗服务机器人,市场需求量大,但
传统影像测量仪制造商针对误差检测主要按照《GBT 24762-2009产品几何技术规范(GPS)影像测量仪的验收检测和复检检测》采用线纹尺比对法进行,此方法主要存在以下问题:检测精
译者是翻译过程中最活跃的因素,在翻译活动中具有非常重要的作用,无论是对原文本的选择、理解,还是对目的语文本的表达和输出,译者都不可避免地发挥着自己的主观能动性。但是,长期以来,原著和作者都占据绝对的统治地位,译者长期处于“隐形人”“仆人”的地位。直到二十世纪七十年代西方翻译界出现“文化转向”后,译者及其主体性逐渐得到译界重视。阐释学与翻译有着天然的联系,随着阐释学进入人文社科领域,翻译研究进入了新
通过对第25届、第26届、第27届3届奥运会田径决赛成绩和第7届、第8届、第9届全运会田径决赛成绩的整理、统计,用客观数据说明了世界田径运动在高水平上保持稳定,投掷项目水平
金属有机骨架材料(MOFs)是一种新型的多孔晶体材料,不仅具有大的孔径尺寸、比表面和孔隙率等特点,而且结构也具有新颖性、多样性以及热稳定性高等特点。MOFs材料的应用领域非
近年来,量子点(Quantum dots,QDs)因其半峰宽窄、亮度高、发光颜色随尺寸连续可调等优点在显示和照明领域具有极大的发展潜力。但在实际应用中还存在荧光强度低,发光性能不稳定等问题,而金属在特定频率光的照射下产生的电场可以增强附近荧光物质的发光性能,并可以通过对金属结构的设计实现对量子点荧光材料光学特性的有效调控。这些独特的性能使得具有表面等离激元特性的金属纳米阵列和荧光物质相结合,即等离
EMB(Electro-mechanical brake)是真正意义上的线控制动,完全摒弃了制动液,可实现与整车ABS、TCS、ESP、EBA等功能集成。提出了一种新的电动执行机构的方案,其相对电子机械制