面向科技文献的主题发现及演化预测方法研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mayy01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,快速精准地从科技文献中识别和预测热点科研主题是帮助科研工作者了解特定科研领域研究现状的重要手段。从海量的学术文献中获取科研热点及科研主题的演化趋势,不仅可以帮助科研人员节约大量人力物力,同时还可以帮助诸多科技创新主体和科技政策制定者从宏观、全局的角度出发,全面深入的了解相关科研领域的现状和未来趋势。因此识别科技领域的热点主题和对主题热度的趋势预测具有重大的现实意义。基于以上背景,本文以科技主题识别和热度预测为核心,提出了面向科技文献的在线主题模型和主题演化预测方法,并在此基础之上设计实现了科技信息智能分析预测系统。本文的主要研究内容和工作如下:(1)提出了一种IOLDA(Improved OLDA)在线主题模型。针对传统OLDA模型由于内容演化矩阵的权重固定导致的新旧主题混合等问题,提出了动态权重计算方法;并结合主题相似度矩阵构建了伪变长的主题内容演化矩阵,改进了主题模型的建模效果。针对本文提出的IOLDA在线主题模型,使用科技文献数据集进行实验。实验结果表明,IOLDA模型在困惑度等指标上要优于其他模型。(2)提出了一种面向主题热度的ESA(EEMD-SVR-Adaboost)组合预测模型。针对现有主题热度特征简单等问题,构建了一种基于科技主题强度等特征的科技主题热度指标体系,提高了主题热度预测的鲁棒性。同时考虑到时间序列的周期性和趋势性等特点,本文提出了ESA组合预测模型,并采用从IOLDA模型中提取的主题热度时间序列数据进行预测实验。实验结果表明,ESA组合预测模型在MAE和RMSE等指标上优于LSTM等其他比较模型。(3)设计并实现了一套面向科技文献的科技信息智能分析预测系统。该系统以科技数据智能分析项目为基础,以主题发现及演化趋势预测为核心,设计并实现了科技信息智能分析预测系统的整体架构和主要功能模块。最后对各个功能模块进行总体测试,测试结果表明,本系统基本满足了科技信息的分析预测要求。
其他文献
在国家“互联网+”战略的推动下,政企市场向个性化、多元化、高融合化的趋势发展,正处在新一轮科技革命的通信运营商,为响应政企市场需求的变化,打造了以5G、云计算、大数据、物联网、人工智能等新一代技术为核心的创新业务体系,但因为创新业务具有较强的专业性、复杂性,宁夏联通现有的组织体系及运营管理已经不能适应市场的变化,亟待解决当前面临的支撑人员不足、支撑效率不高、响应速度不及时等问题,只有解决了这些创新
越来越多的企业和组织开始重视项目的沟通管理工作,究其原因就在于成功的项目通常都有一个和谐的沟通氛围,项目内外部的沟通都较为顺畅。对于项目管理人员而言,除了完成项目的基本工作之外,更多时间都在进行沟通和协调。大多数项目管理工作的开展或多或少都会受到不同程度的干扰,有的来自项目内部,也有一些来自于项目外部。当面对项目中的冲突时,项目管理人员需要收集和分析相关信息,拟定出科学的沟通计划,并运用巧妙的沟通
在当今信息技术飞速发展的背景下,信息技术、智能算法、互联网等技术深入融入工业领域已经成为大趋势。全球各大主要经济体都对这个趋势做出了回应,德国有“工业4.0”、日本有“新制造业”、美国的“工业互联网联盟”和“先进制造伙伴计划”以及中国的“中国制造2025”和“互联网+先进制造业”等等。本文以和云南某公司的仓库数字化项目做研究背景,探讨在生产物流领域中仓库储位分配问题的解决和实现,结合实际问题,建立
随着智慧城市信物系统的不断演进和信息技术的快速发展,越来越多的、异质的网络被建立起来,深入了人们的日常生活。如今,人们对网络质量的要求也变得越来越严格,因此,网络传播动力学以及拥堵问题研究逐渐引起了学者的兴趣。随着复杂网络理论的发展,现实复杂系统的网络得以使用复杂网络模型进行表征,从而可以借助复杂网络模型研究智慧城市信物系统的传播动力学以及提高网络质量。目前,许多实证研究表明,网络性能不仅与网络结
近年来,中国经济高速发展,这背后离不开国家政府的经济规划与产业政策制定,经济政策的变动一直被社会各界紧密关注。然而目前仍然缺乏一套可以定量刻画政策变动的指数体系,如何对政策文本进行科学地量化分析一直都是政策研究的主要内容。传统的政策量化研究方法大多仅从时间、空间两个维度对政策进行统计分析,对研究人员的分析能力依赖程度高,且主观性强、成本较高,不能有效地挖掘政策文本信息。围绕这一问题,本文基于政策文
随着科技的发展,目前物流业已普遍引入信息技术,对仓储、运输、配送等过程产生的信息进行自动化的采集、汇集、分析,其货运模式向核心平台经济转变,新模式“无车承运人”在国内诞生。作为货运经营者,无车承运人平台需要介入货运交易,与实际承揽货运的车主进行运费议价,从而保证利润最大化。随着物流运输行业订单的日益增长,影响货运价格的因素越来越多,采用传统的线性公式计算运费参考价,并电话联系承运司机就运输订单进行
房屋市场是资源分配问题中研究最为广泛的模型之一。传统的房屋市场模型包括了n个参与节点和n个不可划分的资源,这些资源统称为物品。每个节点都持有其中一个物品,并对市场中的所有物品有一个优先级排序。房屋市场的相关问题主要是考虑在这样一个简单模型下,如何设计算法或是机制,有效利用排序信息,通过无金钱参与的交换,找到满足某些市场或是个人需求的分配。在本文中,我们主要研究了一个房屋市场变体模型中的物品可达性问
近些年来,随着信息技术的迅猛发展,反映国家经济活动的高分辨率数据越来越多,从而涌现了许多探索国家经济发展的研究。大量实证研究表明,国家经济与疾病、环境、贸易、教育、科学研究等各方面的活动息息相关。技术创新也是关乎国家经济发展的重要因素之一,但目前技术创新与经济增长关系的研究仅仅停留在相关性分析上,没有深入到预测层面,且大规模、长时间跨度的定量分析仍然缺乏。为了弥补上述缺陷,本论文旨在利用专利这一丰
随着时代的发展,越来越多的人选择走进博物馆,或是享受历史博物馆带来的文化熏陶,或是感受科技博物馆带来的知识魅力。所以博物馆如何更好得服务参观者,用有限的展示空间去尽可能满足游客的参观需求成为很有意义的研究方向。传统的研究方法可能大多局限于问卷调查和人为询问,使得参观者和博物馆工作人员都不太便捷。所以本文主要研究如何结合现有的人工智能技术来获取参观者对博物馆展品的评价,方便博物馆优化其展品的展陈。一
随着互联网的快速发展,新闻的载体逐渐由报纸向网络新闻转变,人们也更倾向于使用电脑和手机去接收新闻消息,互联网给人们带来便捷的同时,也为虚假新闻滋生提供了温床。自媒体的发展,使互联网新闻内容的呈现方式愈发多样,常常包含文本、图片和评论等各种信息,如何有效利用这些信息进行虚假新闻检测,对维持社会稳定、净化网络空间有重要作用。虚假新闻是可被证假且故意传播的新闻报道,传统的虚假新闻检测方法往往只关注单一模