论文部分内容阅读
文本挖掘是处理海量文本数据最重要的技术手段之一。随着信息技术和社会各行各业的发展,相关的信息资源和论文研究数据的爆炸式增长,为文本挖掘带来了发展机遇和挑战。文本数据不同于其他类型的数据,它大都以非结构化的形式存在,而文本数据特别是研究性论文数据中蕴含着大量专家学者的重要研究观点和意见方法,单凭人力读取和处理这些信息资源,不仅耗时费力,而且难以全面获取多类型的有价值信息。这些现象的存在凸显了文本挖掘技术的重要性。现有论文分析方法主要以人力总结和计量式论文分析方法为主,存在明显的不足和缺陷。如何有效构建基于文本挖掘技术的新型文本数据分析及解读方法值得深入研究。由此,本文通过深入探索多种文本挖掘和数据可视化技术,以建筑节能领域和物流领域内的具体论文数据为基础,构建一套学术趋势自动化识别和可视化方法。首先,从ScienceDirect数据库中提取出与建筑节能和物流相关的综述型论文,分别是4951和496篇,以此为研究素材;其次,根据论文数据的结构特征建立预处理方法,构建论文的基础信息语料库,如“年份”,“期刊”、“作者”、“关键词”和“摘要”等;再次,采用TF-IDF算法、图论和社交网络分析、LDA主题模型和情感分析等方法,构建多层次的论文数据挖掘方法;最后,以R语言为工具,自主开发可视一体化分析工具,将本研究构建的理论方法嵌入到实践工具中,帮助研究人员全面快速了解相关领域的总体研究趋势和动态。本文的主要结论如下:本文验证了文本挖掘技术在处理学术论文数据中的可行性和有效性。本文构建的文本挖掘及可视化方法可以帮助研究人员快速完成学术趋势的自动化识别和结果可视化。针对建筑节能领域的综述型研究,本文获得的要点信息包括:(1)最主要研究主题有:建筑节能的起源和发展阶段、气候变化带来的影响及政府应对气候变化的措施、建筑节能改善的具体环节、各种方法和技术的总结、不同阶段和时期节能减排的工作进程和成果、建筑围护结构研究、新能源的开发和利用、节能意识和建筑节能对人类发展的重要性;(2)本数据集内的文章主要投稿期刊是“RenewableandSustainableEnergyReviews”、“JournalofCleanerProduction”、“EnergyandBuildings”、“AppliedEnergy”和“ConstructionandBuildingMaterials”等;(3)重要的研究时间节点是1992年、1997年、2009年和2015年;(4)有影响力的研究人员有KamaruzzamanSopian、SaidurRahman和JianZuo三个和五个重要关系对JingjingJiang与BinYe、VygandasGaigalis与RomualdasSkema、YunhoHwang与ReinhardRadermacher、Bj?rnPetterJelle与ArildGustavsen,以及BaolongWang和XiantingLi;(5)研究中出现最多的关键词有新能源开发(Renewableenergy)、能源有效利用(Energyefficiency)、环境、经济和能源的可持续发展(Sustainability)、太阳能(Solarenergy)和研究地区中国(China)等关键词。针对物流领域的综述型研究,本文获得的要点信息包括:(1)论文中重要的时间节点是2010年;(2)217个期刊中,结合被刊载量和影响因子获得的重要期刊有“JournalofCleanerProduction”、“RenewableandSustainableEnergyReviews”、“EuropeanJournalofOperationalResearch”、“InternationalJournalofProductionEconomics”和“Omega”;(3)论文中相对重要的作者是:JoséMMerigó,RobertPellerin和JosephSarkis,合作关系紧密的作者对是:AngappaGunasekaran和EricW.T.Ngai、AngappaGunasekaran和EricW.T.Ngai、BrunoDeMeulenaer和FrankDevlieghere等;(4)重要的研究关键词有物流、可持续发展、绿色供应链、交通运输发展、闭环经济、人道物流和人工智能等,而该数据集中研究的两大主题是供应链管理和发展以及绿色物流的发展。本文基于文本挖掘技术构建出一种新的文本挖掘通用方法,实现在短时间内最快挖掘大量文本数据,并获得有用的研究趋势和动态信息,另外,借助建筑节能和物流领域的论文数据进行研究方法和交互式软件实用性和适用性的验证,发现自主开发的交互式软件为挖掘结果的直观呈现和解读提供了极大的便利。更重要的是,该方法不仅为初入相关学术领域的学者了解行业的重要信息和趋势提供了客观方法和工具,也为学者们的论文研究拓宽了思路,更为政策指定者指明了前进方向。