【摘 要】
:
随着网络信息技术的快速发展,文本挖掘领域日益受到关注,已经成为当前研究的热点之一。文本挖掘指的是从文本数据中获取有价值的信息和知识,最常用的一种方法就是利用文献耦合对现有文献进行回顾分析。传统的文献耦合网络是通过文献间的耦合强度构建的,只考虑了耦合关系,没有考虑文献内容间的相似性。为了更准确地刻画文献间的相似关系,本文在文献耦合网络的基础上添加语义信息,构建文献语义耦合网络,并对构建的网络进行聚类
论文部分内容阅读
随着网络信息技术的快速发展,文本挖掘领域日益受到关注,已经成为当前研究的热点之一。文本挖掘指的是从文本数据中获取有价值的信息和知识,最常用的一种方法就是利用文献耦合对现有文献进行回顾分析。传统的文献耦合网络是通过文献间的耦合强度构建的,只考虑了耦合关系,没有考虑文献内容间的相似性。为了更准确地刻画文献间的相似关系,本文在文献耦合网络的基础上添加语义信息,构建文献语义耦合网络,并对构建的网络进行聚类分析。本文的研究工作主要从以下三方面开展:首先,构建文献语义耦合网络。通过隐含狄利克雷分配(Latent Dirichlet Allocation,简称LDA)建模方法量化网络中节点的语义信息,将节点的语义信息与节点间的耦合关系相结合,在网络拓扑特征的基础上考虑网络的语义特征,借助社会网络拓扑势的思想构建语义网络的语义场模型,进而构建文献语义耦合网络。其次,优化模块度评价指标。由于本文构建的文献语义耦合网络既考虑了节点间的耦合关系,也考虑了节点的语义信息。因此,其相应的社区发现评价指标不仅要考虑社区内部的关系合理性,还需要考虑节点间的语义信息相似性。基于上述考虑,定义一个语义模块度评价指标。通过对比分析,验证语义模块度指标的优越性。最后,对网络模型进行聚类分析和社区发现。分别运用GN、LPA和Louvain算法对文献语义耦合网络进行社区发现,并根据网络的划分结果以及每个社区中包含的关键字信息分析不同社区的研究主题。同时,对文献语义耦合网络进行可视化特征分析,挖掘该网络的内在规律、研究热点和学科结构。通过实验结果发现,发现在文献耦合的基础上考虑文献内容后,节点间的联系更密切,更能准确掌握学科的发展动态和研究趋势。本文改进的文献语义耦合网络和语义模块度指标为研究文献的引证结构和规律、主题相似性及学科结构提供了一种新的研究思路,对文献聚类和信息检索有一定的借鉴意义。
其他文献
过渡金属催化的选择性碳-氢键官能团化是有机化学中构建碳-碳键和碳-杂原子键非常重要的工具。在过去十几年里,过渡金属催化导向基或者底物诱导的sp2碳-氢键和sp3碳-氢键选择性活化均取得了巨大进步。另一方面,烯烃广泛存在于天然产物和化学化工产品中,并且在有机合成中发挥着十分重要的作用。利用烯烃进行有机合成转化的方法有很多,其中自由基参与的烯烃双官能团化反应为烯烃的应用提供了一种高效的途径。由于自由基
据Scrip报道,惠氏公司(Wyeth)抗肾癌新药temsimlimus(曾用代号:CCI-779)继获得欧盟批准后已于2007年底正式在奥地利上市。在此之前,美国也已经批准了该药的上市申请。
本文概括了交通产业的一般特点,并在此基础上论述智能交通系统(ITS)产业不同于一般交通产业的特点,认为ITS产业具有高科技产业的特征。然后分析ITS产业投资资金的来源问题,并把ITS
<正> 煤炭工业基本建设大型临时工程投资浪费的现象比较普遍,同“一五”期间相比提高十几倍。根据淮北矿区初步统计,一个大中型矿井大临工程费用大体上700万元左右,占总概算5
随着轿车数量和运行里程数的增长,轿车本有的优点渐渐丧失了,轿车技术系统承诺给用户的快速便捷的效用,消失在无休无止的道路拥堵之中,而轿车本身就是拥堵的始作俑者.
日本眼下正在考虑将若干处方药转换为非处方药(OTC),包括一些质子泵抑制剂和喹诺酮类抗菌剂。日本卫生、劳动和福利部称,它将广泛征集意见,并进行相关调研工作,于2009年年底召开一
芳基烯基膦酸酯是一类非常重要的有机磷化合物,它同时也是合成其它有机磷分子的重要中间体,被广泛应用在在有机合成、光电材料、阻燃材料以及药物化学等研究领域。尽管越来越
无论新手老手,只要车在路上走就难免会发生一些小剐蹭,甚至遭遇一些事故。事发后如何进行理赔?这里谈几个基本招数。
一辆汽车,无论安全装备优劣,毕竟它是一台机器,是由人来操纵的,能否令车内车外的人处于安全的环境中,关键取决于手握方向盘的驾驶者。
随着信息化的发展以及终身学习理念的普及,在线学习受到了学生和社会人士的青睐。视频课程作为在线学习的主要载体,也应遵循良好的教学设计。学习不是被动接受的过程,需要通