【摘 要】
:
对论文可视化是挖掘论文潜在价值,促进人类掌握知识创造内在规律的重要手段。然而论文本身并没有坐标信息,对其可视化需要人赋予给它一个坐标位置,因此设计一个能够深刻描述
论文部分内容阅读
对论文可视化是挖掘论文潜在价值,促进人类掌握知识创造内在规律的重要手段。然而论文本身并没有坐标信息,对其可视化需要人赋予给它一个坐标位置,因此设计一个能够深刻描述论文关系的布局算法对于论文可视化效果至关重要。已知的论文可视化系统都是采用力导向图法基于论文间的引用关系生成论文坐标布局的,然而引用关系本身具有缺失和不准确的问题,力导向图法也极其依赖人手工调参,最后生成的布局图孤立点多、斧凿痕迹严重、类别间可区分度差。这种布局法的根本问题在于忽略了论文的内容。我们首次提出了基于文档向量化的海量论文布局算法,提出先依靠自然语言处理模型将论文内容转化为高维文档向量,再通过向量降维方法将文档向量降为二维或三维中作为论文最终的坐标。我们设计了基于纯内容的监督布局算法、基于纯内容的非监督布局算法以及通过内容预测引用关系的融合布局算法。我们提出的布局算法集合能够有效处理带类别标注的论文数据、带引用关系的论文数据和无标注无引用关系的论文数据。我们在Arxiv论文集和IEEE论文集上进行了大量实验,从可视化效果上对各个模型进行了对比,同时我们还设计了量化评价指标从整体性能和局部性能对生成的论文坐标质量进行了评估,无论从可视化效果还是量化指标上基于文档向量化利用论文内容的布局算法都远远超过了之前基于引用关系的算法。我们还将内容预测引用关系推广到了预测文本关系上提出了新的文本关系分类模型,并在篇章关系分类的标准数据集PDTB上进行了实验证实了算法的有效性。
其他文献
随着智能手机的快速发展,其带来的安全问题也越来越严重。特别是由于目前市场上缺乏对安卓APP的有效检测手段,使得虚假的安卓APP越来越容易被用户下载和使用,这些虚假安卓APP
滤波技术指的是将信号中的特定波段频率分离,是现代工业电子、航空航天、图像处理等领域常用的抑制干扰的有效方法,因此得到了国内外专家学者的极度重视。在高斯线性系统中,以卡尔曼滤波器最为著名。而为了拓展滤波技术的应用,学者们研究了针对一类噪声为高斯的非线性系统的滤波算法。但针对非高斯噪声的非线性系统滤波方法的研究相对较为局限,本文就针对该类复杂系统的滤波方法进行研究。本文主要是针对基于特征函数的滤波算法
作为传统石油基聚合物泡沫的理想替代品,聚乳酸(PLA)泡沫因其良好的生物相容性和环境友好性受到了广泛关注。然而,由于其结晶速率慢和熔体黏弹性差,这对于制备高发泡倍率、高
随着无线通信技术的迅速发展,人们对无线网络环境的服务质量要求越来越高。作为现代无线通信关键技术之一的无线网状网(Wireless Mesh Network,WMN)是一种广泛应用的网络结构,由于其具有建设成本低、易于安装和维护、可靠性强及可扩展性好等特性,且WMN还可用于许多特殊的应用场景,使其受到学术界与产业界的广泛关注。因此,研究如何高效的利用WMN中的资源显得很有意义。本文中我们主要研究了W
目的:通过研究益气养阴清热方对2型糖尿病(Type 2 diabetes mllitus,T2DM)小鼠肠道GLP-2及紧密连接蛋白ZO-1、Occludin表达水平的影响,探讨益气养阴清热方抑制慢性炎症反应,
目的:通过观察道地通管汤对输卵管炎性大鼠输卵管组织形态学的改变,输卵管组织中Smad2、Smad7的表达影响及其黏膜超微结构的变化,来探讨其作用机制,为临床治疗输卵管炎性疾病
近年来大量的视频正以惊人的速度急剧膨胀。如何让用户在海量的数据中快速找到目标视频成为目前受到广泛关注的课题之一。例如用户想通过片花检索完整版视频,即难点在于如何
有机电致发光器件(Organic Light-Emitting Devices,OLEDs)具有柔性、宽视角、高亮度、色彩丰富、高像素及低功耗等优点,在显示和照明领域具有巨大的应用价值和发展潜力。与传
在当今社会,人们对无线连接的需求,大部分来自于日益增长的移动多媒体服务和应用,因此不断地推动着移动流量呈指数级增长的趋势。为了能满足这种需求,学者提出了多输入多输出(MIMO)技术。该技术的主要原理是在收发两端都配置多根天线以获取空间增益和时间增益。最近几年,为了使系统能在相同的时间和频段实现多个空间数据传输链路,大规模天线系统被提出。在此系统中,基站配置大量的天线,以使得基站到不同用户间的信道趋
茭白是菰(Zizania latifolia)与菰黑粉菌(Ustilago esculenta)互作而形成的茎部膨大的可食用肥大菌瘿,是中国栽培面积除莲藕以外的第二大水生蔬菜,具有丰富的营养和保健价值。茭