基于GraphOLAP的文献分析与可视化系统的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:buhao00155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于缺乏对大规模多关系型数据的处理能力,传统文献分析工具往往局限于对数据进行局部分析,忽视了数据间的联系。近年来,随着复杂网络研究的兴起,网络分析方法逐步被应用到包括文献分析在内的多个领域。利用网络分析文献数据,可以借助网络的可视化特点结合机器的特长与人的优势,帮助分析人员发现数据的隐藏特征。这也使得结合网络分析的文献可视化分析工具成为当前文献分析工具的主流。本文主要对文献分析做以下几方面的探讨:(1)文献网络的实体解析。文献数据中经常存在实体表述不准确的现象。实体解析的主要任务就是在实体和实体的表述间建立正确的映射关系以解决一物多名和多物同名的问题。当前流行的分析工具以判断实体属性相似度的方法消除不一致数据,在很大程度上提高了数据清理的自动化程度。但基于属性相似度的清理方法需要用户设定相似度阈值和各项属性的相似度权值,需要用户了解更多的背景知识。另外这种清理方法对由属性缺失引起的实体重名处理效果较差。本文尝试在使用属性匹配的基础上,通过分析和比对实体间的关系,使用链接分析、协同分析、社团划分等方法,提高实体解析的准确度。(2) GraphOLAP。使用网络展示文献数据可以直观的反映相关实体的多维特性,如果能进一步对网络作多维分析,有利于分析人员深入理解各类实体间的关系。联机分析处理(Online Analytical Processing)系统常用来分析多维数据,以数据立方体的形式提供数据的多维视图,并通过上卷和下钻操作提供数据的多层次视图。但传统的联机分析处理系统并不支持图结构,现有的主流分析工具也都不支持对图进行OLAP操作。近来,Chen Chen、Xifeng Yan和Jiawei Han等提出了支持图结构的OLAP框架GraphOLAP。但该框架到目前为止还没有实现,也不支持对异质图进行OLAP操作,本文将扩展GraphOLAP的概念以支持对异质图的分析,并实现该框架。(3)本文将上述研究应用于国家科技支撑计划项目《科技文献信息服务系统关键技术研究及应用示范》,开发了一个文献可视分析系统,通过工具证明了上述研究的可行性。
其他文献
数字媒体是指以文本、图片、音频、视频及其组合为表现形式的数字化作品或素材。随着计算机、互联网技术的快速发展,人们使用数字媒体的习惯与购买倾向开始发生巨大变化,网络发
随着计算机网络通信技术的发展,人们对于通信质量的要求越来越高。但是网络的生存能力面临着各种威胁因素,增强网络在自然灾害、人为损害等情况下的生存能力成为一项非常重要
SOA(ServiceOrientedArchitecture,面向服务架构)和WebService是当最热门的研究领域之一,SOA将企业应用中的分散功能整合成具有互操作性的标准服务,企业可以方便快速组合和重
航空结算系统共分成两个部分,一部分用于结算业务的处理,另外一部分用于报表的生成和展示。因此整套系统后台数据库类型应该分成两个部分,一部分为联机事务处理(OLTP)系统,负责实
数控系统被称为机床的“大脑”,是数控装备的核心,它关系到国家经济利益、产业安全和国防安全,在国家工业制造中起着非常重要的作用。运动控制器作为数控系统的核心,其最重要
学位
LED就是light emitting diode,发光二极管的英文缩写,它是一种通过控制半导体发光二极管的显示方式,用来显示文字、图形、图像等各种信息的显示屏幕。  随着计算机网络技术的
近年来,服务计算作为一种新兴的分布式计算和软件应用模式得到了广泛的关注和研究。服务计算的核心思想是软件的广泛复用和松散的耦合形式,采用面向服务的软件架构模式(SOA),
互联网技术的快速发展使Web成为全球范围内信息发布与分享的重要平台。电子商务、微博、社交网络、团购等一系列互联网应用不断涌现,Web网站(网页)数量急剧增加,其信息量也呈
随着信息技术和通信技术的快速发展,Internet已经成为人们日常生活中不可或缺的一部分。然而,在网络规模越来越大,网络用户越来越多,移动互联网设备高度普及的今天,Internet
随着计算机技术的发展和应用,数控系统正在向高速、高效、高精度等方向发展,软PLC作为数控系统的一个重要组成部分,其执行效率直接影响数控系统的性能。设计一个直观、方便、开