以人物为中心的多源异构公开网络数据的关联整合与可视分析

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liubin523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的不断发展使人们进入大数据时代,获取数据的能力不断增强。人是互联网的主体,公开互联网上的数据很大一部分是以人物为中心的。以人物为中心的公开网络数据为研究人类行为、社交网络、事件推理等问题提供了新的契机。公开网络中的数据往往是多源异构的,其研究的重点和难点是如何有效快速地获取整合数据、如何高效直观地呈现数据、如何提供基本的可视分析方法辅助探究分析。本文围绕以人物为中心的公开网络数据的关联整合与可视分析展开,探究并提出了对多源异构非结构化数据的有效整合和可视分析框架。文章根据公开网络上多个数据源的异构性,着重研究了三方面的内容:(1)适合开发人员使用的、工程化的本体构建方法。文章通过对已有本体构建方法的分析,研究在没有领域专家时,适合开发人员使用的本体构建方法,并采用这种方法构建出以人物对象为中心的本体。(2)多源异构非结构化数据进行基于语义的整合框架。文章研究了本体对于数据整合的意义,综合现有的数据整合框架,实现了一种基于本体的中间件模式数据整合框架,并对公开网络上Facebook、Twitter、 DBpedia、YAGO、微博、出租车移动轨迹等数据源进行语义整合。(3)对以人物为中心的非结构数据的可视化和可视分析。文章将多个来源的数据特征转化成可视表达,以用户容易理解的形式呈现,并结合交互操作和机器学习方法实现对以人物为中心的数据的可视查询、关联分析和分类规则提取。最后,本文通过若干个案例说明我们的系统在数据整合、可视查询和关联分析上的有效性。
其他文献
随着计算机网络的迅猛发展,信息安全越来越受关注。信息隐藏技术是一种重要的信息安全技术,而数字图像水印算法又是信息隐藏技术研究的一个热点。   水印加密和水印嵌入是水
随着各种智能移动终端在人们的生产和生活中越来越普及,人们开始更多地使用定位服务,包括行车时目的地的导航、博物馆导引、查找附近的商店等等,因此对定位服务提出了更多的
学位
随着计算、通信和数字媒体技术的发展和渗透,以及嵌入式计算和通信设备的快速兴起,一种全新的计算模式一普适计算一正在兴起和发展。普适计算是信息空间与物理空间的融合,在
随着多媒体技术及工业视觉的迅速发展,嵌入式的图像信息资源的检索已成为国内外研究的热点。基于各种嵌入式平台建立有效的图像描述和检索机制已成为迫切需要解决的问题,基于
随着Internet的迅速普及,垃圾邮件问题引起了社会广泛的关注。目前解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤是一个较为重要的方法。本文采用潜在语义
随着计算机网络技术的发展,网络用户数飞速增长,网络的规模及网络的性能得到了较大程度的提升,网络复杂性不断的提高,这些对网络行为的研究提出了新的挑战。在错综复杂的高速
数据挖掘是从大量数据中提取出可信的、新颖的、有效的并能被人最终理解的模式的高级处理过程,通过综合运用统计学、模糊数学、神经网络、机器学习和专家系统等方法,从大量的
科里奥利质量流量计由于其可以直接测量质量流量、精度高和可以同时测量流体密度等优点,在许多工业领域中获得了广泛的运用。本文采用数字信号处理方法来处理科氏流量计的信号本课题的目的是研制出性能和精度达到国际一流水平的新一代数字化科氏流量计。本文主要从频率测量和相位差测量两个方面对科氏流量计的数字信号处理方法进行了算法研究,针对时不变信号和时变信号提出了两种数字信号处理系统模型。此外本文还对科氏流量计的驱
量子隐形传态(简称QT)一词最初来源于科幻小说,隐形传态是指一种无踪的传送过程,它把一个物理客体等同于构造该客体所需的全部信息,传递客体只需传递它的信息,而不用搬运该客体。