社会网络中的地理数据挖掘方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:diod
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0应用的快速发展,越来越多由用户生成的内容成为了互联网上的一个重要信息来源,出现了许多社会媒体网络站点,如Flickr、Facebook和YouTube等网站。这些网站中存在大量由用户上传的具有地理标签信息的照片数据。通常这些照片数据体现了不同用户的出行轨迹,但出行轨迹数量庞大,且所表达的信息有限。通过分析获取这些地理标签信息,发现社会关系和空间地理关系两者复杂地缠绕在一起,如何从庞大的社会网络数据中抽取、表达这些地理信息,如何采用行之有效的方法来对社会网络中的由用户生成的地理信息内容进行分析和挖掘,这是两个难点问题。本论文的主要工作是从社会网络上的媒体信息中,挖掘出用户轨迹数据,并从多个用户轨迹中提取出用户感兴趣的地理位置,然后挖掘出用户的序列路径轨迹模式,并使用一种排序机制对所获取的路径轨迹模式进行排序,从而获取到相关的出行路径轨迹模式。具体研究内容包括:首先,根据从Flickr网站上获取的照片数据的特点,建立社会网络和地理信息联合描述模型;以联合描述模型为依据,按照不同用户上传的时间顺序提取出照片的经纬度信息,采用二次聚类方法对地理信息进行处理,获取到空间位置相近的有代表的地理位置数据集和相应的照片图片集。其次,针对获取的地理位置数据集,提出路径轨迹模式挖掘方法(Social PathTrajectory Pattern Mining,SPTPM)。该挖掘方法包括两个步骤:(1)基于PreFixSpan算法的序列路径轨迹模式挖掘,获取不同用户的序列路径轨迹模式。对挖掘的结果分析发现,大多数的序列轨迹模式都包含了重要的地理位置,但显示的信息有限,而且挖掘出的路径轨迹数量庞大,许多序列轨迹模式中包含有相同的子模式。(2)提出路径轨迹模式排序算法(Social Path Trajectory Pattern Ranking),把用户、地理位置和路径轨迹三者之间的相互影响,加入到路径轨迹模式的排序中,挖掘出相关的路径轨迹模式的排序。最后,为了验证本文所使用方法的有效性和正确性,进行了实验并对实验结果进行分析。结果表明本研究所提出的路径轨迹模式排序方法(SPTPM)获取到结果达到用户需求的预期结果。本文的研究成果对如何借助地理信息技术,对不同地域的用户的出行路径轨迹进行挖掘,从地理角度来探知社会网络中人与人之间的关系,对理解用户行为和生活轨迹具有一定的理论意义和应用价值。
其他文献
在数据时代,可视化系统开发的需求越来越大,如何制定可视化系统开发的范式已经成为一个热门的研究问题。本文从软件工程的角度出发,提出针对可视化系统开发的嵌套增量模型,帮
目前市场上各个行业对客户关系的重视程度越来越高,只有充分了解客户需求,才能更准确的提供相应的产品和服务,使利润最大化。而这其中最基本的要素便是数据挖掘中的客户分群,
随着Web服务技术的迅速发展,越来越多的Web服务运行在Internet上,但单个Web服务功能有限,难以满足日益增长和不断变化的用户需求。因此,如何将已有的、运行在异构平台上的Web服务
近些年来,随着软件系统规模的庞大、复杂,软件系统功能的改进,软件版本的不断更新,人们对软件质量的要求也不断提高。软件可靠性作为衡量软件质量的关键性指标变得越来越重要。本
在人们不断加深对网络应用的依赖性的同时,网络的可用性逐步成为人们关注的重点。其中让网络管理人员广为熟知却难以应对的网络可用性攻击之一便是DDOS攻击。在复杂多变的网
智能交通系统是利用尖端的电子通信技术,形成人员、公路和车辆三位一体的新公路交通系统的总称。交通管理与控制系统是智能交通系统领域当中一项重要的研究内容,而交通流量预
光在自然界传播时,由于物理规律以及不同物质具有不同的折射率散射率等光学特性,就会产生丰富多彩的视觉效果,比如阴影、表面高光、环境光遮挡以及一些材质的半透明效果等。
人脸识别技术是一种重要的生物特征识别技术,因其友好、直接等使用特点已广泛应用于安全、商业等许多领域。人脸识别系统涉及大量数据的比对操作,对于人脸数据库较小的识别系统
中文语料库的分类与检索的研究对于语料库的管理和学习使用具有相当重要的意义。面对具有海量信息的语料库,人们不可能在短时间内对这些数据进行分类并获得其中所需要的内容,这
为了建立对区域范围内各医疗机构业务联动,实现数据共享或业务协同,需要各医疗机构在个人身份上具有统一的身份机制,此项工作是区域卫生信息平台建设的基本任务。由于发卡机