论文部分内容阅读
近年来,随着互联网、网络通信等技术的应用推广,以Faceboo、Twitter、新浪微博等为代表的社交媒体应用吸引了大量的用户,对社会生活的方方面面都产生了颠覆性的影响。每天有上亿的网民在使用社交媒体服务,通过文字、图片、视频等各种形式记录自己的生活轨迹、与朋友沟通交流、发表自己的看法等等。特别是近年来,随着面向公众的网络地图与位置服务以及智能手机等带有定位功能的移动终端设备的普及,越来越多的社交媒体平台都加入了空间位置相关的服务,使用户能够将包含地理位置信息的内容发布到社交媒体上。位置信息的加入不仅为社交媒体用户提供了更多的便利,也使得社交媒体数据具备了用于时空分析的可能性。庞大的用户基础和较高的使用频率使得社交媒体平台上源源不断地收到大量的由用户产生的数据,这些数据综合了社会关系网络、时间、位置、文本内容等多个维度的信息,使社交媒体成为了一个典型的时空大数据来源。时空关联的社交媒体数据提供了传统时空数据和调查统计数据所无法达到的粒度和广度。基于海量社交媒体数据的研究已经获得了信息学、社会学、地理学等领域众多学者的广泛关注。这些研究成果解决了众多行业中使用传统数据无法解决的难题,具有巨大的实用潜力和广阔的应用前景。在社交媒体大数据时空分析向实际应用领域推广的过程中,时空分析流程的构建是最为关键的环节。然而对于普通的社交媒体时空分析的需求者而言,要快速准确地构建一个社交媒体时空分析流程是十分困难的。首先社交媒体数据来源多样、数据量庞大而且内容复杂,不同社交媒体平台所涉及的用户群体、内容类型、关注的热点、数据提供方式等等都不尽相同;其次,社交媒体数据分析方法复杂多样,涉及到空间分析、时序分析、统计分析、网络分析等各种不同的分析方法和处理工具,需要大量的专业知识和技能才能正确执行社交媒体数据的分析操作。面对特定的社交媒体时空分析应用需求,需要选取适当的社交媒体来源采集相关数据,选择可行的时空分析工具,并按照正确的流程执行才能达到目的。目前的社交媒体时空分析流程建模仍依赖有经验的领域专家手工构建。在已有的社交媒体时空分析研究的文献中也针对一些特定场景和应用需求提出了时空分析的流程。然而这些已有分析流程的可重复利用性十分有限,在应用中必须针对新的应用需求结合实际场景中可用的数据和计算资源重新构建分析流程。总而言之,目前的社交媒体数据分析流程的构建方法远远无法满足日益增长而又复杂多变的社交媒体时空分析需求。如何将已有研究中时空分析工作流构建所涉及的领域知识和实现技术以计算机能够理解的方式进行组织和管理,并利用这些知识实现社交媒体时空分析流程的智能化快速构建,是提高社交媒体数据时空分析应用转化效率,满足日益增长的行业应用需求所亟待解决的重要难题。针对上述问题,本文从社交媒体时空分析的典型应用场景入手,以语义网知识表达与人工智能规划技术为基础,提出了社交媒体时空分析流程建模所需的知识描述框架和分析流程模型的智能化构建方法,实现社交媒体数据的时空语义模型的构建和时空分析流程知识的共享与互联,进而实现面向典型应用需求和场景可感知的社交媒体时空分析流程构建。本文的研究工作主要包括:(1)研究社交媒体时空分析领域知识的建模方法,实现社交媒体领域概念、数据、分析方法等的语义描述,为社交媒体时空分析流程智能建模提供领域知识基础;(2)研究时空分析流程知识的建模方法,将时空分析流程模型构建过程中所涉及的需求、应用场景、解决方案等专业知识以形式化的方式进行语义建模,实现流程知识的共享与互联:(3)以人工智能规划算法为基础,研究社交媒体时空分析流程的自动构建方法,综合利用社交媒体时空分析领域知识和时空分析流程知识,实现面向典型应用需求的、场景可感知的社交媒体时空分析流程的智能化构建。为了验证上述方法的可行性和有效性,本文选取了突发事件应急响应和城市功能区分析这两个案例作为社交媒体时空分析的典型场景,构建了相关的领域知识库和流程知识库,设计并实现了时空分析流程智能构建的实验原型系统,并在此基础上进行了时空分析流程智能构建的实验。实验结果表明,本文所提出的方法能够有效降低社交媒体时空分析流程构建的复杂程度,提高流程模型的构建效率和质量,促进社交媒体时空分析相关研究成果的推广应用。