论文部分内容阅读
互联网是人们获取信息的重要工具,在现实感知领域扮演着重要角色。随着互联网的不断发展,信息呈现出了爆炸式的增长速度,信息传播的速度取得了前所未有的提高,海量信息存在难以处理的问题。微博呈现出的短文本、分享、互动的特质使其在互联网现实感知研究中成为很好的数据源。
本研究从微博是否可以作为感知现实世界的工具以及如何感知这两个问题出发,采用文献调研、网络调研等方式对基于微博数据的互联网现实感知的可行性进行研究,给出感知流程和技术方案。之后,采用具体场景对研究假设进行论证,借助时间序列预测模型、地理信息技术对感知结果进行实证分析。为基于互联网现实感知理论研究和实际应用提供参考,弥补国内外相关研究领域的不足。
本研究分为两个部分,首先是对基于微博数据的互联网现实感知模型相关理论与技术进行研究,建立模型;之后采用“甲流”事件对模型进行实证分析。具体内容包括:
(1)通过文献调研方法分析微博数据特性;采取网络调研的方式对微博平台与网络数据获取方法进行调研;对时间序列分析概念与算法进行研究。
(2)在调研基础上选取合适的平台和数据采集接口,进行爬虫的设计与微博数据数据库设计;建立基于微博数据的互联网现实感知模型,对目标事件进行定义,感知、识别、呈现流程的实现进行详细的描述与说明。
(3)以“甲流”事件作为目标事件进行实证分析,给出时间序列、地理分布感知结果,并采取多渠道数据进行对比验证。
主要研究成果包括:
(1)在理论研究的基础上,构建一个基于微博数据的互联网现实感知模型,形成具有一定普遍性的指导框架。
(2)以定量的方式对微博文进行分析和挖掘,从目标事件/话题入手,从多个维度呈现感知结果,结合地理信息系统作为结果呈现的一部分。
(3)通过实证研究的方法,以“甲流”作为目标事件,对基于微博数据的现实感知模型的感知结果与真实情况是否相同。