基于大规模新浪微博数据的都市人群生活方式挖掘

来源 :山东大学 | 被引量 : 0次 | 上传用户:kensenwey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
世界上半数以上的人居住在都市,都市是现代社会的中心。都市人群的生活包括衣食住行、学习、娱乐等多个方面,研究都市人群生活现状,无论对于政府、企业、社会组织,乃至个人,都有着重要的现实意义。传统针对人群生活状态的研究多以调查问卷、访谈为主,需要投入大量人力物力,且耗费时间长。而近年来,随着社交网络平台的流行,大量的、多层次的、细粒度的用户数据可以越来越容易地被获得,社交网络平台中的数据为研究都市人群生活状态提供了一种新的可行方法。鉴于传统方法中存在的种种缺点以及新兴社交网络平台中的数据优势,本文首次提出利用新浪微博中的大规模用户数据来分析都市人群生活方式,并且以“都市人群睡眠质量评价”与“中国主要城市的主观幸福感分析”为具体切入点,结合实际数据阐述了文中方法的可行性。与传统方法相比,本文的创新性与主要贡献具体如下:一、设计了一种分布式新浪微博爬虫,可以快速按需获取新浪微博上的用户数据,到本文完成时,已成功获取微博平台上约110w都市用户的13亿条微博数据,为研究都市人群生活方式提供了重要的数据基础。二、首次提出利用微博中的大规模用户数据分析都市人群生活方式,并且以“都市人群睡眠质量评价”与“中国主要城市的主观幸福感分析”为具体问题进行解决,详细说明了文中方法的可行性。三、与传统方法中需要大量的人力物力不同,本文提出的方法可以在投入少量资源的情况下,利用大规模网络用户数据快速有效地分析出都市人群生活方式的相关信息。四、本文中提出的方法同时利用了微博用户数据中的文本信息与时空信息两个方面,并且给出具体数学模型,结合实际数据进行了准确的统计分析。分析数据文本与时空信息的方法具有良好的可扩展性,可以为日后进行相关研究的学者提供重要的参考信息。
其他文献
现代农业生产离不开环境控制,本文在对国内外温室智能控制进行深入分析的基础上,针对温室智能化控制存在的诸多因子,将智能传感器监测和单片机控制相结合,提出了基于单片机的温湿
H.264/AVC标准是ITU-T VCEG和ISO/IEC MPEG联合制定的新一代视频编码标准,它采用了一系列新技术成果,主要包括:空间域内的多模式帧内预测、1/4像素精度运动估计、整数DCT变换量
生物特征识别技术是通过生物统计学原理和计算机等高科技的技术手段密切结合,利用人体固有的行为特征和生理特性来进行个人身份的鉴定。它具有传统的身份鉴别方式所不能比拟
随着互联网的普及,信息安全问题越来越受到人们的关注,尤其是可信网络内部的安全问题。因此,安全审计系统应运而生。本文将信息过滤技术应用到安全审计的内容审计中,对于完善
随着机器视觉、深度学习等领域的高速发展,基于视觉的智能化屏幕检测算法接连提出。虽然这些算法的检测效果越来越好,但是无法适用于新型号的数据并且无法对缺陷进行精细的评
随着万维网的迅速发展以及信息技术在各个科学领域的普及,数据的表现方式在同一科学领域的不同机构之间已呈现出不同的特点,数据之间的共享以及集成成为对数据资源进行有效利
随着经济发展,物流作为我国的朝阳产业,其重要性逐渐显现出来,它越来越受到各个行业的重视。如何解决物流配送问题己成为降低成本、增加效益的重要研究课题。配送路线的合理
随着互联网技术飞跃性的发展,Web上的网站数量和网页数量正以指数级的速度快速增长。Web已经成为一个拥有海量数据,数据类型多样,数据结构各异巨大的数据源。Web数据集成系统
云计算自从诞生以来,就备受瞩目,得到了快速地发展。然而,随着云计算规模扩大以及复杂度的提高,遇到的新挑战也是不断出现。负载均衡问题就是其中之一。负载的过重会严重影响
群体动画技术在电影、游戏等多媒体领域有着广泛的应用,因此群体动画生成与编辑技术越来越成为运动编辑方向的研究热点。目前对于大规模多人行为模拟的生成与编辑两部分研究