公交车载WiFi用户网络行为分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zhangliye5
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着手机终端的大屏化和手机应用体验的不断提升,手机作为网民主要上网终端的趋势进一步明显,互联网应用移动化宽带化的需求日益明显。与此同时,WiFi作为无线宽带接入的主要技术之一,具有技术成熟,成本低廉,应用广泛等优点。许多公司结合公共交通系统和WiFi技术,希望为乘客带来更多有价值的增值服务的同时,构建基于公共交通WiFi网络的、以大数据为依托的“入口+平台+服务”生态链。公交车载WiFi用户产生了大量的网络数据,这些数据具有很大的研究价值。通过对这些数据进行挖掘,有利于我们找到规律,理解群体的行为特点,进而为用户群体标签、广告推荐、运营管理等诸多应用提供理论和技术支持。针对这一背景,本文通过对公交车载WiFi用户网络行为的分析,构建行为模式挖掘模型,目标是分析用户行为特点和挖掘用户的潜在行为模式。本文首先从用户网络行为分析的研究背景、国内外研究现状出发,根据公交车载WiFi用户网络行为的数据,借助分布式平台Hadoop和数据流处理引擎Pig,分析了公交车载WiFi下用户网络行为的点击次数、消耗流量、手机品牌、网站类型偏好和上网时段等属性。本文在上面的统计分析工作基础上,提取最重要的1000个网站并且用App分类方式对这1000个网站贴上类型标签,从而得到反映用户行为类别的特征,然后对用户行为类别进行了分析。在此基础上,我们结合分布式机器学习工具Spark MLlib对用户进行聚类,并通过TF-IDF算法提取新的特征,从而改进聚类结果。接着对改进后的聚类结果分析,找到主流的4种类型模式,取得了令人满意的结果。最后,本文对上述工作背后的系统进行了介绍,就数据预处理模块、数据分析模块、数据挖掘模块进行了详细描述。
其他文献
随着科学技术的发展,人们对移动通信服务的需求越来越高。如何在日趋复杂的电磁环境下实现高速地无线数据传输并降低对系统频率资源的占用,已成为无线通信系统研究的热点问题
摘 要:应用差示扫描量热法( DSC )技术测试了三层PE防腐管道中环氧粉末在不同升温速率下的动态DSC曲线,运用温度-升温速率  (T-β)图外推法获得了该管道用环氧粉末涂料的固化工艺参数,即凝胶温度(Tg)、固化温度(Tc)和后处理温度(Tt)。并采用Kissinger方程构建固化反应动力学模型,预测了不同温度条件下该管道用环氧粉末的反应速率常数,通过分析比较,认为:DSC技术可充分的应用到管
进入21世纪以来,随着老龄化社会的到来,心脑血管疾病已经成为了威胁人类生命的重要因素,促进了心电监护类设备的强劲市场需求。然而,传统设备由于数据传输线缆的限制,使用不
认知无线电是能够提高频谱利用率的新技术,它采用频谱共享的方式使认知用户与主用户共同利用授权频带进行通信,但是认知用户的发射功率会对主用户的通信产生干扰。为了保证主
随着通信技术的发展,无线电设备大量增加导致了无线频谱资源日益紧张。目前频谱的分配方式是固定频谱分配,但是该方式会导致频谱利用率的低下。为了改变这种方式,认知无线电(Cogn
图像分割可看作是一种把已获得的图像区分成若干个子图的技术,子图被认为是有意义的区域并且区域与区域之间必然是互不重合的。近年来,图论(Graph Theory)是研究图像分割的一
随着无线通信与网络技术的高速发展和Web的广泛应用,越来越多的多媒体业务在有线-无线异构IP网络中传输,这些业务对数据传输的带宽、延时、抖动都有更高的要求。因此如何改善
针对无线传感器网络能量受限、网络拓扑动态变化的特点,提高能量效率和可扩展性是无线传感器网络MAC协议设计的主要目标。S-MAC协议是一种典型的基于竞争的MAC协议,具有良好
供电网络不是转为通信使用设计的,信道衰减非常大并且随着频率变化而变化,线路负载和衰落的变化速度快,同时噪声环境非常恶劣。所以需要调制解调技术以便实现数据信号在电力
无线组播与传统的单播通信方式有着明显的区别,需要利用无线广播特性(WBA,Wireless Broadcast Advantage)构造高效的组播树来实现组播传输。然而,无线广播特性在满足无线组播