论文部分内容阅读
摘要:随着越来越多的校园用户使用校园无线网上网,对于用户相关行为的分析研究就显得尤为重要。该文基于校园无线网数据设计并实现一个能够进行用户行为分析的系统,该系统能够评估校园无线网的运行状态并分析用户的移动轨迹。系统以华南师范大学校园无线网络数据为例进行测试,并以地图、表格等在线方式显示了用户移动轨迹、用户设备区分等用户行为分析结果。
关键词:无线局域网;用户行为;用户移动轨迹;行为分析
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)03-0025-03
1 研究背景
校园无线网的快速发展,移动终端、App的大量丰富与普通应用,使得用户越来越多地使用并依赖于无线网络,产生了大量的无线数据,这些数据包括校园师生主动产生和各种终端设备自动搜集的数据,如:通过各种即时通信软件(QQ、微信等)分享自己的想法与兴趣、用户接入使用无线网络的连接信息、无线位置信息等。随着这些无线数据的大量产生及数据类型的不断丰富,如何利用这些数据更好地为广大师生提供服务,以及为学校管理提供更好的决策依据,是校园无线网未来发展的重点方向。
校园用户是校园无线网中的行动主体,分析研究无线网络中的用户行为数据有助于挖掘校园用户的行为特点及其行为表现出来的规律。不仅如此,对无线网络的用户行为进行分析研究还能为无线网络管理提供优化调整网络的科学数据、为用户提供更有针对性的网络服务、为教学活动提供技术支持及描述用户的移动轨迹和社会关系等。为了更好的建设校园无线网和为用户提供更好的无线网络服务,对无线网络用户行为进行系统化的分析研究十分必要。
2 校园无线网用户行为分析的应用
2.1 校园WLAN优化
现在的校园无线局域网时常会面临着如频率干扰、负载不均衡、用户无法接入网]、用户吞吐率较低等问题。面对些问题,可以通过分析校园无线网络的用户行为数据,从而優化无线网络来解决,能够有效地提高校园无线网络的信息服务质量。例如,通过对校园无线网络的用户行为进行分析研究,可以发现、预测用户的网络需求,有助于根据实际情况优化信息服务种类和服务水平。
2.2 学生管理
通过分析研究校园无线网的用户行为数据可以挖掘出用户的行为规律与生活习惯等,为学校管理提供更好的支持。
1) 学生失联预警。通过学生用户的上网行为规律与上网记录来判断学生的在校情况,甄别出非假期期间长时间不在校学生,提供给学校相关部门检查确认,及时发现学生失联情况,以更好地保障学生安全。
2) 日常教学活动管理。比如通过分析教学楼不同时间段的无线网络在线用户人数变化,结合学校的教学安排,可以统计出上课时间学生出勤人数及有多少学生在课余时间喜欢去教学楼自习,学校可以根据这些数据加强学生考勤管理、或给自修的学生提供一些空余且相对安静的教室。另外,可以将课表结合终端的位置时间进行课程信息的推送等等。
2.3 用户移动轨迹分析
在校园环境中,校园用户一般有较固定的活动地点,比如学生的日常行为包括在教学楼上课、在图书馆自习、在饭堂吃饭、在宿舍休息等,通过分析用户每次上线下线时与AP(Wireless Access Point 无线访问接入点)的关联信息,结合AP的地理位置,可以挖掘出用户的移动轨迹,也就是用户到了哪些地方,分别停留了多久,这有利于学校了解校园里教师与学生的行为习惯,可以为高校管理提供了一个便捷、可靠的方式,而且,对师生的工作、学习、生活都有很大的好处。
1) 基于群体用户移动性规律,发现热点区域,进而研究校园里不同热点区域的用户流动性。基于个人用户轨迹数据,可以提取个体用户行为特征,进行正常行为及可疑行为判别等。
2) 利用用户移动轨迹区分无线网络中终端设备的拥有者,从而统计出使用无线网络的真实用户。现在校园里有许多用户拥有两个及以上移动终端,使用相同的账号上网,或者是同一台移动终端借用他人的账号接入使用无线网络,如果仅是利用移动终端的MAC(Medium Access Control媒体访问控制)地址来标识用户,则统计出来用户人数要远大于真实的用户人数,不能准确的描述用户的行为规律,因此需要区分不同移动终端是否属于同一个用户所有。同一用户使用所拥有的不同设备在上网行为、移动性方面具有较高的相似性,甚至是一致的,因此可以通过对比不同移动终端的移动轨迹数据来区分使用同一个账号上网的不同移动终端是否属于同一个用户所有。
总的来说,校园无线网用户行为分析在反映网络性能的同时,也可以反映出用户的某些行为规律、偏好和生活习惯等等,不仅能指导将来的校园无线网建设,提高校园信息服务质量与用户体验,也能为学校了解师生及管理提供有力的帮助,具有很好的应用前景和重要的实用意义。
3 系统方案设计
3.1 系统逻辑结构
系统基于B/S架构设计,其系统结构图如图1所示,其系统工作流程如下所述:首先是获取校园无线网络数据,并通过预处理后,将得到的AC(Wireless Access Point Controller 无线控制器)、AP与其他的用户数据存放到设计好的数据库中,然后以WEB方式从数据库中获取相应的数据并显示出来。系统共分为三个主要部分:
第一层为数据采集与预处理部分。采集来自校园无线网络相关数据,并通过系统进行预处理后,存储在已设计好的系统数据库中。采集的数据包括AC、AP等基本信息,同时包括用户上线、下线等各种日志信息;数据预处理包括去除收集到的存在缺失值或不一到状态的数据记录等。
第二层为中间层。负责将采集的原始的数据进行处理,通过统计分析后将得到的网络性能数据、用户轨迹数据存入数据库中。
第三层是管理应用层。实现用户行为分析结果的显示,WEB服务根据不同的查询条件从数据库中查询数据,并以图形化界面显示查询结果,方便用户查看。 3.2 系統功能模块设计
系统的功能模块包括WLAN运行状况显示、用户一般性统计、用户移动轨迹显示、学生失联预警及用户设备区分5个部分。系统的功能模块框架图如图2所示。
1) WALN运行状况。WALN运行状况功能模块包括AC运行状况显示模块与AP显示模块。其中AC运行状况主要显示了AC当前所管理的AP、AC在线用户人数随时间变化情况;AP显示模块显示了各个楼宇AP的分布情况和运行情况。
2) 用户一般性统计。用户一般性统计包括用户终端厂商统计与用户在线情况显示模块。用户终端厂商统计显示了用户所使用设备的品牌及所属品牌设备的数量;用户在线情况显示了各楼宇在线用户人数随时间变化的情况。
3) 用户移动轨迹。用户移动轨迹用于显示用户日常的移动范围,挖掘用户的行为规律。
4) 学生失联预警。学生失联预警通过分析学生用户上网记录对非假期期间长时间不在校的学生用户进行归类,并列出预警名单提交给学校的相关管理部门。
5) 用户设备区分。用户设备区分指的是同一用户使用多个终端设备接入无线时,对不同终端设备进行对比识别,区分不同的终端设备是否属于同一用户所有。在早期的无线网络用户行为研究中单个用户拥有的接入无线网络的终端设备数量有限,研究者多以MAC地址来区分不同的用户,可以统计出比较真实的用户情况,然而,近几年来,随着智能手机、平板电脑等无线移动智能终端的普及,多数校园用户往往同时拥有多个无线移动设备,这样使得用户可以通过多个设备接入与使用无线网络,如果我们依然釆用终端设备的MAC地址来区分不同的用户,则用户行为分析结果可能会出现较大的偏差。因此,区分多个终端设备是否归属于同一个用户就显得很有意义,不仅能够统计出真实的用户,也能更精确的刻画用户的移动轨迹。
4 实验结果与分析
本文采集华南师范大学无线网络数据进行测试,主要测试了用户终端厂商统计、用户移动轨迹、学生失联预警、用户设备区分功能。并通过WEB以地图、表格等在线方式显示了实验结果
1) 用户终端厂商统计。用户终端厂商统计基于终端的MAC地址进行匹配。每个移动终端都有一个固定的MAC地址,且每一个MAC地址都是全球唯一的。任何正规厂家生产的网卡上都直接标明了MAC地址,所有MAC地址的长度都是48位,通常表示为一组12位的16进制数,如0C-D6-BD-90-C4-97,其中前6位代表网卡的生产厂商(如0C-D6-BD表示了该网卡的制造商是华为),后6位由厂家自己分配,标识了设备本身,因此MAC地址作为独一无二的物理地址可以用于标识一台终端设备乃至一个用户(这里指在不区分同一用户同时拥有多个终端设备的情况下)。在用户终端厂商统计模块的实现中,我们采集了一周的终端设备数据集,并将其MAC地址与IEEE组织提供的厂商列表进行匹配。
本文中用户终端厂商统计模块统计了华为、苹果、小米、三星、酷派、魅族、中兴、OPPO等品牌的终端数量,结果如图3所示。
2) 用户移动轨迹。用户移动轨迹利用用户与AP的连接情况来判断用户移动性,描述了用户一定时间内所移动的范围,可以更好地了解用户日常活动空间与用户聚集的热点区域。图4及图5显示了用户群体的移动轨迹,可以看出,公共教学楼、图书馆、学生宿舍的用户人数比较多,其次是饭堂及各学院办公楼。
3) 学生失联预警。通过收集一个月以来接入使用无线网络的用户,共有18344个,然后统计了在数据收集截止日期前3天以来没有再上线的用户,结合用户的上线记录进行区分是否属于有失联情况的用户,最后的甄别出了23个异常用户。
4) 用户设备区分。以某一个用户“方xx”为例,用户“方xx”的上网账号是201603xxxxx。区分前,有103个终端设备使用账号201603xxxxx上网,部分数据记录如图6所示。但仔细观察发现,除了mac为f40f.241f.5913登录次数为107,且长期使用外,其他的登录数据98%以上的终端都只登录一次,偶尔有登录2次或3次,但使用的时间短,而且每次在线时间较短,这部分数据有可能是该用户将上网账户借给他人使用而产生的,应该将其去除。通过算法运算后,系统分析推测出只有一个终端设备才是真正属于用户“方xx”的,该终端设备的mac为f40f.241f.5913,区分结果如图7所示。
5 结束语
本文在校园无线网络数据的基础上,设计了用户行为分析系统,该系统能够对校园无线网络数据进行统计分析,刻画用户的移动轨迹,实现用户设备区分、学生失联预警等功能。对于校园无线网络数据的统计分析可以有效应用于指导或改进无线局域网的建设,而分析研究用户的移动轨迹则可以应用于个性化服务设计、对用户进行网络画像、寻找用户热点区域等多种领域。
参考文献:
[1] 郑宇,谢幸.基于用户轨迹挖掘的智能位置服务[J].中国计算机学会通讯, 2010,6(6):23-30.
[2] 苏孝强,倪宏,马永帅.移动环境下基于用户轨迹的社交亲近度研究[J].微计算机信息,2011(5):7-9.
[3] 吴利兵.无线网络环境下用户行为的社会性分析[D].上海交通大学,2012.
[4] MAC Address[EB/OL], http://standards-oui.ieee.org/oui/oui.txt. 2016.
关键词:无线局域网;用户行为;用户移动轨迹;行为分析
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)03-0025-03
1 研究背景
校园无线网的快速发展,移动终端、App的大量丰富与普通应用,使得用户越来越多地使用并依赖于无线网络,产生了大量的无线数据,这些数据包括校园师生主动产生和各种终端设备自动搜集的数据,如:通过各种即时通信软件(QQ、微信等)分享自己的想法与兴趣、用户接入使用无线网络的连接信息、无线位置信息等。随着这些无线数据的大量产生及数据类型的不断丰富,如何利用这些数据更好地为广大师生提供服务,以及为学校管理提供更好的决策依据,是校园无线网未来发展的重点方向。
校园用户是校园无线网中的行动主体,分析研究无线网络中的用户行为数据有助于挖掘校园用户的行为特点及其行为表现出来的规律。不仅如此,对无线网络的用户行为进行分析研究还能为无线网络管理提供优化调整网络的科学数据、为用户提供更有针对性的网络服务、为教学活动提供技术支持及描述用户的移动轨迹和社会关系等。为了更好的建设校园无线网和为用户提供更好的无线网络服务,对无线网络用户行为进行系统化的分析研究十分必要。
2 校园无线网用户行为分析的应用
2.1 校园WLAN优化
现在的校园无线局域网时常会面临着如频率干扰、负载不均衡、用户无法接入网]、用户吞吐率较低等问题。面对些问题,可以通过分析校园无线网络的用户行为数据,从而優化无线网络来解决,能够有效地提高校园无线网络的信息服务质量。例如,通过对校园无线网络的用户行为进行分析研究,可以发现、预测用户的网络需求,有助于根据实际情况优化信息服务种类和服务水平。
2.2 学生管理
通过分析研究校园无线网的用户行为数据可以挖掘出用户的行为规律与生活习惯等,为学校管理提供更好的支持。
1) 学生失联预警。通过学生用户的上网行为规律与上网记录来判断学生的在校情况,甄别出非假期期间长时间不在校学生,提供给学校相关部门检查确认,及时发现学生失联情况,以更好地保障学生安全。
2) 日常教学活动管理。比如通过分析教学楼不同时间段的无线网络在线用户人数变化,结合学校的教学安排,可以统计出上课时间学生出勤人数及有多少学生在课余时间喜欢去教学楼自习,学校可以根据这些数据加强学生考勤管理、或给自修的学生提供一些空余且相对安静的教室。另外,可以将课表结合终端的位置时间进行课程信息的推送等等。
2.3 用户移动轨迹分析
在校园环境中,校园用户一般有较固定的活动地点,比如学生的日常行为包括在教学楼上课、在图书馆自习、在饭堂吃饭、在宿舍休息等,通过分析用户每次上线下线时与AP(Wireless Access Point 无线访问接入点)的关联信息,结合AP的地理位置,可以挖掘出用户的移动轨迹,也就是用户到了哪些地方,分别停留了多久,这有利于学校了解校园里教师与学生的行为习惯,可以为高校管理提供了一个便捷、可靠的方式,而且,对师生的工作、学习、生活都有很大的好处。
1) 基于群体用户移动性规律,发现热点区域,进而研究校园里不同热点区域的用户流动性。基于个人用户轨迹数据,可以提取个体用户行为特征,进行正常行为及可疑行为判别等。
2) 利用用户移动轨迹区分无线网络中终端设备的拥有者,从而统计出使用无线网络的真实用户。现在校园里有许多用户拥有两个及以上移动终端,使用相同的账号上网,或者是同一台移动终端借用他人的账号接入使用无线网络,如果仅是利用移动终端的MAC(Medium Access Control媒体访问控制)地址来标识用户,则统计出来用户人数要远大于真实的用户人数,不能准确的描述用户的行为规律,因此需要区分不同移动终端是否属于同一个用户所有。同一用户使用所拥有的不同设备在上网行为、移动性方面具有较高的相似性,甚至是一致的,因此可以通过对比不同移动终端的移动轨迹数据来区分使用同一个账号上网的不同移动终端是否属于同一个用户所有。
总的来说,校园无线网用户行为分析在反映网络性能的同时,也可以反映出用户的某些行为规律、偏好和生活习惯等等,不仅能指导将来的校园无线网建设,提高校园信息服务质量与用户体验,也能为学校了解师生及管理提供有力的帮助,具有很好的应用前景和重要的实用意义。
3 系统方案设计
3.1 系统逻辑结构
系统基于B/S架构设计,其系统结构图如图1所示,其系统工作流程如下所述:首先是获取校园无线网络数据,并通过预处理后,将得到的AC(Wireless Access Point Controller 无线控制器)、AP与其他的用户数据存放到设计好的数据库中,然后以WEB方式从数据库中获取相应的数据并显示出来。系统共分为三个主要部分:
第一层为数据采集与预处理部分。采集来自校园无线网络相关数据,并通过系统进行预处理后,存储在已设计好的系统数据库中。采集的数据包括AC、AP等基本信息,同时包括用户上线、下线等各种日志信息;数据预处理包括去除收集到的存在缺失值或不一到状态的数据记录等。
第二层为中间层。负责将采集的原始的数据进行处理,通过统计分析后将得到的网络性能数据、用户轨迹数据存入数据库中。
第三层是管理应用层。实现用户行为分析结果的显示,WEB服务根据不同的查询条件从数据库中查询数据,并以图形化界面显示查询结果,方便用户查看。 3.2 系統功能模块设计
系统的功能模块包括WLAN运行状况显示、用户一般性统计、用户移动轨迹显示、学生失联预警及用户设备区分5个部分。系统的功能模块框架图如图2所示。
1) WALN运行状况。WALN运行状况功能模块包括AC运行状况显示模块与AP显示模块。其中AC运行状况主要显示了AC当前所管理的AP、AC在线用户人数随时间变化情况;AP显示模块显示了各个楼宇AP的分布情况和运行情况。
2) 用户一般性统计。用户一般性统计包括用户终端厂商统计与用户在线情况显示模块。用户终端厂商统计显示了用户所使用设备的品牌及所属品牌设备的数量;用户在线情况显示了各楼宇在线用户人数随时间变化的情况。
3) 用户移动轨迹。用户移动轨迹用于显示用户日常的移动范围,挖掘用户的行为规律。
4) 学生失联预警。学生失联预警通过分析学生用户上网记录对非假期期间长时间不在校的学生用户进行归类,并列出预警名单提交给学校的相关管理部门。
5) 用户设备区分。用户设备区分指的是同一用户使用多个终端设备接入无线时,对不同终端设备进行对比识别,区分不同的终端设备是否属于同一用户所有。在早期的无线网络用户行为研究中单个用户拥有的接入无线网络的终端设备数量有限,研究者多以MAC地址来区分不同的用户,可以统计出比较真实的用户情况,然而,近几年来,随着智能手机、平板电脑等无线移动智能终端的普及,多数校园用户往往同时拥有多个无线移动设备,这样使得用户可以通过多个设备接入与使用无线网络,如果我们依然釆用终端设备的MAC地址来区分不同的用户,则用户行为分析结果可能会出现较大的偏差。因此,区分多个终端设备是否归属于同一个用户就显得很有意义,不仅能够统计出真实的用户,也能更精确的刻画用户的移动轨迹。
4 实验结果与分析
本文采集华南师范大学无线网络数据进行测试,主要测试了用户终端厂商统计、用户移动轨迹、学生失联预警、用户设备区分功能。并通过WEB以地图、表格等在线方式显示了实验结果
1) 用户终端厂商统计。用户终端厂商统计基于终端的MAC地址进行匹配。每个移动终端都有一个固定的MAC地址,且每一个MAC地址都是全球唯一的。任何正规厂家生产的网卡上都直接标明了MAC地址,所有MAC地址的长度都是48位,通常表示为一组12位的16进制数,如0C-D6-BD-90-C4-97,其中前6位代表网卡的生产厂商(如0C-D6-BD表示了该网卡的制造商是华为),后6位由厂家自己分配,标识了设备本身,因此MAC地址作为独一无二的物理地址可以用于标识一台终端设备乃至一个用户(这里指在不区分同一用户同时拥有多个终端设备的情况下)。在用户终端厂商统计模块的实现中,我们采集了一周的终端设备数据集,并将其MAC地址与IEEE组织提供的厂商列表进行匹配。
本文中用户终端厂商统计模块统计了华为、苹果、小米、三星、酷派、魅族、中兴、OPPO等品牌的终端数量,结果如图3所示。
2) 用户移动轨迹。用户移动轨迹利用用户与AP的连接情况来判断用户移动性,描述了用户一定时间内所移动的范围,可以更好地了解用户日常活动空间与用户聚集的热点区域。图4及图5显示了用户群体的移动轨迹,可以看出,公共教学楼、图书馆、学生宿舍的用户人数比较多,其次是饭堂及各学院办公楼。
3) 学生失联预警。通过收集一个月以来接入使用无线网络的用户,共有18344个,然后统计了在数据收集截止日期前3天以来没有再上线的用户,结合用户的上线记录进行区分是否属于有失联情况的用户,最后的甄别出了23个异常用户。
4) 用户设备区分。以某一个用户“方xx”为例,用户“方xx”的上网账号是201603xxxxx。区分前,有103个终端设备使用账号201603xxxxx上网,部分数据记录如图6所示。但仔细观察发现,除了mac为f40f.241f.5913登录次数为107,且长期使用外,其他的登录数据98%以上的终端都只登录一次,偶尔有登录2次或3次,但使用的时间短,而且每次在线时间较短,这部分数据有可能是该用户将上网账户借给他人使用而产生的,应该将其去除。通过算法运算后,系统分析推测出只有一个终端设备才是真正属于用户“方xx”的,该终端设备的mac为f40f.241f.5913,区分结果如图7所示。
5 结束语
本文在校园无线网络数据的基础上,设计了用户行为分析系统,该系统能够对校园无线网络数据进行统计分析,刻画用户的移动轨迹,实现用户设备区分、学生失联预警等功能。对于校园无线网络数据的统计分析可以有效应用于指导或改进无线局域网的建设,而分析研究用户的移动轨迹则可以应用于个性化服务设计、对用户进行网络画像、寻找用户热点区域等多种领域。
参考文献:
[1] 郑宇,谢幸.基于用户轨迹挖掘的智能位置服务[J].中国计算机学会通讯, 2010,6(6):23-30.
[2] 苏孝强,倪宏,马永帅.移动环境下基于用户轨迹的社交亲近度研究[J].微计算机信息,2011(5):7-9.
[3] 吴利兵.无线网络环境下用户行为的社会性分析[D].上海交通大学,2012.
[4] MAC Address[EB/OL], http://standards-oui.ieee.org/oui/oui.txt. 2016.