基于聚类技术的校园网络用户行为数据分析研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:kjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,随着校园网络用户个性化需求的日益增长,网络信息服务的使用从集中统一型向分布式个性化演进,校园网络中的用户有着各自的上网习惯和兴趣,各用户使用网络的时间、服务及关注的内容焦点都有差异。校园网络服务也从传统的网络聊天、浏览新闻网页等方面向更细致、更个性化的服务转变,如网络购物、网络课堂、娱乐游戏等,这为校园网络用户提供了极大的便利。然而,现阶段的个性化校园网络用户服务在及时性、稳定性等方面仍无法满足实际应用的需求,因此,为校园网用户提供更加及时、更高质量的网络服务,成为网络用户行为的研究方向之一。本文将借助挖掘处理、聚类分析技术来研究网络用户的行为,并进一步分析网络用户的兴趣和需求,以优化用户体验。高等院校内的校园网使用者有着比较高的文化教育水平和专业水平,并且不同的用户有着不同的网络使用习惯以及更加个性化的网络需求,因此,在校园网中获取的数据相比社会网络数据有着更高的可研究性。本文的主要研究工作和创新点概括如下:1.本文梳理了近年来国内外有关网络用户行为的分析研究现状,归纳总结出校园网络用户行为的概念及特点、数据挖掘的流程和方法,并根据校园网络用户行为分析数据的特点,选择了K-means聚类算法进行改进,并用于聚类分析。2.本文在传统经典的K-means聚类算法的基础上,提出了基于兴趣矩阵的相似度计算方法。该算法通过构造用户兴趣度矩阵的方式改进了用户间相似度的计算方法,即用户的上网行为以矩阵的形式表示出来,其中,每个矩阵有七行,每一行表示日期的记录,即(周一、周二...周日),每个矩阵元素表示在某影响条件分类下网络使用量占当天总使用量的比重值,每一列表示网络用户在同一影响条件分类下,不同日期的网络使用量占当天总使用量的比重值,进而使用聚类技术,对校园局域网用户行为进行相似度计算。该算法在一定程度上降低了无效数据的影响,提高了用户行为相似度聚类的时效性和有效性,能够较好的应用于校园局域网用户行为的具体研究中。3.本文提出了对影响用户行为的条件进行筛选的算法,即根据用户行为随条件变化的波动情况来对该条件进行有效性判定。在校园局域网中,影响用户行为的可能条件比较多,例如上网的时间和上网位置等等,因此,能够科学的筛选出有效的影响条件是校园局域网用户行为研究的一个重要部分。相对于传统的人工的筛选方法来讲,该方法减少了人为干预的主观随意性,条件筛选结果更为严谨。
其他文献
射频识别,又名称为无线射频识别(RFID),它是利用射频信号的空间耦合性从而实现对目标对象的非接触式自动识别,而不需识别工作系统与特识别目标对象之间建立机械或光学接触,它
学位
本文提出了一个基于上下文语义的图像编辑算法,分析了图像的上下文语义特征,并将其应用到图像编辑技术中。图像语义是人们对图像的直观感受,包括人们对图像中对象的理解和隐
在现在信息和知识驱动的信息化环境中,数据在各个组织内部及之间进行流动的速度逐步加快,在出现紧急情况的时候需要能迅速地决定对敏感数据的访问,并保证这些敏感信息不被无
随着IBM提出的“智慧地球”被列为美国国家战略以后,我国国务院总理温家宝在无锡视察时也提出了“感知中国”的思想。作为“智慧地球”、“感知中国”核心的“物联网”在世界
学位
随着计算机视觉技术不断的发展,图像融合中的图像配准技术已经广泛地应用在医学领域、遥感领域、军事领域等许多领域中。图像配准是为了更全面的了解同一个事物的信息,而对这
互联网技术的快速发展,导致在网络实际应用中产生了各种各样的数据。例如,网上、实体超市中产生的零售商品数据、无线传感器网络收集的数据和GPS定位系统中获取的地理位置信
PDF格式以其生成快捷、高度仿真和高压缩率等优点逐渐成为局域网环境中通用的电子文档格式。与此同时PDF文档格式的安全性问题也日益引起人们的关注。Adobe公司提供的标准口
随着信息社会的发展,信息安全已成为一个关系到国家的政治稳定、社会安定等的一个全局性问题。而访问控制是信息安全保障机制的核心内容,它是计算机系统最重要的安全机制。它通
红外图像增强技术是ART(自动目标识别)及红外成像目标跟踪系统中重要的预处理技术。红外图像普遍具有对比度、分辨率低,噪声大等特点,不利于后续的识别、跟踪应用,因此,红外