论文部分内容阅读
目前,随着校园网络用户个性化需求的日益增长,网络信息服务的使用从集中统一型向分布式个性化演进,校园网络中的用户有着各自的上网习惯和兴趣,各用户使用网络的时间、服务及关注的内容焦点都有差异。校园网络服务也从传统的网络聊天、浏览新闻网页等方面向更细致、更个性化的服务转变,如网络购物、网络课堂、娱乐游戏等,这为校园网络用户提供了极大的便利。然而,现阶段的个性化校园网络用户服务在及时性、稳定性等方面仍无法满足实际应用的需求,因此,为校园网用户提供更加及时、更高质量的网络服务,成为网络用户行为的研究方向之一。本文将借助挖掘处理、聚类分析技术来研究网络用户的行为,并进一步分析网络用户的兴趣和需求,以优化用户体验。高等院校内的校园网使用者有着比较高的文化教育水平和专业水平,并且不同的用户有着不同的网络使用习惯以及更加个性化的网络需求,因此,在校园网中获取的数据相比社会网络数据有着更高的可研究性。本文的主要研究工作和创新点概括如下:1.本文梳理了近年来国内外有关网络用户行为的分析研究现状,归纳总结出校园网络用户行为的概念及特点、数据挖掘的流程和方法,并根据校园网络用户行为分析数据的特点,选择了K-means聚类算法进行改进,并用于聚类分析。2.本文在传统经典的K-means聚类算法的基础上,提出了基于兴趣矩阵的相似度计算方法。该算法通过构造用户兴趣度矩阵的方式改进了用户间相似度的计算方法,即用户的上网行为以矩阵的形式表示出来,其中,每个矩阵有七行,每一行表示日期的记录,即(周一、周二...周日),每个矩阵元素表示在某影响条件分类下网络使用量占当天总使用量的比重值,每一列表示网络用户在同一影响条件分类下,不同日期的网络使用量占当天总使用量的比重值,进而使用聚类技术,对校园局域网用户行为进行相似度计算。该算法在一定程度上降低了无效数据的影响,提高了用户行为相似度聚类的时效性和有效性,能够较好的应用于校园局域网用户行为的具体研究中。3.本文提出了对影响用户行为的条件进行筛选的算法,即根据用户行为随条件变化的波动情况来对该条件进行有效性判定。在校园局域网中,影响用户行为的可能条件比较多,例如上网的时间和上网位置等等,因此,能够科学的筛选出有效的影响条件是校园局域网用户行为研究的一个重要部分。相对于传统的人工的筛选方法来讲,该方法减少了人为干预的主观随意性,条件筛选结果更为严谨。