论文部分内容阅读
以网络日志作为研究数据,采用频繁序列挖掘和K-means聚类算法挖掘不同性别学生上网模式的区别。通过对比男女生在高、中、低三个不同频段的网络访问模式发现:在最常访问的网站类型上男女生并没有明显区别。男生更多地将网络用于娱乐和社交目的,而女生更多地把网络当做获取信息的工具。此外男生访问的网站类型比女生更丰富。同时,提出一种将序列转换成向量的方法 Bit Occurrence。