论文部分内容阅读
该文提出一个基于Web日志的用户和URL聚类的快速算法。利用用户浏览行为建立用户事务矩阵,在此基础上综合考虑用户浏览时间以及点击频率来获取用户权值和页面权值,构建带权值的模糊聚类。为了缩小运算量,构造等价事务,进行事务约减;并针对于FCM算法簇数目初始化敏感的问题,提出了一种全局搜索的方法,搜寻最优的类中心数。实验证实,该算法在精度和效率上都获得了大大提高。