论文部分内容阅读
随着网络资源的不断丰富和网络信息量的不断膨胀,信息过载和资源迷向已经成为制约人们高效使用Web信息的瓶颈。网站需要引入一种能够根据用户的兴趣爱好自动组织和调整信息的服务模式,即个性化服务方式,使信息服务方式从传统“一对多”发展到“一对一”,而利用Web使用挖掘技术已经成为个性化服务的一个研究热点。本文对国内外关于个性化技术的研究现状进行了综合分析比较,从一个全新的角度对基于Web使用挖掘的个性化技术进行了研究。首先,提出了具有实际意义的访问序列(有效访问序列),使页面可以重复点击(回退和刷新),而且项集中的页面可以相邻或近似相邻,然后在此基础之上提出了一种最大频繁项集挖掘算法,该算法采用叠加、合并、筛选的方法挖掘最大频繁项集,同时采用优化子集和忽略单页面检测策略,提高了算法的执行性能和效率。其次,提出了一种新的最大频繁序列模式有向图结构,并基于此有向图结构提出了一种个性化推荐算法,由于该方法只需访问有向图结构的若干子图,无需搜索整个模式库,大大缩短了模式匹配的时间,因而能够更好地满足页面推荐的实时需要。最后,通过实验来验证本文所提出的最大频繁项集挖掘算法及其在个性化推荐中应用的可行性和有效性,并分别比较了两种方法的效率。