基于Web使用挖掘的个性化技术研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:fmf001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络资源的不断丰富和网络信息量的不断膨胀,信息过载和资源迷向已经成为制约人们高效使用Web信息的瓶颈。网站需要引入一种能够根据用户的兴趣爱好自动组织和调整信息的服务模式,即个性化服务方式,使信息服务方式从传统“一对多”发展到“一对一”,而利用Web使用挖掘技术已经成为个性化服务的一个研究热点。本文对国内外关于个性化技术的研究现状进行了综合分析比较,从一个全新的角度对基于Web使用挖掘的个性化技术进行了研究。首先,提出了具有实际意义的访问序列(有效访问序列),使页面可以重复点击(回退和刷新),而且项集中的页面可以相邻或近似相邻,然后在此基础之上提出了一种最大频繁项集挖掘算法,该算法采用叠加、合并、筛选的方法挖掘最大频繁项集,同时采用优化子集和忽略单页面检测策略,提高了算法的执行性能和效率。其次,提出了一种新的最大频繁序列模式有向图结构,并基于此有向图结构提出了一种个性化推荐算法,由于该方法只需访问有向图结构的若干子图,无需搜索整个模式库,大大缩短了模式匹配的时间,因而能够更好地满足页面推荐的实时需要。最后,通过实验来验证本文所提出的最大频繁项集挖掘算法及其在个性化推荐中应用的可行性和有效性,并分别比较了两种方法的效率。
其他文献
可信软件的不断发展,进一步推动了形式化方法的深入研究。形式化方法具有严格的数学语言和精确的逻辑语义,从而保证软件在开发过程中的正确性。形式化方法主要包括形式化推导
随着信息时代的来临,信息技术的迅速发展加快了企业信息化的进程。现在的计算技术正经历着“以机器为中心→以应用为中心→以企业为中心”的变化,软件系统的开发也由技术驱动
随着科学的发展,科学对计算的要求不断提高。受到物理器件极限速度和技术水平的限制,单处理机远远满足不了现代许多领域中具有挑战性的大规模计算课题对计算资源的需求。利用