论文部分内容阅读
Web使用挖掘就是从服务器日志文件和客户交易数据中挖掘有意义的用户访问模式和潜在的客户群,使企业能够提供个性化信息服务和开展有针对性的电子商务活动。随着越来越多的业务在互联网上开展,用户使用Web的规律成了各企业共同关注的一大热点。因此,采用Web挖掘智能地、自动地提取出有价值的知识,构建自适应网站,提高WWW的效率,具有十分重要的现实意义和广阔的应用前景。基于国内外最新研究成果,论述了Web使用挖掘的内容、特点和挖掘过程。定义了自适应网站,提出了基于Web挖掘实现自适应网站的一种方案:在已存在的站点上进行用户访问模式挖掘,预测用户感兴趣的页面,并以增加链接的方式把指向这些页面的链接推荐给用户,动态地改变网站结构。给出了系统体系结构,阐述了系统实现的目标、设计所遵循的原则和源数据的收集等主要问题描述了系统挖掘用户访问模式的过程和算法。提出了一种预处理功能模型,采用基于cookie技术和扩充日志属性的用户识别方法,有效地识别通过同一代理服务器访问网站的不同用户。采用了一种扩展性良好、高效多能的聚类分析算法对用户访问模式进行挖掘,即直接对网站的拓扑结构和用户浏览信息进行处理的关联矩阵方法,避免了复杂的会话识别和事务识别。提出了自适应网站进行自动页面调整的方法,根据挖掘推荐结果,通过在网页中嵌入ASP代码的方式,用程序实现自动在页面中增加动态链接,对不同用户展现不同的网站视图,并给出了源程序。对系统进行了实际运行测试,得到了可行性验证。