论文部分内容阅读
在过去几年,随着互联网的快速发展,Web已真正成为多数公司的一个获取信息和宣传的渠道,并且影响力越来越大(比起其他的信息渠道,如电话销售、广告等等)。于是从Web站点上获取用户的访问信息进而去分析他们的行为成为一个大家关注的热点。因为从互联网经历了繁荣与萧条以来,互联网的投资就变得越来越谨慎,公司希望证明注入到该渠道的投资是有效的,同时想从很多方面观察它以证明其效果。因此Web Analytics(Web分析)变得异常的重要:有了它,在商业运作中,就能够为网站决策者提供投资的有效依据。同时,Web Analytics得到了用户有价值的访问信息,从而为吸引访问者,提供更便利的服务和产品带来了巨大的帮助,进而提高客户的个人网上消费。本文的出发点是以研究Web Analytics技术为目的,致力开发一种比较通用的网站分析服务系统,该系统能够为公司和个人网站提供良好的用户行为收集和分析的价值。本文中提及的网站分析服务系统全称叫“IBM Web Analytics”,它是本人在IBM中国研究院实习期间参与的Web Analytics研究课题。该系统经历了早期Web Analytics技术基础研究、Web Analytics设计阶段、Web Analytics平台的开发三个重要阶段。Web Analytics系统最核心也是难点的部分是数据收集与数据分析。本人在数据收集中采用的是基于目前流行的三种数据收集技术(Logfileanalysis、Page Tagging、Web Beacons),将三者优势整合而形成的一种通用数据收集机制。在数据分析中是采用Web Analytics技术中最新的用户行为分析模式。本人会在文中重点讲述这两个部分设计与实现。另外,本文还将着重深入探讨网站分析技术的核心概念和最前沿的发展状况。本文的意义在于:一方面,它对于网站分析和相关的网站数据挖掘提供了一个比较好的解决方案。同时,在各种测试环境下保证收集网站数据的完整性和可行性。另一方面,它提供了一个网站分析服务的典型案例,介绍了网站分析的核心技术原理,同时也深入解剖网站分析的核心概念,对于想了解Web Analytics学科的读者提供了一个基本的教程。