论文部分内容阅读
在浩如烟海的互联网信息世界中,人们高效率地获取所需信息越来越难。究其原因,一是由于信息资源的分散性和用户信息需求的有限性和动态性之间的矛盾,二是现有搜索引擎和信息服务工具存在缺陷与信息服务准确、实时的需求之间不相适应。比较好的解决方法就是寻求一种优秀的信息服务方式,使其更好地满足用户的需要。随着信息技术的迅速发展,根据每个用户的兴趣主动地为其提供个性化的信息已成为网络信息服务的发展趋势之一,这种针对每个用户的个性化信息服务是解决当前信息提供与需求之间矛盾的最好办法。但通过对当前个性化信息服务工具的研究,本文发现当前的个性化信息服务工具存在提供信息不准确,不能动态跟踪用户信息兴趣变化,需要用户参与过多的缺陷。针对这些问题,本文引进了点击流技术,提出一种新的个性化信息服务方案――基于点击流技术的个性化信息服务方案。方案的思路是利用信息用户点击网站页面所留下的点击流数据记录,分析用户的信息兴趣类型集合,进而以得出的用户兴趣类型集合为依据向网站信息客户推荐信息。方案的特点是及时地获取用户当前访问信息兴趣特征集合,准确全面地向用户推荐信息,无需用户参与其过程。通过对基于点击流技术的个性化信息服务方案,体系架构深入研究,本文提出了一个一般意义上的实施流程,通过建立点击流数据仓库收集点击流数据,并着重探讨了点击数据的主要来源Web日志文件的预处理;然后使用Web内容挖掘和用法挖掘相结合的方法对用户的点击事实进行分析,进而用分类、聚类算法得出用户访问信息兴趣特征集合;最后在此基础上向用户推荐信息。为了加强方案的可用性和推广意义,本文结合了医药行业的门户网站金药网对方案进行实际应用设计。在金药网的基于点击流技术的个性化信息服务应用研究中,本文的设计重点是点击流数据的预处理,用户访问信息兴趣分析,并根据分析主题建立了点击流数据集市。