论文部分内容阅读
随着Internet的飞速发展,Web服务器上的网页数量正在呈指数地增长。Web已经成为人们获取各种信息服务的不可或缺的重要途径,然而Web海量的网页在为人们提供丰富的信息资源的同时,也向人们提出了如何快速准确地从中获得其所需信息的挑战。目前web服务主要采取的是被动的、单一的信息服务方式,站点向所有用户发布相同的信息,然而,用户的需求是千差万别的,现有的信息服务系统主要存在以下几个缺陷:由于海量信息的存在,大量网页链接容易使浏览者在的复杂信息空间中迷失航向,即所谓“信息迷航”;网页中提供的绝大多数链接对于特定用户来说都是多余的,而潜在地为用户所感兴趣的内容往往隐藏在众多无用链接之中;信息服务提供的界面往往单一而呆板的,对所有用户都是同一种面孔;目前的信息服务对服务器来说,主要还是一种被动的信息提供方式,不能够主动感知用户需求,实现对浏览者的主动信息服务。个性化信息服务能够通过收集和分析用户信息来学习用户的兴趣和行为,从而实现信息主动推荐的目的,把Web服务由以网站为中心转变为以用户为中心,把服务方式由‘一对多’转变为’一对一’,从而使网站能更好的为用户提供服务,针对用户个人特征并向其提供准确恰当信息的个性化信息服务技术正成为目前的一个研究热点。本文针对以上需求和现有个性化服务中存在的不足,提出一种基于遗传算法事务聚类的双窗口主动个性化推荐服务系统(Personalized Active InformationService System Based on Genetic Algorithms Transaction Cluster,以下简称GA-PAIS),该系统中用遗传算法实现事务聚类,克服了以往个性化推荐算法中聚类算法复杂度过高、对噪声数据敏感等缺陷,通过实验表明,该算法在事务聚类效率上有较大的提高;在网页推荐系数的计算上,综合考虑影响推荐准确性的匹配因子和距离因子,提出一种基于双窗口匹配因子计算方法,解决了现有推荐算法中推荐因子单一、忽视访问页面顺序对推荐系数影响等问题。