基于WEB使用挖掘的智能自适应站点研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:qqqqq721106
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,WorldWideWeb(简称WWW)系统正在从深度和广度两个方面飞速发展着,Web已经成为一个巨大的信息来源地,Internet正在前所未有地改变我们的生活,WWW浏览则成为人们最主要的日常生活之一。 WWW浏览中的两个常见问题是:搜寻与获取有益信息的困难问题及信息搜寻行为的效率低下问题; 与此同时,WWW上的一些主要工作,例如Web站点结构设计、Web服务设计等工作也正变得越来越繁重和复杂。 现有的静态Web站点结构不能满足人们快速、准确地找到其所需要的信息以及享用个性化服务的要求,为了改善用户信息搜寻行为的效率低下问题和服务缺乏个性化的问题,辅助网站管理员进行复杂的网站结构设计,人们提出了智能自适应站点技术。自适应站点(AdaptiveWebsite),是指能够通过学习用户的访问模式自动或者半自动地改善自身的组织和表现方式的智能站点。 自适应站点的研究是人工智能应用领域的新挑战,其终极目标是使Web站点具备自动学习和设计优化功能,是网络服务向更高层次发展的目标。如何建立能智能自动地适应用户各种需求的Web站点已经成为国际上一个新兴的重要研究领域,其研究工作具有非常重要的理论意义和实际应用价值。 本文以WEB使用数据为基础,采用数据挖掘技术研究自适应站点面向群体用户访问性能的最优化和面向个体用户的服务个性化问题,并将这些实际问题抽象为离线修改优化方法、在线动态推荐方法、自适应站点系统框架构筑等自适应站点理论研究的论题。论文通过对这些论题的研究,取得了以下的研究成果: 在自适应站点系统面向群体用户访问性能的最优化方面(离线修改优化方法),在WEB日志中蕴含的网站用户在网站信息空间进行信息搜索的两种搜索行为模式假设的基础上,引入信息搜索理论,建立了两种新的站点结构离线优化模型: 针对单目标信息搜索假设,建立的基于单目标信息搜索树的站点结构离线优化模型; 针对多目标信息搜索假设,建立的基于多目标信息搜索图的站点结构离线优化模型。 仿真实验验证的结果表明:经过上述方法优化变换后的站点结构能够有效降低群体用户在WEB站点信息空间内搜寻其兴趣目标页面的平均访问代价。 在自适应站点系统面向个体用户的智能导航推荐方面(在线动态推荐方法),在经典的Markov链用户浏览预测模型的基础上,提出了两种改进的模型——可变多阶Markov链模型和混合隐Markov链模型。 可变多阶Markov链模型主要针对传统Markov链浏览预测模型的以下两点不足进行改进: (1)低阶Markov链模型的推荐准确率较低,覆盖率则相对较高,而高阶的Markov模型则具有较高的推荐准确率,而覆盖率则较低,因此,使用阶数固定的Markov链浏览推荐模型并不能同时获得较理想的准确率与覆盖率性能; (2)没有考虑到用户的早期访问行为与近期访问行为对用户未来的访问行为的影响程度不同。而混合隐Markov链模型则改进了传统的Markov链模型不能有效地表征长串访问序列所蕴含的丰富的用户行为特征(用户类别特征、访问兴趣迁移特征)的缺点,从而改善了自适应站点系统用于长串访问序列时的推荐效果。 在自适应站点系统框架构筑方面,设计了一个完整的基于WEB使用挖掘的智能自适应站点系统框架IAWeb-WUMbase(IntelligentandAdaptiveWEB-WebUsageMiningbase,IAWeb-WUMbase)。IAWeb-WUMbase系统包括数据采集模块、数据预处理模块、模式挖掘模块、在线推荐模块以及离线修改模块等五个模块。IAWeb-WUMbase系统的五大模块实现了完整的站点智能自适应功能,可以集成到现有的WEB站点中,使站点具备一定的智能自适应性。 上述研究成果系统地探索了基于Web使用挖掘的自适应站点理论、模型、算法和原型系统框架等,为自适应站点理论发展和应用实践提供了技术支持,丰富和拓广了人工智能的应用领域。
其他文献
目前北京市处理生活垃圾的方法以安全填埋为主,焚烧和堆肥处理为辅,加以回收利用的生活垃圾占总量的比重非常小。城市生活垃圾的填埋占用了大量的土地资源,而且会改变填埋场
仓储是现代物流的一个重要组成部分,作为一门独立的学科来研究和探讨。随着自动化技术和信息技术的不断发展和推进,仓储也由原始的人工仓储发展到现代的智能仓储,其中材料的