论文部分内容阅读
面对复杂而庞大的Internet,多数用户往往觉得力不从心,当用户在网络上搜索信息时,往往就会因为信息量过大且无目的性发生“迷航”、“认知过载”等现象。基于此种情况,面对用户的网络个性化推荐系统应运而生而且发展迅速。个性化推荐系统在用户当前会话的基础上,根据以往访问用户习惯,立即判断当前用户类别并预测其下一步可能感兴趣的页面并推送至当前用户。这种的做法很大程度上减轻了用户的寻找难度,使得信息获取在某种程度上更加高效。本文在深入理解Web日志挖掘一般过程,研究Web日志挖掘的技术的基础上,结合实际情况,重点深入研究了Web日志挖掘的核心算法,在大量研究前人已有算法的基础上,提出了基于兴趣度的矩阵处理算法,此种算法较之以前单纯1,0填值的方式,改进并采用了兴趣度填值,其中兴趣度模型的建立结合了最能代表用户偏好的浏览时间和浏览次数比两个参数,最后得出的结果在保留高效快捷的基础上,更加比普通矩阵算法更加贴近用户习惯,推荐结果更加准确。在得出了核心算法之后,本文进一步研究了页面推荐算法,并给出了一系列定义帮助理解。同时本文也着重分析研究了Agent的概念、技术框架,多Agent之间的通信,JADE开发平台以及代码编写,并在此基础上,利用其交互性、自主性、协作性等众多特性搭建了完整的基于Agent技术的WEB日志挖掘系统框架,并详细阐述了系统中每个Agent的功能和流转方式,针对在MAS系统中遇到的通信问题给出了基于XML的KQML的通信言语解决办法,阐明了在实际开发过程中,独立Agent的代码组成部分及编写方法,并在最后给出了系统实现界面和相应的用户聚类、页面聚类结果图。