论文部分内容阅读
随着互联网的迅猛发展和在世界范围内的普及,Web信息正以指数级的速度增长,在这样一个无限、无序、无边的空间里,快速、准确的查询到所需要的信息已经成为一件非常困难的事。如何帮助用户从互联网的海量信息中获得真正需要的信息正成为当前网络信息获取技术研究领域须迫切解决的一个问题。为了解决这个问题,智能信息过滤技术正成为非常重要的研究方向,信息过滤技术的发展方向应该是不断贴近用户需求,模拟人类智慧,其智能化、个性化发展已经成为必然的发展趋势。本文主要针对网络信息的个性化服务,通过分析用户兴趣的反馈信息,对用户不再感兴趣的信息进行及时过滤,并向用户推荐其可能感兴趣信息而展开研究工作的。研究的目的在于希望通过在客户端浏览器上引入界面Agent、学习Agent和合作过滤Agent的协调工作,加强和改进客户端浏览器的功能,提高信息采集质量和信息搜索效率,实现面向用户兴趣的信息检索。本文的主要工作包括:①提出了基于MAS(Multi-Agent System,简称MAS)的信息合作过滤(Information Collaborative Filtering,简称ICF)模型,ICF通过建立用户个人模型和共同模型来呈现用户兴趣,同时引入反馈学习机制来学习用户兴趣,对用户兴趣进行更新。②提出了基于强化学习的用户兴趣反馈学习算法。根据用户一段时间内的浏览行为和对浏览内容的评价结果,学习Agent使用动态Q学习算法对用户模型更新。③在对频繁项挖掘算法FP-tree改进的基础上,给出了带有用户兴趣度权值的信息过滤算法IWFP-tree。IWFP-tree能够从相似用户兴趣中推导出用户的新兴趣。④使用面向Agent的编程语言JACK实现了ICF原型系统。以江苏大学数字图书馆中总容量近十万字的科技文献作为数据源对ICF进行了原型实验测试,实验结果表明同使用FP-growth算法进行信息过滤的合作过滤系统(Collaborative Filtering Systems based Frequency Pattern-Growth,简称CFS-growth)、传统信息过滤算法(Traditional Collaborative Filtering System,简称TCFS)相比,ICF的查全率和查准率都要高于前两者。