论文部分内容阅读
网络的产生给人类的生活带来了翻天覆地的变化,信息极度膨胀带给人类欣喜之余,更多的问题就是如何更好的利用这些信息。目前,搜索引擎是人们从Web上获得信息的主要工具,但现存的基于关键字的搜索引擎方式难以适应现今复杂的网络环境。无疑,如何更加智能化的返回用户的检索结果是目前搜索引擎研究的主要问题。为了适应现阶段Web检索的需求,全面打破基于关键字检索的方法,努力提高搜索引擎的查准率和查全率,本文提出了一个基于改进后的模糊聚类算法的个性化搜索引擎模型。本系统对Web文档进行模糊聚类分析,形成多种类别的Web信息以供系统进一步分析处理;同时,系统能够对不同用户建立自己的用户个性化模型,来刻画用户的兴趣爱好,并对该模型进行模糊聚类分析,最后通过与Web信息进行比对,使得搜索引擎返回给用户更加人性化的检索结果。另外,本文借助目前的搜索引擎技术,结合模糊数学的概念,利用数据挖掘中的聚类方法及遗传算法思想,提出了一种基于遗传算法的模糊聚类方法——GVFCMdd,克服了FCMdd算法对初始中心敏感及聚类块数人为设定的缺陷。本系统模型中两次用到此算法进行模糊聚类分析,使得搜索引擎的检索结果得到了一定的优化。对于现存的基于关键字检索的搜索引擎来说,本系统模型已初步实现了搜索引擎的智能化,在一定程度上提高了搜索引擎的查全率和查准率。