论文部分内容阅读
针对目前信息检索系统的缺点,在研究Web信息过滤理论的基础上,论文提出了一种基于用户兴趣的Web中文信息个性化信息过滤系统PWCIFS,该系统结合人工智能Agent技术、机器学习技术、中文分词技术与现有信息检索工具,克服了当前搜索引擎不面向单个用户提供个性化服务的缺点。
论文首先给出了PWCIFS的总体设计思想和系统体系结构,然后对Web中文信息过滤算法和个性化的实现方法做了详细阐述。针对中文信息处理的特殊性,给出了适合中文信息的过滤策略,信息过滤前对采集到的Web信息进行预处理、分词等一系列处理,然后对所得结果进行聚类分析,从而得到兴趣主题的子类;提出树型结构的用户兴趣表示模型,采用智能Agent对用户在结果呈现界面上的浏览行为进行跟踪记录,同时利用BP神经网络结合强化学习算法来进行用户兴趣学习,根据所学到的知识对兴趣模型进行更新。
PWCIFS系统“隐式”跟踪用户的浏览行为自动识别用户兴趣,自动生成用户兴趣模型,并基于此兴趣模型对检索结果进行个性化过滤。经过过滤处理后的文档,其精度显著提高,更加贴近用户的兴揶。