基于用户兴趣的Web中文信息个性化过滤系统研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:satan0wei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前信息检索系统的缺点,在研究Web信息过滤理论的基础上,论文提出了一种基于用户兴趣的Web中文信息个性化信息过滤系统PWCIFS,该系统结合人工智能Agent技术、机器学习技术、中文分词技术与现有信息检索工具,克服了当前搜索引擎不面向单个用户提供个性化服务的缺点。 论文首先给出了PWCIFS的总体设计思想和系统体系结构,然后对Web中文信息过滤算法和个性化的实现方法做了详细阐述。针对中文信息处理的特殊性,给出了适合中文信息的过滤策略,信息过滤前对采集到的Web信息进行预处理、分词等一系列处理,然后对所得结果进行聚类分析,从而得到兴趣主题的子类;提出树型结构的用户兴趣表示模型,采用智能Agent对用户在结果呈现界面上的浏览行为进行跟踪记录,同时利用BP神经网络结合强化学习算法来进行用户兴趣学习,根据所学到的知识对兴趣模型进行更新。 PWCIFS系统“隐式”跟踪用户的浏览行为自动识别用户兴趣,自动生成用户兴趣模型,并基于此兴趣模型对检索结果进行个性化过滤。经过过滤处理后的文档,其精度显著提高,更加贴近用户的兴揶。
其他文献
随着Web服务的出现和推广,基于Web服务的动态服务组合技术也成为近年的研究热点。Web服务的业务流程执行语言(BPEL4WS)作为一种基于业务流程的服务组合方法,建模理论基础比较
现代科学研究和工程实践对高性能计算的需求越来越强烈。Internet的出现和普及为全国各地的科研和工程技术人员远程使用各计算中心提供的高性能计算能力和网络上的其它资源提
数据挖掘在企业决策支持系统中处于重要地位,能提供非常重要的决策信息。如何提高企业决策支持系统的效率一直是数据仓库和数据挖掘技术致力解决的问题。对数据挖掘得出的结果
数字图像给人类生活带来了极大的便利,但它易被图像处理软件随意地修改,使其内容的真实性和完整性备受质疑,因此必须研究图像认证技术。传统的数字签名技术虽可对图像进行认证,但
嵌入式Intemet技术的飞速发展和广泛应用,给应用于电力控制领域的嵌入式操作系统带来了新的挑战——它带来高效、便捷的同时,也引入了安全问题。本课题针对传统的嵌入式操作系
安全空间数据库是当前信息安全研究的一个重要分支,具有广泛应用前景。该领域的研究具有较强的保密性,信息技术发达国家对我国一直施行尖端安全产品禁止输出策略,数据库安全产品
随着网络技术的迅猛发展,电子商务和电子政务等也发展迅速。信息安全显得尤为重要。数字签名技术是信息安全理论与技术的基础和重要保证之一。在传统的数字签名中,对信息的签名
随着计算机相关技术的迅速发展,医院信息系统(HIS)已经成为医院不可或缺的一种快速、高效、准确的管理工具和手段。目前的医院信息系统着重于医院业务流程的重组与实现,而医院
网络蠕虫能利用系统漏洞,自动传播,造成网络拥塞甚至瘫痪,具有极大的破坏性。自网络蠕虫出现以来,已经造成了数百亿美元的直接经济损失。网络蠕虫对抗技术的研究具有重大的现实意
随着电影业的发展以及互联网的普及,每年都会产生大量的多媒体信息。这些多媒体信息中(如电影等),往往会包含不健康的内容,尤其是暴力内容。由于多媒体信息的急剧增多,仅仅依靠人工