【摘 要】
:
随着互联网Internet的飞速发展,网络上的信息呈指数增长。如何能够更有效、更准确地找到自己感兴趣的内容,关系到我们能否充分利用这个巨大的信息资源,这已成为基于Internet
论文部分内容阅读
随着互联网Internet的飞速发展,网络上的信息呈指数增长。如何能够更有效、更准确地找到自己感兴趣的内容,关系到我们能否充分利用这个巨大的信息资源,这已成为基于Internet的网络信息获取的热点问题,也是本文的研究目标。本文首先分析了网页(Web)上信息搜索的基本问题,包括:信息检索和信息过滤的关系;信息过滤系统的特点及分类;信息过滤的方式;过滤模型、相关性测算算法及搜索系统的性能评价指标等。从总体上对搜索系统进行一定的论述,指出Web搜索系统中现存的问题。针对检索系统中存在的部分问题,在现有信息过滤技术的基础上,将基于内容的过滤方式与协作的过滤方式相结合,提出了一个信息过滤系统框架。本文的主要研究内容为以下三个部分:信息检索与信息过滤;混合式过滤算法;相对查准率和相对查全率。文中首先提出个性化搜索引擎模型框架,并给出工作原理,在元搜索引擎的基础上,把信息过滤技术引入到搜索引擎中,实现搜索引擎的智能化和个性化服务。相关度测算函数是信息过滤系统中核心的部分,它决定系统预测的精度,本文将一种基于内容的过滤算法和一种协作的过滤算法相结合,设计出一种新的混合式过滤算法。在海量的互联网信息检索上,高的查全率带来的成千上万个“命中网页”对用户实在是一个沉重的负担,所以在海量的互联网信息检索上,用查全率与查准率来衡量检索效果不是很合适,为此本文提出了相对查全率和相对查准率两个全新的衡量指标。
其他文献
本文将介绍一种在Linux虚拟实验系统中的基于Applet方式的SSH仿真终端的研究和设计。文章首先分析了终端及仿真终端的演进过程,指出早期的TELNET仿真终端的功能和缺陷。接下来
在企业信息系统软件的开发中,为了提高开发效率、增强软件的可复用性和可移植性等性能,越来越多的软件开发都采用模型驱动架构(Model Driven Architecture, MDA)方法学。但是
Peer-to-Peer(P2P)系统的开放结构使其具有如下特性:适应性、自组织性及可扩展性,并能通过大量副本实现高可用性。因此,基于P2P环境的电子商务系统发展十分迅速。但是,P2P电子商
近年来,随着网络技术的迅速发展和J2EE平台的广泛应用,基于B/S的多层Web体系结构逐渐发展成熟起来。与此同时,这也促进了e-Learning平台的研究与发展。 本文在分析e-Learning
网格是继万维网之后出现的一种新型网络计算平台,是为用户提供全面共享各种资源的基础设施。由于网格中的资源具有分布、动态、异构、大规模、多组织等特征,因此网格资源的组织
信息战已成为未来高技术局部战争的主要作战样式,制信息权和制空权、制海权一样,成为战争胜负的关键。导航战是信息战的重要组成部分,现代战争精确快速的定位和导航是提高军事武
随着Internet技术的发展,加强实验环境的建设,利用模拟(Simulation)技术辅助解决网络的鲁棒性、可维护性和传输可靠性等问题是当前研究的一个热点。网络模拟是进行计算机网络
随着互连网的迅猛发展,越来越丰富的信息展现在人们面前,但是面对海量的互联网资源,人们感兴趣的往往只是某一领域的专门信息。如何从纷繁芜杂的网络信息中快速准确地找到人
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们拥有和积累的数据越来越多。数据挖掘在最近几年里已被数据库界广泛研究和应用,而关联规则的挖掘在其中占有很重要
目前,交通安全问题成为世界性的广泛话题,根据统计,大约有40%的交通安全问题来自疲劳驾驶。研究驾驶员疲劳监测方法,用以预防交通事故的发生,具有非常重要的现实意义。 本文在对