【摘 要】
:
随着互联网的不断发展和日益普及,互联网上的信息也是增长快速,全世界的网页数量也高达40亿左右,在我国的数量也超过了3亿左右,与此同时搜索引擎的作用越来越显的极为重要,但
论文部分内容阅读
随着互联网的不断发展和日益普及,互联网上的信息也是增长快速,全世界的网页数量也高达40亿左右,在我国的数量也超过了3亿左右,与此同时搜索引擎的作用越来越显的极为重要,但是当前很多使用者对它的使用结果与预先想象的还是有很大的差距,原因就是在于用户查询到的信息往往是不需要的。浪费了大量的查询时间。为了提高搜索效率,就要在搜索引擎方面下功夫,所以搜索引擎还需要进一步的提高和发展。基于这一原因,本论文在分析网络服务的现有基础上,结合相关技术,规划了一个相对完整的个性化搜索引擎,并实现了它的一部分作用和功能。主要内容为:首先引入了搜索引擎的概念、分类、工作机制、搜索引擎的发展历史状况、个性化搜索引擎的根本工作原理及当前搜索引擎所存在的不足之处,其次描述了网络服务的定义和如何实现的一些环境、及当前网络服务的主要方法及以后的发展方向——个性化的搜索引擎,再次详细分析了当前WWW个性化搜索引擎的相关实例和个性化搜索引擎所需要的一系列技术,接着是设计出一个个性化搜索引擎系统,并对网络爬虫在搜索引擎中地位进行分析,并给出网络爬虫系统的总体设计,以及具体每个模块的设计,包括网页采集模块,网页分析模块,网页索引模块,最后实现了网络爬虫的各个功能模块,可以实现网页采集、存储扩展和网页分析的功能。
其他文献
视频图像序列中运动目标的检测与跟踪是实现智能视频监控系统的关键技术,也是计算机视觉方向的研究热点。本文主要的研究工作及贡献有两个方面:(1)在运动目标检测与分割方面,
随着多媒体通讯技术的不断发展,人们对语音通讯质量的要求越来越高,基于Internet的一对一的语音通讯已经不能满足用户的需求。而目前存在的多人语音通讯都存在延时大,音质差
以大型企业应用系统、云计算等为代表的大规模复杂系统日益广泛,性能调优、性能管理和能力规划成为这类系统部署运行过程中面临的重要挑战。论文在实现TPC-App测试基准(事务
互联网是广大残疾人获取信息、就业、娱乐的主要途径,然而目前绝大多数网站在最初设计实现时只关注普通人的用户体验,忽视了许多无障碍设计细节,使得残疾人群在访问时困难重重。
随着现代社会工业化和信息化的迅猛发展,条码技术的应用越来越广泛,对其防伪性的要求也越来越高。PDF417条码是目前使用最为广泛的条码技术,数字水印技术是一种可以有效提高
在研究网络拓扑结构时,运用图论来构建模型是常见的方法。而路径嵌入和泛圈性是研究网络拓扑结构容错性时不可回避的内容,从而越来越受人们的关注。提高网络的容错性能够改善
随着互联网信息以指数级别增长,目前数字信息已呈现数量庞大、类型繁多、更新迅速等发展趋势。根据Forrester Research的统计资料,目前全世界数字信息量每年以数量级1018。字
近年来,随着我国高等教育的不断发展及学校对外交流活动的日益增多,给校园安全带来了很大影响。为加强“平安校园”的建设,各高校采取保安巡查、安全制度制订等措施,但是由于
随着互联网技术的发展,子空间学习已经成为机器学习、数据挖掘、模式识别等领域的研究热点。高维数据难以使模型得到理想的学习效果。子空间学习旨在通过计算高维空间中样本
纤维缠绕成型的玻璃钢制品作为一种新型材质,是由缠绕机缠绕成型后,用树脂胶固化、脱模后形成的产品。与传统金属材质相比具有许多突出的优点和优良性能,因此被广泛地应用到