【摘 要】
:
在互联网蓬勃发展的今天,互联网上的信息更是浩如烟海。人们在享受互连网带来的便利的同时,却面临着一个如何在如此海量的内容中准确、快捷地找到自己所需要的信息的问题,由
论文部分内容阅读
在互联网蓬勃发展的今天,互联网上的信息更是浩如烟海。人们在享受互连网带来的便利的同时,却面临着一个如何在如此海量的内容中准确、快捷地找到自己所需要的信息的问题,由此互联网搜索引擎应运而生。当前对于搜索引擎的研究是互联网技术中最热门的领域。 本文对搜索引擎的原理、组成、数据结构、工作流程等方面做了深入而细致地研究与分析。搜索引擎的未来发展方向是个性化、智能化。对于不同类型的用户群搜索相同的内容将得到不同的更适合用户的搜索结果,这就是搜索引擎的个性化;而智能化则指搜索引擎具有自我学习的功能,能自动地适应用户的查询需求,并能对用户进行智能分类从而为搜索引擎的个性化提供依据。 在理论研究的基础上,本文还利用Java技术对搜索引擎的三个核心部分即网络蜘蛛、网页索引、搜索进行了实现。网络蜘蛛部分采用了非递归爬取方式和Java的多线程机制,利用一个基于内存的作业队列管理器负责网页抓取过程中URL链接的加入、分配、处理等作业,同时使用线程池管理多个抓取线程,并发抓取网页。索引和搜索部分借助Lucene全文搜索引擎库中的Java类进行实现。Lucene是Apache软件基金会的一个开源项目,完全由Java实现,适用于需要全文搜索能力的应用程序,并具有良好的跨平台能力。最后采用JSP(Java Server Pages)技术设计了一个简易的搜索引擎客户端。
其他文献
随着我国司法改革的深化,鉴定制度逐渐显现出滞后的趋势,出现了许多与诉讼价值目标、庭审方式改革、证据制度的发展不相适应的情况。种种弊端,严重损害了鉴定的严肃性,也与我国司
本文把意境美学理论引入到艺术设计中,从美学、哲学角度对意境进行分析,并将分析结果应用到中国现代艺术设计的研究上,从而全面介绍意境在艺术设计中的应用以及它对中国式艺术设
随着环境保护日益受到重视,对外贸易与环境之间的问题变得越来越突出,环境问题已经成为当前国际贸易领域的重大议题。我国作为世界上最大的发展中国家,在参与经济全球化的过
我国商法和西方商法由于历史传统、社会经济结构等诸多因素的不同,而经历了不同的发展历程。在西方,商法的产生、发展、独立化的过程是一个自然的历史过程,是一种内发型的法
本文以江苏大学2003级6 135名大学新生为调查对象,采用UPI量表进行心理健康状况调查和分析。结果发现,大学新生中有19.96%的学生可能有严重的心理问题,有29.68%的学生可能有
<正> 在非惯性系中解决质点的运动问题与在惯性系中一样是根据牛顿运动定律,只是用非惯性系中测得的质点的坐标、速度和加速度来表述。相对于惯性系作变速运动的参考系就是非
目的对侧位内括约肌切断治疗陈旧性肛裂临床处理体会进行总结。方法随机抽取我院采取侧位内括约肌切断治疗陈旧性肛裂的患者病历资料64例,对其临床治疗效果进行分析,并对临床处
文章针对大型发电机励磁碳刷超温问题,系统分析了碳刷发热产生的机理以及碳刷超温的各项因素,根据原因分析有针对性的提出处理措施,为大型发电机碳刷超温维护处理提供借鉴。
我国悠久的历史中,形成了许多优秀的艺术项目,舞蹈是其中的重要组成部分,舞蹈不仅具有深厚的文化内涵,同时还能起到锻炼身体素质和精神意志的作用。近些年来,我国许多城市都
客户关系管理正逐渐成为现代企业的焦点,同时也是计算机科学中的一个活跃的研究领域。本文介绍了CRM的概念、体系结构。对CRM的核心技术数据仓库、数据挖掘的概念进行了简要