基于Linux平台Ftp搜索引擎的研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:dsfsfsg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网络带宽的提高,人们通过网络共享大量数据文件,而架设Ftp服务器来提供共享服务无疑是最节约成本投入方式。因此研究一种高性能的Ftp搜索引擎来帮用户定位数据文件是非常有必要的,它可以大大提高Ftp文件查找速度、准确度,对节省查询成本、提高工作效率有积极意义。 本文在详细分析了Ftp协议的相关工作机制以及实现原理,结合Ftp协议讨论了Ftp搜索引擎的工作机制,并阐述了目前Ftp搜索引擎的研究进展和研究现状,给出了预期的研究目标和研究内容。接着简略阐述了Ftp搜索引擎三大性能指标,即查准率、查全率、查询代价。根据系统设计目标,设计一个基于Web界面,并能够提供多种查询方式、大数据量、查询速度较快的Ftp搜索引擎,指出了本搜索引擎在Linux平台下Web实现的系统软硬平台选型和主要模块。系统主要分为三大模块,即数据采集模块、数据检索模块、数据更新模块,并对各个模块设计思路进行了说明介绍。接着详细给出了系统设计实现中各个模块相关数据结构和实现,在实现中我们设计了一种IP距离计算思路来判断目标主机和源主机的距离,以便在检索结果输出时将距离较近的结果靠前反馈给客户,引入了服务器存活性检查,通过收集客户反馈来优化搜索结果输出,查询结果的文件属性过滤等功能,这些都丰富了搜索引擎的功能,在一定程度上提高了检索的准确度和精确度,给出了搜索引擎的性能展望。最后对研究课题进行了分析展望,指出了搜索引擎需要改进的几大问题,即当文件过大的时,严重消耗系统存储资源,必须压缩后存放、将系统进行分布式部署、数据在多个搜索引擎间同步,在数据检索模块引入索引机制,分析了常用索引和倒排索引机制,探讨了一种新的索引思路来增加系统检索效率。
其他文献
随着数字技术、多媒体技术和网络通信技术的迅速发展,因特网已成为人们获取信息的重要渠道。而网络应用的巨大需求导致网络系统经常会出现拥塞现象,虽然网络设备的处理速度不断
工作流技术是实现企业业务过程建模、仿真分析、优化和业务过程管理与集成,从而最终实现业务过程自动化的核心技术。研究和推广工作流技术对企业信息化具有重要的现实意义。但
当前生产调度问题的研究主要是解决工件间无约束的简单产品的车间调度问题,没有考虑工件间存在约束关系的复杂产品的情况。事实上,在许多调度中是存在着工件之间的工艺约束的
由于因特网的发展与普及以及数字化信息存取的低成本和高便利性,越来越多的出版商和个人以数字媒体的形式发布信息,并通过网络进行传播。虽然数字化为信息的传播与存储提供了
随着信息技术的飞速发展,无线传感器网络(Wireless Sensor Networks,WSN)正成为无线网络研究的热点。它集成了传感器、微电机系统和网络三大技术,是一种全新的信息获取和处理技
本文在分析P2P网络中存在的安全问题以及现有信任模型的基础上,设计了一种基于P2P的混合安全信任模型。该模型介于应用层与网络层的中间,是一个中间层模型,由自治网络模块和信任
组播是一种同时发送数据到多个接收者的有效通信方式,如IP组播和应用层组播(ALM)。尽管IP组播比较简单,但是由于技术和商业模式上的难题,IP组播并没有得到大规模部署,取而代之的
数据流突变检测是数据流研究领域中的一个重要分支,受到越来越多的科研学者的高度重视。数据流突变检测的应用非常广泛,可以应用在金融、灾害预警、网络流量监控等重要领域。
在传统网络架构中,IP地址既作为主机的身份标识,又作为主机的位置标识,即IP地址存在语义重载问题。伴随着移动通信网络的快速发展,IP地址语义重载问题在移动通信网络中愈发凸
随着Web Services技术和分布式系统的日益发展和广泛应用,我们对其可靠性、可用性和安全性的要求越来越高。高可用性的系统要求在部分部件发生故障或遭受攻击的情况下,仍然可