论文部分内容阅读
随着网络时代发展,用户对搜索引擎的要求也发生了变化。从最初的设法找到更多的信息到设法找到更准确、更有价值的信息。网络用户对网络检索数据的各方面要求提高直接促使了搜索引擎的大幅进步,在这种形式下主题搜索引擎应运而生并不断发展壮大。主题搜索引擎又称为专业搜索引擎、专用搜索引擎、实时搜索引擎等。目前主题搜索引擎在搜索引擎发展过程当中具有重要意义。主题搜索引擎主要着力于某一特定领域,并对这一领域内的信息的完全收录并及时更新,避免通用搜索引擎搜索出来的信息包罗万象,容易被各种无用信息的干扰。从而保证了搜索出的关键信息的准确度和时效性。本文分析了辽宁大学门户网站对辽宁大学相关工作的重要性,指出辽宁大学门户网站是集辽大新闻介绍、校务公告、各职能部门门户入口等功能于一体的门户网站。由此可见辽大网的信息量是相当庞大的、功能设计也是相当丰富的。因此对于一个陌生的使用者来说,需要一个好的搜索引擎来为其进行信息导航以更方便的找到相关信息,以便了解辽大或者与辽大取得联系是十分必要的。引擎确立了实现包括对网站新增信息的自动添加索引、网站信息的自动分类、索引的维护、自动网站信息与标签的提取、关键词检索、对后台数据库中自定义分类的维护等功能的搜索引擎设计目标。最终基于lucene和heritrix这两个核心技术,设计出一个服务于辽宁大学相关用户群的针对辽宁大学门户网站的主题搜索引擎的原型系统,该系统提供了在线的查询接口和友好的用户界面。可以满足辽大在校专任教师、辽大行政管理人员和其他工作人员、辽大在校学生以及关心辽大的社会人士对辽宁大学门户网站内各自感兴趣的信息进行快速搜索和准确定位。本系统目前是初次开发版本,整体来说系统的成熟度不高。但其查询查准查全率高、中文解析分词准确、用户界面友好且响应迅速。