论文部分内容阅读
使用搜索引擎技术,基于Sphinx、MySQL、Scrapy等开源软件,将网站、应用系统以及非结构化文档、图像、音视频等各种异构信息资源进行整合,实现海量非结构化信息资源的抽取、存储、索引和检索,为校园网用户提供校内数字化资源的统一检索服务,使校园网用户能够方便、快捷地从一个统一的入口精确地定位和获取信息,有效地解决现有校园网信息资源庞杂分散、类型各异、难以查找利用的问题。