论文部分内容阅读
随着计算机与网络的发展,人们信息获取的方式开始越来越依赖于网络。而作为信息展现与搜索的工具——搜索引擎,在需求的驱动下也有了长足的发展。面对日益庞大的数据和信息,如何确保搜索引擎的效率已经成为各大搜索引擎商们急需解决的问题。本论文旨在通过使用大数据技术对大规模数据集进行搜集和整理,并在开源架构Hadoop下实现这一搜索引擎的基础算法——倒排索引。