论文部分内容阅读
【目的/意义】针对互联网时代图书馆的海量业务、文献和用户数据,利用Spark技术框架有效解决图书馆大数据挖掘处理下读者更复杂的多重处理需求和低延迟的交互式查询需求问题。【方法/过程】阐述并分析了智慧图书馆建设发展的相关理念及功能性需求,建立了基于Spark大数据处理技术的图书馆智慧服务框架,对比Hadoop Map Reduce框架法,提出和介绍了基于Spark大数据处理技术的图书馆智慧服务流程和应用实践情况。【结果/结论】理论分析和实践表明,相较传统Hadoop Map Reduce框架法,Spark在运行速度、易用性、通用性及容错性上都有更好的表现;基于Spark技术的大数据处理平台,可优化和改进图书馆大数据处理模型,能更好地满足图书馆智慧服务的知识共享、使用便利、服务高效功能需求。