论文部分内容阅读
随着电子商务的迅猛发展,人们的生活方式正在发生前所未有的改变,资源提供者与用户之间可以建立起更加直接的关系,为商务模式的发展提供了更多的选择。与此同时信息数据的爆炸式增长,使得用户很难通过一个小小的屏幕了解获取所有和自己需求相关的有效资源信息。传统的基于关键字的搜索在海量数据和多种格式资源的情况下,也显得力不从心。如何能够获取有效信息,如何能够处理海量数据成为大数据时代的难题。在此背景下,系统能够自动分析用户行为,准确向用户推荐相关资源成为解决这一问题的构想。首先介绍了推荐系统以及MongoDB在国内外的研究现状和应用情况,简单描述了推荐思想应用于涉及大数据系统的重要性和优势。然后着重介绍了该系统所涉及到的关键技术以及市场应用情况,主要包括推荐系统的应用,推荐模型及相应策略的研究,以MongoDB为代表的非关系型数据库的发展,还有涉及数据挖掘的长尾理论部分。第三部分详细介绍了系统的分析设计过程,主要包括系统的需求分析,概要设计,系统的详细设计和数据库设计等内容。第四部分详细说明了系统在具体实现时所做的工作,主要包括系统开发实现的软硬件配置环境,核心功能模块及流程的实现和分布式数据处理的实现。第五部分详细说明了整个系统的测试情况,系统采用单元测试法进行测试。主要包括测试概要,测试的详细情况以及测试数据情况和最终的性能分析部分。最后对系统的进一步研究做了总结和展望。系统研究开发的过程中,通过推荐模型的构建,有效挖掘了长尾上数据的效能,同时将分布式计算的思想运用到用户行为数据分析中去,大大提高了数据的处理效率,并节约了计算资源。通过系统的测试情况可以看出,系统所采用的Slope One算法在大规模数据的预测中显现出优势,能够有效解决推荐系统所存在的冷启动等问题。采用新非关系数据库MongoDB作为数据存储,可以提高系统对于数据的高扩展能力。系统所涉及的模型和方法也适用于其他领域,具有良好的推广前景。