论文部分内容阅读
摘要:本文围绕大数据环境下个性化教育资源推荐系统的构建及关键技术研究展开,设计一个可以处理PB级教育资源的个性化推荐系统架构,并基于此架构实现一个教育资源个性化推荐系统。主要设计一种基于内容与基于协同过滤相结合的混合推荐算法,在满足推荐新颖性要求的同时也解决了推荐系统的冷启动问题。研究一个弹性的、可靠的、高性能的可以存储、处理PB级数据并可进行实时推荐的个性化推荐系统架构,研究个性化推荐引擎,数据预处理及数据挖掘模型构建,对实现的推荐系统进行相关功能及性能验证,确定系统的可用性有重要的意义。
关键词:大数据、教育资源、推荐系统、技术研究
1. 研究的主要内容框架
项目研究的主要内容是设计一个可以处理PB级教育资源的个性化推荐系统架构,并基于此架构实现一个教育资源个性化推荐系统。个性化推荐系统建设时整体逻辑结构内部建设两个子系统同时与外部另外两个系统协作,即内部的分类树子系统、个性化推荐Web子系统及外部的资源共享平台、统一登录系统相互协作实现系统功能。系统功能设计及应用总体架构如图1所示:
2. 大数据计算框架关键技术分析
MapReduce是一个分布式计算框架,最早由Google公司提出,因可以在上千台廉价服务器组成的分布式集群中处理海量数据而被熟知,广泛应用于大数据处理。本项目采用的是HadoopMapReduce,是一个广泛使用的开源MapReduce实现,其MapReduce详细执行过程如图2所示。
教育资源个性化推荐系统个性化推荐引擎,Mahout是一个可以基于Hadoop之上运行大规模机器学习算法的Java程序框架,本项目使用的是Mahout的基于Item推荐引擎部分,Mahout推荐引擎由原来独立框架Taste实现。
3. 研究重点难点
(1)构建基于三维矩阵的数学模型。建立基于三维矩阵的数学模型。将得到的数据的每个属性定义为空间中的一个维度,从而构成一个N维空间。
(2)基于协同进化思想的关联规则分析方法。采用改进的遗传算法和粒子群算法对两个种群同时进行迭代,弥补遗传算法早熟收敛和后期收敛速度慢的缺陷,有效地搜索出高质量的关联规则。
4. 研究技术路线
课题围绕大数据环境下个性化教育资源推荐系统的构建及关键技术研究展开,在对现有研究成果进行梳理分析的前提下,立足于实践发展需要,采用以下几种研究方法,从多角度对个性化教育资源推荐系统的构建的应用,结合数据预处理技术、个性引擎推荐、数据挖掘技术等问题及对策展开探讨。
(1)三维矩阵数学模型
将所有矩形按照一定规则组合形成一个包含所有信息的三维矩阵即我们建立的数学模型。三维矩阵数学模型如下图3所示。
5、结束语
本课题围绕大数据环境下个性化教育资源推荐系统的构建及关键技术研究展开,在对现有研究成果进行梳理分析的前提下,立足于实践发展需要,从多角度对个性化教育资源推荐系统的构建的应用,结合数据预处理技术、个性引擎推荐、数据挖掘技术等问题及对策展开探讨。设计了一个可以处理PB级教育资源的个性化推荐系统架构,以面向大数据的可拓数据挖掘技术作为研究对象,旨在为大数据时代下的数据分析技术、数据提取技术以及可拓数据挖掘技术打下理论基础,并最终建设一个基于可拓数据挖掘技术的教育资源个性推荐系统。
参考文献
[1]基于大数据的个性化自适应在线学习分析模型及实现[J]. 姜强,赵蔚,王朋娇,王丽萍. 中国电化教育. 2018(01)
[2]获取教育大数据:基于xAPI规范对学习经历数据的获取与共享[J]. 顾小清,郑隆威,简菁. 现代远程教育研究. 2017(05)
[3]一种基于Kademlia的全分布式爬虫集群方法[J]. 黄志敏,曾学文,陈君. 计算机科学. 2018(03)
[4]大数据与智慧教育[J]. 柯清超. 中国教育信息化. 2018(24)
[5]面向大数据的开源推荐系统分析[J]. 米可菲,张勇,邢春晓,蔚欣. 计算机与数字工程. 2018(10)
基金项目
(1)2019年1月,主持廣东省特色创新项目(人文社科)--《新工科背景下创新人才培养模式研究》(2018GWTSCX054),已顺利开展;
(2)2019年5月,主持《新工科背景下高职院校大数据专业建设与创新人才培养模式研究(GDYJSKT19-13)》广东省高等教育学会高职高专云计算与大数据专业委员会项目,已顺利开展;
关键词:大数据、教育资源、推荐系统、技术研究
1. 研究的主要内容框架
项目研究的主要内容是设计一个可以处理PB级教育资源的个性化推荐系统架构,并基于此架构实现一个教育资源个性化推荐系统。个性化推荐系统建设时整体逻辑结构内部建设两个子系统同时与外部另外两个系统协作,即内部的分类树子系统、个性化推荐Web子系统及外部的资源共享平台、统一登录系统相互协作实现系统功能。系统功能设计及应用总体架构如图1所示:
2. 大数据计算框架关键技术分析
MapReduce是一个分布式计算框架,最早由Google公司提出,因可以在上千台廉价服务器组成的分布式集群中处理海量数据而被熟知,广泛应用于大数据处理。本项目采用的是HadoopMapReduce,是一个广泛使用的开源MapReduce实现,其MapReduce详细执行过程如图2所示。
教育资源个性化推荐系统个性化推荐引擎,Mahout是一个可以基于Hadoop之上运行大规模机器学习算法的Java程序框架,本项目使用的是Mahout的基于Item推荐引擎部分,Mahout推荐引擎由原来独立框架Taste实现。
3. 研究重点难点
(1)构建基于三维矩阵的数学模型。建立基于三维矩阵的数学模型。将得到的数据的每个属性定义为空间中的一个维度,从而构成一个N维空间。
(2)基于协同进化思想的关联规则分析方法。采用改进的遗传算法和粒子群算法对两个种群同时进行迭代,弥补遗传算法早熟收敛和后期收敛速度慢的缺陷,有效地搜索出高质量的关联规则。
4. 研究技术路线
课题围绕大数据环境下个性化教育资源推荐系统的构建及关键技术研究展开,在对现有研究成果进行梳理分析的前提下,立足于实践发展需要,采用以下几种研究方法,从多角度对个性化教育资源推荐系统的构建的应用,结合数据预处理技术、个性引擎推荐、数据挖掘技术等问题及对策展开探讨。
(1)三维矩阵数学模型
将所有矩形按照一定规则组合形成一个包含所有信息的三维矩阵即我们建立的数学模型。三维矩阵数学模型如下图3所示。
5、结束语
本课题围绕大数据环境下个性化教育资源推荐系统的构建及关键技术研究展开,在对现有研究成果进行梳理分析的前提下,立足于实践发展需要,从多角度对个性化教育资源推荐系统的构建的应用,结合数据预处理技术、个性引擎推荐、数据挖掘技术等问题及对策展开探讨。设计了一个可以处理PB级教育资源的个性化推荐系统架构,以面向大数据的可拓数据挖掘技术作为研究对象,旨在为大数据时代下的数据分析技术、数据提取技术以及可拓数据挖掘技术打下理论基础,并最终建设一个基于可拓数据挖掘技术的教育资源个性推荐系统。
参考文献
[1]基于大数据的个性化自适应在线学习分析模型及实现[J]. 姜强,赵蔚,王朋娇,王丽萍. 中国电化教育. 2018(01)
[2]获取教育大数据:基于xAPI规范对学习经历数据的获取与共享[J]. 顾小清,郑隆威,简菁. 现代远程教育研究. 2017(05)
[3]一种基于Kademlia的全分布式爬虫集群方法[J]. 黄志敏,曾学文,陈君. 计算机科学. 2018(03)
[4]大数据与智慧教育[J]. 柯清超. 中国教育信息化. 2018(24)
[5]面向大数据的开源推荐系统分析[J]. 米可菲,张勇,邢春晓,蔚欣. 计算机与数字工程. 2018(10)
基金项目
(1)2019年1月,主持廣东省特色创新项目(人文社科)--《新工科背景下创新人才培养模式研究》(2018GWTSCX054),已顺利开展;
(2)2019年5月,主持《新工科背景下高职院校大数据专业建设与创新人才培养模式研究(GDYJSKT19-13)》广东省高等教育学会高职高专云计算与大数据专业委员会项目,已顺利开展;