Web使用挖掘在个性化远程教育中的应用研究

来源 :考试周刊 | 被引量 : 0次 | 上传用户:areschicken
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 本文分析了远程教育提供个性化教学服务的现状,提出利用Web使用挖掘技术,构造一个个性化远程教育的系统模型,通过对学生访问行为、频度、内容、停留时间等的分析,得出学生访问行为和方式的一般模式,并通过该模型的应用实例及其应用效果的分析验证了该模型的有效性和实用性。
  关键词: Web使用挖掘 个性化远程教育 教学支持服务
  
  1.问题的提出
  随着互联网应用的快速发展,以及教育大众化和终身教育的需求,以网络通讯技术、计算机多媒体技术为依托,通过网络向学生提供形式多样的学习模式可以实现在不同地点实时地、交互地和有选择地进行学习,具有时空自由、资源共享、系统开放等优点。向学生提供个性化的教学服务就成为其区别于传统教学模式的重要特征,因此也成为现代远程教育的重要研究课题之一。
  Web挖掘就是将传统的数据挖掘技术和Web结合起来,進行Web知识的提取。一般Web挖掘可分为:Web结构挖掘、Web内容挖掘和Web使用挖掘。本文讨论的重点在于Web使用挖掘。
  2.Web使用挖掘
  2.1处理模型
  Web使用挖掘的主要任务是研究用户的浏览行为(即对Web站点的使用)。和其他数据挖掘一样,Web使用挖掘也需经过数据采集、数据预处理、模式发现和模式分析等过程。
  2.1.1数据预处理
  对得到的原始用户浏览信息进行处理,取出用户访问的URL、页面的大小、请求的时间、在页面上停留的时间、请求者的Internet域名、用户、服务器状态等变量。下面分析比较常见的从Web日志中获取的浏览信息的预处理过程。它包括如下几个方面。
  2.1.1.1数据清洗。删除Web日志中与数据挖掘不相关的冗余项。Web日志记录了用户IP地址、用户名、用户请求访问的URL页面、访问时间、传输协议、传输的字节数、访问出错信息等属性,而与数据挖掘相关的只有用户IP地址、用户名、用户请求访问的URL页面与访问时间,其他属性可以去掉。
  2.1.1.2用户识别。由于本地缓存、代理服务器和防火墙的存在,识别用户的任务变得很复杂。只能尽可能地用比较合理的启发式规则来进行用户识别。如一旦发现用户端浏览器软件或操作系统发生改变,则认为是新用户。
  2.1.1.3事务识别。会话是指同一个用户连续请求的页面,不同用户访问的页面属于不同的会话。
  2.1.2模式发现
  在对事务进行了划分后,我们就可以根据具体的分析需求选择访问模式发现的技术,如路径分析、关联规则挖掘、序列模式,以及聚类和分类技术。这些对于Web站点的性能改进有重要的作用,如路径分析可以用来发现Web站点中最经常被访问的路径,从而可以调整站点的结构。
  2.1.3被发现的模式用于个性化处理
  在模式抽取后进行分析和应用。挖掘结果可能会有大量的模式,如关联规则可能会发现很多的规则。如果这些模式全部被采用,人们就很难理解。模式分析忽略了一些不重要的模式,而且允许人们将模式表示加上一些限制,将抽取出的模式用容易理解的方式显示出来,如可视化。然后应用这些模式改进站点的结构和帮助用户浏览。
  2.2Web使用挖掘在远程教育中的应用
  Web使用挖掘在远程教育中主要应用于以下各个方面。
  2.2.1系统改进
  对Web系统的特性数据进行分析,如:可以提供Web流量行为的分析,利用它来进行Web缓存、存取平衡等,据此对远程教育系统性能进行改进。
  2.2.2站点修改
  对所有学生的浏览路径进行挖掘,发现其中某些页面的逻辑关联。把一组频繁访问的页面直接链接,以改善远程教育站点结构。
  2.2.3智能服务
  学生如何使用远程教育网站来进行学习对于远程教育提供者来说是很重要的。通过对学生行为和所选课程等关系的挖掘,发现其中的学生群学习特征和趋势等来进行智能服务,为远程教育提供者提供决策依据。
  2.2.4个性化
  从单个学生的浏览信息发现学生的兴趣,向每位学生提供符合其兴趣要求的个性化界面。
  3.个性化远程教学模型
  Web服务器为客户端提供HTTP服务等功能,应用服务器内存放学生的个人注册和相关课程等信息。
  每个学生在开始使用网站时先在应用服务器上进行注册,控制模块负责对采集的学生浏览路径进行预处理和相关的数据挖掘,学生个性数据库用于存放挖掘出来的各种模式。
  个性化远程教育主要由以下几部分组成。
  3.1浏览路径预处理
  对学生的浏览路径信息进行一些预备处理,包括数据清洗、用户识别、会话识别和路径补充等。数据清洗是指删除一些无用的或错误的数据。用户识别是指对路径信息通过一些启发式规则进行识别路径的用户归属。会话识别是指在用户识别的基础上辨认不同的会话。一般利用超时的方法决定用户是否都开始了一个新的会话。路径补充是在路径不完整的情况下利用站点的拓扑结构找出遗漏的页面。
  3.2建立学生个性数据仓库
  对已预处理过的学生访问数据建立数据仓库,这个数据库负责提供一个良好的数据挖掘环境。数据仓库可以设立多个维度,如时间维、域名维、文件维和浏览工具维等。每个维设立多个属性值,如时间维的属性可以表示为星期一、星期二、……星期日等。
  3.3被发现的模式用于个性化处理
  在已建立的数据仓库的基础上,我们可以用五种挖掘技术进行个性化教学支持服务。
  3.3.1根据路径分析改善站点结构。它可以用于辨别在Web站点中频繁访问的路径集和其他一些通过路径分析得到有关知识,并利用这些知识来改善站点结构。
  3.3.2利用关联规则发现学生的某些知识兴趣点之间的相关性,然后将它们之间的超链接动态地提供给学生,使学生在网上学习更加方便。
  3.3.3通过分类算法对学生的知识水平进行分类,给予不同级别的训练。
  3.3.4利用聚类算法从Web访问信息数据中聚类出具有相似性的那些学生。
  3.3.5利用序列模式的挖掘来找出学生学习过程中的事件序列关系。
  本文对Web使用挖掘的过程、挖掘算法,以及挖掘出来的模式和表示进行了分析,构造了一个基于Web使用挖掘的个性化远程教育网站模型。进一步的工作是将模型细化、扩充,使其在远程教育的实践中发挥作用。
  Web挖掘技术在远程教育的教学支持服务中的应用是一个新的领域,也是一个带有很大挑战性的课题。随着研究的进一步深入,此项技术将为远程教育中个性化教学支持服务研究提供一条新的途径。
  
  参考文献:
  [1]周蔚.现代远程教育学习支持服务现状研究[J].中国远程教育,2005,(3).
  [2]冯建军.试论个性化教育的原则[J].江西教育科研,2004,(5).
  [3]舒蓓,申瑞民,王加俊.个性化的远程学习模型[J].计算机工程与应用,2001,(9).
  [4]夏火松.数据仓库与数据挖掘技术[M].科学出版社,2004:207-225.
其他文献
在实践活动中培养学生自主创新的潜质是非常有效的,体育课程在这方面有得天独厚的优势。在教学活动中,教师要提高自身的创新意识,营造和谐的创新氛围,建立客观的创新机制,使学生变被动学习为主动创新实践,从而使学生的创新意识得到提高,创新能力得到培养,创新个性得到发展。  1.打破传统观念,提高创新意识  在创新活动中,有了创新意识,才能抓住创新机会,产生创新办法,启动创新思维,然而传统的体育教育思想把学生
提高高中体育教学成效,教师要发挥重要作用,与学生之间建立起和谐的关系,营造浓厚的教学氛围,将现代教学手段有效运用到教学活动之中,并注重教学手段的创新,促进学生全面发展。  一、构建和谐关系,激发体育学习兴趣  师生之间关系的和谐程度,与教学成效具有直接的联系。和谐的师生关系有助于学生增强向师性,激发学习兴趣,更加愿意主动投入到学习活动之中。  1.尊重学生人格。高中生处于16—20岁的年龄,身心发
摘 要: Ca语言的一个主要特点是运算符丰富、范围广。灵活地使用各种运算符可以实现在其它高级语言中难以实现的运算。本文主要对C语言中自增、自减两个运算符的使用作详细说明。  关键词: C语言 自增、自减运算符 功能 运算规则    C语言中的运算符非常丰富,把除了控制语句和输入输出以外的几乎所有的基本操作都作为运算符处理,灵活使用各种运算符可以实现在其他高级语言中难以实现的运算。在这些运算符中,最
摘 要: 针对本院学生中女生占绝大多数的实际,本文作者进行了自卫防身术的课堂教学,深受学生的欢迎。 自卫防身术是一项新兴的体育项目,该项目不仅教给学生尤其是女学生抗暴防辱的意识和以弱克强、以巧制蛮的招式,而且符合年青学生自我防卫的心理需要。实践证明,它能充分调动学生学习的积极性,使学生在平时的生活和工作中充分展示自我,提高临危应变的能力。   关键词: 卫生职业学院 自卫防身术 教学前景    自
摘 要: C语言是计算机相关专业学生的必修课程,是一门深奥枯燥的学科,但它作为计算机语言中最基本的一种高级语言,有着广泛的应用。对学生来说,程序设计的思维方式和概念都是全新的,学生接受起来很困难。本文通过对C语言教学方法的探讨,力求找到好的方法来提高本课程的教学质量,取得良好的教学效果。  关键词: C语言 教学方法 探索    随着现代科学技术的不断提高,计算机强大的功能已为人们所深刻认识,计算
近年来,在片面追求升学率的应试教育的导向下,各门文化课教学中都有学生厌学的问题,甚至在体育课上同样有“厌学”的现象。从理论和实践上讲,小学生应该是最喜欢体育的人群,常常可以看到,在体育游戏中小学生是那样投入。由此可见,学生并不是从内心讨厌体育活动或体育课,而是对一些体育教师在体育课上教的内容、教的方法感到枯燥厌倦甚至反感。这是体育教学中教与学的对立。因此,体育课如何激起学生的兴趣,是一个值得研究的
摘 要: 在体育业余训练中,运动损伤的发生和预防是一个重要而又易被忽视的问题,一直困扰着运动员和教练员,如何防止运动损伤是各位体育教师和体育训练工作者所关心的问题。本文作者通过对汉中市11—16岁的在校初中业余体育运动员在训练及比赛过程中受伤情况的调查、分析与研究,从中找出原因,提出对策,以更好地促进中小学体育运动的正常开展。  关键词: 初中学生 运动损伤 原因 对策    1.引言  运动损伤
摘 要: 云计算提出了与最佳企业客户端计算策略有关的新问题。随着通过云计算提供的服务越来越多,云计算下客户端平台和服务提供模式组合的选择就成为了尤为重要的问题,本文对云计算下客户端的选择情况作了介绍,并结合云计算下客户端的发展对最新的客户端要求作了概述。  关键字: 云计算 客户端 客户端选择    1.引言  云计算已经成为了当前IT界最热门的话题。如果把通过网络可以获得的IT、软件、互联网相关
钳工是一个传统的专业,应用范围广,在工矿企业及事业单位的工程类项目中可以说是应用最广泛的技能工种。钳工技能享有“万能钳工”的美誉,我国各类技工院校都普遍开设钳工专业。  一、高职院校钳工实习教学现状  随着社会竞争的日趋激烈和科学技术的日新月异,各种新工艺、新设备、新技术、新材料得以大量出现和推广应用,机械制造业正在经历着一个前所未有的巨大变化,“从主要的技艺型传统制造技术向自动化、最优化、柔性化