论文部分内容阅读
摘要:高校中分散在各个教学信息系统如招生系统、教务系统、在线学习平台、图书馆系统中的各类教学数据共同构成了高校的教学大数据,利用数据可视化技术将教学大数据以直观、高效的可视化信息呈现可以有效地服务高校领导决策。本文中笔者提出了基于MVC的大数据可视化架构,并以浙江开放大学“浙江学习网”可视化大屏设计和实现为例,利用德尔菲法和层次分析法等建模方法和ETL及可视化工具完成MVC可视化架构的设计和实现,取得了较好的效果,具有理论到应用的现实指导意义。
关键词:MVC;教学信息系统;大数据;数据可视化;可视化技术
Abstract: All kinds of data distributed over the systems such as teaching manager information system, online learning platform and digital library constitute the teaching big data of universities. Using data visualization technology to present teaching big data with intuitive and efficient information can effectively serve the decision-making of university leaders. In this paper a case of data visualization of Zhejiang Open University is implemented with Delphi method,AHP method and ETL,Data visualization tool based on MVC mode .
Key words: MVC; teaching information system; big data; data visualization; visualization technology
1引言
目前各高校都建設了各类教学信息系统如招生系统、教务系统、在线学习平台、学习资源管理系统、图书馆系统等。随着历史的积累,这些系统中都包含着大量的各类教学数据,共同构成了高校的教学大数据。如何有效利用这些教学大数据,以直观、高效的可视化信息呈现形式服务高校领导决策,数据可视化正好满足了这项需求。数据可视化起源于1960年计算机图形学,通过计算机创建图形图表,可视化提取出来的数据,可以将数据的各种属性和变量呈现出来,它们是数据可视化的最基础最常见的应用。近年来随着计算机硬件的发展以及复杂或大规模异型数据集的出现,数据可视化也逐渐发展为大数据可视化,需要应用包括数据建模、数据采集、 数据分析、数据管理、数据挖掘在内的一系列复杂数据处理技术,然后由可视化算法及技术实现[1]。
目前在教学数据可视化研究和应用上,较多是针对特定专业系统的专题数据可视化,如教务系统、教学平台、图书馆系统等[2,3,4]。在当前各高校实践中,由于信息系统数据的“孤岛现象”以及跨部门业务协调和沟通的困难,也主要采用多屏形式分别建设多个数据大屏展示各类教学信息。割裂的数据展示带来数据统计的不统一和主题表达的分散,难以向校领导决策层提供基于一个统一教学大数据主题的可视化全貌展现,使可视化的直观,高效呈现的优势难以发挥。
如何综合学校各类教学数据,设计和实现一个基于学校教学大数据下的可视化大屏是本文的研究目的,本文提出了一个基于MVC的大数据可视化架构,并以笔者所在学校实际情况为例,运用德尔菲法和层次分析法完成教学数据模型的建立,利用ETL和可视化工具完成了数据控制和可视化大屏设计。
2 大数据可视化的MVC架构
MVC已是一种为众多实践所应用的标准设计模式,MVC是模型(Model)、视图(View)和控制器(Controller)的缩写。模型用来封装业务逻辑和基础数据。模型对外提供接口,可以被控制器和视图调用,视图是应用程序与用户的接口,作用是负责显示,也就负责表达逻辑的内容。视图是模型的外观,可以访问模型的数据,但不能改变这些数据。控制器是模型和视图之间的桥梁,它解释用户的输入并进行相应的处理,再将请求转发给视图[5]。
MVC模式可以很好地分割业务逻辑和表达逻辑的内容。模型可以封装应用系统的数据,视图是作为与用户的接口,负责数据的显示和交互,控制器是模型和视图之间的桥梁,能够较好地满足大数据可视化的架构设计需求。
3 模型的构建
3.1主题和数据指标的确立
主题确定了可视化的表达目标,数据指标确定了从众多系统中提取哪些数据以及数据重要性的排序。高校教学大数据主题和数据指标确定的难点是在于学校教学业务的多样性和复杂性,而且每所高校的情况各不相同,没有统一的标准。以笔者所在浙江开放大学(浙江广播电视大学)为例,是一所以开放教育为主体、多元办学、多种教育类型协调发展的省属现代远程开放大学,学校还增挂浙江省社区教育指导中心、浙江老年开放大学牌子履行相应职能。
学校教学的多元性和复杂性,使得主题和数据指标的建立较为困难。本例中笔者综合使用了德尔菲法和层次分析法进行主题和数据指标的建立。
德尔菲法系以一系列问卷向各类专家征询意见,依据所有专家对原问卷的答复再拟定下一份问卷,再次向各类专家征询意见,直到大多数专家的意见看法趋于一致才获得结论的一种定性预测、评估方法[6]。
本研究在开大(电大)体系内选择在教学管理、教学实践、招生、学工、技术各相关领域具有丰富理论和实践经验的专家10人组成专家组,首选进行了二轮的德尔菲法咨询,第一轮向各位专家下发问卷对可视化的主题、维度和指标进行征询,由于各个专家的需求和目标不尽相同,征询意见比较分散,根据第一轮问卷结果向专家进行反馈后,进行了第二轮的征询,大多数专家的意见看法趋于一致,确定了可视化主题、维度和指标,同时各专家各自独立地给出隶属度等评估值。 使用德尔菲法往往不能避免因个人主观判断而导致的偏差,因此本研究采用了层次分析法(AHP)对可视化主题、维度和指标权重进行分析。层次分析法是美国运筹学家萨蒂提出的一种层次权重决策分析方法。在层次分析法中专家对各个因素两两进行比较,进而确定该因素的相对重要性,通过建立判断矩阵,计算出各个因素的权重值[7]。指标建立结果详见表1。
3.2数据的封装
数据指标确定后,需要从各个数据源获取基础数据,通过清洗、计算生成指标数据。数据源来自各个信息系统的数据库以及Excel等表文件,来自数据源的数据需要通过ETL技术进行抽取(extract)、转换(transform)和加载(load)将最终生成的指标数据存入指標数据库中。
ETL技术能够较好地解决学校各个信息系统独立建设所形成的数据的“孤岛现象”。以浙江开放大学为例,业务涉及教学信息系统包括浙江学习网、招生报名与入学测试、省开课程考核、浙江终身学习在线、第三年龄学堂、数字化资源库、学分银行、数字图书馆等。从众多的信息系统中抽取和封装数据的工作主要包括:
1)确定数据抽取策略,包括对每个数据源访问的方式,抽取的字段属性信息,采集时间的频率设置,采集异常值的处理等。
2)数据的转换,对从数据源采集到的原始数据并不能直接形成指标数据,需要对原始数据进行分类、合成、统计等处理,如学习概况指标需要从多个数据源数据进行合成,学习者画像指标需要对学生数据进行统计处理等。
3)将处理生成的指标数据存入指标数据库中。
在本例中运用学校的数据中心和基于kettle的ETL工具完成了数据抽取、处理和封装。
4 控制器与视图
控制器是模型和视图之间的桥梁,它通过接口访问模型中的数据,并根据视图中用户的输入,将可视化组件展示所需的数据传递给视图。在本例中使用了袋鼠云公司的Easy[V]可视化工具完成控制器功能。Easy[V]可视化工具支持从 CSV,Oracle,MySQL等多种数据源的数据接入。同时Easy[V]的每个可视化组件都可以定义数据源,通过字段映射,实现数据源与组件的映射,不同组件有不同的字段映射规则,以柱状图为例,一般 X 轴为类目字段,Y 轴为数值字段,在配置完数据以后,将数据源的字段名称分别和 X、Y 字段一一对应,组件就会根据字段里的数据进行展示。
视图将模型和控制器提供的数据转换为视觉结构(各种形状、色彩的图形),通过视觉(可视化大屏)的方式表现出来。视图设计的主要内容包括界面风格设计、内容布局设计和可视化组件。
1)界面风格设计
界面风格主要是指大屏的基础色调和颜色搭配、字体、页面布局等,界面风格要与学校主体的整体形象一致,同时需要考虑大屏展示的目标群体的喜好和视觉感受。本例中结合学校主站色调设计风格,大屏整体设计采用深蓝色为基色调,基本字体为白色。
2)内容布局设计
可视化大屏内有众多的数据,如何有效地布局,突出重点和主题,主要从大屏宏观大局表达的主题和内容关联上考虑,内容的布局比例可以根据模型中确定的维度和指标的权重排序进行合理安排,本例中按照模型中确定的主题和权重比例进行了大屏布局设计。
3)可视化组件
大屏要想清楚地表现数据,必须先了解所要表现的数据的特征包括数据的维度、数据之间的关系、数据的规模等,然后匹配合适的可视化组件。如体系建设数据考虑的特征包括地理位置、招生数量、时间、类别等,适合使用地图组件;而招生数据适合用趋势图表示等,在实践中,通常利用可视化工具提供的各类组件进行设计。
在本例中,使用了袋鼠云公司的Easy[V]可视化工具,该产品提供了丰富的可视化组件,除了支持柱形图、折线图、饼图等常规类型组件外,还提供了地域区块、3D地图、3D地球等特效组件。最终设计的浙江学习网大屏效果如图2所示。
5 结论
大数据可视化技术能有效利用分散在各种教学信息系统中的教学数据,以直观、高效的可视化信息呈现形式服务高校领导决策。大数据可视化需要综合使用数据建模、数据采集、数据分析、数据管理、数据挖掘、可视化算法等在内的一系列技术。在本文中笔者在高校教学大数据可视化设计和实现研究中,提出了基于MVC大数据可视化架构模式,利用德尔菲法和层次分析法等建模方法和学校现有的ETL工具和可视化工具做出了一次理论到应用实践,取得了较好的效果,具有理论到应用现实指导意义。如何在MVC架构下,进一步将数据建模方法与、数据处理技术和可视化技术更加有机地整合在一起,完善模型,并能以更加高效、自动化地数据处理和可视化展示将是下一步研究的内容。
参考文献:
[1] 谢然.大数据可视化之美[J].互联网周刊,2014(11):32-34.
[2] 吕太之,蒋玉婷,宋恒阳,王熠焘,沈李晨. 教务大数据可视化系统的设计与实现[J]. 电脑知识与技术,2020,16(28):86-87.
[3] 罗仁芝.试论可视化大数据在在线教育教学中的应用[J].科技资讯,2020,18(17):4-5.
[4] 马晓亭.图书馆大数据可视化分析系统的设计与实现[J].图书馆学研究,2015(10):37-41,36.
[5] 李海峰.MVC模式架构的应用研究[J].自动化与仪器仪表,2013(1):4-5,7.
[6] 王少娜,董瑞,谢晖,贾贤杰. 德尔菲法及其构建指标体系的应用进展[J]. 蚌埠医学院学报, 2016(5):695-698
[7] 任仕蓉,黄梅.层次分析法在中学化学教师教学能力表现性评价中的应用[J]. 化学教育(中英文),2020(3):61-66
【通联编辑:王力】
关键词:MVC;教学信息系统;大数据;数据可视化;可视化技术
Abstract: All kinds of data distributed over the systems such as teaching manager information system, online learning platform and digital library constitute the teaching big data of universities. Using data visualization technology to present teaching big data with intuitive and efficient information can effectively serve the decision-making of university leaders. In this paper a case of data visualization of Zhejiang Open University is implemented with Delphi method,AHP method and ETL,Data visualization tool based on MVC mode .
Key words: MVC; teaching information system; big data; data visualization; visualization technology
1引言
目前各高校都建設了各类教学信息系统如招生系统、教务系统、在线学习平台、学习资源管理系统、图书馆系统等。随着历史的积累,这些系统中都包含着大量的各类教学数据,共同构成了高校的教学大数据。如何有效利用这些教学大数据,以直观、高效的可视化信息呈现形式服务高校领导决策,数据可视化正好满足了这项需求。数据可视化起源于1960年计算机图形学,通过计算机创建图形图表,可视化提取出来的数据,可以将数据的各种属性和变量呈现出来,它们是数据可视化的最基础最常见的应用。近年来随着计算机硬件的发展以及复杂或大规模异型数据集的出现,数据可视化也逐渐发展为大数据可视化,需要应用包括数据建模、数据采集、 数据分析、数据管理、数据挖掘在内的一系列复杂数据处理技术,然后由可视化算法及技术实现[1]。
目前在教学数据可视化研究和应用上,较多是针对特定专业系统的专题数据可视化,如教务系统、教学平台、图书馆系统等[2,3,4]。在当前各高校实践中,由于信息系统数据的“孤岛现象”以及跨部门业务协调和沟通的困难,也主要采用多屏形式分别建设多个数据大屏展示各类教学信息。割裂的数据展示带来数据统计的不统一和主题表达的分散,难以向校领导决策层提供基于一个统一教学大数据主题的可视化全貌展现,使可视化的直观,高效呈现的优势难以发挥。
如何综合学校各类教学数据,设计和实现一个基于学校教学大数据下的可视化大屏是本文的研究目的,本文提出了一个基于MVC的大数据可视化架构,并以笔者所在学校实际情况为例,运用德尔菲法和层次分析法完成教学数据模型的建立,利用ETL和可视化工具完成了数据控制和可视化大屏设计。
2 大数据可视化的MVC架构
MVC已是一种为众多实践所应用的标准设计模式,MVC是模型(Model)、视图(View)和控制器(Controller)的缩写。模型用来封装业务逻辑和基础数据。模型对外提供接口,可以被控制器和视图调用,视图是应用程序与用户的接口,作用是负责显示,也就负责表达逻辑的内容。视图是模型的外观,可以访问模型的数据,但不能改变这些数据。控制器是模型和视图之间的桥梁,它解释用户的输入并进行相应的处理,再将请求转发给视图[5]。
MVC模式可以很好地分割业务逻辑和表达逻辑的内容。模型可以封装应用系统的数据,视图是作为与用户的接口,负责数据的显示和交互,控制器是模型和视图之间的桥梁,能够较好地满足大数据可视化的架构设计需求。
3 模型的构建
3.1主题和数据指标的确立
主题确定了可视化的表达目标,数据指标确定了从众多系统中提取哪些数据以及数据重要性的排序。高校教学大数据主题和数据指标确定的难点是在于学校教学业务的多样性和复杂性,而且每所高校的情况各不相同,没有统一的标准。以笔者所在浙江开放大学(浙江广播电视大学)为例,是一所以开放教育为主体、多元办学、多种教育类型协调发展的省属现代远程开放大学,学校还增挂浙江省社区教育指导中心、浙江老年开放大学牌子履行相应职能。
学校教学的多元性和复杂性,使得主题和数据指标的建立较为困难。本例中笔者综合使用了德尔菲法和层次分析法进行主题和数据指标的建立。
德尔菲法系以一系列问卷向各类专家征询意见,依据所有专家对原问卷的答复再拟定下一份问卷,再次向各类专家征询意见,直到大多数专家的意见看法趋于一致才获得结论的一种定性预测、评估方法[6]。
本研究在开大(电大)体系内选择在教学管理、教学实践、招生、学工、技术各相关领域具有丰富理论和实践经验的专家10人组成专家组,首选进行了二轮的德尔菲法咨询,第一轮向各位专家下发问卷对可视化的主题、维度和指标进行征询,由于各个专家的需求和目标不尽相同,征询意见比较分散,根据第一轮问卷结果向专家进行反馈后,进行了第二轮的征询,大多数专家的意见看法趋于一致,确定了可视化主题、维度和指标,同时各专家各自独立地给出隶属度等评估值。 使用德尔菲法往往不能避免因个人主观判断而导致的偏差,因此本研究采用了层次分析法(AHP)对可视化主题、维度和指标权重进行分析。层次分析法是美国运筹学家萨蒂提出的一种层次权重决策分析方法。在层次分析法中专家对各个因素两两进行比较,进而确定该因素的相对重要性,通过建立判断矩阵,计算出各个因素的权重值[7]。指标建立结果详见表1。
3.2数据的封装
数据指标确定后,需要从各个数据源获取基础数据,通过清洗、计算生成指标数据。数据源来自各个信息系统的数据库以及Excel等表文件,来自数据源的数据需要通过ETL技术进行抽取(extract)、转换(transform)和加载(load)将最终生成的指标数据存入指標数据库中。
ETL技术能够较好地解决学校各个信息系统独立建设所形成的数据的“孤岛现象”。以浙江开放大学为例,业务涉及教学信息系统包括浙江学习网、招生报名与入学测试、省开课程考核、浙江终身学习在线、第三年龄学堂、数字化资源库、学分银行、数字图书馆等。从众多的信息系统中抽取和封装数据的工作主要包括:
1)确定数据抽取策略,包括对每个数据源访问的方式,抽取的字段属性信息,采集时间的频率设置,采集异常值的处理等。
2)数据的转换,对从数据源采集到的原始数据并不能直接形成指标数据,需要对原始数据进行分类、合成、统计等处理,如学习概况指标需要从多个数据源数据进行合成,学习者画像指标需要对学生数据进行统计处理等。
3)将处理生成的指标数据存入指标数据库中。
在本例中运用学校的数据中心和基于kettle的ETL工具完成了数据抽取、处理和封装。
4 控制器与视图
控制器是模型和视图之间的桥梁,它通过接口访问模型中的数据,并根据视图中用户的输入,将可视化组件展示所需的数据传递给视图。在本例中使用了袋鼠云公司的Easy[V]可视化工具完成控制器功能。Easy[V]可视化工具支持从 CSV,Oracle,MySQL等多种数据源的数据接入。同时Easy[V]的每个可视化组件都可以定义数据源,通过字段映射,实现数据源与组件的映射,不同组件有不同的字段映射规则,以柱状图为例,一般 X 轴为类目字段,Y 轴为数值字段,在配置完数据以后,将数据源的字段名称分别和 X、Y 字段一一对应,组件就会根据字段里的数据进行展示。
视图将模型和控制器提供的数据转换为视觉结构(各种形状、色彩的图形),通过视觉(可视化大屏)的方式表现出来。视图设计的主要内容包括界面风格设计、内容布局设计和可视化组件。
1)界面风格设计
界面风格主要是指大屏的基础色调和颜色搭配、字体、页面布局等,界面风格要与学校主体的整体形象一致,同时需要考虑大屏展示的目标群体的喜好和视觉感受。本例中结合学校主站色调设计风格,大屏整体设计采用深蓝色为基色调,基本字体为白色。
2)内容布局设计
可视化大屏内有众多的数据,如何有效地布局,突出重点和主题,主要从大屏宏观大局表达的主题和内容关联上考虑,内容的布局比例可以根据模型中确定的维度和指标的权重排序进行合理安排,本例中按照模型中确定的主题和权重比例进行了大屏布局设计。
3)可视化组件
大屏要想清楚地表现数据,必须先了解所要表现的数据的特征包括数据的维度、数据之间的关系、数据的规模等,然后匹配合适的可视化组件。如体系建设数据考虑的特征包括地理位置、招生数量、时间、类别等,适合使用地图组件;而招生数据适合用趋势图表示等,在实践中,通常利用可视化工具提供的各类组件进行设计。
在本例中,使用了袋鼠云公司的Easy[V]可视化工具,该产品提供了丰富的可视化组件,除了支持柱形图、折线图、饼图等常规类型组件外,还提供了地域区块、3D地图、3D地球等特效组件。最终设计的浙江学习网大屏效果如图2所示。
5 结论
大数据可视化技术能有效利用分散在各种教学信息系统中的教学数据,以直观、高效的可视化信息呈现形式服务高校领导决策。大数据可视化需要综合使用数据建模、数据采集、数据分析、数据管理、数据挖掘、可视化算法等在内的一系列技术。在本文中笔者在高校教学大数据可视化设计和实现研究中,提出了基于MVC大数据可视化架构模式,利用德尔菲法和层次分析法等建模方法和学校现有的ETL工具和可视化工具做出了一次理论到应用实践,取得了较好的效果,具有理论到应用现实指导意义。如何在MVC架构下,进一步将数据建模方法与、数据处理技术和可视化技术更加有机地整合在一起,完善模型,并能以更加高效、自动化地数据处理和可视化展示将是下一步研究的内容。
参考文献:
[1] 谢然.大数据可视化之美[J].互联网周刊,2014(11):32-34.
[2] 吕太之,蒋玉婷,宋恒阳,王熠焘,沈李晨. 教务大数据可视化系统的设计与实现[J]. 电脑知识与技术,2020,16(28):86-87.
[3] 罗仁芝.试论可视化大数据在在线教育教学中的应用[J].科技资讯,2020,18(17):4-5.
[4] 马晓亭.图书馆大数据可视化分析系统的设计与实现[J].图书馆学研究,2015(10):37-41,36.
[5] 李海峰.MVC模式架构的应用研究[J].自动化与仪器仪表,2013(1):4-5,7.
[6] 王少娜,董瑞,谢晖,贾贤杰. 德尔菲法及其构建指标体系的应用进展[J]. 蚌埠医学院学报, 2016(5):695-698
[7] 任仕蓉,黄梅.层次分析法在中学化学教师教学能力表现性评价中的应用[J]. 化学教育(中英文),2020(3):61-66
【通联编辑:王力】