论文部分内容阅读
【摘要】新工科建设是当前新经济背景下对高校工科人才培养体系提出的新挑战。本文以Python大数据分析及应用课程为研究,提出适合创新创业能力培养为核心的课程知识体系,希望能为新工科建设提供一种实践参考。
【关键词】新工科 知识体系 大数据分析
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2018)40-0231-01
一、新工科是工科教育发展的必然
近年来,随着以新业态、新技术、新产業、新模式为主要特征的四新经济迅猛发展,给传统工科教育带来了全新挑战。传统工科教育因过分强调其工程性,而忽视理科与人文艺术教育,使学生缺乏创新能力。其次,传统工科因思观念守旧性和学科偏细而缺乏对交叉学科为核心新经济的敏感性。因而很难适应新的社会经济生活,亟需新的工科教育教学理念来培养具有创新能力的新兴工程科技人才。基于此,教育部于2017年6月在北京召开新工科研究与实践专家组成立暨第一次工作会议,全面启动、系统部署新工科建设,目的是为深化工程教育改革,推进新工科的建设与发展[1]。因而研究适合新经济的工科课程知识体系是当前新工科建设的重要内容。
二、Python大数据分析及应用课程
大数据是当前社会经济生活领域最热门话题之一,也是新工科人才必须了解的一门新兴课程,对于工科工程技术人才交叉学科应用具有重要的实用价值。然而,大数据知识涉及相当广泛,教授什么知识以培养学生大数据分析及应用能力去适应新经济是当前新工科教育工作者面临的重要课题[2]。大数据分析课程知识相当广泛,包括大数据概念、数据来源、数据处理基本过程、大数据特点和应用等多领域;同时还有大量的大数据具体应用系统,如数据查询分析计算系统包括HBase、Shark、Hive、Hana、Cassandra;批处理系统Hadoop、Spark;流式计算系统Scribe、Storm、Flume、S4、Spark Streaming等。
作为工科而言,学科具有很大的差异性,因而所需掌握的大数据分析及能力也区别较大。本文将以软件工程学科为例,分析在新工科背景下需要哪些大数据知识点。由于面向软件工程学科,本文将主要针对当前大数据分析最重要的编程语言Python进行分析,以提出适合新工科的Python大数据分析及应用课程知识体系,为新工科建设提供一种思路。
三、面向新工科的课程知识体系
新工科要求课程知识体系要有利于培养学生创新能力,能适应新经济形式下的工程实现与项目创新能力。因而Python大数据分析及应用课程首先将系统介绍大数据概念、数据来源、数据处理基本过程、大数据特点和应用领域。重点在于大数据是随着社会信息大量涌现而出现的一门技术,这种技术的人创新性如何,与现有技术的区别与联系。因而要求学生明确大数据与云计算、移动互联网、物联网、数据库等技术的相互关系,了解大数据的结构化数据、半结构化数据和非结构化数据特点及价值所在。以此创新为大数据分析而不是传统的数据挖掘、数据仓库技术。
其次,由于大数据是种新知识、新技术发展的课题,为给学生直观了解其技术体系,课程将介绍具体的大数据分析关键技术如存储系统BigTable、文件系统Colossus、搜索索引系统Caffeine、查询工具BigQuery等。要求重点在于这些系统提出来的背景、技术特点及创新解决的问题,从而让学生掌握大数据知识体系的应用概况。因而课程将引入Python语言来开发大数据实际系统,要求学生掌握这些系统所处的平台。为此课程将系统平台基础知识向学生展示,这些平台基础包括常见的Linux操作系统命令、Docker客户端和服务器、Docker镜像、Registry、Docker容器、Docker安装与启动、Docker镜像操作等。要求学生掌握平台部署与维护能力。
第3部分课程将以Python程序设计语言的学习为重点。但由于学生已经具备基本程序设计能力,因而将简要介绍Python语言与其语言不同的基础知识,如Python安装、Python表达式、变量、语句、函数、 模块、列表、元组、字符串、字典等相关概念。然后,课程知识将进入Python高级主题,包括文件、抽象、魔法方法、异常、属性、迭代器等知识。
课程第4部分将是Python如何存储数据,因而将介绍大数据数据库。由于大数据系统的开放性、数据的非结构化性,课程采用开源数据SQL 数据库引擎SQLite和PySQLite数据库技术。其次,大数据分析是网络发展的产物,因而将需要大量网络编程模块及网络编程技术。所以课程将重点介绍Python socket、urllib和 urllib2等基于网络的编程实现技术。海量数据处理将涉及大规模事务处理,课程也把Python多线程编程技术作为重要的知识点,以期能提出学生进行大数据处理的能力。
第5部分课程将以综合实践应用能力培养为目标,重点在于培养学生创新项目设计与实现能力。因而课程主要介绍Python爬虫基本概念,包括网络爬虫概念、XPath语法、XML解析、Python re、json模块、HTTP协议和分布式爬虫原理等。以此为基础,实现一个影评信息实爬例,包括网页下载器、网页解析器、数据存储器、爬虫调度器等Python编码与实现。基于以上能力,要求学生们分组实现基于某团购网的大型离线电商数据分析平台、大数据分析在媒体公关与危机处理方面应用、期货金融大数据分析等综合实践应用大数据技术案例。以此培养学生在新经济环境中的创新创业能力。
四、小结
本文针对新经济背景下的新工科课程知识体建设,提出Python大数据分析及应用课程的知识体系,系能为新工科建设提供一定的实践参考。
参考文献:
[1]https://baike.baidu.com/item/%E6%96%B0%E5%B7%A5%E7%A7%91/20597803?fr=aladdin
[2]祝夫文,段园培,朱协彬.学时缩减背景下基于大数据的本科教育课时优化.教育教学论坛,2018,(12):89-90
作者简介:
唐小勇(1973.3-),男,湖南洞口人,副教授,博士,主要研究方向:计算机教学法、高性能计算。
【关键词】新工科 知识体系 大数据分析
【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(2018)40-0231-01
一、新工科是工科教育发展的必然
近年来,随着以新业态、新技术、新产業、新模式为主要特征的四新经济迅猛发展,给传统工科教育带来了全新挑战。传统工科教育因过分强调其工程性,而忽视理科与人文艺术教育,使学生缺乏创新能力。其次,传统工科因思观念守旧性和学科偏细而缺乏对交叉学科为核心新经济的敏感性。因而很难适应新的社会经济生活,亟需新的工科教育教学理念来培养具有创新能力的新兴工程科技人才。基于此,教育部于2017年6月在北京召开新工科研究与实践专家组成立暨第一次工作会议,全面启动、系统部署新工科建设,目的是为深化工程教育改革,推进新工科的建设与发展[1]。因而研究适合新经济的工科课程知识体系是当前新工科建设的重要内容。
二、Python大数据分析及应用课程
大数据是当前社会经济生活领域最热门话题之一,也是新工科人才必须了解的一门新兴课程,对于工科工程技术人才交叉学科应用具有重要的实用价值。然而,大数据知识涉及相当广泛,教授什么知识以培养学生大数据分析及应用能力去适应新经济是当前新工科教育工作者面临的重要课题[2]。大数据分析课程知识相当广泛,包括大数据概念、数据来源、数据处理基本过程、大数据特点和应用等多领域;同时还有大量的大数据具体应用系统,如数据查询分析计算系统包括HBase、Shark、Hive、Hana、Cassandra;批处理系统Hadoop、Spark;流式计算系统Scribe、Storm、Flume、S4、Spark Streaming等。
作为工科而言,学科具有很大的差异性,因而所需掌握的大数据分析及能力也区别较大。本文将以软件工程学科为例,分析在新工科背景下需要哪些大数据知识点。由于面向软件工程学科,本文将主要针对当前大数据分析最重要的编程语言Python进行分析,以提出适合新工科的Python大数据分析及应用课程知识体系,为新工科建设提供一种思路。
三、面向新工科的课程知识体系
新工科要求课程知识体系要有利于培养学生创新能力,能适应新经济形式下的工程实现与项目创新能力。因而Python大数据分析及应用课程首先将系统介绍大数据概念、数据来源、数据处理基本过程、大数据特点和应用领域。重点在于大数据是随着社会信息大量涌现而出现的一门技术,这种技术的人创新性如何,与现有技术的区别与联系。因而要求学生明确大数据与云计算、移动互联网、物联网、数据库等技术的相互关系,了解大数据的结构化数据、半结构化数据和非结构化数据特点及价值所在。以此创新为大数据分析而不是传统的数据挖掘、数据仓库技术。
其次,由于大数据是种新知识、新技术发展的课题,为给学生直观了解其技术体系,课程将介绍具体的大数据分析关键技术如存储系统BigTable、文件系统Colossus、搜索索引系统Caffeine、查询工具BigQuery等。要求重点在于这些系统提出来的背景、技术特点及创新解决的问题,从而让学生掌握大数据知识体系的应用概况。因而课程将引入Python语言来开发大数据实际系统,要求学生掌握这些系统所处的平台。为此课程将系统平台基础知识向学生展示,这些平台基础包括常见的Linux操作系统命令、Docker客户端和服务器、Docker镜像、Registry、Docker容器、Docker安装与启动、Docker镜像操作等。要求学生掌握平台部署与维护能力。
第3部分课程将以Python程序设计语言的学习为重点。但由于学生已经具备基本程序设计能力,因而将简要介绍Python语言与其语言不同的基础知识,如Python安装、Python表达式、变量、语句、函数、 模块、列表、元组、字符串、字典等相关概念。然后,课程知识将进入Python高级主题,包括文件、抽象、魔法方法、异常、属性、迭代器等知识。
课程第4部分将是Python如何存储数据,因而将介绍大数据数据库。由于大数据系统的开放性、数据的非结构化性,课程采用开源数据SQL 数据库引擎SQLite和PySQLite数据库技术。其次,大数据分析是网络发展的产物,因而将需要大量网络编程模块及网络编程技术。所以课程将重点介绍Python socket、urllib和 urllib2等基于网络的编程实现技术。海量数据处理将涉及大规模事务处理,课程也把Python多线程编程技术作为重要的知识点,以期能提出学生进行大数据处理的能力。
第5部分课程将以综合实践应用能力培养为目标,重点在于培养学生创新项目设计与实现能力。因而课程主要介绍Python爬虫基本概念,包括网络爬虫概念、XPath语法、XML解析、Python re、json模块、HTTP协议和分布式爬虫原理等。以此为基础,实现一个影评信息实爬例,包括网页下载器、网页解析器、数据存储器、爬虫调度器等Python编码与实现。基于以上能力,要求学生们分组实现基于某团购网的大型离线电商数据分析平台、大数据分析在媒体公关与危机处理方面应用、期货金融大数据分析等综合实践应用大数据技术案例。以此培养学生在新经济环境中的创新创业能力。
四、小结
本文针对新经济背景下的新工科课程知识体建设,提出Python大数据分析及应用课程的知识体系,系能为新工科建设提供一定的实践参考。
参考文献:
[1]https://baike.baidu.com/item/%E6%96%B0%E5%B7%A5%E7%A7%91/20597803?fr=aladdin
[2]祝夫文,段园培,朱协彬.学时缩减背景下基于大数据的本科教育课时优化.教育教学论坛,2018,(12):89-90
作者简介:
唐小勇(1973.3-),男,湖南洞口人,副教授,博士,主要研究方向:计算机教学法、高性能计算。