论文部分内容阅读
随着科学技术的发展,信息化、数字化风暴席卷全球,各大高校纷纷采用计算机平台进行日常办公、人事管理等。这些业务系统为我们的生活带来便利的同时,也存储了丰富的业务数据。在这个信息爆炸的时代,从海量业务数据中挖掘出有效的、新颖的、潜在有用的、最终可理解的信息,并将这些抽象数据直观形象地展现给用户,以支持用户进行数据分析和行政决策,成为目前校园信息化建设的一项巨大的工程。本文在对国内外数据统计研究现状分析的基础上,结合本校的实际,提出了一套符合本校需要的数据统计及展现的解决方案。研究生数据统计以山东大学研究生管理信息系统为背景,通过引入创新的数据统计模型进行有效的数据统计。统计工作面向研究生管理信息系统各类用户的需求,为教育事业分析预测提供准确依据,满足学校管理人员和教育事业研究人员对山东大学研究生各方面数据的需求。本文以ETL过程为主线,描述了山东大学研究生在学籍和就业方面的数据统计过程。统计过程涉及数据的抽取、数据的清洗和转换、数据的加载三个阶段。经过以上三个阶段的预处理,源数据被转换成准确、规范的格式以报表的形式进行展现。在需求分析中,首先分析了研究生数据统计的重要性和目前存在的问题,明确了研究生数据统计的必要性;其次,引入多维数据模型的相关概念,解决了统计结果的存储问题;再次,分别描述了研究生学籍和研究生就业的数据统计过程;最后,介绍了统计数据的展现方式。在数据统计过程中,首先介绍了数据仓库的概念和特点,着重分析了数据仓库的产生原因、数据仓库的基本概念和数据采集的相关知识:其次分析了数据统计的重要性,并介绍了数据统计的流程;最后以研究生就业数据的统计为例,详细描述了数据的ETL过程。在统计数据输出阶段,介绍了一种面向客户的统计数据查询和展现方法,并针对不同用户对数据格式的不同需求,将数据的展现分为Excel、饼状图和柱状图三种模式。最后以上述三种模式展现了山东大学研究生学籍和就业的统计数据。当前山东大学研究生数据统计工作已经完成,统计结果已经按照要求展现,统计数据准确有效,为学校研究生管理人员和国家教育事业研究人员进一步分析预测提供了依据。