中考平台数据分析与应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:whm9903
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,广东省高中阶段招生报名和录取都是通过网上进行,本人曾经参与了广东省高中阶段招生报名服务平台(中考平台)的开发与设计。通过对中考平台中获得的数据进行分析,发现每次对考生的数据进行分析都需要通过编写复杂的SQL语句才能进行相关统计,并且难以多方位地对数据进行查询分析。每年中考过后,数据都仅仅是经过简单的归档备份后就再不使用,对数据造成了极大的浪费。人们希望对考生数据进行更加深入的分析来得出一些未知的知识,以便利用这些知识来进行决策。数据挖掘与数据仓库是目前解决这个问题的主流解决方案。   本文的考生信息数据都是通过广东省中考平台上采集到的,首先简要介绍了广东省中考平台的设计概况和本人所负责的相关功能模块。在平台的开发工程中发现由于数据量庞大且数据结构复杂,为了保证平台正常运行,每年都要把往年的考生数据清空;对考生信息的统计分析也不方便,虽然中考平台有相应的统计功能,但由于各个功能模块相对独立且可选择的属性有限,很难适应一些特定的需求。为了解决这一问题,本文提出了对考生信息建立数据仓库。   接着对考生信息数据进行详细分析,并根据管理部门的业务需要,面向不同的主题,根据《数据仓库工具箱:维度建模的完全指南》四步骤维度建模方法来建立考生数据仓库各主题的星型模型并且对考生数据仓库进行概念模型、逻辑模型和物理模型设计。利用SQL Servers2005的BI系统(Analysis Servers、Integration Services)对考生数据进行数据清洗、转换,并根据前面建立好的考生数据仓库模型建立多维数据集市,根据决策管理的需要,使用OLAP工具面向不同的主题实现了联机分析处理。考生数据仓库建立完成后通过对考生录取信息的统计分析发现汕尾市地区的学校录取后考生报到率偏低,造成了学校招生数量不足,其他符合条件的考生又不能顺利被录取到满意的学校。为了找出影响考生报到率高低的相关因素,对考生录取主题使用决策分类方法进行数据挖掘,再针对这些因素制定相关的政策措施,可以有效地提高考生的报到率讲而对当前的教育现状有所提高。
其他文献
XML以其扩展性、结构性、平台独立性和自描述性等诸多特性,越来越多的信息采用XML格式进行存储和交换,XML已经成为Web上信息表示和交换的标准。大量XML数据的出现给XML的存储和
生物命名实体识别是生物医学文本挖掘的关键步骤,只有正确地识别出生物命名实体,才能有效地完成基因(蛋白质)标准化和蛋白质-蛋白质相互关系抽取等更加复杂的工作。然而,由于生
随着个人媒体设备的快速普及和互联网技术的出现,现实生活中图像的数量急剧增长,因此如何快速有效地组织和管理这些图像成为一个研究热点。与此同时,各种新兴技术的迅速发展
恶意代码作为信息技术的衍生物,对网络安全领域的威胁日益严重。恶意代码分析工作具有十分重大的意义。通过对恶意代码运行机制的深入挖掘可以获得其内部详细信息,进而作为恶
随着经济的发展,企业内部以及企业之间日益膨胀的企业活动需要工作流技术的支持,因此对工作流系统的可用性、灵活性、效率性、安全性提出了更高的要求。企业不仅需要一个能够定
进入二十一世纪,现代科技的发展正推动着各行各业的革新。教育事业作为立国之本,也在科学技术的推动下,产生了巨大的进步。现代社会的学习形式发生了很大的变化,我们正从单一的课
由于国内宽带网络的出口带宽瓶颈和服务器处理能力的限制,传统的基于C/S模式的流媒体分发系统,为了支撑不断扩张的客户群,需要购买越来越多的服务器硬件和带宽资源,从而导致
随着网络的高速发展,越来越多的实时业务在网络中传输,这些业务对数据传输的带宽、延时、抖动都有更高的要求。服务质量QoS成为研究的热点。QoS的研究目标是有效地为用户提供
学位
近年来随着各个行业数据量的大幅度增长,如金融,电信行业等,使得存储费用和管理费用也随之增长。面对信息量不断膨胀的问题,数据库系统采用压缩数据的方法保存数据,同时为了提高压
随着互联网技术的高速发展,网络信息量也随之飞速增长,如何从海量的信息中搜索出用户需要的信息成为当前热门的研究课题,搜索引擎作为互联网信息检索技术得到了广泛的应用,垂