【摘 要】
:
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要的信息。如何从历史数据中及时发现有用的
论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,各行各业积累了大量的历史数据,而这些激增的历史数据中往往隐藏着很多重要的信息。如何从历史数据中及时发现有用的知识,从而挖掘出其潜在的价值,提高其利用率,是信息处理技术研究领域的一项重要课题。作为其解决方案,近年来数据挖掘(DataMining,DM)技术迅速崛起。以省为单位,每年高考志愿信息相关记录高达数百万条,分布存储在省市的多个数据库中,这些数据规模巨大,蕴涵丰富的决策信息和知识,开发这些宝贵的信息资源,是服务高招录取工作,指导考生科学地填报志愿的一项重要任务,是目前迫切需要解决的问题之一。本文以数据挖掘技术为数据分析手段,根据高考志愿数据的特点和平行志愿投档方式下考生的自我定位原则,对高考志愿及相关数据进行了分析和研究,提出了一个基于数据挖掘技术的考生志愿风险评估模型,并给出了相应具体的算法和解决方案。具体的有以下几个方面的工作。1.对考生志愿相关数据进行预处理。2.灵活运用决策树C4.5算法并进行改进,针对该算法易忽略小数据量属性的缺点和为提高稀少样本精度,使用属性递归优化与经验优选策略相结合的方法;同时提出了能进行增量学习的C4.5算法处理方法,生成非平衡数据集下的决策树,设计一个志愿分析的分类器。3.根据考生填报志愿时自我定位的实际情况,合理的选择K-Means聚类算法的初始中心,使用K-Means聚类算法对院校等信息进行聚类,对高考相关数据进行知识挖掘,获取其中规律性的潜在信息。4.建立一个考生志愿风险评估模型,根据考生的成绩、科类、报考的专业和学校等情况对高考录取情况进行预测,得出平行志愿投档方式下每个志愿较有可能被录取的多个院校和该院校下的志愿风险系数,提供给高考填报志愿考生。据此所开发的“考生志愿风险评估系统”通过对过去三年的河南省高考志愿相关数据进行实验测试,与当年高校实际录取情况分布基本吻合,有理由相信,这些测试结果对来年考生在填报志愿时有着很好的参考价值。
其他文献
图像降噪是图像处理的一个重要环节。图像在采集和传输过程中,往往受到噪声的干扰,而降噪的目的是尽可能的保持原始信号有效信息,同时除去信号中的噪声。近年来,小波理论得到
随着计算机技术尤其是互联网技术的蓬勃发展,越来越多的人开始接触并使用互联网,这促进了对基于互联网应用系统和软件的巨大需求,从而推动了许多新的研究领域和方向,也加速了
与其他多物品拍卖方式相比,组合拍卖通过允许竞标组合从而能更精确地表达竞标者对竞标物品之间关联价值的真实需求。由于竞标组合的不可分割性,使得竞标者避免了由于关联价值物
无线传感器网络涉及许多个学科,知识相互交叠,随着传感器技术、微电子技术、嵌入式计算、分布式处理和无线通信等技术的极大进步成为当今世界IT领域备受关注的研究热点之一。
人类通过视觉识别文字,感知外界信息。人脸是人机交互中相当重要的因素,通过人脸我们可以判定许多信息。利用人脸特征进行身份验证又是最自然直接的手段,它具有直接、友好、方便
在金融领域,软件系统的集成测试通常会涉及到多个遗留系统间的交互,并且单个系统的业务逻辑不会频繁变动。如何在黑盒或灰盒的状态下对多个跨平台跨组织的系统进行有效测试是
随着高科技的飞速发展,全世界每天都有几十亿的人在使用手机、电脑和其他电子产品,产生了大量的海量数据。大数据从互联网向其他领域急速蔓延,各行各业都已经被数据给渗透,对
虚拟现实技术是一门前沿学科,它与计算机仿真学,环境艺术学等密切相关。在军事,经济,教育,生活等方面都有着广泛的应用和发展前景。本文研究的是机械表三维虚拟仿真与漫游,采用了3ds Max为场景建模工具,以Unity 3D引擎为虚拟现实开发平台,通过JavaScript脚本语言、动画控件进行交互控制,实现机械表仿真与漫游的目的,具有实用参考价值。本系统在实物机械表的基础上划分了具体的功能模块,通过机械
数据挖掘技术具有较高的有效性和良好的可操作性,被广泛应用于各个领域。近年来,基于数据挖掘技术的研究方法不断涌现:如基于决策树分类、统计分类、贝叶斯分类、神经网络等方法
随着计算机的迅速发展,软件复杂性逐渐增大,软件质量问题受到越来越多的关注。软件测试是保障软件质量的关键技术,研究表明测试通常占总的开发费用的50%,因此有效的软件测试