数据挖掘中关联规则的研究及在高校教学质量评估中的应用

被引量 : 0次 | 上传用户:tanner007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年伴随着数据量的急剧增长,数据挖掘己经成为人工智能、模式识别等领域的研究热点,已经越来越引起人们重视。其中,关联规则是数据挖掘中最活越的研究方向之一。本文对数据挖掘技术,尤其是关联规则挖掘及其应用进行了系统学习和分析研究,主要包括以下内容:1.Apriori改进算法的设计和分析。对现有关联规则挖掘文献进行调研,特别是对经典的关联规则挖掘算法Apriori算法及其各种优化改进技术进行了广泛研究。在此基础上,提出了命名为Apriori-B的改进算法,该算法主要考虑Apriori算法中频繁项目集生成的瓶颈问题,通过减少事务数据库扫描次数、压缩进一步迭代扫描事务数的方法对Apriori算法进行改进。我们通过实例,给出了采用Apriori-B算法进行关联规则挖掘,发现频繁项集的过程。通过与Apriori算法的对比性实验,对Apriori-B算法的性能进行了分析。2.关联规则有效性的研究。为了挖掘真实有效的关联规则,目前常用的衡量标准是关联规则的支持度和置信度。如果按现有标准来生成关联规则,可能会发现大量冗余的、虚假的关联规则。为了减少关联规则挖掘中无效关联规则,我们提出了三种改进方法,即在关联规则的衡量标准中增加兴趣度、有效度或综合评定度标准,并分别定义了这三种度量。根据兴趣度、有效度或综合评定度的大小,我们将强关联规则分为正关联规则、无效关联规则和负关联规则。一般来说只有正关联规则才是有效的关联规则,有时它们只占强关联规则总数的一小部分。最后,我们提供了基于新衡量标准进行关联规则挖掘的改进算法,实验表明我们提出的方法能明显减少无效的关联规则。3.关联规则挖掘在教学质量评估系统中的应用。对湖南城市学院部分评教数据和教师的档案数据进行关联规则挖掘。我们使用Apriori-B算法产生频繁项集,基于新衡量标准产生关联规则,挖掘出影响教学质量的关键因素。对挖掘结果进行了分析和解释,从而为教学管理部门提供决策支持信息,促使更好地开展教学工作,提高教学质量。
其他文献
多元统计聚类方法已被广泛应用于自然科学和社会科学的各个领域,而在现实处理多元数据聚类分析中,离不开统计软件的支持;R软件由于其免费、开源、强大的统计分析及其完美的作
研究目的:了解长沙市护士的职业倦怠程度,长沙市护士的专业工作环境现状,探讨护士专业工作环境中引起护士职业倦怠的因素,初步提出职业倦怠的组织干预措施。研究方法:采用分层随机
连锁经营以其特有的魅力在短时间内风靡全球,掀起了营销界的第三次革命,成为有史以来最成功的经营概念之一。连锁经营的成功,一方面根源于连锁这一先进的经营组织形式顺应了社会
近年来,Internet上的流媒体应用得到了迅猛发展。如何实现一个经济、高效的流媒体通信传输系统已成为流媒体服务系统的核心问题。传统的分布式多媒体系统主要使用C/S模式,服务器
财务困境是公司财务学的一个重要而又复杂的研究领域。而财务困境成本(Financial Distress Cost)始终是个颇具争议的概念和论题。财务困境成本问题的复杂性在于两方面:其一,财
农民工城市化是指农民工融入现代城市文明的过程.农民工的城市化已经成为中国城市发展不可逆转的趋势,也是社会稳定、公平和持续发展等诸多目标实现过程中不可忽视的一环.通
在科学、经济、工程等许多应用中都存在着在历史数据的基础上预测未来的问题。时间序列预测是预测领域内的一个重要研究方向,这是一种根据历史数据构造时间序列模型,再把模型外
营销与创新是三一重工赖以生存的两大基石,但面对具有很强创新能力且不断适应中国的世界500强企业,我们与它们的差距很明显;而国内的工程机械厂家也在多年的市场竞争中,正不断的
电视新闻深度报道是凭借现代电视技术手段,以电视传播符号为载体,以客观事实为依据,通过反映重大新闻事件和社会问题,深入挖掘和阐明事件关系并预测其发展趋向,使受众认知社会事实
药品与每个人息息相关,药品行业每发生微小的变化都会引起社会的广泛关注,而药品流通领域更是近些年来政府和社会关注的焦点。但我国的药品流通渠道存在着较多的问题,这既与国家