论文部分内容阅读
在过去的数十年中,无论是商业企业、科研机构或者政府部门,都积累了海量的、以不同形式存储的数据资料。由于这些资料十分繁杂,要从中发现有价值的信息或知识,达到为决策服目的,成为非常艰巨的任务。此外,作为全球信息系统的万维网的流行,已经将我们淹没在数据和信息的汪洋大海中。存储数据的爆炸性增长业已激起对新技术和自动工具的需求,以便帮助我们将海量数据转换成信息和知识。 数据挖掘是数据库系统和新的数据库应用的一个有希望的、欣欣向荣的学科前沿。数据挖掘(Data Mining),通常又称数据库中的知识发现(Knowledge Discover in Database),是自动的或方便的模式提取,这些模式代表隐藏在大型数据库、数据仓库或其他大量信息存储中的知识。数据挖掘是目前国际上数据库和信息决策领域的最前沿研究方向之一,其中关联规则(Association Rules)的挖掘是它的重要问题之一。 关联规则挖掘是发现大量数据中项集之间有趣的关联或相关联系。随着大量数据不停地收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事物记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、交叉购物和贱卖分析。 本文重点研究了关联规则的挖掘算法,并进行了以下几方面的工作: 1.数据挖掘现状研究。 2.对关联规则算法(特别是Apriofi算法,DHP算法)进行深入研究,针对关联规则算法普遍存在的FSC(Frequent set counting)问题进行改进,提出一种高效的关联规则算法(Apriori-3)。在数据挖掘的研究领域,Apriori算法和DHP算法是其中比较有代表性的一个算法。关联规则的数据挖掘主要挑战性在于数据量巨大,因此算法的效率是关键。 3.完成大连交通大学教务管理系统成绩管理子系统、教学计划子系统的设计与开发,包括初步设计、详细设计以及软件丌发。大连交通大学教务管理系统主要包括学籍管理子系统、成绩管理子系统、教学计划子系统和公共信息子系统(基