论文部分内容阅读
随着数据库技术的成熟应用和Internet技术的迅速发展,人类面临的数据量呈指数增长。当前,人们已经告别没有数据可用的年代,转而进入如何从海量数据中提取出有用知识的年代。对这种海量数据,不能只应用传统的查询、统计分析方法,而应该挖掘出数据更深层的规律和数据之间的联系,从而为决策者提供支持。因此,数据挖掘技术应运而生。关联规则挖掘是数据挖掘技术的一个分支,它根据给定的支持度和置信度阈值,从事务数据库中发现各数据之间的联系,并以关联规则的形式体现出来。本文的主要工作如下:1.讨论数据挖掘技术,包括数据挖掘的产生背景、主要任务与功能、一般挖掘过程、常用技术与方法、面临的困难与挑战等。2.讨论关联规则挖掘技术,包括关联规则挖掘的背景、问题描述、一般挖掘步骤、挖掘种类、目前挖掘算法存在的问题等。3.讨论关联规则挖掘的经典算法,包括Apriori算法和SETM算法。4.针对经典算法采用水平数据布局事务数据库的数据压缩不足的缺点,提出事务数据库垂直数据布局形式的频繁补项存储结构,并研究基于频繁补项存储结构的频繁项集挖掘算法。5.将基于事务数据库频繁补项存储结构的关联规则挖掘算法应用于团体心理健康评估系统中。对测试系统得到的测试数据进行关联规则挖掘,以分析团体中各心理影响因子之间的联系,为心理医生治疗疾病提供依据,促进人们心理健康。