论文部分内容阅读
为了快速有效地挖掘数据立方体中的数据,提出了阈值异常和区间异常两种基于回归分析的异常发现方法,根据回归系数帮助用户快速地找出数据单元内的异常数据.阈值异常方法通过比较数据的规格化残差和用户给定的偏差阈值来发现异常数据.区间异常方法通过比较数据点的残差绝对值和置信区间来发现异常数据.最后,对这些算法的性能进行了分析,理论分析和实验结果验证了这两种算法的有效性.