论文部分内容阅读
为了挖掘对象间的相关关系,建立对象间的相关关系网,该文提出了一种基于传递闭包聚类法挖掘相关关系的方法。为使方法高效、实用,对方法中相似阵及等价阵的计算,文章给出了计算等价阵的一种贪心算法-最大树法、计算相似阵的嵌套循环算法(RNL)及渐进式嵌套循环算法(IRNL)。RNL算法有效减少了大型数据库的I/O开销。当数据库中的数据增加时,使用IRNL算法能够充分利用原来的挖掘结果,避免了原有对象间相关度的重复计算,从而提高了整个挖掘过程的效率。