半结构化文档数据流的快速频繁模式挖掘

来源 :东南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:dbscy001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高半结构化文档数据流的挖掘效率,对原有挖掘算法StreamT进行了改进,提出了一种半结构化文档数据流的快速频繁模式挖掘算法——FstreamT.该算法针对利用集合存储候选频繁模式效率较低的缺点,采用枚举树存储候选频繁模式,可以有效地提高对候选频繁模式集合进行查找和更新的效率,同时利用频繁模式的单调性和枚举树的特点减小了维护负边界的搜索空间,从而提高了整个算法的效率.理论分析和实验结果表明,算法FStreamT与算法StreamT相比具有较高的效率,是有效可行的.
其他文献
在直接蒸发冷却和间接蒸发冷却(IEC)优化组合的基础上构建了溶液除湿蒸发冷却系统(LDCS),该系统通过IEC对排风进行全热回收,并能够提供高质量的空调送风.研究表明:用LDCS进行空气调节
远离故土灌南600多公里的杭州乃“人间天堂”,处处洋溢着现代大都市气息。在杭州,在许多来自灌南的农民“淘金者”,他们从迈入杭州的那一刻起,就用自己的辛勤、自己的朴实,自己的
为了正则化扩散张量磁共振成像所产生的扩散张量场,提出了一种非线性张量值加权方向-距离滤波方法.首先通过张量间的二次点积定义了张量值图像的方向滤波,然后结合张量中值滤波