【摘 要】
:
无重叠条件序列模式挖掘是一种带间隙约束的序列模式挖掘方法,能够有效地克服当前此类挖掘中的问题.但是当前的方法仅仅用于挖掘频繁模式,为了高效地挖掘最为频繁的k种无重叠
【机 构】
:
河北工业大学人工智能与数据科学学院; 河北省大数据计算重点实验室;
【基金项目】
:
国家自然科学基金项目(61702157)资助;黑龙江省自然科学基金项目(F2017019)资助
论文部分内容阅读
无重叠条件序列模式挖掘是一种带间隙约束的序列模式挖掘方法,能够有效地克服当前此类挖掘中的问题.但是当前的方法仅仅用于挖掘频繁模式,为了高效地挖掘最为频繁的k种无重叠序列模式,本文提出了"Gfp-tree(Gain-frequence-patterntree)"这一数据结构,构建了无重叠条件下完备的Top-k模式挖掘算法.该算法基于Apriori性质,不预先设定支持度阈值,而是在挖掘过程中生成并动态调整,直到挖掘过程结束.有效减少了候选模式的生成数量,节约了运行时间.实验表明,该算法具有较高的效率.
其他文献
楚辞名家关于《天问》主旨的论述见仁见智,将其归纳为抒愤说、诘问说、究理说、讽刺说四类逐一辨析,引出《天问》乃一首咏史性的哲理抒情诗的结论。然后从抒情性、咏史性、哲
曾国藩是清朝"同治中兴"的重臣。其大量采集收藏图书资料,并认真阅读、刻苦研究、积极创作的治学态度与思路,所取得的成果及其产生的作用,在当时被众多的才子所青睐。有许多
陶渊明和华兹华斯是中西两位伟大的田园诗人,两位诗人的田园诗作如同一座艺术桥梁沟通了中西田园诗歌艺术之流。本文试从"浪漫主义风格"、"语言特色"两个方面探讨两位诗人田
全球薄膜太阳能龙头厂美国First Solar近期举行法人说明会时表示,计划2014年其碲化镉(CdTe)薄膜太阳能电池模块每瓦制造成本将达到0.52~0.63美元,相较于目前每瓦约0.93美元的成本下降
上党梆子在其发展历史上曾同时包含昆、梆、黄、罗、卷五种主要声腔,且各有其独立剧目,但现下变成以板腔体为主导的剧种。这是在清朝板腔体风靡的大趋势下,受乐籍制度禁除影
目的探讨鼠神经生长因子联合血栓通对急性脑梗死患者血清肿瘤坏死因子(TNF)-α、可溶性白细胞介素-2受体(s IL-2R)、脂联素、C反应蛋白(CRP)及神经功能评分的影响。方法 82例急性脑
《刑法修正案(九)》中规定首次规定终身监禁制度,而本制度的首次适用便引起了学界的众多讨论,本文将以白恩培终身监禁案作为视角,在充分理解我国的终身监禁以及刑法溯及力原
目的分析医院儿科门诊抗菌药物使用情况,以促进合理用药,提高临床用药水平。方法随机抽取2010年6月至12月儿科门诊处方11235张,对抗菌药物使用情况、联合用药等进行统计分析。结
水凝胶是一种三维网状亲水性高分子软材料,具有良好的固体力学和液体热力学性能,其自身柔软、可塑性强、生物相容性好,具有可降解性和刺激性响应特征。但传统方法制备的水凝
随着当代社会科技的进步,人们的生活领域及设计媒介内的领域都发生了相应的改变.在经济社会发展的过程中,信息也渐渐呈现出复杂化和多样化的发展状态,如何对其进行有效的信息