无重叠条件下的Top-k序列模式挖掘

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:db0928
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在一些模式挖掘问题研究中,经常会挖掘出大量用户不感兴趣的模式,这些模式在实际生活中难以应用。由于越频繁的模式,越容易是用户关心的模式,为此提出了Top-k模式挖掘。尽管该模式挖掘可以帮助用户找到最频繁的k种模式,但是在满足Apriori性质的挖掘中,Top-k挖掘只能挖掘到短模式。然而短模式所包含的信息量不如长模式的多。为此本文针对无重叠序列模式挖掘问题,研究挖掘各个模式长度下前k个支持度最高的模式,即无重叠条件下的Top-k序列模式挖掘。本文的主要研究内容和相关工作如下:(1)分析了传统Top-k序列模式挖掘存在的缺点,对周期间隙约束的Top-k序列模式挖掘算法MAPBOK和改进的Top-k序列模式挖掘算法NOSEP-k进行了描述和分析。针对已有Top-k算法存在的不足,本文提出了无重叠条件下的Top-k序列模式挖掘算法NOSTOPK(Non-overlapping Sequence Pattern Mining for Top-k)。(2)本文算法NOSTOPK采用网树结构计算模式支持度,无需设置最小支持度阈值,有效解决了最小支持度阈值ρ在频繁模式挖掘中难以设置的问题;每次都选择支持度最高的前k个模式向下挖掘,探寻其对应的k*|?|个模式中支持度最高的前k个,不但减少了模式候选集的数量,而且对模式进行了有效压缩。(3)传统的Top-k模式挖掘算法是为了得到所有频繁模式中最频繁的前k个模式,而本文挖掘算法可以得到各个长度下支持度最高的前k个模式,满足用户对模式的特殊需求。大量的实验结果验证了我们提出的NOSTOPK算法的可行性和有效性。
其他文献
基于局部特征点的图像匹配算法是SLAM系统、视频拼接、图像拼接等图像处理方向的重要一环,因此被国内外学者广泛研究。由于不同图像拍摄条件、图像储存格式、拍摄时的光照强度等的差异,故基于局部特征点的图像匹配算法需要满足仿射不变性、尺度不变性、压缩比不变性、光照鲁棒性等等。同一个图像匹配算法不可能适用于所有的场景,故在特定情景下需要改进图像匹配算法,以增算法的强鲁棒性。光照差异、相机成像差异等因素对图像
留用地制度是扶持被征地农民发展集体经济、保障失地农民利益的一项政策措施,在近二十年的征地拆迁工作中发挥了积极的作用。在城市外围区,留用地承担着中心城区转出产业、功
高能物理学中,重味物理的研究一直是热门话题。近年来,实验组发现大量不稳定的粒子,这些粒子有可能是基态粒子的径向激发态。由于激发态粒子特别不稳定,实验上很难对激发态粒
随着云计算的迅速发展,依赖于位置信息的服务逐渐增多,人们在享受服务便利性的同时,对于位置信息的安全也更加地重视。常用的位置加密方法一般是通过模糊真实位置或者向攻击者发送虚假位置的方式来实现信息的保护,在实际应用中,对位置信息进行层次性的划分更加适合人们日益增长的安全需求。基于属性的位置分层访问控制方案按照属性的重要程度将位置信息划分在不同的层次中,允许用户根据自己的需求定义访问策略,实现了细粒度的
由于处理器性能高速发展,能耗成为人们不得不关注的问题,因此多核低功耗调度的问题一直是现在的研究热点。在现有的多核低功耗调度的研究上,存在下面三个问题。第一,在模型建
一战后,英国通过国际联盟获得中东地区的主导权,开启了对巴勒斯坦地区长达二十八年的委任统治时期。委任统治之初,面对犹太复国主义的迅速发展,出于自身实力的相对衰弱及中东地区统治秩序的双重考量,英国当局对犹太复国主义运动采取了一系列支持性政策。在此期间,通过保障犹太移民合法性、授予土地占有权以及鼓励犹太移民工商业发展等措施,巴勒斯坦地区的犹太社区得到了迅速发展,犹太复国主义运动在移民活动、经济发展和政治
在movielens、豆瓣等视频播放网站中,用户给视频标注的标签,构成了视频的描述文档,同时也形成了用户的描述文档,视频标签推荐系统根据这些信息分析用户的喜好特征,并给用户推
管道在人们的生活中,常作为运输物质的一种工具,出现在工业生产和人民生活中的方方面面,占有举足轻重的地位。诸如天宫、蛟龙等高精端设备油液气的传导运输,从工厂生产中乙炔、氧气、液压油等传导运输,再到人们日常生活中的水、燃气的传导运输,都离不开管道的参与。而金属管道因为其自身材料的强度高、刚度大等有利条件,在管道运输中占有重要地位。但是在管道运输过程中,管道的管壁质量不是坚不可摧、一成不变的,因为其不同
广义逆理论一直都是矩阵理论和算子理论的一个非常活跃的研究领域,在数值分析,微分方程,数值线性代数,控制论等领域中都有重要应用.而Drazin逆及其推广作为它的一个热门分支,
图像去雾是计算机视觉领域的重要研究内容,其主要目的是尽可能减弱甚至消除雾气对图像质量的影响.现有的去雾算法主要分为两类:基于图像增强的去雾算法和基于物理模型的去雾算法.其中,基于物理模型的去雾算法因其针对性强且复原效果好逐渐成为去雾领域的主流方法.但是这类去雾算法中常存在一些待优化的问题,如:边缘保持能力较差、伪影抑制能力较弱以及易在大片天空区域失效等.以上这些不足在很大程度上是由透射率估计不准确