基于K均值聚类的大数据频繁项集挖掘研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:ghostraider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统大数据项集挖掘方法存在占用内存较多、挖掘效率较低的问题,提出新的基于K均值聚类的大数据频繁项集挖掘方法。通过对K均值聚类的区间标度变量、二元变量等相似度量的分析来表示样本之间的相似度与离散度,根据样本数据的不同属性选择对应矩阵类型;利用频繁项集自身的约束性质压缩空间,缩小挖掘范围;在K均值聚类基础上,采用fg-growth算法将目标数据高度压缩在fp-tree结构中,并命令原始聚类质心和数量,将其作为K均值的输入,实现大数据频繁项集挖掘。仿真结果证明,研究方法有效降低了挖掘计算复杂度,可保证
其他文献
上海市消协发布消费警示提醒消费者:薄膜制品的用料与其卫生状况密切相关,消费者在使用薄膜制品包装食品时需谨慎对待。
本文采用BP神经网络的方法,以过去七年的数据为基础,实证研究了天然气生产成本,并对未来三年的生产成本与损益进行了预测,实证结论表明:进入稳产期以后,第四采气厂的利润变化
当前方法对脑机接口信号识别时,因其基函数无法自适应调整,导致信号特征提取与识别结果不够准确,因此提出基于经验模式分解的脑机接口信号多模态识别方法。根据固有模态函数及其相关约束条件,通过筛选对经验模式分解实施分析,基于细胞电流架构的信号频率,对脑电信号分类;根据分类结果,采用经验模式分解法对脑机接口信号滤波降噪,经过确定经验模态分解级数,滤波处理剩余信号分量;利用Hilbert变换方法提取信号包络,
减肥保健品非但没有使人更美丽.还把一个健康人拉进流血甚至丧命的深渊。为什么这“夺命”的相关减肥保健品.在经过这么多国家合法程序后还能堂而皇之地躺在药店柜台上?所有机
一般情况下,新产品的研制开发可分为以下三个阶段:
几个月前,沃伦·巴菲特(Warren Buffett)披露了自己缴纳的所得税率低于中产阶级,引来了各方的密切关注。你想知道这位生活简朴的亿万富豪交了多少房产税吗?我们发现,他在内布拉
<正>和弦听觉训练在视唱练耳教学中有着非常重要的作用。它是由单声部听觉训练迈向多声部听觉训练的必经之路,也是成功迈向多声部音乐听觉思维的基础与关键。因此,和弦听觉训
2001年11月27日,随着南充市市中级人民法院审判长庄严而又宏亮的声音“驳回上诉,维持原判”,一起闹得沸沸扬扬的建筑承包商状告质监部门的行政诉讼案,终告结束。
对比了传统照明系统的不足,重点介绍了智能照明管理系统的架构和照明管理方式,分析了智能照明管理系统的使用效果。提出在工业厂房中引入智能照明管理系统,实施先进的管理方