【摘 要】
:
数据流频繁闭合模式的挖掘技术应用的普遍性,使得数据流频繁闭合模式挖掘技术的研究受到越来越广泛的重视,特别是在商务决策、知识库方面发挥着很大的作用。由于数据流自身高
论文部分内容阅读
数据流频繁闭合模式的挖掘技术应用的普遍性,使得数据流频繁闭合模式挖掘技术的研究受到越来越广泛的重视,特别是在商务决策、知识库方面发挥着很大的作用。由于数据流自身高速、海量、多变、无限等特点,使数据流挖掘遭遇了很大的挑战。一些研究学者采用数据结构存储数据量中的所有项集,滑动窗口机制来挖掘,提出基于滑动窗口的闭合频繁模式挖掘的多种算法,在数据流挖掘领域取得了很大进展。但是这些基于滑动窗口机制的数据流频繁闭合模式挖掘的算法中,由于较多地考虑快速且精确的效果,而较少考虑数据流的时变特性,因此数据流挖掘算法多是在等速的理想数据流环境中的研究,而现实生活中的数据往往不是等速的,研究结果与实际应用的差距给数据流挖掘的研究带来了新的问题。为了寻求解决数据流挖掘中的这些新问题的方法,本文提出可变滑动窗口数据流频繁闭合模式挖掘算法,主要是针对不等速数据流的挖掘算法。这对数据流挖掘算法的实际应用价值方面具有重要意义。为了更好的挖掘不等速数据流,文中首先对数据流,数据流处理系统,数据流频繁模式挖掘及数据流频繁闭合模式挖掘的相关理论性质和挖掘技术进行了深入的理解。其次在对各种数据流频繁闭合模式挖掘的概念和算法理解的基础上,重点分析了DSCFI算法。最后改进了滑动窗口机制,提出可变滑动窗口,针对可变滑动窗口的机制,提出了DS-stream算法,并用人工合成数据集进行实验,对实验结果进行分析。实验结果表明, DS-stream算法在挖掘数据流频繁集上有很好的时间与空间效率。
其他文献
随着信息通信技术的发展,电子医疗服务成为了一个新兴的研究领域。电子医疗服务集合了医疗信息学,公共健康和商业学的一个交叉领域,指的是通过互联网及其相关技术来交付或改
物联网描绘的美好前景以及它所带来的巨大商业利益,吸引着科研机构、跨国企业、科技公司和各国政府的投入,以物联网为代表的新兴技术一跃成为信息社会的核心产业之一。在各方
时滞神经网络是时滞系统的一个分支,具有丰富的动力学行为。鉴于神经网络在模式识别、图像处理和优化计算等方向有着广泛的应用前景,吸引了很多学者对时滞神经网络展开研究。
场景解析对于室内机器人语义定位和地图构建有着重要的应用价值。直接测量高精度的深度信息能弥补传统RGB纹理视觉信息的不足,对于解决室内场景解析问题具有巨大潜力和诱人前
计算机辅助颅面复原是指在计算机上根据颅骨信息再现人脸面貌的过程,在考古领域的重建古代人物面貌、刑侦案件中的骸骨身份辨认及虚拟整容手术方面有着广泛的应用。本文在对
数字家庭是利用通信、电视和计算机等数字技术,把家庭中的各种通信设备、计算机设备、家用电器、安防设备等,通过数字家庭网络连接在一起,进行监视、控制与管理的一种智能数
惯性导航系统(INS)与全球导航卫星系统(GNSS)两者结合可以互补各自的不足,具有非常广阔的应用前景,因此组合导航一直备受国内外相关研究领域所关注。组合导航应用研究中的一
随着微处理器设计工艺的飞速发展和计算机体系结构技术的不断进步,新的硬件平台被推出的速度逐年加快,大量新型的、具有更高性能和更适用于特定专业领域的体系架构涌入市场。
码的网格理论起源于有限自动机的研究,1967年Forney受Viterbi算法的启发而发明了网格,从此开启了网络编码的网格研究。给定一个线性分组码,存在多个不同的网格表示,然而如何
随着汽车持有量的增加,我国交通安全问题日益突出,由驾驶员疲劳驾驶造成的交通事故越来越多,现已成为交通事故发生的主要因素之一,由此可见,研究并实现疲劳检测相关算法对预