一种基于哈希链表的高效概念漂移连续属性处理算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:liongliong471
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文重点研究了数据流挖掘中存在概念漂移情形的连续属性处理算法。数据流是一种增量、在线、实时的数据模型。VFDT是数据流挖掘中数据呈稳态分布情形下最成功的算法之一;CVFDT是有效解决数据流挖掘中概念漂移问题的算法之一。基于CVFDT,本文提出了有效地解决数据流挖掘中存在概念漂移情形的连续属性处理问题的扩展哈希表算法HashCVFDT。该算法在属性值插入、查找和删除时具有哈希表的快速性,而在选取每个连续属性的最优化划分节点时解决了哈希表不能有序输出的缺点。
其他文献
回归测试是一个成本很高的测试过程。为了减少回归测试的成本,可以使用测试用例排序技术。测试用例排序是指按照事先确定的目标重新安排测试用例集中测试用例的执行次序,使得具
今年4月26日,蒙西电网告:风电上网电量11138万度,占总上网比例达30.5%,再次创新高,并且全天电网运行平稳,这已是一个月内第五个历史最高水平这是中国风电发展的一个缩影,相对去年此时
为了选育优良的三叶草品种,对高加索三叶草、白三叶及其10个F1代株系种子的颜色、大小、千粒重、发芽率及出苗率进行了比较分析。结果表明,供试材料种子各指标间均存在显著差异
本文就无约束优化问题提出了一个带记忆模型的非单调信赖域算法。与传统的非单调信赖域算法不同,文中的信赖域子问题的逼近模型为记忆模型,该模型使我们可以从更全面的角度来求
本报讯 (记者谢超平 通讯员惠 信)昨日上午,市委书记、市人大常委会主任陈奕威主持召开专题会议,听取我市乡村振兴战略实施方案制定情况和乡村振兴综合改革试点工作推进情况汇报,
报纸
P2P是近年来网络研究领域的热点。当前P2P网络的研究多集中在文件共享的应用,其检索机制只支持基于关键词的查询,缺乏对语义检索的支持。本文将语义网技术和P2P的优点结合起来,
为了研究滩羊和小尾寒羊不同部位脂肪酸组成的差异,试验对滩羊和小尾寒羊股二头肌、背最长肌和臂三头肌3个部位31种脂肪酸的停留时间和浓度进行了对比分析。结果表明,31种脂
由于空间域嵌入的水印对旋转和缩放攻击相当脆弱,本文提出一种新的水印算法。将原图像和水印图像进行对数极变换,将变换后的水印图像嵌入到变换后的原图像中,然后再反变换为直角坐标系下的图像。水印嵌入到图片的位置不同,检测的水印图像发生变化。本文提出三种嵌入位置的方案,显示不同的效果。检测水印时,对几何攻击过的水印进行几何校正,然后与原图像相减得到水印。这种水印方案能够很好地抵抗几何攻击。
非结构网格上求解粒子输运方程的可扩展并行算法是一个亟待解决的课题。本文在文献[1]并行流水线勖扫描算法的基础上提出了一种改进算法。改进后的算法可以有效降低原算法对
ID.3算法是经典的决策树算法,而样本集分布不均衡性会对树的结构和识别效果产生较大影响。本文在分析显微镜下细胞识别库样本分布规律基础上,利用直方图均衡化技术对样本特征分布进行变换处理,使整个特征分布规律转变为[0,1]区间内近似均匀分布。实验表明,基于特征直方图均衡化技术实现的ID.3算法收敛速度加快,产生的决策树平均深度降低。