海量数据集相关论文
针对海量数据聚类过程中,经典的K-均值聚类算法对其K个初始聚类中心点的选择以及数据集噪声十分敏感的问题,提出了一种针对海量数......
数据挖掘的首要工作是数据的准备,数据的准备包括:数据选取、数据预处理和数据变换.对于真正的大型数据集来讲,在数据挖掘过程中,......
随着网络速度的提高,网络的数据流量越来越大.为了提高基于数据挖掘的入侵检测系统的检测性能,提出了一种在海量数据集上进行数据......
通过开发大型企业财务信息专家系统的项目经验,详细剖析基于AjiiX.NET3.5技术的B/S架构系统搭建过程.对新一代的B/S级大型财务系统设计要......
相似自连接是一个在很多应用领域中很重要的问题.对于海量数据集,MapReduce可以提供一个有效的分布式计算框架,相似自连接操作也同样......
研究运用复旦中文文本及搜狗中文文档作为研究对象,提高了中文文本分类精确度及召回率,分析得出特征词的最佳贡献值。应用朴素贝叶......
关键词自动抽取的任务就是使用计算机自动地从文本中抽取能够高度有效表达文本主题的词汇。小规模训练集和测试集下的关键词自动抽......
传统的体绘制方法需要将原始体数据全部装入内存,无法应用于Out-of-core(海量)数据集。针对这个问题,提出一种有效的针对海量数据......