【摘 要】
:
在竞争激烈的市场环境下,为了更好分析商业用户信息,赢得更多的商业用户,需要进行海量大数据分析。本文针对传统K-means算法自身初始聚类选取的缺陷和单机串行聚类算法的局限
【机 构】
:
凌拓(上海)商贸有限公司北京分公司,华北理工大学电气工程学院
【基金项目】
:
河北省自然科学基金(ZD2014077)
论文部分内容阅读
在竞争激烈的市场环境下,为了更好分析商业用户信息,赢得更多的商业用户,需要进行海量大数据分析。本文针对传统K-means算法自身初始聚类选取的缺陷和单机串行聚类算法的局限性,提出了一种改进的K-means聚类算法。结合当前主流的开源云计算平台Hadoop,把改进的算法并行化,克服了传统串行聚类算法在海量数据处理时的不足,以某大型网络存储服务企业每日商业用户网络存储资源使用量为实验数据,验证了算法的高效性和可行性。
其他文献
清代《西厢记》人物批评,是中国古典戏曲学从曲学体系向叙事学和剧学体系转向之后的产物,反映了戏曲文学人物中心观念与人物批评意识的自觉。在批评过程中呈现以"神韵"写意、
1858至1865年是艾米莉.狄金森诗歌创作生涯的巅峰时期,其中尤以1862年前后最为突出。解读她在此期间创作的反映死亡、宗教和内心冲突等主题的诗作,能够揭示诗人在经历了巨大
作为民法功能之下位概念,民法的社会功能是指民法通过其自身运行而对整个社会所产生的影响与效能。它和同位阶的民法的规范功能相比,具有目的性与根本性、独立性与变迁性;而
清康熙以后,清水江中下游地区随着木材贸易的兴起和繁荣,在木商文化的影响下,区域社会迅速融入王朝的统治体系。锦屏县平鳌苗寨保存的康熙三十六年“输粮附籍”碑,反映了清水
这是第一篇探讨《尚书》“有+S”式复音词的专论。文章通过详细分析《尚书》“有+S”的主要结合方式,对学术界的一些传统见解提出不同看法。文章认为“有+S’式是汉语词汇附音式复音
企业网站设计方案是将企业网站建设成为一个优质网站首先要考虑的重要环节,企业网站建设方案适合中小型企业,它有自己独特的风格设计及其建设步骤。网站建设方案能反应出网站
对硅的反应离子刻蚀(R IE)工艺参数进行了研究.通过控制变量法,得出了刻蚀速率与射频功率、刻蚀气体压强和刻蚀气体流量之间的关系曲线.结果表明,随着射频功率的增加,刻蚀速
<正>研究函数图像的对称性,是函数学习中的重要内容.函数图像有两种对称,一种为轴对称,另一种为中心对称.从图像的对称性上,直观上能发现图像的对称美、和谐美.同时,如果函数
目的探讨基于医疗影视的情境案例式教学法对灾难护理教学实践中护生情感能力培养的应用效果。方法采取整群便利抽样法,抽取江苏大学医学院2014级两个班级共75名本科护生为研
刘勰的情采观和苏珊.朗格的情感形式观,虽然在时代思潮以及各自的立论基础上都各不相同,但在情采关系和情感形式关系方面却有相同之处:一是情采和情感形式都是构成文本缺一不