MAPREDUCE模型相关论文
协同过滤算法广泛应用于电子商务网站的推荐系统中,它基于对大量用户历史行为数据的分析,挖掘用户的兴趣并向用户推荐合适的产品.......
期刊
本次研究基于MapReduce模型在并行式环境中提出一种高性能的计算机数据挖掘算法,将模型输入由原始的一个样本转变为一组样本代以减......
高性能计算机主要应用于传统的科学计算领域,而在云计算时代,数据密集型应用成为一大类新型应用,已经变得越来越重要。主要探索如何在......
云计算关心的是在大量廉价服务器构成的基础设施上,提供具有可扩展性和高可用性的分布式并行计算,用以处理Internet产生的海量数据。......
会议
本文引入MapReduce模型来解决决策分解的正确性问题进行了深入研究,并做出展望。随着大数据技术的进步与发展,人们意识到其自身蕴......
期刊
有效的潜在好友推荐是促进社交网络不断增长的重要途径,同时面临大规模社交网络环境下的复杂计算问题,为此提出了一种适用于大规......
会议
自从Web2.0的兴起,在线社交网络吸引了许多国内外研究者的兴趣。这些社交网络有许多独特的结构性质如度的幂律分布、极短的网络半径......
随着互联网技术和分布式数据存储的高速发展,企业对云平台使用越来越普及。与此同时,人们对于自身存储在云平台的数据安全的关心程......
在电信这个服务型行业中。企业为了在竞争激烈的市场中生存发展,客户关系管理工作的质量显得尤为重要,客户流失预测是客户关系管理......
数据访问延时是影响系统性能的关键因素之一。在MapReduce环境中,由于输入数据远大于处理代码,不在数据节点执行的Map任务将会引起大......
频繁项目集最重要的数据挖掘研究方向之一。设计高效并行算法是大规模频繁项目集挖掘的主要挑战。论文基于MapReduce模型,提出负载......
近年来,随着MapReduce分布式计算框架的提出,一场席卷全球的变革正在互联网领域内悄然发生。作为MapReduce的开源实现,Hadoop分布式系......
近年来,互联网应用的高速发展和电信、交通、金融等各个领域数据规模的快速增长,大规模数据处理的应用日益显著。Google提出的MapRed......
随着社会进入网络时代,各种各样的网络设备骤增,产生了大量的数据信息,而这些数据大部分是以文本的形式存在的,如何高效快速的处理......
随着Internet的迅猛发展与互联网用户的快速增加,Internet上的数据也呈爆炸式的增长。对于互联网提供商来说,这些海量数据中隐藏着......
边缘是图像最核心的属性,包含了很多有用的数据。边缘检测技术利用图像的边缘信息对图像进行分割获得目标图像,它是图像进行其它处......
因为MapReduce对于处理大规模数据有着很好的可扩展性,所以MapRe-duce成为了云计算中非常流行的一个编程模型。但是,MapReduce在异构......
随着大数据时代的到来,如何高效地分析处理海量数据成为了计算机学科的一个新的挑战。MapReduce就是在此背景下出现并飞速发展的一......
随着数据规模的日益扩大和数据类型的日益复杂,人类已经进入了大数据时代。一方面,各类场景和应用程序的可用数据量在急剧增加,另外一......
随着信息技术的快速发展,数据在医疗、商业、民生、科研与军事等领域都呈现出爆炸式增长,数据密集型计算环境下数据挖掘算法的研究已......
随着大数据时代的的来临,如何高效地处理海量数据已经是各行各业都要面对的一个无法回避的问题。为了避免在海量数据面前出现“信......
随着数据大爆炸时代的到来,大数据业已成为信息领域的一大研究热点。目前已有不少云计算环境下基于MapReduce模型的分布式处理系统......
随着网络技术的快速发展,各类信息数据的增长速度越来越快,针对海量数据的处理需求,云计算逐渐成为业界的主流计算模式。MapReduce......
互联网的快速发展推动着数据信息呈现着几何式增长,数据占用空间从GB发展到TB甚至PB,飞速增长的数据规模标识着人类进入了大数据时......
随着计算机技术的进步与发展,云计算作为从分布式计算、网格计算和并行计算发展而来的新兴计算模式得到了飞速的发展。云计算把所有......
学位
TSP问题(Traveling Salesman Problem),即旅行商问题,是数学领域里面组合优化问题中被广泛研究的著名问题之一。TSP问题在学术研究......
随着硬件技术的迅猛发展带来了图形处理器的革新,这个原本只是用于图形数据处理的设备现在却变得举足轻重,它拥有高带宽和高度并行计......
随着社会信息化的进程,海量数据迅速出现,许多并行数据挖掘算法已被提出。聚类分析是数据挖掘的一种强有力的分析工具,其显著特征......
Google设计提出的MapReduce并行编程模型有效地把并行程序的编写者从一些琐碎的编程困难中解放出来。程序员无需为并行程序的任务......
21世纪是一个信息化的时代,信息以及数据快速增长,这对计算能力提出了更高的要求,云计算在此环境下应运而生,它带来了新的变革。云......
自2007年云计算诞生至今,它已经逐渐成为国内外IT界热门的概念,得到了广泛的关注。在当今互联网高速发达的环境中,面对数据量的急剧增......
人脸识别作为一种典型的生物特征鉴别方式,已经成为模式识别领域中一个重要的研究方向,具有广阔的应用前景。近年来移动互联网的迅速......
微博是近年来发展最快的网络媒体之一,随着其用户规模的不断扩大,其产生的信息量和社会影响力也越来越大。同时,网络信息的泛滥阻碍了......
作为数据挖掘领域中的一种重要方法,聚类分析能够发现数据对象自然的分布结构。它根据数据对象之间的相似性,把数据对象分割成簇,......
计算机技术发展至今,互联网的普及率也越来越高,已经成为人们生活中必不可少的工具,特别是随着近年来移动互联网的发展,数据需求呈现分......
近年来,随着互联网应用的迅速发展和云计算技术的广泛应用,数据存储量呈现爆炸式增长。如何在大规模数据集中找到人们感兴趣的数据......
网络图是指由网页及网页之间的链接关系组成的图,通过研究网页间的链接关系,抽取有用的信息,多用于爬虫算法,搜索和社区发现等方面......
随着网格计算、普适计算以及计算机通讯技术的快速发展,人们越来越希望能把资源、软件及应用更好地整合在一起,并以服务的形式向外......
“智能交通”和“社交网络”越来越普及,然而如何处理这些领域背后复杂图结构的问题迫在眉睫。比如,在“智能交通”中,如何计算两......
随着国内外互联网的广泛应用,社会得到了飞速发展。企业和智能终端每天都会产生大量的生产数据、网络社交数据等,传统的数据挖掘算......
随着技术的发展,数据的规模也随之增长。通过各种方法收集的原始数据(即非结构化数据)的指数增长迫使公司必须改变其业务战略和运......
随着遥感影像数据量的增加,传统非监督分类迭代自组织分析(ISODATA)算法的运算将十分耗时,应用并行计算技术能够有效解决该性能瓶......
海量网络数据流量检测可以发现网络中的异常行为,如Probe攻击和U2R攻击等.传统K-Means算法确定聚类中心具有较大的随机性,聚类结果......
随着我国智能电网技术不断地发展和深化,电力信息系统面临着数据海量、分布异构、处理复杂、使用繁琐、维护困难等问题,而云计算技术......
学位
随着“大数据”时代的来临,数据的重要性及其背后蕴含的价值日益凸显,如何更为方便而高效的对数据进行处理成为亟待解决的问题。伴随......
随着遥感技术的不断发展,遥感数据获取呈现三多(多平台、多传感器、多角度)和三高(高空间分辨率、高光谱分辨率和高时间分辨率)的......
学位
网络书写纹是指用户在网络文字中留下的具有独特写作风格(如用词习惯、语法结构等)的特征集合。网络书写纹就像人的指纹一样,是可......
利用MapReduce模型可自动编写串行程序及编程接口简单的优点,实现量子进化算法在MapReduce模型下的并行化,提出基于MapReduce模型......
社会化标签系统是Web2.0的一个重要应用,标签之间的共现关系抽取对于信息检索和标签推荐具有十分重要的意义.本文在分析社会化标签......