一个基于hadoop的并行社交网络挖掘系统

来源 :软件 | 被引量 : 0次 | 上传用户:study_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几年,以微博为首的社交网络迅猛发展,这些平台上包含了网民对于时事热点的观点,对生活和人际关系的看法等大量有价值的信息和资源。由于微博数据非常庞大又难以获取等困难,如何有效地对社交网络进行数据挖掘,是近两年数据挖掘研究的重点和热点。本工作设计和实现了一个基于Hadoop的并行社交网络挖掘系统,包含了分布式数据库,并行爬虫,并行数据处理和并行数据挖掘算法集,可以有效地获取和分析挖掘海量的社交网络数据,为社团分析,用户行为分析,用户分类,微博分类等工作提供支持。
其他文献
在我国各地区乡镇建设水平逐渐提高条件下,乡镇安全生产监督也受到人们高度重视。这就应在适当策略支持下对乡镇地区各行业开展安全生产监督,从而提高乡镇地区安全发展水平。
在我国,中小型物流企业虽然在规模上不及大型企业,却由于发展的需求与限制承受着较大的资金压力,融资问题始终制衡着中小型物流企业规模的扩张,本文以中小型物流企业为分析对象,对
基于Servlet技术和数据结构中的哈希映射,以构建索引表的方式对网页关键字进行组织。根据客户端提供的关键字对索引表分析,得到搜索结果。由于搜索过程是访问缓存,因而有较高
绩效考核是企业发展中的关键一环,是企业根据绩效标准采用科学的考核标准,评定员工工作任务完成程度、责任履行程度以及员工自身在企业的发展情况,并且将评定结果反馈给员工的过
企业服务总线是企业应用集成的发展方向。本文通过运用VS.NET实现最基本的ESB功能的研究,对ESB的概念、原理及它与SOA的关系进行了一个总体阐述。
本文剖析了试用期员工的管理难点及试用期员工绩效管理面临的问题,并在此基础上提出了试用期员工绩效管理建议,增强员工的归属感和认同感,促进公司稳步长远发展。
从给定的矩阵等式,求相应的矩阵多项式的逆矩阵是线性代数教学中的一类重要问题。本文利用多项式的除法介绍求矩阵多项式的逆矩阵的一个简单计算方法,使得这类问题计算更容易
对嵌入式数据库特性及体系结构分析的基础上,使用C语言作为调用SQLite数据库的嵌入式语句,设计出了一种嵌入式数据库SQLite图象处理方法,并将SQLite的源代码直接嵌入到应用程序中,使它们共用相同的进程空间,实现了对BLOB字段的定制与修改。给出的Demo实例成功地实现了图象的动态交互,验证了SQLite应用于系统图象数据管理的有效性。
旅游地社区的本地民众因不堪其扰,对旅游活动和游客产生"对抗"情绪。本文从承载力、经济、自然与文化等角度分析这种情绪产生的原因,并提出改善旅游地民众与旅游产业之间的关系
企业的人事管理工作对员工的工作进行计划与管理,对企业内部的工作进行一定程度上的协调,将企业信息更好地进行传播与控制。 企业要使用科学合理的管理方法,更好地提高工作人