云计算平台的海量数据知识提取框架

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户：bosigai

【摘要】

：

针对从海量数据中分析与提取知识计算时间高的问题,提出一种基于Hadoop的知识提取算法.本文结合Hadoop的并行处理能力与分布式存储特点,设计了一种知识提取框架,可兼容不同的

【作者】

：

邹裕

【机构】

：

东莞理工学院计算机学院

【出处】

：

计算机系统应用

【发表日期】

：

2016年11期

【关键词】

：

海量数据知识提取原型约简云计算并行计算数据聚类 massive data knowledge extraction prototype reduc

【基金项目】

：

广东省自然科学基金（S2013010011858）, 广东省高校优秀青年创新人才培养计划（2012LYM0125）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对从海量数据中分析与提取知识计算时间高的问题,提出一种基于Hadoop的知识提取算法.本文结合Hadoop的并行处理能力与分布式存储特点,设计了一种知识提取框架,可兼容不同的原型约简方法.基于Map Reduce编程方法将约简方法并行化处理,并且设计了分类准确率高、计算速度快的原型约简组合规则.最终基于真实UCI大数据集进行实验,本框架将最近邻分类器的分类时间提高两个数量级.

其他文献

基于多维度推荐的智慧在线学习系统

针对目前在线学习系统中存在的不足,探讨如何有效地运用数据挖掘技术建立智慧的在线学习系统.从大量的用户数据中挖掘出关联关系,用以提供全面个性化、定制化的学习过程序列.

期刊

智慧在线学习系统数据挖掘多维度网络多维度推荐扩散激活intelligent e-learning system data mining multi

基于概率及退避等待的车辆安全消息广播机制

在车辆自组织网中,针对安全消息广播的有效覆盖及竞争冲突问题,本文提出了基于概率及退避等待的广播机制(VANET Broadcast Mechanism based on Probability and Backoff,VBM-PB).该机制隶属于接受者机制,其复杂度低并且具有完全分布式计算特性.VBM-PB将车辆的地理位置信息和节点负载结合,计算各节点潜在的转发概率;构造概率转发函数并设计自适应退

期刊

安全消息广播车辆自组织网概率退避等待safety message broadcast vehicular ad hoc network（VANET

基于双GPS的振捣棒定位算法

提出一种基于双GPS的振捣棒定位算法.该算法首先获得GPS精确定位的坐标数据,并将所得坐标数据反馈至单片机.然后在单片机中经过该算法的整合处理,最后得出振捣棒的位置坐标.

期刊

GPS差分定位坐标GPS differential positioning coordinate

抵御模仿人类行为DDoS的软件防火墙

模仿人类行为的HTTP洪水是一种分布式拒绝服务攻击.提出一种抵御方法,它包括三个关键点：使用会话号标示请求者身份,通过分析单位时间的请求消息序列发现傀儡主机,通过丢弃或修

期刊

网站安全HTTP洪水分布式拒绝访问攻击用户识别防火墙Website security HTTP Floods distributed denial

汉英-泰互译有声语料的数据库研究

＂汉英-泰互译有声语料库＂的开发,在泰文舆情分析领域,解决了词典分词算法中训练语料缺乏的问题.本文采用计算机化信息处理技术,对大量的收集来的泰文语料进行整理、规范、加工

期刊

汉英-泰语料库互译有声舆情泰文分词English Chinese-Thai corpus translation audible public

复杂背景下的三级级联快速正面人脸检测算法

针对复杂背景下的正面人脸检测问题,提出一种三级级联快速正面人脸检测算法:第一级使用HSV肤色模型,通过分析最大肤色连通区,快速排除非人脸区域;第二级采用Haar-like特征结合Ada Boost算法定位人脸区域;最后提出基于局部特征点加权的改进主动形状模型(W-ASM)算法匹配人脸的特征点坐标,通过68个特征点位置判断当前人脸图像是否是正面人脸.实验结果表明,本算法能准确识别出垂直于图像旋转不超

期刊

人脸识别正面人脸检测主动形状模型HSV肤色模型特征点匹配知识表示Face recognition Front face detection Act

基于AdaCostBoost算法的网络钓鱼检测

针对日益严重的网络钓鱼攻击,提出机器学习的方法进行钓鱼网站的检测和判断.首先,根据URL提取敏感特征,然后,采用AdaBoost算法进行训练出分类器,再用训练好的分类器对未知URL

期刊

网络钓鱼敏感特征AdaCostBoost分类器代价因子phishing sensitive features adacostboost clas

产品全生命周期数据自动采集PEID研制

为了实现产品使用、维护乃至生命结束阶段数据的自动、有效采集,在简要介绍产品嵌入式信息设备（Product Embedded Information Device,PEID）概念、类型、功能和参考架构的基础

期刊

PEIDPLM代理闭环PLM系统低温等离子体设备系统UMLPEID PLM Agent Closed-loop PLM System low t

一种车载终端软件架构及实现

车载终端是车联网系统的重要组成部分,为了提高终端软件的可靠性和开发效率,参考NGTP（Next Generation Telematics Pattern）,设计了一个开放式的车载终端软件架构.在该架构中,

期刊

车载终端软件架构NGTP守护系统vehicle-mounted terminal software architecture NGTP guard

基于ARM920T的嵌入式图像处理平台搭建及应用

研究了在Linux OS上交叉编译Open CV和Qt后将其移植到嵌入式Linux操作系统的方法.搭建了以ARM920T为核心的嵌入式图像处理平台,能够实现复杂图像算法的处理.在此平台上实现了

期刊

OPENCV嵌入式QT条形码识别OpenCV embedded Qt barcode recognition

云计算平台的海量数据知识提取框架

与本文相关的学术论文