【摘 要】
:
随着云数据规模的急剧增长,传统的基于统计学和机器学习方法的数据分类算法在处理海量、异构和复杂的Web数据时面临系统扩展性的瓶颈。在云计算平台Hadoop上,实现数据分类中
【基金项目】
:
江苏省高校自然科学基金资助项目(13KJB510005);江苏开放大学、江苏城市职业学院“十二五”2013年度规划青年专项课题(13SEW-Q-055);江苏开放大学、江苏城市职业学院“十二五”2012年度规划重点课题(12SEW-Z-005)
论文部分内容阅读
随着云数据规模的急剧增长,传统的基于统计学和机器学习方法的数据分类算法在处理海量、异构和复杂的Web数据时面临系统扩展性的瓶颈。在云计算平台Hadoop上,实现数据分类中特征提取、特征分析和特征分类的MapReduce化处理。通过知识推理并行化特征构造,建立概念层次结构的特征度量,与分类算法的并行化处理进行融合,在真实数据集上进行验证,与传统算法组合在精度和时间开销上进行比较,实验表明该分类算法能获得更好的准确性和加速比,是一种有效的海量数据分类方法。
其他文献
中国特色社会主义的经济思想对中国传统经济思想的扬弃是革命性的。它变革了中国以伦理为中心的文化传统,否定了中国文化传统中重农抑商的自然经济思维定势,冲击了"不患寡而
比例效用理论认为财富的变化量与最终持有量的比值决定效用。根据比例效用理论的假设推导比例效用恒等式,然后利用中国31个省份的城镇人均收入与消费数据对恒等式进行验证,结果
目的研究亚临床甲减患者和正常人群血清促甲状腺激素(TSH)与血压的关系。方法采用随机整群抽样方法对2007年沈阳市大东区1319名研究对象进行问卷调查,测量血压、身高、体重,
目的 加强对重症急性胰腺炎 (SAP)中全身炎性反应综合征 (SIRS)的认识。方法 回顾 1 991~ 2 0 0 0年 60例SAP住院患者SIRS的发生及其全病程 ,并对其治疗和死亡原因进行分析
对填加烷基磺酸盐类抗静电剂、有机类阻燃剂、增韧剂的ABS复合体系进行了研究,实验表明:阻燃剂、增韧剂可以提高抗静电剂的抗静电性能,同时,湿度环境对体系的抗静电性能有较大
特发性膜性肾病(IMN)是成人肾病综合征(NS)中常见的病理类型,其诊断主要是肾脏活检病理检查和排除继发性膜性肾病。改善全球肾脏病预后组织(KDIGO)指南主要从循证医学角度出
目的研究肥胖相关性肾病患者肾小球足细胞病变,分析不同肾组织病理类型患者肾小球足细胞中neph-rin、desmin、WT1的表达和分布特征。方法收集2001—2008年河北医科大学第二医
主持人要想准确地表情达意,仅仅依靠口头语言是不够的,还必须借助另一种辅助性“语言”———坐姿、手势、体态举止等“体态语言”和道具。思想感情的表露是极其复杂,十分微