【摘 要】
:
随着互联网技术和高通量技术的迅猛发展,使得大数据相较于传统数据,具有了4V特性——海量(Volume)、变化速度快(Velocity)、多模态(Variety)、价值总量高(Value),4V特性导致传统分类算法和单实例处理平台很难处理大数据,近年来并行化技术和特征选择型分类算法的发展为大数据处理提供了一个新视角。随机森林(RandomForest)是其中一类重要算法,相比其他分类算法而言具有诸多
论文部分内容阅读
随着互联网技术和高通量技术的迅猛发展,使得大数据相较于传统数据,具有了4V特性——海量(Volume)、变化速度快(Velocity)、多模态(Variety)、价值总量高(Value),4V特性导致传统分类算法和单实例处理平台很难处理大数据,近年来并行化技术和特征选择型分类算法的发展为大数据处理提供了一个新视角。随机森林(RandomForest)是其中一类重要算法,相比其他分类算法而言具有诸多优势,分类效果上的优势体现在函数逼近能力强、泛化误差小而且有能力处理高维数据;训练过程的优势体现在算法学习过程快速而且易于并行化。因此,基于大数据的随机森林研究已经成为数据发掘分类领域的研究热点。目前,Spark环境下基于特征寻优和子空间分层构建的并行随机森林算法虽然取得了一定的成效,但由于样本数据特征的不可靠性、网络的小世界性和复杂性,以及目前随机森林算法自身的局限性,使得现有并行随机森林算法普遍存在两个问题,分类准确率不高和并行效率较低。本文主要从两个方向着手解决,一是,从特征信息素出发,先是利用主成分分析并结合误差约束分层构建具有高信息浓度的特征子空间,最后以RDD(Resilient...
其他文献
随着中国证券市场的逐步发展,信息披露不规范问题日益突出,严重阻碍了中国证券市场的高效、有序运行.鉴于此,该文比较分析了国外信息披露制度,详细阐述了信息披露制度的基本理论,并结合中国证券市场发展的实际,对现有的信息披露制度进行评价,提出了若干法律设想,以期完善中国信息披露制度,促进证券市场健康发展.
该文以公司资本的法律意义作为研究的起点,对目前世界上主要三种公司资本制度的一般原则和基本框架进行了比较考察,在此基础上阐明了公司资本制度发展的一般趋势,接着对中国内外资公司资本制度的现状和存在的问题进行了较为全面的分析,并结合中国的具体情况,尝试性地提出重建中国公司资本制度的一些具体构想.
具有现代性意味的人物造型,是常玉艺术风格的典型特征。不同于客观写实的造型方式,常玉更多的运用了“简化”的艺术表现形式。作为贯穿传统与现代、东方与西方艺术的桥梁,“简化”,在常玉将现代精神与写意性融于个人风格中,扮演了重要的作用。对于简化的研究,是理解常玉人物造型的关键,在探究简化与画面形式关系的基础上,全文从三个方面——结构特征的简化、夸张的简化方式、几何化倾向的简化——对常玉人物造型的简化特征进
教育部关于实施卓越教师培养计划的意见提出应重点探索小学全科教师培养模式。学校通过改革小学教育专业的培养方案,完善课程内容,开发新的课程资源,创新教学手段四个方面探究研究型卓越小学全科教师培养模式改革。采用启发性教学与学生自主学习相结合的研究型教学模式,培养具有创新精神和实践能力的小学全科教育人才。
水下无线信息传输在战术监视、石油控制、海洋勘探、污染监测、气候变化监测和海洋科学研究等方面扮演者着重要角色,引起了军事、工业和科学界的高度关注。为了方便这些活动,越来越多的探测机器人或无人驾驶设备部署在水下,这对高带宽和大容量的水下信息传输提出了要求。当前,水下无线网络的信息传输主要利用水声进行通信。然而,水声通信还是存在传输速率小、可以使用的带宽较窄以及传播速度缓慢等不足,导致其端对端时延较大、