大数据环境下的不确定数据流在线分类算法

来源 :东北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:ccbeilu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率.
其他文献
片形吸虫病(Fasciolasis)是一种严重的全球性人兽共患食源性寄生虫病,其病原体主要为复殖目(Digenea)片形科(Fasciolidae)片形属(Fasciola)的肝片形吸虫(Fasciolahepatica 和
由于在传送过程中存在数据失真、丢失或者网络延迟等原因,时空数据的不确定性普遍存在且无法避免,因此需要研究一个折中办法,使其不影响对数据的处理. 基于XML建立不确定时空
旧城改造一直是我国学术界极具热度的社会问题,其代表了城市化快速进程中的建筑与空间演变的过程,不仅是国家政治、经济、文化、历史等多个层面互相介入的结果,更与城市中土地分配、土地布局、土地管理等息息相关。本文以旧城区公共空间的改造为主要研究对象,借助日本新陈代谢流派的相关理论作为指导,意图探讨以空间代谢为基本设计策略的公共空间改造方法。第一章交待了全文的研究背景与意义,研究范围聚焦在我国早年建成的核心
电解锰渣是锰矿石酸浸电解之后的一种工业废渣。由于其硫含量高、重金属离子多、组成复杂等特点,已成为电解锰行业面临的首要难题。因此,研究电解锰渣的资源化利用及途径,具有重要意义。电解锰渣中含有较多的硫酸盐及赤铁矿等组分,是制备硫铝酸钙型膨胀剂中硫铝酸钙和铁相的常见组分,本论文采用电解锰渣制备富含铁相的硫铝酸钙型膨胀剂,系统研究了不同配比、烧成工艺(烧成温度、保温时间)、石膏掺量、养护制度、颗粒级配对硫
大学生心理危机干预是大学生心理健康教育工作的重要内容之一。针对大学生心理危机事件,建立校医联动机制能够畅通心理危机干预的转介渠道,及时研判学生危机情况,有效预防重
目的:本研究分析、比较母乳吸吮+口腔按摩、母乳吸吮以及非营养性吸吮这三种吸吮方式对于缓解早产儿静脉穿刺疼痛的效果,评价不同的吸吮方式和吸吮物对于早产儿穿刺疼痛的影响,为临床提供参考依据。方法:研究采用电脑随机数表法(首先将调查总体床单位进行统一编号并充分混合,再按规定抽样的起点和规定的抽样顺序依次从随机号码表上抽取样本单位号码进行录取),抽取我院新生儿重症监护室2018年02月01日至2019年0
基于修正的叶素动量理论提出了一种适应于水平轴风力机叶片的静气弹性分析方法;运用该方法对不同稳态风速下的叶片变形曲线进行研究,揭示了叶片预弯设计的机理,并给出了一种