【摘 要】
:
随着计算机网络的迅猛发展和大数据时代的到来,数据越来越频繁地呈现出多属性异构的特点.这种包含多种不同类型属性的大数据流称为异构大数据流(Heterogeneous Big Data Stre
【机 构】
:
中国科学院计算技术研究所信息安全研究中心,中国科学院信息工程研究所信息内容安全技术国家工程实验室,北京邮电大学计算机学院
【基金项目】
:
国家自然科学基金(61370025);国家“八六三”高技术研究发展计划(2011AA010703,2012AA012502);国家“九七三”重点基础研究发展规划项目基金(2013CB329606);中国科学院战略性先导科技专项课题(XDA06030200)资助~~
论文部分内容阅读
随着计算机网络的迅猛发展和大数据时代的到来,数据越来越频繁地呈现出多属性异构的特点.这种包含多种不同类型属性的大数据流称为异构大数据流(Heterogeneous Big Data Streams).在面向大规模数据在线监测分析的应用中,通常需要在异构大数据流上注册大规模监测规则.因此,对于每一个数据流元组,必须用最小的计算开销满足所有的规则.同时,由于大数据流上监测规则集异常庞大,提高规则监测的性能是大规模数据流在线监测的关键.基于此,该文提出一种层次化的索引结构H-Tree及其在线规则匹配算法.具体的,H-Tree将大数据流上的属性集划分为离散型属性和连续型属性.基于不同的属性集,构建两层索引结构:在第1层,通过改进的红黑树对离散型谓词构建触发索引;在第2层,通过量化连续型谓词构建多维索引结构.H-Tree的在线规则匹配算法利用关联关系表对两层索引的监测结果进行融合过滤.实验分析表明,与经典的R+方法相比较,H-Tree通过层次化的索引结构,在不降低准确度的前提下,显著提升了大数据流的监测效率.
其他文献
以我国互联网的迅猛发展为时代背景,基于在证据融合过程中经常遇到的信息来源广泛、信息数量庞大、信息不确定性等特点,研究了多源信息的融合方法和决策问题。选取信息的原理
雷达信号发生器用于模拟雷达回波信号,以便在实际雷达系统前端不具备的条件下,对雷达系统的后级进行调试。传统的雷达信号发生器多是采用锁相式频率合成技术,由于其存在频率
<正>近年来林徽因传记一本接着一本地出版,我所寓目的林传已达十一二种,其中还不乏重印重版者。林传之多几乎要与张爱玲传记相当了。形成林徽因传记出版热点,原因诸多,固然有
随着计算机科学和网络技术的迅速发展和普及,信息系统已深入到社会各行各业之中,许多人工作业正逐步被计算机智能软件系统替换,使人们从重复的劳动中解脱出来。在目前的各类
随着中国经济的飞速发展,环境保护议题日益受到政府、企业和民众的关注。“十二五”规划明确提出要把建设节约型、环境友好型社会作为加快转变经济发展方式的重要着力点,为中
<正>1.功能性二尖瓣反流的夹合术2018年公布的COAPT研究结果将对2019心脏瓣膜病领域产生巨大影响。该结果表明,经导管二尖瓣夹合术(MitraClip)结合药物治疗(GDMT)可有效减少
如何在教学课时较少的情况下让学生最大限度地理解并掌握有机教学内容是有机化学教师要重点解决的问题,自2016年开始我院有机化学教学团队进行了知识传授与核心素质培养相结
恩格斯在《反杜林论》中严厉批判了杜林关于自由的谬论,深刻阐述了马克思主义自由观,指出自由不是抽象的、绝对的,而是具体的、相对的,是社会历史发展的产物。在建设中国特色
采用以PC 5 5 0型工业控制计算机为核心的卫星地面站计算机监控系统,可以通过卫星传送系统,对各卫星地面站设备的运行情况进行远程监控,提高了管理和控制的自动化程度
如何控制好露天煤矿采、运、排工程质量是目前大中型煤矿质量控制的课题之一,本文以魏家峁露天煤矿实践为例,针对露天矿的特点,介绍了该矿在基建期存在的问题,分析了出现问题