不确定数据流上Top—k异常点查询算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:frontwave
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,随着数据流和不确定数据的产生,不确定数据流上的异常点检测成为新的研究热点。然而,现有的不确定数据的异常点定义中涉及3个参数,这对于用户是非常难设定的,以致不能查询到适合的异常点。在大多时候,用户更想知道最可能是异常点的对象,因此提出了不确定数据流上的top-k异常点查询算法。该算法通过估计数据对象异常点的概率范围而进行剪枝,从而减少了一些不必要的计算,同时增量地计算数据对象异常点的概率范围。在真实数据集和合成数据集上进行了一系列的模拟实验,证明了算法的性能。
其他文献
我院从1982—01/2002—06采用人造血管旁路移植术治疗下肢慢性缺血性疾病105例,护理效果较好,总结如下。
北京京能热电股份有限公司是北京国际电力投资公司控股的热电联产的大中型企业.2001年底,用现代物流管理思想和理论结合目前国内物流企业的实际情况,开发了一套集物资计划、
目的:探讨慢性硬膜下血肿钻孔引流术后并发症发生的原因及相应防治措施。方法:对收治的慢性硬膜下血肿50例患者的临床资料进行回顾性分析,并对其钻孔引流术后发生并发症的8例进
分析用户行为的历史数据,使用特定方法建立用户的偏好模型,是目前研究的热点和关键。考虑了数据产生的时序特征,以及具有时间特征的变量在用户行为模型中的影响,以心理学中的记忆
现有主存索引方案为实现重用功能仅将更新操作存储到硬盘中,根据操作序列进行索引恢复,实时性和重用性均较差。为进一步提升重用性和实时性,提出了一种可持久化的CSB+-树(cachesen