不确定数据流上Top—k异常点查询算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户：frontwave

【摘要】

：

近几年，随着数据流和不确定数据的产生，不确定数据流上的异常点检测成为新的研究热点。然而，现有的不确定数据的异常点定义中涉及3个参数，这对于用户是非常难设定的，以致不能查询

【作者】

：

曹科研王国仁韩东红李硕儒

【机构】

：

东北大学信息科学与工程学院

【出处】

：

计算机科学与探索

【发表日期】

：

2015年2期

【关键词】

：

不确定数据数据挖掘异常点 TOP-K uncertain data data mining outlier top-k

【基金项目】

：

The National Natural Science Foundation of Chinaunder GrantNos.61025007,61328202,61173029（国家自然科学基金）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近几年，随着数据流和不确定数据的产生，不确定数据流上的异常点检测成为新的研究热点。然而，现有的不确定数据的异常点定义中涉及3个参数，这对于用户是非常难设定的，以致不能查询到适合的异常点。在大多时候，用户更想知道最可能是异常点的对象，因此提出了不确定数据流上的top-k异常点查询算法。该算法通过估计数据对象异常点的概率范围而进行剪枝，从而减少了一些不必要的计算，同时增量地计算数据对象异常点的概率范围。在真实数据集和合成数据集上进行了一系列的模拟实验，证明了算法的性能。

其他文献

下肢动脉缺血血管重建术后护理

我院从1982—01／2002—06采用人造血管旁路移植术治疗下肢慢性缺血性疾病105例，护理效果较好，总结如下。

期刊

下肢/血液供给血管成形术/护理手术后医护人类

构建物资采购阳光平台

北京京能热电股份有限公司是北京国际电力投资公司控股的热电联产的大中型企业.2001年底,用现代物流管理思想和理论结合目前国内物流企业的实际情况,开发了一套集物资计划、

期刊

经营管理物资管理电子商务物资采购北京京能热电股份有限公司电力企业

慢性硬膜下血肿钻孔引流术后50例分析

目的：探讨慢性硬膜下血肿钻孔引流术后并发症发生的原因及相应防治措施。方法：对收治的慢性硬膜下血肿50例患者的临床资料进行回顾性分析，并对其钻孔引流术后发生并发症的8例进

期刊

血肿硬膜下慢性/外科学引流术

基于记忆曲线的数据密集型动态用户行为建模*

分析用户行为的历史数据，使用特定方法建立用户的偏好模型，是目前研究的热点和关键。考虑了数据产生的时序特征，以及具有时间特征的变量在用户行为模型中的影响，以心理学中的记忆

期刊

动态用户行为模型用户偏好记忆曲线增量更新MAPREDUCEdynamic user behavior model user preference

可持久化CSB＋-树索引技术研究

现有主存索引方案为实现重用功能仅将更新操作存储到硬盘中，根据操作序列进行索引恢复，实时性和重用性均较差。为进一步提升重用性和实时性，提出了一种可持久化的CSB＋-树（cachesen

期刊

主存索引持久化CSB+-树内存映射索引头main-memory index durable CSB＋-tree memory map inde

不确定数据流上Top—k异常点查询算法

与本文相关的学术论文