【摘 要】
:
为了适应高维大规模数据集的稀疏性,解决现有离群点探测算法在运用于高维大规模数据集时计算量以及时间效率均无法令人满意的现状,区别于以往文献中以点的数量作为判断稠密的
【机 构】
:
东南大学计算机科学与工程系,东南大学计算机科学与工程系
【基金项目】
:
中国科学院资助项目,高等学校博士学科点专项科研项目
论文部分内容阅读
为了适应高维大规模数据集的稀疏性,解决现有离群点探测算法在运用于高维大规模数据集时计算量以及时间效率均无法令人满意的现状,区别于以往文献中以点的数量作为判断稠密的阈值,在基于密度的局部异常检测算法LOF的基础上,以通过数据集中每一点周围的邻近点的状况作为判别依据,提出了稠密单元和稠密区域的概念以及基于网格和稠密单元的快速局部离群点探测算法.通过证明稠密单元和稠密区域中的点不可能成为离群点,使得算法减少了LOF值的计算量并显著提高效率.实验表明,该算法对于高维大规模数据集具有良好的适用性和有效性.
其他文献
研究旨在探讨转型时期高中生化学学习策略训练的有效性。自编《转型时期高中生化学学习策略训练教程》,并运用此材料,对湖南省4所中学174名高一学生进行了一个学期的教学实验,研
9月3日至5日,由中国共产党主办的第三届亚洲政党国际会议在北京召开.这是中国共产党历史上首次主办的国际性政党会议.有30多个国家的80多个政党派代表与会,这些代表中包括一
水利工程施工项目中,尤其是堤坝、江湖等防渗问题的处理,行业相关人员开始了大量的试验研究,基础防渗是水利工程中最重要的环节,土质结构薄弱、土体渗透较强时,施工环节中水
历史经验证明,科学判断国际局势,正确处理国际事务与对外关系,是历代执政者都必须具备的重要能力。无论国家大小,实力强弱,执政者是否具备并不断提高这方面的能力,不仅关系到执政者
为了快速准确地估算出桥墩的振动基频,在瑞利法和Southwell频率合成法的基础上导出了变截面桥墩复合振动基频的计算公式.将基频表示成各惯性元和复原元所组成子系统的频率合
利用人工神经网络的BP算法,建立了碳/陶瓷复合材料性能与多组分掺杂含量之间的预测模型.模型由输入层、隐含层和输出层3层神经元组成,用以模拟人脑的结构.以掺杂物的质量分数
2003年新年伊始,朝鲜和美国围绕核问题的斗争日益升级.韩国派出特使出访中、俄,日俄首脑会晤重点谈核问题,俄还派特使与金正日见面;美国在加强与其盟国磋商的同时,派特使访问