【摘 要】
:
为解决基于密度的聚类算法处理大规模数据集效率低和存储开销大的问题,提出一种分片的基于K邻近关系的空间均匀抽样算法作为聚类应用的数据预处理过程,将数据集分片,按密度降
【基金项目】
:
上海市教委重点学科资助项目(12ZZ09);上海市科委资助项目(13DZ118800)
论文部分内容阅读
为解决基于密度的聚类算法处理大规模数据集效率低和存储开销大的问题,提出一种分片的基于K邻近关系的空间均匀抽样算法作为聚类应用的数据预处理过程,将数据集分片,按密度降序方式去除数据集中部分样本的K邻居,将剩余样本作为抽样样本,在保证精度的同时,可以降低数据规模,提升计算效率.实验结果表明,在数据规模较大且保证聚类结果准确性的前提下,通过降低聚类数据规模,可以有效提升聚类效率.
其他文献
目的:探讨中医药治疗组织细胞性坏死性淋巴结炎的体会.方法:口服中药治疗经病理学检查确诊的病例.结论:中医药治疗本病有独特的优势,可以起到抗病毒,提高机体免疫力等作用.
探究2008-2016年湖北省各县域乡村地域人口外流的空间特征和演变机制,研究发现,湖北省乡村人口外流呈现明显的空间自相关格局,具有显著的集聚特征。研究期内外流比例呈全面上
近年来我国机动车数量增长速度较快,机动车的运转离不开油料的支持,这就使人们对加油机计量准确度越来越关注.导致加油机产生误差的原因较多,在自身原因及外界因素影响下都会
地市级书店图书进销存一体化管理的构想刘海平地市级新华书店如何把握机遇,尽快转换经营机制,建立新的适应市场经济需求的图书发行模式,己成为当前新华书店改革的重要课题。一新
文章通过2012年环渤海地区北京、天津、河北、山东、辽宁5 省区的投入产出表,结合区域间投入产出模型 (IRIO模型)和区域间贸易数据,调整为环渤海地区区域间投入产出表.采用Mill
<正> 7月23日早晨,突然接到学院办公室的同志打来的电话:“您先别着急,告诉您一个不幸的消息,史院长已病故。”听完电话,我愣住了,不由自主地“啊?”一声,脑子里嗡嗡作响,一
考虑捕食者无密度制约,食饵具有非线性密度制约的第二类Holling功能性反应捕食者食饵系统.对该系统给出了完整的定性分析,证明了该系统至多有一个极限环,存在极限环的充要条
对一带结构转换层的超限高层建筑,运用PMSAP有限元软件分别建立带梁式转换层和桁架式转换层的超限高层建筑有限元模型。首先通过弹性静力分析确定最优转换层形式,其次运用反
导入ISO9000质量管理体系是机关加强管理、优化服务的有效手段。本文以改革开放以来绍兴市提高机关效能的探索为背景,以绍兴市人民政府办公室为例,阐述了政府机关导入ISO9000质
根据郑州地区夏季太阳辐射和空调负荷特点,以HFO1234yf为制冷剂,基于实验测试和模拟计算,针对某一太阳能喷射制冷空调系统运行性能进行研究,该系统供冷对象为200 m~2别墅,采