【摘 要】
:
近邻传播(Affinity Propagation,AP)聚类具有不需要设定聚类个数、快速准确的优点,但无法适应于大规模数据的应用需求。针对此问题,提出了分层近邻传播聚类算法。首先,将待聚
【机 构】
:
解放军信息工程大学,数学工程与先进计算国家重点实验室,信息保障技术重点实验室
【基金项目】
:
信息保障技术重点实验室开放基金(KJ-12-04)资助
论文部分内容阅读
近邻传播(Affinity Propagation,AP)聚类具有不需要设定聚类个数、快速准确的优点,但无法适应于大规模数据的应用需求。针对此问题,提出了分层近邻传播聚类算法。首先,将待聚类数据集划分为若干适合AP算法高效执行的子集,分别推举出各个子集的聚类中心;然后对所有子集聚类中心再次执行AP聚类,推举出整个数据集的全局聚类中心;最后根据与这些全局聚类中心的相似度对聚类样本进行划分,从而实现对大规模数据的高效聚类。在真实和模拟数据集上的实验结果均表明,与AP聚类和自适应AP聚类相比,该方法在保证较好聚类效果的同时,极大地降低了聚类的时间消耗。
其他文献
稻谷去壳后成为糙米,糙米加工去掉占总重10%左右的种皮和胚后,就成为精米,种皮和胚加工成米糠。米糠营养丰富,是较好的能量饲料,且价格低于玉米和小麦麸,因此,米糠在动物畜禽
研究了硅橡胶/聚烯烃弹性体(POE)共混物的物理机械性能和相形态。结果表明,硅橡胶/POE共混物为两相结构,POE的加入能有效地提高硅橡胶的物理机械性能。
在5个平菇生产基地和5个农贸市场采集60个平菇样品,测定样品中甲醛的含量在0.09~2.31 mg/kg。同时,选择生产过程中无甲醛使用的平菇生产基地开展全程跟踪,针对平菇生产过程中
针对传统的雷达脉冲信号测试方法功能单一、测量精度低、实时性差等缺点,文中设计并开发了一种基于VS2010平台的雷达脉冲信号自动测试软件,可实现对常见复杂调制方式雷达脉冲
用蒙特卡罗方法研究了1种闪烁纤维中子探测器对不同能量中子和伽玛射线的相对灵敏度,并在实验室对几个能点的灵敏度进行了标定.实验结果表明:理论计算与实验标定的探测器能量
阐述了七台河市大豆植株底荚高度增高现象发生的概况,分析了产生的原因,提出了预防的具体措施,为大豆的高产稳产和优质栽培提供参考。
<正>近几年来,辽宁省北票市积极推广以沼气为纽带的猪一沼一菜立体生态农业栽培模式.其做法是:在蔬菜保护地日光温室的一侧建一个10m~3的地下沼气池,在沼气池上建一个20m~3的
我们通过多年的教学研究,在新课程理念下,提出了一种新的课堂教学模式——"三动"课堂。本文通过《互感与自感》的教学设计,来阐释以"问题驱动、主体活动和立体互动"为主线的
以DNA分子为材料组建纳米级尺度药物和机械,或作为编码其它纳米到微米尺度蛋白质功能器件模板的研究,逐渐使人们认识到核酸分子不仅仅是生命的遗传密码,更因为其具有的变性-
学业生涯规划对当代大学生有极其重要的意义,但由于自身的局限性,加之生涯规划意识的淡薄,极大地影响了大学生学业生涯规划的有效性。此外,学校投入的欠缺,职业指导师资的匮