【摘 要】
:
聚类是数据挖掘的一个重要方面,而对高维混合特征数据聚类仍然是一个具有挑战性的问题.针对高维混合特征数据下欧氏距离失去意义的问题,提出了一种基于随机贪婪的树状基学习器集成的森林聚类算法.模型能够利用树状基学习器集成的优点,同时处理离散和连续特征混合下的数据以及高维度的数据.借鉴随机森林计算相似度矩阵的方法,计算聚类森林中样本之间的相似度,用相似度矩阵代替传统聚类时的欧氏距离,解决了高维混合特征数据下欧氏距离没有意义的问题.通过在合成数据集和真实数据集上的一系列实验,与传统聚类算法进行对比,以纯度为评价指标,
【机 构】
:
浙江浙石油综合能源销售有限公司 浙江杭州 310000;浙江浙能技术研究院有限公司 浙江杭州 311121
论文部分内容阅读
聚类是数据挖掘的一个重要方面,而对高维混合特征数据聚类仍然是一个具有挑战性的问题.针对高维混合特征数据下欧氏距离失去意义的问题,提出了一种基于随机贪婪的树状基学习器集成的森林聚类算法.模型能够利用树状基学习器集成的优点,同时处理离散和连续特征混合下的数据以及高维度的数据.借鉴随机森林计算相似度矩阵的方法,计算聚类森林中样本之间的相似度,用相似度矩阵代替传统聚类时的欧氏距离,解决了高维混合特征数据下欧氏距离没有意义的问题.通过在合成数据集和真实数据集上的一系列实验,与传统聚类算法进行对比,以纯度为评价指标,该算法在混合特征数据集上的聚类纯度明显高于传统聚类算法.
其他文献
针对无法主动调姿和灵活漫游的传统星表着陆器不适用于未来大范围星表探测和星表基地建设等任务的问题,提出了一种可移动月球着陆器.首先,介绍了可移动月球着陆器的系统组成以及各子系统的组成;其次,介绍了可变构型式本体和缓冲/驱动集成式缓冲器的功能及实现;然后,建立了缓冲/行走一体化腿足机构的运动学模型,设计了减少调姿次数的直线行走和转弯等步态,规划了足端迈步与整器调姿等工况下的腿足机构各关节运动轨迹,并通过建立整器虚拟样机模型完成了步态仿真;最后,研制了行走试验样机并搭建了试验辅助设施,完成了行走步态试验.结果表
利用二苯甲烷二异氰酸酯(MDI)、硅烷偶联剂(KH550)2种试剂对木粉表面接枝改性,在碱性催化剂条件下,将改性后的木粉与己内酰胺单体混合,使其发生阴离子聚合反应,制备聚酰胺6(PA6)/木粉复合材料,对其进行测试及表征,研究PA6/木粉复合材料的微观结构、力学性能和摩擦特征.研究结果表明,木粉表面成功接枝了MDI和KH550,使木粉与PA6两相之间的界面粘结强度增大,同时增大了复合材料的冲击强度和拉伸强度,当木粉含量为1.5%时,复合材料的冲击强度达到掺杂木粉后的最大值.摩擦磨损性能实验中,随着木粉含量
月表配电网架是月球科研站长久稳定供电的动力来源和骨架支撑.微型核反应堆重量轻、结构紧凑、拓展性好,能够为月球科研站发电装置提供持久的能量来源.为了满足月球科研任务和未来建设大型月球基地的需要,月表配电网架必须具备高可靠性和可扩展性.提出了一种融合微型核反应堆的月表高可靠可扩展配电网架,同时提出了可保证月表供电系统大功率高可靠运行的配套供电保障技术,从月表配电网的拓扑结构、分区互联和运行控制方法三个方面论述了所提配电网架的可行性及应用优势.本设想期望能够为载人登月、地外星体基地建设计划提供有益思考和启发.
“天问一号”火星探测任务是中国通过一次发射,实现对火星“绕、落、巡”的探测任务.火星探测任务的进入、下降及着陆段(Entry,Descent and Landing,EDL)是整个任务过程中最为重要的环节之一.基于该过程中继通信任务特点,介绍了“天问一号”火星探测器为适应EDL段通信任务时序复杂、高自主性、黑障现象以及高动态性等特点的中继通信系统方案及关键技术.同时结合“天问一号”软着陆任务,对EDL段中继通信在轨验证情况进行了总结和分析.提出的中继通信系统方案圆满支持了“天问一号”火星探测EDL段中继通
“嫦娥四号”中继星于2018年6月14日成功进入地月L2点Halo轨道,承担地面测控站与“嫦娥四号”着陆器的数据传输功能.目前“嫦娥四号”中继星处于稀疏观测模式,平均4~5天进行一次观测.分析了2021年1月“嫦娥四号”中继星绕地月L2点的定轨精度,结果表明:中继星绕L2点轨道精度优于2 km,包含有甚长基线干涉测量技术(Very Long Baseline Interferometry,VLBI)时延和时延率的弧段达到百米量级;在有VLBI观测的前提下,合理分配测距和测速弧段的覆盖时段,能在数据覆盖率相
月球两极永久阴影区(Permanently Shadowed Regions,PSR)全年没有直接光照,搜寻PSR内的月球水冰是“嫦娥七号”的主要任务之一.人类至今没有在PSR着陆,中国的“嫦娥七号”任务计划在PSR附近的太阳直射区域登陆,着陆器上携带的飞跃器将进入PSR进行采样与分析.如何选择登月点和取样点是该项任务的一个关键,结合高精度的数字高程模型,“嫦娥七号”卫星搭载的极化合成孔径雷达(Polarization Synthetic Aperture Radar,Pol-SAR)可以进一步确定月表面
2021年5月15日,中国“祝融号”火星车成功登陆火星乌托邦平原南部,首次独立在一次任务中成功实现“绕、落、巡”的探测目标.火星车高精度定位对于火星任务的顺利实施和后续科学研究都至关重要,如火星车路径规划和规避危险区域.详细介绍了基于多源影像的“祝融号”火星车定位方法,采用由粗至精的策略实现了着陆点在轨道器高分影像的精确定位,采用相对定位和绝对定位相结合的地面修正方式实现了火星车站点的连续高精度定位.对多源影像的定位方法进行了实验验证,结果表明基于视觉的着陆点定位精度能优于高分轨道器影像1个像素,基于光束
针对天体表面探测遥操作模拟验证需求和特点,设计实现了综合天体表面地形模拟、模拟星球车、地形扫描测量与遥操作处理评估等功能的天体表面探测遥操作模拟验证系统.以人工砂搭建可变形表面模拟环境,研制了具有感知、移动及规划结果响应功能的模拟星球车,提出了基于激光扫描的地形测量与星球车位姿测量方法,建立了基于模拟场景和星球车的天体表面探测遥操作模拟验证系统,对火星表面探测的感知、规划等关键作业过程进行了模拟验证,为天体表面探测遥操作实际实施提供了有力支撑.
基于半导体异质结原理,设计并制备了新型氯氧铋/二氧化钛复合光催化材料,以甲基橙为目标污染物,研究了氯氧铋制备条件和复合比例对复合材料的光催化特性的影响,随后利用XRD、UV-Vis DRS、TEM、EPR等方法对催化材料进行表征,从表面形貌、自由基等角度,分析其光催化原理.结果 表明,新型复合光催化材料相对氟氧铋、二氧化钛的单体,具有更强的紫外催化能力,对传统有色染料均具有良好的去除效果.这是由于氯氧铋和二氧化钛可以形成半导体异质结,光生电子传递降低了载流子负荷率,羟基自由基生成量增加,因此光催化性能大幅
传统的无线传感器网络,由于安全性较低,数据容易被截获及篡改.为了满足现在数据爆炸的网络环境下的数据安全需求,在传统的无线传感器网络基础上提出在感知节点和基站中间添加了一个中间节点——存储节点,构成双层无线传感器网络,使得数据的管理更加安全,使得网络的拓展及删除、维护更加方便.与此同时,在数据加密过程中,使用轻量级的国密算法SM2、SM3,提高数据加密的速度的同时,降低数据对硬件的需求.由此,提出“基于国密算法实现两层无线传感器网络数据加密”的网络模型.