【摘 要】
:
在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显得尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类
【基金项目】
:
国家教育部—新华三集团“云数融合”基金项目(2017A13055)
论文部分内容阅读
在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显得尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类,再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集;然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且大大降低了时间复杂度。
其他文献
根据江岸机务段对HX03机车近2年来的现场使用情况,统计收集了APU辅助变流器的故障种类,查找分析了这些故障发生的原因,并且提出了相应的解决措施。
喉罩是介于气管导管和麻醉加压面罩之间的第三种全麻通气工具,具有操作简单、对呼吸道损伤较小、患者易于接受、并发症少等优点[1]。然而喉罩在置入过程中对咽喉部黏膜的直接
平遥纱阁戏人是以泥捏纸扎为主要制作技法、以戏曲表演为表现内容的观赏性造型艺术品,独产于山西平遥,极具丰富地域文化内涵。本文通过研究平遥纱阁戏人产生的背景,分析纱阁
自《消防法》颁布实施以来,经过广大监督干部的共同努力,消防监督工作逐步走上了法制化、规范化、制度化的轨道,务实了工作基础,取得了明显成效。本文针对当前如何做好消防监督管
八大山人是清初杰出的画家,其水墨写意画简约质朴,空灵通脱,影响深远。八大山人的绘画思想散见于他的书画题跋中,对其进行系统整理与深入探究不仅有助于我们深入理解八大山人
20世纪90年代以来,学案教学备受推崇,笔者所在的学校也在使用学案进行教学。但笔者在初中数学学案教学中发现,学生课堂上做学案时常常出现错题纠错正确率不高的现象。为了解
地面三维激光扫描技术以其高精度、高密度等优点,在潮间带地形测量中得到了非常广泛的应用。为了对潮间带地形地貌进行精确反演,必须对点云数据中的非地面点(主要是植被点)予
2007年7月9日,中国香港特别行政区政府发行了香港第一张塑料钞票——10元港币,成为全球第二十五个发行塑料币的地区。据有关方面统计,尽管塑料货币的单位成本是纸币的两倍,但是由