【摘 要】
:
传统k最近邻算法(k-Nearest Neighbor,kNN)作为一种非参数化分类技术在数据分析中具有广泛的应用,但该算法具有较多的冗余计算,致使处理数据时需要花费较多的计算时间。目前
【机 构】
:
广东工业大学计算机学院,广东省大数据分析与处理重点实验室
【基金项目】
:
国家自然科学基金(No.61702114),广东省大数据分析与处理重点实验室开放基金(No.201805),广东省省级科技计划(No.2017A040402009)
论文部分内容阅读
传统k最近邻算法(k-Nearest Neighbor,kNN)作为一种非参数化分类技术在数据分析中具有广泛的应用,但该算法具有较多的冗余计算,致使处理数据时需要花费较多的计算时间。目前大量的研究都集中在数据的预处理阶段,通过为数据建立模型降低kNN查询的计算量。提出一种基于对象数量的宽度加权聚类kNN算法(NOWCkNN),该算法中数据集首先以全局宽度进行聚类,每个生成的子集群根据其对象数量递归计算其宽度的权值,然后算法根据其权值的大小和调和系数调节宽度值,最后生成不同宽度大小的集群用于kNN查询。这不
其他文献
学生的成长主要靠教师的帮助和引导,教师队伍的素质和能力是办好学校的关键。只有教师自身素质的提高,才有学生素质的提高,才有学校教育教学质量的提高。如何提高教师队伍的素质
从内蒙古锡林郭勒酸马奶中分离筛选出一株酵母菌A9,通过A9的紫外(UV)诱变、硫酸二乙酯(DES)单因素实验,确定最佳诱变参数。结果表明,最佳紫外诱变参数为于30w紫外灯下、距灯30cm处、
文章依据有关低压配电设计的规范性要求,对低压配电线路的保护和保护选择性的要求做了较为详细的阐述,对于应该如何选择低压保护电器的型号问题进行了分析,重点对配电低压线
<正>2017年12月27日,省人力资源社会保障厅党组理论学习中心组围绕学习贯彻习近平新时代中国特色社会主义思想进行集体学习研讨。省委组织部副部长,省人力资源社会保障厅党组
<正>执纪者必先守纪,正人者必先正己。在推进全面从严治党的新征程中,打造一支具有铁一般的信仰、铁一般信念、铁一般纪律、铁一般担当,让党放心,人民信赖的高素质纪检监察干
现代社会发展阶段,房屋建筑工程的数量在不断增多,这些对于工程建筑的要求也更加严格。施工环节是构造建筑实体的过程,对产品质量有着决定性作用。为不断改善房屋建筑工程项目的
针对运输路段交通事故概率未知的情况,提出同时考虑运输成本和风险的危险品运输网络选线模型,以降低危险品运输事故对沿线居民和周围环境的影响。考虑发生交通事故后有毒气体
我国西部民族地区可再生能源开发潜力巨大,产业带动作用显著,具有优越的资源禀赋和发展条件。近年来,西部民族地区可再生能源开发取得了初步成效,但也面临着资金、技术、人才
随着社会生产、生活方式的日新月异,人们对办公环境、办公效率的要求越来越高,因而办公建筑设计思路亟待改变。以企业自用办公楼为重点研究对象,尝试从使用功能、工作单元、
为解决常见的相似性方法存在未考虑用户间共同评分项在目标用户所评项目中的比例以及用户评分偏好的问题。提出了非对称因子和偏好因子,用于提高用户相似性计算的准确性。在