【摘 要】
:
针对大数据下密度聚类算法中存在的数据划分不合理、参数寻优能力不佳、并行性能较低等问题,提出一种基于IFOA的并行密度聚类算法(density-based clustering algorithm by using improve fruit fly optimization based on MapReduce,MR-DBIFOA)。首先,该算法基于KD树,提出网格划分策略(divide gird
【机 构】
:
江西理工大学信息工程学院,江西理工大学应用科学学院信息工程系
【基金项目】
:
国家重点研发计划资助项目(2018YFC1504705),国家自然科学基金资助项目(41562019),江西省教育厅科技项目(GJJ151528,GJJ151531)。
论文部分内容阅读
针对大数据下密度聚类算法中存在的数据划分不合理、参数寻优能力不佳、并行性能较低等问题,提出一种基于IFOA的并行密度聚类算法(density-based clustering algorithm by using improve fruit fly optimization based on MapReduce,MR-DBIFOA)。首先,该算法基于KD树,提出网格划分策略(divide gird based on KD tree,KDG)来自动划分数据网格;其次在局部聚类中,提出基于自适应搜索策略
其他文献
针对大数据背景下基于划分的聚类算法中存在初始中心敏感,节点间通信开销大以及集群效率低下等问题,提出了基于网格密度和局部敏感哈希函数的PBGDLSH-MR并行化聚类算法。首先,对初始数据集提出网格密度策略(GDS)获取初始中心点,有效避免了随机选取引起的初始中心敏感的问题;其次,提出基于局部敏感哈希函数的数据分区(DP-LSH)用于投射关联性较大的数据对象到同一子数据集中,得到map上的数据分区,并
本文基于创新扩散理论框架,结合典型案例,通过文献分析法、调查法、访谈法等分析学术期刊开展知识付费的产品形态和风险困境。学术期刊具备开展知识付费的全产业链要素,但在
目的总结结直肠腺瘤患者的临床特点。方法选择2020年6—12月于北京中医药大学东方医院肛肠科及消化内镜中心就诊,经病理诊断为腺瘤性息肉的且符合纳入标准以及排除标准的患者
目的运用蛋白芯片技术筛选复发性流产患者肾虚血瘀证与非肾虚血瘀证的差异蛋白,为进一步诊治复发性流产提供理论依据。方法选择2016年1月至2018年12月就诊于首都医科大学附属
目的研究毛细血管再充盈时间(capillary refill time,CRT)联合序贯器官衰竭评分(sequential organ failure score,SOFA)对感染性休克患者预后的评估价值。方法选择2018年1月
如何在计算能力和存储能力有限的移动或嵌入式设备中部署神经网络是神经网络发展过程中必须面对的一个问题。为了压缩模型大小和减轻计算压力,提出了一种基于信息瓶颈理论的神经网络混合压缩方案。以信息瓶颈理论为基础,找到相邻神经网络层之间冗余信息,并以此为基础修剪冗余的神经元,然后对剩余的神经元进行三值量化,从而进一步减少模型存储所需内存。实验结果表明,在MNIST和CIFAR-10数据集上与同类算法对比,所
目的考察采用穴位注射法联合小承气汤剂治疗剖宫产术后腹胀的效果。方法选取2015年1月至2017年12月湖北省武汉市普仁医院剖宫产手术后腹胀者114例,按随机数字表法分为对照组
创建世界一流的出版企业是文化强国的使命任务,走出去也是世界一流出版企业的必由之路。本文从产品贸易、版权贸易、国际出版交流、国际合作出版、跨国经营、国际出版物网上
云控制系统是软件定义的云计算基础理论和方法在自动控制领域中的延伸和应用,然而其研究尚处于起步阶段,其概念内涵、体系架构、理论方法和关键技术还需进一步明确。通过对体系结构和构成要素的分析,归纳总结了云控制系统的典型特征;综合分析了云控制系统与相关技术的支撑关系;基于云控制系统的理论特点引申出五项关键技术,并对各关键技术的研究现状进行了详细阐述;最后提出了云控制系统未来发展所面临的问题与挑战。
针对现有的序列推荐算法仅利用短期顺序行为进行推荐,而没有充分考虑用户的长期偏好和项目之间更深层次的联系等问题,提出一种融合自注意力机制与长短期偏好的序列推荐模型(combines self-attention with long-term and short-term recommendation,CSALSR)。该模型首先建模用户和项目的潜在特征表示,将用户短期交互序列中的项目成对编码为三向张量