【摘 要】
:
传统聚类方法往往无法避免邻域参数和聚类数量的选择问题,而这些参数在不同形状的数据中的最优选择也不尽相同,需要根据大量先验知识确定合适的参数选择范围。针对上述参数选择问题,提出了一种基于自然邻居思想的边界剥离聚类算法NaN-BP,能够在无需设置邻域参数和聚类数量的情况下得到令人满意的聚类结果。算法核心思想是首先根据数据集的分布特征,自适应迭代至对数稳定状态并获取邻域信息,并根据该邻域信息进行边界点的标记与剥离,最终以核心点为数据簇中心进行聚类。在不同规模不同分布的数据集上进行了广泛的对比实验,实验结果表明了
【机 构】
:
重庆师范大学计算机与信息科学学院,教育大数据智能感知与应用重庆市工程研究中心
【基金项目】
:
教育部人文社会科学研究项目(18XJC880002,20YJAZH084),重庆市教委科学技术研究项目(KJQN201800539),重庆市基础科学与前沿技术项目(cstc2016jcyjA0419)。
论文部分内容阅读
传统聚类方法往往无法避免邻域参数和聚类数量的选择问题,而这些参数在不同形状的数据中的最优选择也不尽相同,需要根据大量先验知识确定合适的参数选择范围。针对上述参数选择问题,提出了一种基于自然邻居思想的边界剥离聚类算法NaN-BP,能够在无需设置邻域参数和聚类数量的情况下得到令人满意的聚类结果。算法核心思想是首先根据数据集的分布特征,自适应迭代至对数稳定状态并获取邻域信息,并根据该邻域信息进行边界点的标记与剥离,最终以核心点为数据簇中心进行聚类。在不同规模不同分布的数据集上进行了广泛的对比实验,实验结果表明了
其他文献
国内消费者对麻织物的认知观念发生了明显转变,也促进了麻织物的消费和创新。麻织物是中国的传统包装材料,将其应用在民族风格的服饰包装设计中,不仅可以体现传统文化的深厚底蕴,还可以凭借生态层面的优势来满足环保要求。文章重点探讨如何在包装设计领域应用麻织物,吸引更多的消费者。
大多数利用标签与用户和项目之间关系的推荐算法,都要面临用户个体不同所导致的标签稀疏问题,不同的用户为项目所标注的标签会有所不同。针对由于用户标注标签的随意性而导致的用户标签和项目标签矩阵稀疏问题,提出了一种标签扩展的协同过滤推荐算法。该算法根据用户标注标签的行为计算基于标签的标签相似度,根据用户标注的标签语义计算基于标签语义的标签相似度,从用户行为和标签语义2个方面评估标签的相似度,并利用标签相似度来扩展每个项目标签,降低由项目与标签的关联关系产生的矩阵稀疏度。在MovieLens数据集上的实验结果表明,
采用双曲正弦函数忆阻器作为正反馈项,设计了一个具有4个翅膀的四维混沌模型。首先利用四阶龙格库塔算法对该系统进行数值求解,对系统的稳定性进行了分析,发现系统只有一个平衡点且为鞍点。对系统进行动力学分析,绘制了随系统参数变化的Lyapunov指数和分岔图,计算了系统的Lyapunov维数,得到了系统随参数变化时运动状态的变化情况,发现系统存在周期和混沌等多种运动形态。最后,利用FPGA设计了一个混沌电路系统,用示波器观察结果,发现与数值结果基本一致,为忆阻混沌系统在通信中的应用奠定了基础。
黎族织锦是中国传统文化的瑰宝,是海南黎族千年流变后沉淀下来的历史、风俗、宗教等文化的结晶,具有极高的历史价值以及艺术价值。目前,海南省自贸港建设的多措并举为创建全域旅游示范省提供了诸多便利,进一步推动了海南民宿业的发展。文章旨在挖掘黎锦纹样的现代艺术性,将其与当下乡村民宿设计有机结合并迸发新的艺术活力,对海南旅游业的发展具有积极作用。
无监督的图像风格迁移是计算机视觉领域中一个非常重要且具有挑战性的问题。无监督的图像风格迁移旨在通过给定类的图像映射到其他类的类似图像。一般情况下成对匹配的数据集很难获得,这极大限制了图像风格迁移的转换模型。因此,为了避免这种限制,对现有的无监督的图像风格迁移的方法进行改进,采用改进的循环一致性对抗网络进行无监督图像风格迁移。首先为了提升网络的训练速度,避免梯度消失的现象出现,在传统的循环一致性网络
在生物医学领域,以静态词向量表征语义的命名实体识别方法准确率不高。针对此问题,提出一种将预训练语言模型BERT和BiLSTM相结合应用于生物医学命名实体识别的模型。首先使用BERT进行语义提取生成动态词向量,并加入词性分析、组块分析特征提升模型精度;其次,将词向量送入BiLSTM模型进一步训练,以获取上下文特征;最后通过CRF进行序列解码,输出概率最大的结果。该模型在BC4CHEMD、BC5CDR-chem和NCBI-disease数据集上的平均F1值达到了89.45%。实验结果表明,提出的模型有效地提升
使用拍卖机制对计算资源进行分配是当前边缘计算研究领域的热点问题之一,但当前研究大多存在资源类型单一、无法满足防策略的问题。提出一种适用于边缘计算环境的资源分配防策略拍卖机制,它以虚拟机的方式组合资源,进而支持多种资源的分配,在资源分配算法中同时考虑了用户需求的资源密度和部署约束以及资源服务器的容量,这能够有效地提高资源利用率和社会福利,通过使用二分法计算出临界价格作为支付价格,提升了支付价格的计算速度,并且使得该机制满足防策略。实验结果表明,该机制显著提高了资源提供商的资源利用率和社会福利,并能将计算时间
大数据下的目标检测算法常常会出现目标漏检和重复检测问题,针对此问题提出一种基于自适应阈值-非极大值抑制AT-NMS的Mask RCNN改进算法Mask RCNN_(AT-NMS)。首先在ResNet基础上添加可变形卷积模块增强提取目标多层卷积特征的能力;其次使用AT-NMS算法提取目标候选区域的深层信息;然后通过ROI Align2次量化处理实现对目标更加精确的定位;最后通过3个分支实现目标实例分
近年来,多核聚类(MKC)在融合多源信息以提高聚类性能方面取得了显著进展。但是,以n表示样本数,O(n2)内存消耗和O n 3计算消耗限制了这些方法的实用性。重新设计了基于子空间分割的MKC公式,从而将其内存和计算复杂度分别降低到O(n)和O(n2)。在该算法(基于压缩子空间对齐的多核聚类算法CSA-MKC)中,通过对部分数据采样来重建整个数据集。具体而言,在该算法中,在信息融合过程中同时学习了共识采样矩阵,从而使生成的锚点集更适合于跨不同视图的数据重建。因此,
针对烟叶存储期间的霉变问题,传统的防治措施效果欠佳,且已有的烟叶霉变预测模型的准确率较低,不能有效减少烟叶霉变现象的发生。为了提高预测烟叶霉变状态的准确率,提出了一种基于一维卷积深度神经网络(1D-CNN)的方法。以采集终端传感器数据为基础,对其进行标准化处理,得到模型训练特征,训练一个1D-CNN来预测烟叶霉变状态,优化网络结构,实验结果表明所提方法的预测准确率高于其它传统模型。最后,设计并实现了烟叶仓储霉变智能监测系统,实现了烟叶霉变的实时预测功能,取得了较好的效果。