【摘 要】
:
随着云计算、大数据、物联网的普及,人们迎来了第三次信息化浪潮。为了从这些海量的数据中发现有趣的模式,数据挖掘方法便应运而生。数据挖掘是将数据转化为知识的桥梁,关联规则挖掘是数据挖掘的一个具体任务,旨在从数据中发现事物之间可能存在的关联或者联系。在关联规则挖掘中,频繁共同出现的项目称为频繁项集。高效用项集挖掘是频繁项集挖掘的延伸,不仅考虑了项目在事务中是否出现,而且还使用了项目的权重信息,在现实生活
论文部分内容阅读
随着云计算、大数据、物联网的普及,人们迎来了第三次信息化浪潮。为了从这些海量的数据中发现有趣的模式,数据挖掘方法便应运而生。数据挖掘是将数据转化为知识的桥梁,关联规则挖掘是数据挖掘的一个具体任务,旨在从数据中发现事物之间可能存在的关联或者联系。在关联规则挖掘中,频繁共同出现的项目称为频繁项集。高效用项集挖掘是频繁项集挖掘的延伸,不仅考虑了项目在事务中是否出现,而且还使用了项目的权重信息,在现实生活中应用更广泛。群体智能算法从自然界获得灵感,通过模拟个体或种群的行为来建模,具有不过度依赖具体问题的优势。不同于传统的数据挖掘方法,基于群体智能算法的高效用项集挖掘,通过结合启发性规则和随机因素来遍历搜索空间,可以自组织自适应的迭代更新,在求解组合优化问题上表现出了明显的优势。本文主要的研究内容包括:1)提出了基于集合型粒子群算法的高效用项集挖掘方法HUIM-SPSO。算法采用基于集合的粒子群算法(Set-Based Particle Swarm Optimization,S-PSO)来挖掘高效用项集。实验结果验证了基于集合型粒子群算法的高效用项集挖掘方法的先进性;提出了种群多样性的衡量方法,在群体智能算法中,种群的多样性对算法的性能有着不可忽视的作用。在HUIM-SPSO算法中,为了衡量整个种群的多样性,提出了位编辑距离,并定义了最大位编辑距离和平均位编辑距离。实验证明HUIM-SPSO算法的多样性更高,在同样的迭代次数内会挖掘得到更多的高效用项集。2)提出了基于人工鱼群算法的高效用项集挖掘方法HUIM-AF。人工鱼群算法是一种具有广泛应用的启发式算法,在高效用项集问题中,人工鱼群算法只记录当前位置信息,无需记录额外的历史信息。算法的结果并不总是分布在几个极值点附近,这与高效用项集挖掘问题是一致的。通过人工鱼的三种行为:追尾、聚群和觅食,对HUIM进行建模。详细描述了HUIM-AF算法,并在4个数据集上与两种相关的算法进行了比较,验证了算法的有效性。
其他文献
随着国家工业化进程加快,对各种矿物资源需求增大,导致在用尾矿库数量巨大,尾矿排放量也日益增多,尾矿库安全事故也因此时有发生,造成巨大生命财产损失;同时,由于避免事故的发生,近几年建立的尾矿坝坡比偏小,占地面积过大,库容量偏小。干堆尾矿坝相对湿堆而言有更好的稳定性,可以适当提高坡比。由于我国对干堆尾矿坝的设计还未出台明确规范,因此对干堆尾矿坝合理坡比的确定以及相应加固措施进行研究有十分重要的现实意义
网络图是生活中离不开的一个概念,以社交网络图为例,人与人之间的关系往往呈现出一种社区结构,社区中的人比与社区外的人交互更加频繁。对这样的社区结构进行分析能够得到有意义的信息,如寻找社交平台上哪些人的影响力最大等。社区发现的研究具有重要的现实意义,成为长期以来众多学者研究的课题。随着对社区发现算法研究的不断深入,涌现出很多经典社区发现算法。这些算法基于不同的思想,本文主要研究基于局部扩展思想的重叠社
电梯的安全性和可靠性一直是人们高度重视的问题。针对于电梯故障预测领域,目前国内外对于电梯故障预测方面研究的基本思路是根据电梯的故障情况和维护保养记录,对电梯设备进行故障预测。根据用于社区电梯故障预测的电梯故障数据的小样本性质,本文利用小样本数据分析方法进行社区电梯故障外因分析与预测算法研究,主要工作内容如下:一是研究分析影响社区电梯故障的外部因素,选取并计算与电梯故障相关的外因特征值,对社区电梯故
随着道路交通的快速发展,城市道路交通拥堵的问题日益凸显。交叉口拥堵问题成为交通管理的痛点。交通信号优化是解决道路交叉口拥堵的有效途径之一。但是对于一些偏远路口和检测设备缺失的交叉口,信号优化由于缺乏准确的交通转向流量数据的支撑,交通信号控制无法达到最优的控制效果。但是随着路网中运行的浮动车数量的增加以及在车辆运行过程中轨迹数据的积累,使得通过轨迹数据预测交叉口转向流量变为可能。本文针对偏远及检测设
近年来随着车路协同技术逐渐的成熟,很多交通方面的研究人员将其应用于解决交通难点问题。而基于车路协同的公交优先方法研究也成为各大城市对于交通拥堵的新的解决方案。传统公交优先信号控制方法由于软硬件条件的限制存在一些不足之处,比如不够实时、不够智能等。车路协同系统可以为公交优先信号控制提供更加多源、精确、实时的数据,能够科学的淡化公交车和社会车辆的矛盾,有效的引导车辆和合理的进行信号控制,为公交优先提供
隧穿场效应管(TFET)是后摩尔时代的低功耗(LP)器件的候选者之一,因为它可以突破亚阈值摆幅(SS)(60 m V/dec)的极限,从而在更低的供应电压下工作。使用二维(2D)材料对TFET进行设计是一种有潜力的方案,因为2D材料较薄的原子层预示着出色的栅极控制,而光滑的表面则意味着在运输过程中载流子被散射的概率降低。其中IV族硫族化合物由于兼具二维材料的优点,和无毒、稳定、各向异性、载流子迁移
随着5G大规模商用,“万物互联”的时代已然到来,但目前云计算的传输时延过长,对于时延敏感型应用并不友好。为了解决这一问题,Cisco提出了雾计算的概念,雾计算与其他边缘计算实现方式相比,具有部署灵活、接入方式多样和支持节点间通信等优势。首先,介绍了边缘计算的三种系统实现方式:微云计算、多接入边缘计算和雾计算及其应用场景和系统架构,并从系统架构和请求处理机制两个方面进行比较,总结了三种边缘计算实现方
随着城市建设居民生活需求的不断增大,与燃气有关的各类风险因素也在不断增加。为了加强对社区户内燃气系统的监管,确保社区居民的安全用气,需要对户内燃气系统进行风险评估,以快速全面的了解户内燃气系统的风险水平。而现有的风险评估方法还存在一些问题。首先,目前户内燃气系统的风险评估大都为静态分析方法,这些方法只能粗略的估计户内燃气系统长期处于的安全风险状态,难以适应风险的动态特性也无法及时预测出风险事件的发
近年来频发的食品安全风险事件对我国食品安全事业的发展带来了巨大的压力,当下有关食品安全的情报分析以及研判预警已经成为食品安全监督、管理的关键环节,合理的防控机制可以有效提高食品安全的整体态势。在信息高速交互的时代,数据来源主要趋向于网络化和数字化,数据结构也变得复杂多样,数据之间的关联性尤为隐蔽而不易觉察。面对错综复杂的食品海量数据信息,传统的情报研判技术已经无法满足其需求,因此本文运用机器学习等
AGV(Automated Guided Vehicle)是一种无人操作自动导引车,主要负责工厂物料的转运工作。随着“中国智能制造2025”的提出,自动化、智能化和集成化成为各个行业发展的主流方向,因此智能物流行业迎来了一个大的发展,AGV作为物流行业重要的转运工具,具有非常大的研究价值。本课题以AGV实际的工程项目为背景,对车载控制系统的行走转向控制、货叉升降控制和安全控制部分进行了硬件的选型、