基于分布式概念格的关联规则算法研究及其在中美洲进出口贸易数据分析中的应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:pf2858888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各国进出口贸易往来日趋频繁,每天都会产生大量的交易数据,能否从这些海量交易数据中提取出有效信息与规则,对于企业与政府做出商业决策显得尤为重要。而数据挖掘正是实现这一手段的重要方法之一,关联规则作为数据挖掘中最活跃的研究方向,它反映了大量数据项目之间有意义的关联和联系。因此,采用数据挖掘中的关联规则技术可以从海量贸易数据中提取出有价值的规则信息,从而为决策提供参考。然而,传统的关联规则算法有很多局限性,如何提高挖掘算法的效率已成为了关联规则算法研究的核心问题。概念格作为知识表达的一种简洁手段,近年来以其在这方面特有的优势正赢得越来越多研究者的关注。 本文在对传统关联规则算法研究分析的基础上,针对进出口贸易数据的特点,将概念格模型引入关联规则算法研究当中,并针对概念格的表示、存储及访问方式进行了改进,给出了一种基于排序索引链表的概念格新算法-OICL算法,极大地提高了概念格构造及规则提取的效率,降低了算法的时空复杂度。然后针对OICL算法设计了一种高效的分布式挖掘方案,给出了算法流程图。最后使用该方案在J2EE平台上对系统进行了设计与实现。本文所做的具体工作如下: 1.介绍了数据挖掘和关联规则的基本理论,针对传统关联规则算法的缺陷,将概念格引入关联规则算法研究中,阐述了基于概念格模型的规则提取理论。 2.在分析了经典概念格算法的基础上,针对概念格的表示、存储及访问方式进行了改进,给出了一种基于排序索引链表的概念格新算法OICL。不仅对其从理论、流程等方面进行了详细地阐述,还针对OICL,算法设计了一种高效的分布式挖掘方案,给出了算法流程图。最后对该分布式算法进行了评价和实例验证。 3.基于J2EE平台设计开发了分布式数据挖掘系统。该系统采用了本文提出的分布式挖掘方案,并将OICL挖掘算法在该系统上实现。最后分析和总结了挖掘出的关联规则,实现了理论研究与实际应用的结合。
其他文献
曲面编辑在计算机动画、游戏、工业制造等领域中得到了广泛的应用,而曲面的优化与变形是曲面编辑里经常用到的两个工具。本文主要研究了基于一种显式曲面——三角网格模型的优
学位
网络入侵检测系统把网络数据包作为检测对象,实时的分析网络上的数据流量。随着ATM、千兆以太网、G比特光纤网等大量的高速网络技术在近几年内不断涌现,单一的基于模式匹配的
通用串行总线(USB)是一种高速、灵活、方便的设备接口总线。作为一种总线接口,USB在测试、自动控制、通信等领域得到了越来越多重视和应用。基于Windows平台下USB接口的步进电
随着无人机在军事和民用领域内都发挥了越来越重要的作用,无人机技术的发展得到了很多国家的重视。飞翼布局无人机有诸多独特的技术优势,所以世界上很多先进无人机采取飞翼布
在诸多的应用领域,需要获取真实世界物体的计算机三维模型。首先需要在物体表面进行采样,得到一个无规则采样点云数据,然后利用表面重建技术,从采样点云精确地构造出一个连续
为了有效地抑制风电场输出功率的波动性和随机性,需要将风电场与储能系统二者相结合,从而可以减小由于风电场输出功率的波动而对电网造成的不利影响,由于混合储能系统同时兼具了能量型储能设备和功率型储能设备的优势,因此本文重点研究了基于混合储能的风力发电波动平抑控制策略。本文首先分析了风电场输出功率的波动特性,然后结合混合储能系统的结构和特点,提出了一种基于小波包分解和荷电状态(SOC)分层优化的混合储能风
并联机器人机构是末端执行器(动平台)通过若干条独立的支链与定平台相连的闭链机构。与串联机器人相比具有结构刚度大、承载能力强、运动精度高以及位置的反解简单和力反馈控
本文以智能模糊传感器为研究对象,在对国内外研究现状进行深入分析的基础上,针对井下信息量大、噪声多、多参数、动态等特征以及单一数量值难以被非专业人员理解等问题,提出
WorldFIP是一种应用于工业自动化系统的现场总线,提供现场设备与控制器以及控制器之间的数字化连接。它融合了控制技术和信息技术,是一种先进而开放的现场总线,具有实时性好