基于EJB的数据分析助理系统的研究与设计

来源 :华侨大学 | 被引量 : 0次 | 上传用户:lywy0201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘在各个领域中有着广泛的应用前景,是进行数据分析的重要工具。 企业在使用数据挖掘时,面临应用的分布性和对大数据集的挖掘需求这两个应用方面的问题。此外,还有企业本身的软硬件环境的限制。如何充分利用企业现有的软硬件资源,既能利用好数据挖掘这个强大的分析工具,满足应用需求,又能方便管理和节约成本,已成为亟需解决的问题。 本文提出了构建适应企业环境的通用型数据挖掘系统的解决方案。该方案包括近似挖掘技术的应用,以适应对大数据集挖掘进行的需求。设计和实现了基于EJB的数据分析助理DAA(Data Analysis Assistant)原型系统,并在该系统中进行挖掘实践。 在企业实际应用中,挖掘系统对大数据集挖掘的支持是必要的。本文通过理论分析和模拟实验,探讨了使用近似挖掘技术进行大数据集挖掘的途径,最后归纳出实现近似挖掘的三个要点,即算法、挖掘框架和挖掘思路应用。 原型系统DAA的功能涉及浏览、统计和数据挖掘等方面,其核心功能是数据挖掘。本文对DAA系统设计的论述包含基本功能的实现和系统性能的优化两个方面内容。 设计工作主要包括挖掘系统体系结构设计、挖掘服务器端设计和客户端设计。体系结构设计包括多层服务的划分和EJB体系的选择。服务器端设计是工作重点,包括EJB服务设计和Web服务设计。客户端设计涉及界面设计、任务描述和模型描述等内容。 在系统性能优化方面,结合了几个旨在提高系统性能的解决方案和技术。包括粗粒度访问方案、中间数据管理技术、挖掘的异步通信技术等内容。 最后给出一个典型的应用实例,即DAA在银行贷款系统的应用,包括分析人员进行建模和客户应用模型两个方面。同时给出了近似挖掘技术在挖掘实践过程中的应用实例。
其他文献
工作流是一种反映业务流程的计算机化的模型,是为了在先进计算机环境支持下实现经营过程集成与经营过程自动化而建立的、可由工作流管理系统执行的业务模型。工作流的生命周期
城市轨道交通系统因基建成本高,故采用高密度方式运营,而城市轨道交通系统的安全、速度、输送能力和运营效率与通信信号系统密切相关。现在国内城市轨道交通信号系统全部来自国
通过引入基于网络的存储虚拟化技术,使数据与物理设备相分离,实现数据的集中存储,统一管理。不但可以有效地消除信息孤岛,而且方便了对数据进行维护,保证数据的一致性和可靠性。存
近十几年来,Internet取得了惊人的发展,已经成为人们交流思想、传达信息和获取知识的快速和重要的渠道.多媒体技术尤其是流媒体技术的发展,使信息的传播力和影响力更胜传统的
  本文介绍了一些关于XML的基础知识,以及时态数据库的基础知识。然后介绍了一种关于时态XML的模型。利用该模型可以实现时态XML文档到与时态数据库间的相互存储转换。另外,
近几年,嵌入式系统的应用越来越广泛了,Linux在嵌入式系统中被广泛的使用。但嵌入式应用中一般要求嵌入式操作系统小型化并具有实时性能,而Linux作为一种通用操作系统,对这些
JXTA技术是由Sun公司在2001年2月提出的一项新技术,主要用于提供P2P程序所需的基础服务。该技术致力于创建一个通用的平台,以简单而有效的方式构建特定的对等式和分布式服务
无线车辆自组织网络是无线网络领域的一个热门话题。它是一种移动自组织网络,用来在车辆之间或移动车辆与路边固定设备之间进行无线通信,以达到传递数据,相互通信的目的。因为无
随着对WEB应用开发效率及质量要求的不断提高,开发工作的难度不断增加。在WEB应用开发过程中存在很多直接影响开发的因素,主要包括开发平台及技术灵活多样,导航关系复杂,而且
目前,随着网络规模不断扩大,IP地址管理不可避免的愈加复杂。为了解决这一问题,网络管理员有必要建立规范的IP地址分配表、IP地址和硬件地址(MAC)登记表,并且做到实时监控。