论文部分内容阅读
随着国家信息基础结构建设目标的实施,企业在各种活动中普遍采用现代信息技术来提高竞争力。传统的基于数据的管理信息系统已不能满足决策者对数据质量的需求,面向决策的数据挖掘系统正在蓬勃兴起。数据挖掘是近年来发展起来的新技术,通过数据挖掘,人们可以发现数据背后隐藏的有价值的、新颖的规律,为科学决策提供强有力的支持。当今,数据挖掘已发展成一门跨越多领域的学科。它涉及到数据库、模式识别、神经网络、统计学、计算智能等相关技术。Web 数据挖掘机(WebMiner)是电子科技大学计算智能实验室(CIlab)数据挖掘小组研究开发的基于Web 的数据挖掘系统。其目的是为了探索网络环境下的数据挖掘技术,特别是尝试在因特网上建立数据挖掘服务器与数据库服务器配合,实现基于Web 挖掘。WebMiner 采用J2EE 架构和Struts框架完成设计和实现,具有良好的开放性、可扩展性和健壮性。该系统为开发人员提供了一个标准的MVC 开发模式,将业务与视图分离,便于有效地理清系统结构,降低系统复杂度与开发维护难度,也为数据挖掘研究人员提供了一个基于B/S 的数据挖掘研究平台,提高了易用性。只要遵循WebMiner 的数据模型和算法模型接口,新的数据挖掘算法可以很容易地集成到系统中来。同时,该系统还是一个具有实际应用价值、可以与数据挖掘应用紧密结合的、便于升级、移植和维护的数据挖掘系统。全文共分为六章。第一章主要介绍数据挖掘的应用背景以及课题的任务。第二章首先介绍了数据挖掘的概念和产生,然后介绍了数据挖掘研究的任务、数据挖掘过程、常用方法和应用,最后介绍了数据挖掘未来的研究方向。第三章主要阐述了计算智能实验室(CIlab)数据挖掘小组的基于J2EE 架构的WebMiner。第四章是论文的重点部分,详细介绍了我在系统设计和实现方面的工作,对系统的设计理念、功能、体系结构、具体设计,服务端实现等方面进行了充分的分析和讨论。第五章将简单讨论将一个文本流主题提取算法集成到WebMiner 的步骤,并总结出通用的规律。第六章对课题的主要研究工作进行了总结。