基于J2EE的高校知识发现系统的构建

来源 :中国教育信息化·高教职教 | 被引量 : 0次 | 上传用户:yedayong0007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:为了将高校数据库、知识发现技术高度集成,结合J2EE可扩展、可重用、独立性强等优点,构建基于J2EE的高校知识发现系统,在此基础上介绍了该系统的体系架构、技术实现和功能模块。
  关键词:J2EE EJB 数据挖掘 知识发现系统
  中图分类号:TP311文献标识码:B文章编号:1673-8454(2007)10-0054-03
  
  本文拟在J2EE平台上,利用XML技术、数据库、知识库、数据挖掘和信息搜索技术,构建高校知识发现系统,将地理位置分散的、异构的数据进行合理地组织和挖掘,不仅能实现不同部门内部的知识发现,而且能胜任部门之间的联合知识发现。
  
  一、系统可行性分析
  
  高校建立知识发现系统在设备、技术、人才方面都具有很强的可行性。目前高校都在投入较大的物力和财力来实现数字化校园,已经利用成熟的WEB技术建立了Internet系统,将学校内部的各种数据、信息和文档置于Web数据库和服务器上,便于教职员工和学生之间信息的共享与交流,同时也将Intranet系统和外面的Internet世界连接,建立起对外信息发布窗,为基于网络上的不同部门的知识发现提供了可能;而高校各个部门的管理信息化都已成熟,如人事、科技处等都积累了完善的历史数据,为知识发现提供可靠的数据来源;而高校拥有雄厚的信息技术和信息人才储备,这些都使得高校实现知识发现成为可能。鉴于高校数据地理位置分散、异构等特性,拟在J2EE平台上开发实现该系统。
  
  二、J2EE的体系结构介绍
  
  J2EE(Java 2 Enterprise Edition)是由SUN公司领导,各厂商共同制定,并得到广泛认可的工业标准。可以满足当前不断变化和日趋复杂的商业应用需求,也很快变成了企业构建新系统和集成、扩展已有系统的首选技术。J2EE的体系结构图如图1所示,可以分为4层。[1]
  
  图2 基于J2EE的高校知识发现体系图
  
  系统分为用户层、Web层、业务层、数据层。用户根据需要通过校园局域网浏览器发送请求,通过HTTP、HTTPS、IIOP等协议访问后端的应用服务器内的资源,客户应用层根据用户的权限不同而显示不同的信息。Web服务器层是连接用户层和业务逻辑层的桥梁,通过由显示动态HTML/WML页面的JSP与用户进行交互,根据用户请求Servlet控制器将其传递给相应的业务EJB操作处理。业务处理服务器层是功能实现EJB集合,根据系统实现目标包括知识查询和知识发现两大模块,狭义的知识发现是基于数据挖掘的,笔者认为广义的知识发现应包括知识检索与查询。该层包括知识查询EJB、数据处理EJB、数据挖掘EJB、知识处理EJB,其中后3个是完成狭义知识发现功能的。数据层由分布在高校各个部门的数据库和存储发现结果的知识库构成,系统采用杨炳儒教授提出的“双库协同机制”进行数据驱动,双库即数据库和知识库,传统的知识发现是针对各类数据库进行的,为了体现认知的自主性以及使新旧知识有机融合,杨教授首次提出双库协同机制,为知识发现领域的一大创新。[3][4]
  
  四、系统技术实现
  
  整个系统是在J2EE1.4平台开发的,系统整体架构采用B/S模式,其中Web Server使用Tomcat,应用服务器采用遵从J2EE规范的EJB服务器Jboss。在设计开发系统时,充分考虑其复杂性和分布性,采用了面向对象的系统开发方法和JSP Servlet Java Bean的开发结构。为便于系统移植和维护,将主要的业务逻辑封装在EJB,为JSP和Servlet提供各种方法和属性调用。
  由于高校知识发现系统要涉及不同部门的信息,而他们已经有了各种不同的管理信息系统,数据库存在异构性,很难在各系统之间达到共享,为解决这个问题,采用XML数据格式的接口,实现异构数据的集成。XML是全球范围内用于描述数据和交换数据的一种标准方式,由于它的自描述性、可扩展性、可校验性、多样式表支持等特点,已在多方面得到了广泛的应用,如应用于内容管理发布、数据层集成、应用层集成、系统配置信息描述、工作流描述等。在该系统中,XML主要解决以下几个问题:将客户端传来的异构数据转换成统一XML数据给业务处理服务器,并且将以XML形式的知识发现结果转换成客户端的特定形式返回给用户;作为数据挖掘元模型的配置文件,描述知识发现业务流程,支持建模与业务过程重构描述;描述EJB组件在容器中的动态部署配置文件。[5]
  
  五、系统功能模块
  
  1.知识查询EJB
  知识查询模块利用SQL技术实现数据库之间的简单查询功能,例如要查询学生“张三”的信息,系统会从教务、学工以及财务等保存张三信息的相关数据库中将他的学习成绩、行为表现以及缴费信息查找出来,利于教师全面了解学生。
  2.数据预处理EJB
  高校数据库中的数据多半具有不完整、噪声和不一致的特征,数据预处理在数据挖掘之前使用,可以提高数据挖掘模式的质量,降低实际挖掘所需要的时间。数据预处理包含数据清洗、数据集成、数据转换、数据归约。[2] 数据清洗通过填写空缺的值,平滑噪声数据,识别、删除孤立点,解决不一致来“清洗”数据;数据集成将来自不同数据元的数据集合成一致的数据存储,元数据、相关分析、数据冲突检测和语义异种性的解析都有助于数据集成;数据变换将数据变换成适于挖掘的形式,如属性数据规范化,使得他们落入小区间,如0.0-1.0;数据归约如数据立方体聚集、维归约、数据归约和离散化都可以用来得到数据的归约表示,使得信息内容的损失最小。
  3.数据挖掘EJB
  预处理后的数据要根据用户的要求进行不同的分析处理,该系统面向的用户是具有一定数据挖掘知识、会根据具体问题选择适合的数据挖掘方法并且能进行结果分析利用的人。
  这是一个数据挖掘EJB Container,包含实现数据挖掘功能如分类、聚类、预测以及关联的常用算法实现组件(如图3):分类的决策树C4.5算法、K-Means聚类算法、Apriori关联算法、时间序列分析、回归分析算法、BP神经网络分类算法以及SOM神经网络聚类算法等,这些组件是小的Java Bean,用户可以根据需要调用其中的某种或某几种方法进行分析比较,另外,随着数据挖掘算法的不断成熟与完善,新的算法组件可以方便地加入Container中,这种可移植性是J2EE的EJB优势之一。[2]
  
  图4 知识处理内部逻辑图
  
  六、结语
  
  J2EE平台支持简化的、基于组件开发模型,由于J2EE基于Java编程语言和J2EE平台,它提供了编写一次,随处运行的可移植性,遵循J2EE标准的所有服务器都支持该模型。EJB组件使编写应用程序更为简单,由于在EJB模型中,各个软件组件都是严格分离的,因此,可以从现有的软件组件装配出服务器端应用程序,另外,J2EE对应用层要求低、操作简单。因此基于J2EE的高校知识发现系统有效解决了高校数据库异构、分散的缺陷,并且具有良好的可重用性、可扩展性,能为高校教学、管理人员从纷繁的数据中发现真正感兴趣的知识助一臂之力。
  
  参考文献:
  [1]Sue Spielman, Meeraj Kunnumpurath著,马树奇等译. J2EE1.4编程指南[M]. 北京:电子工业出版社,2005.5
  [2] Jiawei Han Micheline Kambe著,范明等译. 数据挖掘概念与技术[M]. 北京机械工业出版社,2005.2
  [3]杨炳儒等. 基于知识发现的实用智能系统总体结构模型[J]. 计算机工程,2003(10):42-45
  [4]杨炳儒等. 基于内在认知机理的知识发现理论及其应用[J]. 自然科学进展,2006(1):107-115
  [5]李强等,基于J2EE的数据挖掘算法组件库设计[J]. 计算机工程与设计,2005(11):3091-3093
  [6]何新贵著. 知识处理与专家系统[M]. 北京:国防工业出版社,1990.9
其他文献
许多家长都有一个误区,以为学校的教育才是“教育”,其实不然,家庭教育和社会教育也是教育的重要形式。其中,生活教育又是家庭教育最为重要的组成部分,也是幼儿园家园共育指导的难点。那么家庭中如何开展生活教育更为有效呢?我想到了陶行知和陈鹤琴两位先生的理念:“生活即教育”“大自然、大社会是活教材”“做中教、做中学、做中求进步”。  生活教育既是依托当下生活开展的教育,亦是为未来生活做准备的教育,而其成功的
“教育诊断”栏目的专家:  您好!  我最近参加了一次教研活动,本来是观察搭建区域的活动,但引起我思考的,却是有关孩子分享的话题。我疑惑的是,当同伴提出分享要求时,被要求的孩子,一定要分享吗?事情经过是这样的。  我们观察的是某幼儿园小班的搭建区。区域里一共有4个小朋友正分别用纸杯搭建着各自的作品。小男孩可可(文中幼儿皆用化名)挑出红色的纸杯,把纸杯整整齐齐地摆成一条直线。玩了一会儿,可可回头向欢
一题多解,在数学中应用很多,作用也很大。一题多解。可以调动学生思维的积极性,提高运用所学知识来解决问题的能力:一题多解,可以训练学生思维的灵活性,促进他们敏捷地思维。越学越聪明;一题多解,还可以发展学生思维的创造性,掌握各知识点之间的联系,主动综合运用。  看,最近我在教学《解决面积问题的策略》中,这样的一题。让孩子兴趣浓厚。思维活跃。解法还真多。  题目:文明广场上一个正方形花坛的四周有一条1米
摘要:针对360安全卫士在线修复漏洞补丁时间较长的缺点,本文详细介绍了如何在离线状态下,快速修复Windows XP操作系统的漏洞补丁,避免系统因漏洞而受到网络威胁。  关键词:安全卫士;系统漏洞;离线  中图分类号:G 434文献标识码:B文章编号:1673-8454(2007)11-0081-01    一、问题    对于一个初装的、没有打过任何补丁的操作系统,在连入因特网的几分钟内就可能被
学期初,植物角新来的两只小蜗牛引起孩子们的关注,他们总会谈论关于蜗牛的话题。一天,子墨和大家说:“我家也养着小动物,是特别大的蜗牛,养了好久呢。”过了几天,子墨将家里饲养的白玉蜗牛带到班里,孩子们更加好奇,都争先恐后围了过去,一边观察一边谈论,兴趣也越发浓厚。之后,孩子们陆续带来了自己的小蜗牛。皓辰说:“我的蜗牛是最大个的,我还给它起了个名字呢,叫大佛!”琪轩指着自己的蜗牛说:“我的蜗牛壳上有漂亮
我对自闭症幼儿最初的印象是他们的行为刻板,不与人对视,不太会使用语言进行表达……当我来到我园的保利园区工作后,对特需群体模糊的印象变得直接而清晰起来,特需幼儿走进了我的工作和生活,我们一起开启了融合教育的探索历程。  接纳、理解与关爱的班级氛围  营造一个接纳、理解和关爱的班级氛围是我们最重要的工作。氛围包括两个方面,一是教师、幼儿对特需幼儿的理解和接纳,二是家长们对特需幼儿及其家庭的理解和接纳。
摘要:新的语文课程资源观要求开发信息化课程资源,开发和利用网络课程资源是改变单一的纸质课程资源的重要方式之一。本文分析了信息化课程资源的优势,在构建语文课程网的过程中,对如何开发和利用信息化语文课程资源提出了可供参考的方法。   关键词:课程资源;信息化;开发利用;语文课程网  中图分类号:G 203文献标识码:B文章编号:1673-8454(2007)11-0037-03    随着信息技术的发
摘 要:当前传统的软件工程课程教学和实践中存在一些缺陷,即缺少一些较为完整的软件开发流程的模板和案例;老师授课多采用分散举例的方法,没有完整的案例,无法让学生形成使用软件工程的方法、原理去进行软件开发的全部流程的整体观念,同时学生、教师之间没有良好的交流反馈环境,致使教学效果不佳。应用本系统将为师生搭建这样一个交流平台,同时设计出相关的模板、案例和指导说明并建立软件工程电子资料库以供查询,从而在一
高水平合作游戏对幼儿的学习品质、社会性、语言等方面的发展起着非常重要的促进作用。但在合作游戏中,教师也同样面临许多问题,比如,“如何帮助性格内向的幼儿加入合作游戏”“如何促进幼儿自主进行角色分配”“如何帮助幼儿探索游戏冲突与规则之间的平衡”等,都是教师在指导幼儿角色游戏开展时非常关注的问题。本文以“海盗船”游戏为例,向大家展示我们为解答这些问题所做的一些探索。  海盗船游戏是几名大班幼儿开展的主题
“十四五”时期是我国大力发展婴幼儿照护服务后第一个五年规划,对我国托育服务的健康发展有着深远影响。党中央、国务院高度重视婴幼儿照护服务工作。2016年,中办、国办《关于实施全面两孩政策 改革完善计划生育服务管理的决定》明确提出“要补齐托育服务短板”。十九大报告在保障和改善民生的蓝图中,将“幼有所育”排在首位。2020年《政府工作报告》进一步强调“要深化供给侧结构性改革,突出民生导向,发展养老、托幼